Rapport du MIT Technology Review Insights en partenariat avec Databricks : "Mettre au point une organisation puissante de données et d’IA"
- Eric PEZON
- 16 août 2024
- 3 min de lecture
Dernière mise à jour : 17 août 2024

Ce rapport du du MIT Technology Review explore comment les experts en données et en analytique parviennent à générer des résultats commerciaux grâce à l'utilisation des plateformes cloud et d'IA.
Contexte et Objectifs
Le rapport se base sur une enquête menée auprès de 351 Chief Data Officers (CDO), directeurs de l’analytique, DSI, et autres décideurs technologiques issus de grandes entreprises (CA > 1 milliard USD) à travers l'Amérique du Nord, l'Europe, et l'Asie-Pacifique. L'objectif est de comprendre comment ces entreprises utilisent les technologies de données pour atteindre des objectifs commerciaux.
1. Culture de Données
Le rapport souligne l'importance d'établir une culture axée sur les données au sein des organisations. Cela signifie que les décisions doivent être guidées par des données fiables plutôt que par des intuitions ou des habitudes. Une telle culture encourage l'utilisation des outils analytiques et du machine learning (ML) par une large gamme d'employés, pas seulement les data scientists ou les analystes de données. Cela nécessite non seulement l'accès aux données, mais aussi la formation des utilisateurs pour interpréter et utiliser ces informations de manière efficace. Une culture de données forte est un catalyseur pour l'innovation et l'agilité des entreprises.
2. Complexité des Données
La gestion des données devient de plus en plus complexe à mesure que les entreprises accumulent des technologies anciennes et nouvelles. Cette complexité se manifeste souvent par une "architecture spaghetti" où les données sont dispersées dans plusieurs systèmes non connectés. Cela peut rendre difficile l'accès rapide aux informations nécessaires pour prendre des décisions. De plus, cette fragmentation des données augmente les coûts d'exploitation et ralentit l'innovation, car il est nécessaire de consolider et de nettoyer les données avant qu'elles ne puissent être utilisées efficacement.
3. Stratégies de Données
Seulement 13% des entreprises parviennent à réaliser pleinement leurs stratégies de données. Ces entreprises ont tendance à avoir adopté des architectures modernes, souvent basées sur le cloud, qui permettent une meilleure intégration et un accès simplifié aux données. Ces architectures incluent souvent des data lakes ou des "Lakehouses" qui combinent les avantages des entrepôts de données traditionnels avec la flexibilité des data lakes. En conséquence, ces entreprises sont en mesure de démocratiser l'accès aux données et d'augmenter l'utilisation du machine learning à travers l'organisation, ce qui leur donne un avantage concurrentiel significatif.
4. Priorités Futures
Les priorités des entreprises se concentrent sur plusieurs axes :
Amélioration de la gestion des données : Cela inclut la consolidation des systèmes de données pour réduire la fragmentation et améliorer la qualité des données.
Renforcement de l'analytique et du ML : Les entreprises cherchent à intégrer davantage le machine learning et l'analyse prédictive dans leurs processus pour améliorer la prise de décision.
Intégration des données en temps réel et non structurées : Les données ne viennent plus seulement de sources structurées (comme les bases de données relationnelles) mais aussi de sources non structurées (comme les réseaux sociaux, les images, les vidéos) et en temps réel (comme les flux de capteurs ou les transactions en ligne). Les entreprises cherchent donc à développer des systèmes capables de traiter et d'analyser ces types de données de manière efficace.
5. Challenges et Solutions
Mise à l’Échelle du ML : De nombreuses entreprises ont du mal à mettre en œuvre le machine learning à grande échelle, souvent parce qu'elles manquent de ressources ou de compétences pour gérer le cycle de vie complet du ML, de l'entraînement des modèles à leur déploiement et leur gestion. Le manque de centralisation des modèles entraîne également une inefficacité et une duplication des efforts.
Architecture Spaghetti : Pour remédier à l'architecture complexe et fragmentée, le rapport recommande l'adoption de plateformes unifiées comme le "Lakehouse", qui permettent de centraliser les données tout en offrant une flexibilité dans leur utilisation. Ces plateformes réduisent les coûts et simplifient les processus, facilitant ainsi l'innovation.
Normes Ouvertes : L'adoption de normes open source et de formats de données ouverts est cruciale pour permettre une meilleure interopérabilité entre les différents outils et technologies. Les normes ouvertes favorisent également l'innovation en permettant aux entreprises de combiner et de personnaliser les outils en fonction de leurs besoins spécifiques.
6. Perspectives Futures
Les stratégies de données évolueront vers des architectures ouvertes, sécurisées, et gouvernées, soutenues par des plateformes cloud. Cela permettra une plus grande efficacité dans la gestion des données et maximisera le potentiel d'innovation. Les organisations qui parviennent à créer des environnements de données robustes et bien gouvernés pourront exploiter pleinement le potentiel du ML et de l'IA pour obtenir des résultats commerciaux tangibles.
En somme, le rapport souligne que pour réussir dans l'ère numérique, les entreprises doivent non seulement investir dans les technologies de données et d'IA, mais aussi transformer leur culture et leur architecture technologique pour tirer le meilleur parti de ces investissements. La clé du succès réside dans l'intégration harmonieuse des données à travers l'organisation, soutenue par des plateformes avancées et une gouvernance rigoureuse.
Comentarios