Qu’est-ce que le DAMA-DMBOK ? Un guide pratique du Data Management Body of Knowledge
Le DAMA-DMBOK est un framework de référence largement reconnu pour la gestion des données. Il définit les principes, les pratiques et les fonctions qui sous-tendent tout programme de données mature. Ce guide couvre les 11 domaines de connaissances, la manière dont ils sont liés et comment les mettre en pratique.
- Qu’est-ce que le DAMA-DMBOK ?
- Les 11 domaines de connaissances du DAMA-DMBOK
- Appliquer le DAMA-DMBOK avec Snowflake
- Le DMBOK est exhaustif par nature
- Ressources
Le Data Management Body of Knowledge, ou DAMA-DMBOK® ou encore Référentiel des bonnes pratiques de gestion des données, offre aux équipes de gestion des données, aux CDO et aux professionnels de la gouvernance un langage commun et une cartographie structurée de la discipline au sein d’un framework de gouvernance des données plus large. Il est intentionnellement non prescriptif. Il définit ce que les entreprises doivent aborder, sans pour autant dicter la manière de le faire. Cela le rend applicable à tous les secteurs, à tous les stacks technologiques et aux entreprises de toutes tailles.
Les équipes mettent généralement en œuvre le DAMA-DMBOK par phases. Elles donnent la priorité aux domaines de connaissances les plus pertinents face à leurs contraintes réglementaires, opérationnelles ou stratégiques immédiates, puis étendent la couverture à mesure que le programme gagne en maturité.
Avec le DMBOK 3.0 en cours de développement pour 2026, le framework évolue pour intégrer la gouvernance de l’IA, la gestion des données pour le machine learning et les architectures cloud modernes. Ses principes restent ainsi ancrés dans les réalités auxquelles les équipes data sont confrontées aujourd’hui.
Qu’est-ce que le DAMA-DMBOK ?
Le DMBOK est le framework de référence mondialement reconnu de DAMA International pour la gestion des données. Il définit les principes, les pratiques et les fonctions fondamentales dont les professionnels de la data et les entreprises ont besoin pour créer et maintenir des programmes de gestion des données efficaces. Il constitue également la base de connaissances fondamentale de la certification CDMP (Certified Data Management Professional), un titre professionnel largement reconnu dans le domaine de la gestion des données.
Alors que des frameworks comme le DCAM fournissent un modèle structuré d’évaluation de la maturité, le DMBOK est un corpus de connaissances. Il s’agit d’une référence exhaustive qui définit ce que recouvre la gestion des données, à quoi ressemblent les bonnes pratiques dans chaque discipline et comment les fonctions interagissent.
Quelques limites importantes méritent d’être soulignées :
- Le DMBOK n’est pas un modèle de maturité. Il n’évalue pas les entreprises par rapport à des niveaux définis et ne produit pas d’analyse des écarts. Les entreprises qui ont besoin de ce type de résultat associent généralement le DMBOK à un framework d’évaluation tel que le DCAM.
- Le DMBOK n’est pas une obligation de conformité. Il s’aligne sur les exigences réglementaires, mais n’est pas juridiquement contraignant.
- Le DMBOK n’est pas un manuel de technologie. Il ne recommande pas d’outils ni de plateformes spécifiques.
Au centre du framework DMBOK se trouve la gouvernance des données, la fonction qui sous-tend et relie tous les autres domaines de connaissances. DAMA représente cela visuellement sous la forme de la roue DAMA, avec la gouvernance des données comme moyeu central et les 11 domaines de connaissances rayonnant autour d’elle.
Les 11 domaines de connaissances du DAMA-DMBOK
Le DMBOK organise la gestion des données en 11 domaines de connaissances interconnectés. Chaque chapitre du framework couvre les moteurs économiques, les concepts essentiels, les activités, les outils et les conseils de mise en œuvre pour ce domaine.
| Domaine de connaissances | Ce qu’il recouvre |
|---|---|
| Gouvernance des données | Politiques, droits de décision, rôles et structures de responsabilité pour gérer les données en tant qu’actif stratégique |
| Architecture de données | Structures de données d’entreprise, modèles et frameworks qui alignent la conception des données sur la stratégie commerciale |
| Modélisation et conception des données | Modèles de données conceptuels, logiques et physiques qui prennent en charge l’intégration, les opérations et l’analytique |
| Stockage de données et opérations | Conception du stockage physique, gestion des bases de données, performances et prise en charge opérationnelle des données structurées |
| Sécurité des données | Confidentialité, contrôle d’accès et protection des données tout au long de leur cycle de vie |
| Intégration des données et interopérabilité | Processus et techniques de déplacement, de consolidation et de transformation des données entre les systèmes |
| Gestion des documents et du contenu | Gestion des données non structurées et semi-structurées, y compris les documents, les archives et le contenu numérique |
| Données de référence et données de base | Gestion des données partagées faisant autorité, y compris les données de base (clients, produits) et les données de référence (codes, classifications) |
| Data warehousing et Business Intelligence | Planification, mise en œuvre et gestion de l’infrastructure de données analytiques et du reporting |
| Métadonnées | Collecte, gestion et utilisation des données concernant les données : définitions, traçabilité, classification et contexte |
| Qualité des données | Définition, mesure et amélioration de l’exactitude, de l’exhaustivité, de l’homogénéité et de la pertinence des données |
Appliquer le DAMA-DMBOK avec Snowflake
Les 11 domaines de connaissances du DMBOK peuvent être alignés sur les capacités disponibles dans Snowflake. Cela offre aux équipes un cheminement pratique pour passer des principes du framework à la mise en œuvre opérationnelle.
Gouvernance des données
Snowflake Horizon Catalog offre une gouvernance intégrée pour les données, les applications et les modèles. Le contrôle d’accès unifié (RBAC et ABAC), l’Object Tagging, la Data Classification pour les données sensibles, le Dynamic Data Masking, les Row Access Policies et la traçabilité des données de bout en bout permettent d’opérationnaliser certains des aspects du domaine de connaissances de la gouvernance du DMBOK. Ils traduisent les droits de décision et les frameworks de politiques en contrôles appliqués et auditables.
Métadonnées
Horizon Catalog maintient des métadonnées homogènes sur les données natives de Snowflake, les tables Apache Iceberg et les sources externes. Universal Search permet de découvrir les actifs de données en langage naturel. De plus, les descriptions d’objets générées par l’IA et la gestion de la traçabilité des données prennent en charge les pratiques de gestion des métadonnées définies par le DMBOK, notamment la classification, la provenance et le contexte stratégique.
Sécurité des données
Les fondations de sécurité de Snowflake incluent des politiques réseau, la gestion des identités, un RBAC centralisé, la classification automatique des données sensibles et la surveillance continue des risques. Snowflake dispose des certifications SOC 2 Type II, PCI DSS, FedRAMP Moderate et High, ISO 27001 et HITRUST. L’entreprise aide ainsi les organisations à répondre aux exigences réglementaires décrites dans le domaine de connaissances de la sécurité des données du DMBOK. »
Qualité des données
La surveillance de la qualité des données de Snowflake utilise des fonctions de métriques de données (DMF) intégrées et personnalisées pour mesurer en continu les dimensions de la qualité sur l’ensemble du parc de données. Les résultats s’affichent dans une vue de centralisée facilitant une surveillance continue. Cela permet de respecter les recommandations de mesure et d’amélioration définies par le DMBOK pour le domaine de connaissances de la qualité des données.
Intégration des données et interopérabilité
Snowpipe (ingestion continue), Streams (capture des données modifiées) et la prise en charge native d’Apache Iceberg via Horizon Catalog et Apache Polaris répondent au domaine de connaissances de l’intégration et de l’interopérabilité du DMBOK. Ils permettent le déplacement des données entre les sources tout en maintenant la gouvernance et la traçabilité des données.
Data warehousing et Business Intelligence
L’architecture partagée multi-cluster de Snowflake, qui sépare le calcul du stockage, fournit l’infrastructure analytique décrite dans le domaine de connaissances du data warehousing et de la Business Intelligence du DMBOK. Elle est évolutive sur AWS, Azure et Google Cloud, et prend en charge un vaste écosystème d’outils de BI et d’analytique.
Le DMBOK est exhaustif par nature
L’étendue du DMBOK (11 domaines de connaissances et des centaines de pages de conseils) peut sembler écrasante pour les organisations qui commencent tout juste à développer leur stratégie de gestion des données. Mais la vaste portée du DMBOK est aussi ce qui fait sa pérennité. En définissant ce que la discipline englobe plutôt qu’en prescrivant la manière de l’exécuter, le DMBOK s’applique à des organisations de tailles, de secteurs et d’environnements technologiques très différents. Les équipes qui en retirent le plus de bénéfices l'utilisent comme un fondement pour fédérer les parties prenantes autour d'une vision commune, définir les priorités et créer des programmes de gestion des données qui réussissent sur le long terme.
