En août 2020, avec mon employeur, Groupe Neos, j’ai animé un webinaire sur la gouvernance de données. Pour ceux qui veulent l’écouter au complet, allez au bas de l’article. Le but est de vous résumer l’essence de ce vidéo.
J’aime toujours commencer avec de bons fondements, donc débutons avec une définition de la gouvernance de données :
Elle est un ensemble de pratiques et de principes qui assure la qualité de l’entièreté du cycle de vie des données
Le point important à retenir est qu’on veut améliorer la qualité du processus (e.g. Comment les données sont gérées) des données ainsi que les données elles-mêmes.
Pourquoi c’est important
Maintenant qu’on en connait davantage sur la gouvernance de données, regardons pourquoi vous devriez porter attention et allouer des ressources pour l’améliorer :
Augmentation de la quantité et variété de données
Parce que la quantité et la variété de données traitée est plus grande qu’auparavant. Pour vous donner une idée, il est estimé qu’en 2020, 1,7 Mo de données est créé chaque seconde pour chaque personne sur la Terre (Source: Domo report 2018) C’est gigantesque! La variété aussi est importante, maintenant les données n’apparaissent pas toujours de manière structurée. On analyse les données des réseaux sociaux, des courriels ou nos logs applicatifs.
Réglementation
En tant qu’entreprise qui collecte des données sensibles, on veut être certain que ces données sont protégées. Les différents gouvernements ont mis en place lors des dernières années plusieurs réglementations sur la protection des données personnelles (e.g. PIPEDA, GDPR) ou sur la certification des données financières (e.g. SoX, loi C-198). Ne pas se soumettre à ces réglementations amène une mauvaise image de votre entreprise ainsi que des pénalités financières.
Interprétation des données
Finalement, l’entreprise veut utiliser les données comme actif pour la transformer en informations et elle veut être capable de capitaliser sur les données et leur valeur. Une bonne gouvernance des données permet de mieux comprendre le chemin des données de bout en bout, car c’est très rare que les données sont utilisées à leur aspect brut, on va les filtrer, les agréger et les mélanger à d’autres sources.
Le modèle de maturité
Pour bien évaluer la progression de votre entreprise en termes de gouvernance de données, vous pouvez utiliser le modèle suivant. Il permet d’évaluer votre maturité, ainsi vous avez des barèmes et vous pouvez montrer votre évolution. Il est possible que votre entreprise ait des traits qui font partie de plusieurs niveaux. Les prochaines sections de l’article vont détailler chaque niveau.
Modèle de maturité de Gouvenance des données de la part de Gartner
Niveau 0 – Ignorance
À ce niveau, l’entreprise ne compte pas ou peu de processus de gouvernance de données. C’est souvent une initiative personnelle. Quelqu’un dans l’entreprise veut démarrer l’initiative et la vendre à l’entreprise. À cette étape, il est important de déterminer pourquoi on devrait adopter une stratégie de gouvernance de données. Le pourquoi rend plus facile la promotion du projet aux exécutifs. Voici quelques exemples d’objectifs :
- Conformité aux normes légales, attention grande à la sécurité et à la gouvernance des données
- Utiliser les données pour améliorer la prise de décision en améliorant le degré de confiance des informations utilisées (Qualité de données)
- Améliorer l’efficacité opérationnelle de l’entreprise
Niveau 1 – Conscience
Au niveau 1, l’entreprise réalise l’importance d’une bonne gouvernance de données. On commence à remarquer davantage les problèmes et on veut y remédier. À cette étape, on doit commencer notre business case avec nos raisons établies à l’étape 0 et les bénéfices qu’on veut obtenir grâce à cette initiative, voici quelques exemples :
- Mieux comprendre vos données (e.g. d’où viennent-elles, quelles transformations sont effectuées)
- Amélioration de la qualité de données
- Faciliter la gestion des données
- Responsabiliser les acteurs propriétaires de la donnée
Niveau 2 – Réactif
À cette étape, on commence à exécuter notre stratégie et les ressources et le soutien exécutif sont là. Un des points intéressants à ce point est qu’on commence à avoir quelques règles de gouvernance, mais celles-ci peuvent être ignorées lors de problèmes ou d’urgences. L’entreprise commence aussi à avoir quelques pratiques en place, comme celles-ci :
- Découverte des données et cartographie : Avoir un inventaire des données de l’organisation pour faciliter la recherche de données et la formation de nouvelles ressources
- Inventaire et gestion des métadonnées : Il s’agit des données sur les données, il en existe deux types, business et techniques. Les métadonnées techniques sont la documentation des tables, des champs, des types de données, les transformations effectuées. Les métadonnées business sont les définitions et l’utilisation des données.
Niveau 3 – Proactif
On entre dans un niveau important, la gouvernance des données est prise au sérieux et on voit davantage de bénéfices. On voit une grande diminution du risque opérationnel. L’entreprise répond aux exigences des réglementations et même davantage. Elle réussit à implémenter la gouvernance à même ses projets internes. La sécurité n’est plus une réflexion qu’on fait quand le projet est près de la livraison. Les rôles et responsabilités en termes de gouvernance sont très claires à ce niveau.
Niveau 4 – Géré
Au niveau 4, l’entreprise veut poursuivre sur sa lancée et que les efforts restent constants. C’est pour cette raison que la gouvernance de données est un processus et non un projet, il faut que l’entreprise cherche toujours à s’améliorer. Pour s’améliorer, il faut se mesurer, à cette étape, l’entreprise intégré des indicateurs de performance tel que des niveaux de service (SLA) sur la qualité des données présentée aux utilisateurs.
Niveau 5 – Efficace
Au niveau 5, on est au plus haut. L’entreprise a atteint les buts fixés par la stratégie de gouvernance de données. Elle utilise les données comme avantage compétitif et n’hésite pas à se comparer à ses compétiteurs. Il s’agit d’une entreprise Data Driven qui croit aux données et qui a une politique sérieuse pour la gestion et l’utilisation de celles-ci.
Rôles et responsabilités
En gouvernance de données, on retrouve 3 niveaux de rôles et responsabilités, ceux-ci cadrent avec les niveaux auxquels ils doivent intervenir. La prochaine image illustre le tout.
Maintenant regardons chaque rôle plus en détails :
- Data Governance Board : Ce conseil est responsable de l’évolution de la stratégie de gouvernance de données. Les membres se rencontrent de façon périodique pour discuter des enjeux de données. Le groupe est homogène et comprend des gens avec des rôles différents pour donner une légitimité au conseil grâce à une présence exécutive et de l’information sur les problèmes rencontrés chaque jour grâce à l’ajout de gens près des opérations.
- Data Steward : Ils sont responsables de la qualité et de la définition des données. La clé dans ce rôle est que la personne fasse partie de la business et d’être un expert dans son domaine.
- Data Custodians : Il s’agit des gens techniques (développeurs, analystes, administrateurs de bases de données) qui accède et opère vos données. Ils sont responsables du transport, du stockage des données et de l’implémentation des règles d’affaires.
Conclusion
J’espère que cet article va vous en avoir appris davantage sur la gouvernance de données et vous donne envie d’en savoir plus. Je vous invite à consulter le webinaire entier où je traite aussi des technologies intéressantes sur le marché et je réponds aux questions des participants. Pour accéder à la vidéo, simplement cliquer sur l’onglet ci-dessous.
Bon visionnement !