Pourquoi mettre en place une démarche de Data Discovery est indispensable à l’amélioration de la cartographie des données ?
Ce contenu sur la démarche Data Discovery fait partie de notre dossier sur le Data Catalog.
La cartographie des données est le processus de visualisation et de représentation graphique des relations, des structures et des attributs des données. Elle permet de créer une représentation visuelle claire et compréhensible des données, facilitant ainsi leur exploration, leur analyse et leur interprétation. C’est un outil clé de la gouvernance de données qui répond à des enjeux de sécurité numérique importants.
Dans l’optique de lutter contre ce phénomène, l’Union Européenne (UE) a légiféré pour instaurer un environnement digital fiable et sécurisé sur son territoire. Ainsi, les équipes chargées de la sécurisation du Système d’Information et/ou de la protection des données à caractère personnel sont de plus en plus soumises à une forte pression pour se conformer à des réglementations complexes (Directive NIS 1-2 « Network and Information Security », Réglementation RGPD « Règlement Général sur la Protection des Données », etc.)
e phénomène de cyber-attaques est mondial. Chaque année, le nombre d’attaques informatiques contre les entreprises, les collectivités locales et les hôpitaux ne cessent d’augmenter. Les victimes de piratage informatique constatent généralement une intrusion dans leur système d’information, un fonctionnement boqué ou un vol de données.
Selon une étude de l’entreprise de cybersécurité SurfShark sur le dernier trimestre 2022, la France se hisse en première place en densité de fuites de données. En moyenne, l’hexagone compte 212 comptes en fuite pour 1000 personnes.
De même, la valorisation de la donnée est devenue un nouvel enjeu structurel de toute organisation. La donnée est devenue un élément fondamental mais demeure encore complexe dans la gestion de son cycle de vie. Mais par manque de connaissance, sa valorisation peut ressembler un peu à la quête du Graal. En effet, les équipes dédiées à la valorisation des données ou à l’innovation passent une grande partie de leur temps à rechercher et trouver la bonne information.
La data discovery permet de simplifier la navigation dans les données et de les rendre plus accessibles à l’ensemble des utilisateurs. La connaissance et la valorisation du patrimoine de données sont des enjeux de plus en plus importants pour les DSI et RSSI. Ils sont renforcés par de nombreux facteurs comme le RGPD, la cybersécurité, la sobriété numérique ou la volonté de mettre à disposition un portail de données.
Gain de temps et de productivité
Identification des risques
Amélioration de la prise de décision
Facilitation de l'accès aux données
Amélioration de la collaboration interne
Jusqu’ici, les méthodologies de catalogage des données sont généralement basées sur des processus manuels. Aussi, au regard des ressources humaines nécessaires, les organisations ont beaucoup de mal à maintenir le catalogage des données à jour; ceci en raison de la complexité grandissante des réglementations, des technologies et des formats de sources de données disparates.
Dans la mise en œuvre d’un référentiel de données, la difficulté rencontrée n’est pas un problème technique/informatique mais bien dans la collaboration et le réalignement des données entre métiers et gouvernance.
Un tiers peut en effet selon le métier s’appeler Client, Usager, Fournisseur, Collaborateur, Magasin, … . Aussi, une fois la solution de référentiel définie et choisie, comment trouver et localiser les applications et sources de données qui traitent de Tiers et qu’il faut connecter au service ? Pour résoudre cette problématique, il existe 2 solutions :
Comprendre les traitements associés aux données (qu’elles soient personnelles ou non, sensibles ou simplement métier). La plupart des organisations commenceront par des méthodes semi-automatiques pour établir cette cartographie et l’amélioreront à l’aide de services collaboratives et également de découverte de données automatisée.
Des outils de découverte de données tels que MyDataCatalogue permettent désormais aux équipes chargées de la sécurisation, de la valorisation ou de la protection des données de mieux comprendre les données à disposition, en leur fournissant du contexte et en les conceptualisant automatiquement. La récupération du contexte comme l’origine des sources de données permet d’effectuer rapidement un premier classement automatique; ceci en associant un niveau de sensibilité/criticité aux applications utilisées, aux utilisateurs créateurs des données, à l’emplacement de stockage.
Contrôles, vérifications, alertes, traçabilité des actions et des flux…
Aide à la saisie, automatisation, enrichissement, mise en perspective, corrélation…
Listes toujours à jour, flexibilité, modifications des flux…
Connectivité bidirectionnelle, intégration dans l’entreprise étendue
Editique des informations sous les formats souhaités (Excel, PDF, Word…)
Alertes en temps réelles, sondes sur les procédures critiques, KPI, simulation des scénarios lors du traitement d’une alerte
Au sein de notre plateforme Phoenix, la Data Discovery s’intègre nativement grâce à notre outil MyDataCatalogue pour cartographier l’intégralité de vos données
Ce module assure l’interopérabilité des données et la capacité des métiers à disposer en temps réel de toute la data utile. Acteurs de l’utilisation du Data Catalog et principaux destinataires de la donnée, les services métiers se libèrent des contraintes techniques pour se concentrer sur leurs activités.