DIGITAL SOLUTIONS
« Accélérer la création de valeur grâce au Data Mesh »
Alberto Pan, Chief Technology Officer de Denodo, solution leader en gestion de la donnée, évoque avec nous les vertus d’une approche de gestion décentralisée de la donnée selon le concept de Data Mesh, pour accroître l’agilité des organisations « data driven », garantir la qualité de la donnée et en démocratiser l’accès à celle-ci.
January 19, 2023
Lorsqu’on évoque les enjeux d’analyse des données, le concept de Data Mesh n’est pas encore connu de tous. Pouvez-vous partager avec nous les grands principes qui le définissent ?
Le Data Mesh correspond à une nouvelle approche d’architecture et d’organisation. Le concept a été formalisé par Zhamak Dehghani, spécialiste de la gestion et de la valorisation des données. La promesse, derrière cette notion, est d’améliorer la création de valeur au départ de la donnée. Ce n’est pas un concept purement technique, mais plutôt une approche culturelle et organisationnelle de la gestion des données avec des implications technologiques fortes.
Quelle est la nouveauté derrière ce concept ?
Ce qui est nouveau, avec le Data Mesh, c’est l’idée d’opter pour une approche décentralisée pour ce qui relève de l’analyse des données, principalement au sein des grandes organisations. Traditionnellement, en matière de valorisation des données, ces structures s’appuient sur une infrastructure centralisée et une équipe unique dont la mission est de fournir aux décideurs les données utiles. Ce qui a souvent des limites. Avec Data Mesh, la donnée n’est plus produite et gérée de manière centralisée. La responsabilité inhérente à la production et la mise à disposition des données est placée au niveau de divers domaines, soit des départements, soit des unités business de l’entreprise. C’est à eux de gérer la donnée comme un produit et de la proposer directement à ceux qui pourraient en avoir besoin.
En quoi le concept de « data product » est important ?
Le concept de « data product » n’est pas nouveau. Au sein des organisations, on a pris conscience que la donnée est un actif précieux, qui permet de prendre de meilleures décisions. L’approche Data Mesh a surtout le mérite de clairement définir les composantes et les caractéristiques d’un « data product », de standardiser le concept. Ce qui est plus intéressant avec ce concept, c’est qu’il place la responsabilité de la donnée dans les mains de ceux qui en ont la compréhension la plus profonde : les métiers. Une équipe de gestion centralisée, en effet, n’a pas toujours en sa possession l’ensemble des éléments de contexte liés à la donnée exploitée. L’idée est de placer la responsabilité de la donnée dans les mains de ceux qui sont les mieux placés pour en préciser la valeur, qui ont la meilleure compréhension de la manière avec laquelle elle peut être valorisée et contribuer au business.
Pourquoi adopter une telle approche ? A quels enjeux répond-elle ?
Le concept de Data Mesh répond, selon moi, à deux problématiques principales rencontrées par les organisations. La première, c’est le manque d’agilité dans la mise à disposition de données répondant aux besoins du business. Les dirigeants, à tous les niveaux de l’entreprise, souhaitent appuyer leurs prises de décision sur des données. Cependant, les organisations, avec une approche centralisée, une équipe unique dédiée à l’analyse des données, peinent à démocratiser l’accès à la bonne information. Avec le modèle traditionnel, on est rapidement confronté à un problème de goulot d’étranglement, l’équipe centrale ne parvenant pas à répondre efficacement à des demandes croissantes. La deuxième problématique, comme nous l’évoquions, a trait à la qualité des données. La responsabilité de la donnée étant placée au niveau des métiers, on s’assure d’une meilleure compréhension de celle-ci et on peut veiller plus efficacement à sa qualité.
Dans quelle mesure le changement vers une méthode décentralisé/plus orientée métiers est-elle complexe ?
Cela dépend des organisations. Beaucoup, aujourd’hui, si elles disposent d’un niveau de maturité élevé en matière de gestion et de valorisation des données, appliquent déjà des principes proches de ceux établis au niveau de Data Mesh, souvent sans le savoir. Si elles ne les suivent pas à la lettre, elles ont déjà compris l’intérêt d’une approche décentralisée pour certains cas d’usage.
Le challenge est plus important pour des organisations s’appuyant sur un modèle traditionnel, centralisé. Il est à la fois organisationnel, culturel et technique. Au niveau organisationnel et culturel, d’abord, il faut parvenir à faire comprendre aux équipes l’intérêt de la démarche mais aussi faire évoluer les compétences en leur sein pour bien appréhender ces enjeux. Toutes les unités, dans l’entreprise, ne sont pas préparées à cela. Pour certaines, cela n’a d’ailleurs pas d’intérêt. A ce niveau, il faut donc faire évoluer l’organisation progressivement, en commençant par exemple par les équipes qui ont le niveau de maturité le plus élevé en la matière ou qui détiennent les données à forte valeur ajoutée pour l’ensemble de l’entreprise.
Quelle est le rôle de la technologie dans la mise en œuvre d’une telle approche ?
Pour mettre en œuvre une telle approche, il faut se départir d’une infrastructure monolithique, en déployant notamment un ensemble de nouveaux outils liés à la virtualisation de la donnée, des API ou encore un catalogue de données. Il faut intégrer une série de technologies pour faciliter la gestion de la donnée par les équipes et en simplifier l’accès pour l’ensemble des parties de l’organisation. Cette approche décentralisée est au fondement de Denodo. Notre plateforme facilite la mise en œuvre du concept de « Data Mesh » à l’échelle d’une organisation.
Si la décentralisation permet d’accéder à de nouvelles opportunités, la démarche n’implique-t-elle pas certains risques ?
Si. Décentraliser purement et simplement implique de nombreux risques, en matière de contrôle de la qualité de la donnée ou de sécurité par exemple. Le concept de Data Mesh, dès lors, établit une série de principes permettant d’appréhender ces risques. On peut notamment évoquer trois grands principes. L’approche définit clairement les caractéristiques d’un « data product », ce que chacun doit comporter chacun, ainsi qu’une série de bonnes pratiques associées à la production et à la gestion des données. Cela permet de garantir que les équipes ont la même compréhension de ce qu’est un data product et de veiller à ce que chacun d’eux puisse être trouvé et utilisé par ceux qui en ont besoin.
Quels sont les deux autres enjeux en matière de gestion des risques ?
Il s’agit aussi d’adopter une gouvernance commune des données. Chaque équipe a la liberté d’établir un certain nombre de règles associées à l’usage des données dont elle est responsable, parce qu’elle est la mieux placée pour établir les risques en matière de confidentialité ou de sécurité par exemple. Il est toutefois important d’établir une gouvernance globale, permettant de cadrer un ensemble d’éléments et de s’assurer d’une bonne utilisation des données à l’échelle de l’organisation tout entière. Enfin, il faut pouvoir s’appuyer sur une plateforme centralisée, facilitant la publication des données et leur utilisation. Si cette plateforme est gérée par une équipe centrale, son rôle évolue. Il ne lui appartient plus seulement de produire et de mettre la donnée à disposition, mais aussi d’assurer une bonne coordination de sa gestion, de supporter les unités désormais responsables des données, de veiller au respect des règles de gouvernance.
Data Mesh est un sujet important pour Denodo. Pouvez-vous nous dire pourquoi ?
Le concept de Data Mesh met l’accent sur une architecture distribuée de la gestion des données. Ce qui correspond à la vision de Denodo depuis la création de l’entreprise. La solution Denodo, en l’occurrence, répond naturellement aux enjeux que nous venons d’évoquer. Concrètement, grâce à la data virtualisation, elle permet d’accélérer la création et la mise à disposition de data products. Elle intègre un ensemble de fonctionnalités, et notamment une marketplace de la donnée, facilitant l’accès à la donnée pour les différentes parties de l’organisation. Enfin, elle offre la possibilité de mettre en œuvre des règles de gouvernance globale et d’en assurer le suivi.
Bien que le Data Mesh soit relativement nouveau, la méthode s’appuie sur d’autres approches distribuées, qui ont fait leurs preuves et ont résisté à l’épreuve du temps. Si vous voulez vraiment associer de la valeur aux données de l’entreprise, il semble qu’il n’y ait pas de meilleur moyen : il faut faire en sorte que cette valeur soit créée et entretenue par les personnes qui apportent cette valeur, c’est-à-dire les unités opérationnelles.
Pour cela, vous devez donc envisager de décentraliser votre gestion des données et de l’analyse, restructurer votre méthode de travail.
En tant que Denodo, nous avons toujours été un élément clé dans la mise en place d’une architecture de données distribuée, et il semble que les clients qui ont adopté le maillage de données progressent beaucoup plus rapidement que ceux qui ne l’ont pas (encore) fait.