banner

Blog

Dec 10, 2023

Comment expliquer les maillages de données, les structures et les nuages

Par Isaac Sacolick

Rédacteur collaborateur, InfoWorld |

Votre PDG sait ce qu'est une base de données et pense probablement qu'un entrepôt de données est un grand coffre-fort de données utilisé pour le reporting et l'analyse. Ils connaissent peu les magasins de données NoSQL, pourquoi ils ont besoin d'un cluster Spark ou comment les lacs de données sont utilisés pour ingérer des données structurées et non structurées.

Les PDG et les chefs d’entreprise se concentrent sur la valeur commerciale des données, de l’analyse et de l’apprentissage automatique et se soucient moins des technologies sous-jacentes.

Mais c’est là un paradoxe, car ils veulent comprendre l’intérêt d’investir du temps et de l’argent dans les nouvelles technologies. Essayez d'expliquer les dernières technologies de gestion de données, notamment les maillages de données, les structures de données et les nuages ​​de données distribués, et observez la tête qui tourne dans votre PDG.

Il ne s’agit pas seulement des PDG. La technologie des données a explosé depuis les débuts du Web, lorsque le principal débat était de savoir s'il fallait construire votre entrepôt de données sur Oracle, Microsoft ou open source. Aujourd'hui, de nombreux responsables non informatiques se contentent de croire que les données sont « dans le cloud » et que l'intégration, la qualité et les performances des données sont des « problèmes informatiques ».

Toute personne travaillant avec des données doit être prête à expliquer les technologies et pratiques les plus critiques dans un langage accessible. Dans mon livre, Digital Trailblazer, je partage une histoire expliquant ce qu'est un cookie de navigateur aux membres du conseil d'administration de notre startup lorsque le Web était nouveau. On ne sait jamais quand on vous remettra le micro pour répondre à une question technique. Répondre avec du technobabble peut facilement dissuader ou ralentir des investissements clés.

Gordon Allott, président et PDG de K3, suggère de commencer par une réponse simple : « Le lac de données, l'entrepôt de données, le maillage et la structure font tous simplement référence à la stratégie globale en matière de données de l'entreprise. »

Il est important de donner des réponses simples, mais ce n'est souvent pas suffisant. Lorsqu'un cadre me pose des questions sur un terme technique, je souhaite répondre à la question d'une manière qui encourage la curiosité et les questions de suivi.

Commençons par expliquer ce qu'est un maillage de données. Steven Lin, responsable marketing produit chez Semarchy, a partagé cette réponse concise : « Un maillage de données est une approche décentralisée de la gestion des données, dans laquelle plusieurs équipes au sein d'une entreprise sont responsables de leurs propres données, favorisant la collaboration et la flexibilité », a-t-il déclaré.

Il n'y a pas de mots complexes dans cette définition, et elle présente les problèmes que les maillages de données visent à résoudre, le type de solution et pourquoi elle est importante.

Attendez-vous cependant à ce qu'on vous demande plus de détails techniques, surtout si le cadre a une connaissance préalable d'autres technologies de gestion de données. Par exemple : « Les entrepôts de données et les lacs de données n'étaient-ils pas censés résoudre le problème de la gestion des données ?

Cette question peut être un piège si vous y répondez avec les différences techniques entre les entrepôts de données, les lacs et les maillages. Concentrez plutôt votre réponse sur l’objectif commercial.

Satish Jayanthi, co-fondateur et CTO de Coalesce, propose cette suggestion : « La qualité des données affecte souvent l'exactitude des analyses commerciales et de la prise de décision. En mettant en œuvre des paradigmes de maillage de données, la qualité et la précision des données peuvent être améliorées, ce qui se traduit par une confiance accrue parmi les entreprises pour utiliser les données plus largement pour une prise de décision éclairée.

J'aime cette réponse et j'espère que l'exécutif souhaite approfondir la manière dont les paradigmes de maillage de données contribuent à améliorer la qualité des données. Jayanthi répond : « L'un des principes fondamentaux, la propriété du domaine, garantit que l'équipe produisant les données est responsable de la qualité et de l'exactitude. Ce principe des données en tant que produit garantit que les données partagées avec d’autres groupes sont exactes, réutilisables, auto-documentées et répondent à des normes élevées.

Si vous êtes nouveau dans les maillages de données et que vous souhaitez vous plonger dans les détails techniques, je vous suggère de consulter l'article crucial de Zhamak Dehghani sur le passage d'un lac de données monolithique à un maillage de données distribué.

PARTAGER