BLOG

Lexique data : votre consultant maîtrise-t-il le jargon ?

Pour tester votre consultant data, ou simplement pour enrichir votre lexique data, nous avons décidé de vous livrer un glossaire des termes à connaître absolument.

Dark Data

Les dark data sont l’ensemble des informations que les organisations stockent, mais qu’elles ne connaissent pas. Elles représentent, d’après le Bureau Véritas près de 50% des données d’une entreprise. Elles peuvent être des documents, des données conversationnelles ou des médias.
Les entreprises pourraient découvrir de nouvelles opportunités si elles parvenaient à les exploiter

Data lake

Littéralement traduit “lac de données”, le data lake est un socle de données permettant de stocker un très important volume de données brutes (dans leur format d’origine) pour une durée indéterminée. Les données structurées et non structurées se côtoient. C’est une solution pertinente pour les entreprises qui ont besoin de stocker beaucoup de data. Encore faut-il pouvoir maîtriser ce type de stockage. Pour en savoir plus, nous vous invitons à revoir notre article à ce sujet : le Data Lake comme référentiel opérationnel, bonne idée ?

Data puking

Le data puking se définit comme une profusion de données. C’est le fait de disposer d’une multitude de data, de ne pas savoir les hiérarchiser, de ne pas en extraire la valeur et de vouloir absolument toutes les utiliser. Cela aboutit finalement à perdre du temps, perdre de vue les objectifs et ne donner aucun résultat concret. Gilles Fiolet, Directeur Offres et Innovation, en parle très bien dans cette vidéo : du Data Puking au Data Storytelling.

Open Data

Les open data (ou données ouvertes) sont des datas accessibles, utilisables et partageables par tout le monde. Selon la définition donnée par l’Open Knowledge Foundation, les critères caractérisant les open data sont les suivants :

  • Disponibilité et accès : les données doivent être pleinement accessibles, leur forme doit être confortable et modifiable facilement.
  • Réutilisation et redistribution : les conditions de mise à disposition des data doivent permettre leur réutilisation et leur redistribution et pouvant se mélanger avec d’autres données.
  • Participation universelle : tout le monde doit être en mesure d’utiliser et de redistribuer les données, sans restrictions.

Certaines entreprises ou organismes publics, comme la SNCF ou l’INSEE mettent ainsi leurs données à disposition des acteurs économiques.

Data for & from IoT

Ce sont toutes les données générées pour ou par l’Internet des Objets. Ces data méritent d’être exploitées, car elles sont utiles pour définir des tendances et fournissent des informations précieuses. Comme le nombre d’objets connectés ne cesse d’augmenter, il est donc nécessaire de disposer d’outils capables de gérer ces volumes de données.

Chaîne de valeur Data

Les chaines de valeur Data permettent de faire apparaître les liens entre les processus de l’entreprise par la data qu’ils partagent. Une chaine de valeur porte également un enjeu / un objectif de l’entreprise (exemple :améliorer la valorisation des stocks)

Data mesh

C’est une approche architecturale qui décentralise la gestion des données en attribuant la propriété et la responsabilité des données à des domaines spécifiques au sein d’une organisation en favorisant la diffusion de la culture data, ainsi que l’agilité et l’innovation à grande échelle

LLM

Il s’agit d’un modèle d’intelligence artificielle capable de comprendre et de générer du langage humain à grande échelle. Son intérêt pour une organisation réside dans sa capacité à automatiser des tâches linguistiques complexes, à améliorer la communication avec les clients et à analyser de vastes ensembles de données textuelles pour fournir des informations précieuses.

Data literacy

Il s’agit de la base de la culture Data dans l’entreprise :
La data literacy désigne la capacité des individus à comprendre, interpréter et communiquer efficacement avec les données. Pour une entreprise, cela signifie que ses employés sont capables d’analyser les données de manière critique, de prendre des décisions éclairées et de collaborer de manière plus efficace, ce qui conduit à une meilleure performance organisationnelle et à une innovation accrue

Data quality by design

Elle consiste à intégrer la qualité des données dès la conception des applications et tout au long du cycle de vie de la donnée. Pour une entreprise, cela garantit que les données utilisées pour prendre des décisions sont fiables, précises et pertinentes. Cela réduit les erreurs, améliore la confiance dans les informations et permet une meilleure prise de décision, ce qui peut conduire à une plus grande efficacité opérationnelle.

Data storytelling

Pour une communication impactante et engageante, il est nécessaire de raconter une histoire adaptée à notre cible. Il est donc indispensable de proposer des visualisations graphiques qui ne laissent pas de place aux doutes.

Data centric

Avoir une approche data centric consiste à répondre à la stratégie de l’entreprise par  l’usage, la gouvernance et la qualité des données et en la valorisant dans  tous les processus de l’organisation.

Maintenant que vous êtes au point sur le lexique de la data. Apprenez-en plus sur la data et son environnement consultez nos autres articles !