Pour tester votre consultant data, ou simplement pour enrichir votre lexique data, nous avons décidé de vous livrer un glossaire des termes à connaître absolument.
Dark Data
Les dark data sont l’ensemble des informations que les organisations stockent, mais qu’elles ne connaissent pas. Elles représentent, d’après le Bureau Véritas près de 50% des données d’une entreprise. Elles peuvent être des documents, des données conversationnelles ou des médias.
Les entreprises pourraient découvrir de nouvelles opportunités si elles parvenaient à les exploiter
Data lake
Littéralement traduit “lac de données”, le data lake est un socle de données permettant de stocker un très important volume de données brutes (dans leur format d’origine) pour une durée indéterminée. Les données structurées et non structurées se côtoient. C’est une solution pertinente pour les entreprises qui ont besoin de stocker beaucoup de data. Encore faut-il pouvoir maîtriser ce type de stockage. Pour en savoir plus, nous vous invitons à revoir notre article à ce sujet : le Data Lake comme référentiel opérationnel, bonne idée ? |
Data puking
Le data puking se définit comme une profusion de données. C’est le fait de disposer d’une multitude de data, de ne pas savoir les hiérarchiser, de ne pas en extraire la valeur et de vouloir absolument toutes les utiliser. Cela aboutit finalement à perdre du temps, perdre de vue les objectifs et ne donner aucun résultat concret. Gilles Fiolet, Directeur Offres et Innovation, en parle très bien dans cette vidéo : du Data Puking au Data Storytelling.
Open Data
Les open data (ou données ouvertes) sont des datas accessibles, utilisables et partageables par tout le monde. Selon la définition donnée par l’Open Knowledge Foundation, les critères caractérisant les open data sont les suivants :
- Disponibilité et accès : les données doivent être pleinement accessibles, leur forme doit être confortable et modifiable facilement.
- Réutilisation et redistribution : les conditions de mise à disposition des data doivent permettre leur réutilisation et leur redistribution et pouvant se mélanger avec d’autres données.
- Participation universelle : tout le monde doit être en mesure d’utiliser et de redistribuer les données, sans restrictions.
Certaines entreprises ou organismes publics, comme la SNCF ou l’INSEE mettent ainsi leurs données à disposition des acteurs économiques.
Data for & from IoT
Ce sont toutes les données générées pour ou par l’Internet des Objets. Ces data méritent d’être exploitées, car elles sont utiles pour définir des tendances et fournissent des informations précieuses. Comme le nombre d’objets connectés ne cesse d’augmenter, il est donc nécessaire de disposer d’outils capables de gérer ces volumes de données.
Chaîne de valeur Data
Les chaines de valeur Data permettent de faire apparaître les liens entre les processus de l’entreprise par la data qu’ils partagent. Une chaine de valeur porte également un enjeu / un objectif de l’entreprise (exemple :améliorer la valorisation des stocks) |
Data mesh
C’est une approche architecturale qui décentralise la gestion des données en attribuant la propriété et la responsabilité des données à des domaines spécifiques au sein d’une organisation en favorisant la diffusion de la culture data, ainsi que l’agilité et l’innovation à grande échelle
LLM
Il s’agit d’un modèle d’intelligence artificielle capable de comprendre et de générer du langage humain à grande échelle. Son intérêt pour une organisation réside dans sa capacité à automatiser des tâches linguistiques complexes, à améliorer la communication avec les clients et à analyser de vastes ensembles de données textuelles pour fournir des informations précieuses.
Data literacy
Il s’agit de la base de la culture Data dans l’entreprise : La data literacy désigne la capacité des individus à comprendre, interpréter et communiquer efficacement avec les données. Pour une entreprise, cela signifie que ses employés sont capables d’analyser les données de manière critique, de prendre des décisions éclairées et de collaborer de manière plus efficace, ce qui conduit à une meilleure performance organisationnelle et à une innovation accrue |
Data quality by design
Elle consiste à intégrer la qualité des données dès la conception des applications et tout au long du cycle de vie de la donnée. Pour une entreprise, cela garantit que les données utilisées pour prendre des décisions sont fiables, précises et pertinentes. Cela réduit les erreurs, améliore la confiance dans les informations et permet une meilleure prise de décision, ce qui peut conduire à une plus grande efficacité opérationnelle.
Data storytelling
Pour une communication impactante et engageante, il est nécessaire de raconter une histoire adaptée à notre cible. Il est donc indispensable de proposer des visualisations graphiques qui ne laissent pas de place aux doutes.
Data centric
Avoir une approche data centric consiste à répondre à la stratégie de l’entreprise par l’usage, la gouvernance et la qualité des données et en la valorisant dans tous les processus de l’organisation.
Maintenant que vous êtes au point sur le lexique de la data. Apprenez-en plus sur la data et son environnement consultez nos autres articles !