Big Data: les 3 V

Petit article aujourd’hui sur le sujet des 3V du big data que nous avions évoqué il y a un moment maintenant lorsque l’on avait évoqué le théorème de CAP [1].

Le Big Data est devenu un sujet de plus en plus important pour les entreprises de toutes tailles et de tous secteurs. Les sources de données se multiplient et le besoin de les ingérer de plus en plus vite est un enjeu majeur pour être en mesure d’obtenir des informations précieuses sur les tendances et les habitudes de leur consommateurs.

Les 3V du Big Data, à savoir la vélocité, la variété et le volume, sont des caractéristiques essentielle afin de permettre a un système de se projeter a long terme sur les services qu’il devra assuré.

Voyons un peu plus en détail ces propriétés.

Vélocité

La vélocité est la vitesse à laquelle les données sont générées, collectées et traitées. Le traitement est pseudo-temps réel voir temps réel amenant la performance de traitement comme un axe essentiel.

Cette vélocité est lié a la nature des sources de données qui sont soient massivement exploités par les consommateurs comment les réseaux sociaux, ou simplement des informations issus de métriques produites par des objets connectés et des applications mobiles.

De manière a être le plus réactif possible, la vitesse de traitement de ces données doit être optimal pour prendre des décisions en temps réel et fournir une information la plus cohérente avec la situation actuelle.

Variété

La variété fait référence à la diversité des sources de données. Les données peuvent être structurées ou non structurées, et être stockées dans des formats différents.

Les données structurées sont organisées en tables ou suivent un schéma et sont facilement compréhensibles, tandis que les données non structurées sont plus difficiles à comprendre et nécessitent des outils de traitement de données avancés pour être utilisées efficacement. Les données semi-structurées se situent entre les deux, ce qui signifie qu’elles ont une certaine organisation, mais qu’elles peuvent également contenir des informations non structurées.

Cette variété bien que complexe a manipuler ou a croiser permet d’obtenir une image complète et précise du système observé, ce système pouvant être large puisque croisant a la fois des données internes ou externes.

Volume

Le volume fait référence à la taille des données. Les entreprises sont confrontées à des ensembles de données de plus en plus volumineux, ce qui peut rendre leur traitement et leur analyse difficile.

Le volume des données stockées est en pleine expansion : les données numériques créées dans le monde seraient passées de 1,2 zettaoctet par an en 2010 à 1,8 zettaoctet en 2011, puis 2,8 tettaoctets en 2012 et s’élèveront à 64 zettaoctets en 2020, et 2 142 zettaoctets en 2035. [2]

Les technologies de Big Data peuvent aider à gérer ces volumes de données en utilisant des systèmes de stockage distribués et de traitement parallèle tel que Hadoop [3] ou Spark [4] dont nous parlerons prochainement.

Conclusion

En conclusion, les 3 V du Big Data – Volume, Vitesse et Variété – sont des concepts clés pour comprendre la nature des problématiques du Big Data. Cela met en évidence les enjeux de la gestion de la data dans son utilisation comme element permettant de mettre en œuvre un processus décisionnel pour comprendre un marché et prendre des décisions éclairées.

Références

Laisser un commentaire