Le terme Big Data est de plus en plus utilisé presque partout sur la planète - en ligne et hors ligne. Et ce n'est pas lié uniquement aux ordinateurs. Il s’agit d’un terme générique appelé «technologie de l’information», qui fait désormais partie de presque toutes les autres technologies, domaines d’études et entreprises. Big Data n'est pas un gros problème. Le battage médiatique qui l’entoure est un sacré truc pour vous embrouiller. Cet article examine ce qu'est le Big Data. Il contient également un exemple de la façon dont NetFlix a utilisé ses données, ou plutôt le Big Data, pour mieux répondre aux besoins de ses clients.
Qu'est-ce que le Big Data?
Les données stockées dans les serveurs de votre entreprise étaient des données qui ont été classées et classées jusqu'à hier. Soudainement, l'argot Big Data est devenu populaire et maintenant, les données de votre entreprise sont des Big Data. Le terme couvre toutes les données que votre organisation a stockées jusqu'à présent. Cela inclut les données stockées dans les nuages et même les URL que vous avez ajoutées aux favoris. Votre entreprise n’a peut-être pas numérisé toutes les données. Vous n'avez peut-être pas déjà structuré toutes les données. Mais alors, toutes les données numériques, papiers, structurées et non structurées de votre entreprise sont désormais des Big Data.
En bref, toutes les données - classées ou non - présentes sur vos serveurs sont collectivement appelées BIG DATA. Toutes ces données peuvent être utilisées pour obtenir des résultats différents en utilisant différents types d’analyses. Il n'est pas nécessaire que toutes les analyses utilisent toutes les données. Les différentes analyses utilisent différentes parties de BIG DATA pour produire les résultats et les prévisions nécessaires.
Les données volumineuses sont essentiellement les données que vous analysez pour obtenir des résultats que vous pouvez utiliser pour les prévisions et autres utilisations. Lorsque vous utilisez le terme Big Data, votre société ou votre organisation travaille avec les technologies de l'information de haut niveau pour déduire différents types de résultats en utilisant les mêmes données que vous avez stockées intentionnellement ou non au fil des années.
Quelle est la taille du Big Data
En gros, toutes les données combinées sont du Big Data, mais de nombreux chercheurs s'accordent à dire que le Big Data - en tant que tel - ne peut pas être manipulé à l'aide de feuilles de calcul normales et d'outils de gestion de base de données classiques. Ils ont besoin d’outils d’analyse spéciaux comme Hadoop (nous l’étudierons dans un article séparé) pour que toutes les données puissent être analysées en une fois (pouvant inclure des itérations d’analyse).
Contrairement à ce qui précède, bien que je ne sois pas un expert en la matière, je dirais que les données de toute organisation - grande ou petite, organisée ou non organisée - sont des Big Data pour cette organisation et que celle-ci peut choisir ses propres outils pour analyser les données. Les données.
Normalement, pour analyser les données, les personnes créaient différents ensembles de données sur la base d'un ou plusieurs champs communs, de sorte que l'analyse devienne facile. Dans le cas du Big Data, il n’est pas nécessaire de créer des sous-ensembles pour l’analyser. Nous disposons maintenant d'outils capables d'analyser les données, quelle que soit leur taille. Probablement, ces outils eux-mêmes catégorisent les données tout en les analysant.
Je trouve important de mentionner deux phrases du livre «Big Data» de Jimmy Guterman:
“ Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”
-et-
“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”
Vous voyez donc que le volume et l'analyse constituent une partie importante du Big Data.
Lis: Qu'est-ce que l'exploration de données?
Concepts Big Data
C’est un autre point sur lequel la plupart des gens ne sont pas d’accord. Certains experts disent que les concepts de Big Data sont trois V:
- Le volume
- Rapidité
- Variété
D'autres ajoutent quelques V supplémentaires au concept:
- Visualisation
- Véracité (fiabilité)
- Variabilité et
- Valeur
Je couvrirai les concepts du Big Data dans un article séparé, car cet article est déjà en train de devenir énorme. À mon avis, les trois premiers V suffisent à expliquer le concept de Big Data.
Exemple de données volumineuses - Comment NetFlix l'a utilisé pour résoudre ses problèmes
Vers 2008, NetFlix a connu une panne qui a laissé de nombreux clients dans le noir. Si certains peuvent toujours accéder aux services de diffusion en continu, la plupart d’entre eux ne le peuvent pas. Certains clients ont réussi à obtenir leurs DVD loués alors que d'autres ont échoué. Un article de blog sur le Wall Street Journal indique que Netflix vient de démarrer le streaming sur demande.
La panne a incité la direction à réfléchir aux problèmes futurs et aux problèmes éventuels; il s'est tourné vers le Big Data. Il a analysé les zones à fort trafic, les points sensibles, le débit du réseau, etc. à l'aide de ces données, puis a travaillé sur ces données pour réduire les temps d'arrêt en cas de problème futur. Voici le lien vers le blog du Wall Street Journal, si vous souhaitez consulter les exemples de Big Data.
Ce qui précède résume ce qu’est le Big Data dans la langue d’un profane. Vous pouvez appeler cela une introduction très basique. Je prévois d’écrire quelques articles supplémentaires sur des facteurs associés tels que - Concepts, Analyse, Outils et utilisations du Big Data, Big Data 3 V, etc. En attendant, si vous souhaitez ajouter quelque chose à ce qui précède, veuillez commenter et partager avec nous.