Le terme «données» n’est pas nouveau pour nous. C'est l'une des principales choses enseignées lorsque vous optez pour la technologie de l'information et les ordinateurs. Si vous vous en souvenez, les données sont considérées comme la forme brute d'informations. Bien que cela existe déjà depuis une décennie, le terme Big Data est un buzz ces jours-ci. Comme il ressort clairement du terme, les charges et les charges de données sont Big Data et peuvent être traitées de différentes manières en utilisant différentes méthodes et outils pour obtenir les informations requises. Cet article traite des concepts du Big Data, en utilisant les 3 V évoqués par Doug Laney, un pionnier dans le domaine de l’entreposage de données considéré comme ayant initié le Infonomie (Économie de l'information).
Big Data 3 Vs
Les données, sous leur forme énorme, accumulées par différents moyens ont été classées correctement dans différentes bases de données et ont été sauvegardées après un certain temps. Lorsque le concept est apparu que plus les données étaient nombreuses, plus il était facile de les trouver - des informations différentes et pertinentes - en utilisant les bons outils, les entreprises ont commencé à stocker les données pendant de plus longues périodes. Cela revient à ajouter de nouveaux périphériques de stockage ou à utiliser le cloud pour stocker les données, quelle que soit la forme sous laquelle elles ont été obtenues: documents, feuilles de calcul, bases de données, HTML, etc. Elles sont ensuite organisées dans des formats appropriés à l’aide d’outils capables de traiter de grandes quantités de données. Les données.
REMARQUE: Le champ d'application du Big Data ne se limite pas aux données que vous collectez et stockez dans vos locaux et dans le cloud. Il peut inclure des données provenant de différentes autres sources, y compris, sans toutefois s'y limiter, des éléments du domaine public.
Le modèle 3D de Big Data est basé sur les V suivants:
- Volume: fait référence à la gestion du stockage de données
- Vélocité: fait référence à la vitesse de traitement des données
- Variété: fait référence au regroupement de données d'ensembles de données différents apparemment non apparentés
Les paragraphes suivants expliquent la modélisation Big Data en décrivant en détail chaque dimension (chaque V).
A] Volume de données volumineuses
En parlant du Big Data, on pourrait comprendre le volume comme une énorme collection d’informations brutes. Bien que cela soit vrai, il en va de même pour les coûts de stockage des données. Les données importantes peuvent être stockées sur site ou sur le cloud, ce dernier constituant une option flexible. Mais avez-vous besoin de stocker chacun et tout?
Selon un livre blanc publié par Meta Group, lorsque le volume de données augmente, certaines parties de celles-ci deviennent inutiles. En outre, il est indiqué que seul le volume de données que les entreprises ont l'intention d'utiliser devrait être conservé. D'autres données peuvent être supprimées ou, si les entreprises sont réticentes à abandonner des «données supposées non importantes», elles peuvent être transférées sur des périphériques informatiques non utilisés et même sur des bandes afin que les entreprises n'aient pas à payer pour le stockage de telles données.
J'ai utilisé des «données supposées sans importance», car j'estime moi aussi que toutes les entreprises pourront exiger des données de tout type à l'avenir - tôt ou tard - et qu'elles doivent donc être conservées assez longtemps avant de savoir qu'elles sont réellement non important. Personnellement, je vide les anciennes données sur des disques durs d’antan et parfois sur des DVD. Les ordinateurs principaux et le stockage en nuage contiennent les données que je considère importantes et savent que je vais utiliser. Parmi ces données, il y a aussi des données uniques qui peuvent se retrouver sur un ancien disque dur après quelques années. L'exemple ci-dessus est juste pour votre compréhension. Cela ne correspond pas à la description du Big Data car son montant est bien inférieur à ce que les entreprises perçoivent comme du Big Data.
B ] Vitesse dans le Big Data
La rapidité de traitement des données est un facteur important lorsque l’on parle des concepts du Big Data. Il existe de nombreux sites Web, en particulier le commerce électronique. Google avait déjà admis que la vitesse à laquelle un chargement de page était essentiel pour un meilleur classement. Outre les classements, la vitesse procure également un confort aux utilisateurs lorsqu'ils magasinent. Il en va de même pour les données en cours de traitement pour d'autres informations.
Tout en parlant de vitesse, il est essentiel de savoir qu’elle dépasse la bande passante. Il combine des données facilement utilisables avec différents outils d'analyse. Des données facilement utilisables signifient quelques devoirs pour créer des structures de données faciles à traiter. La prochaine dimension - la variété, diffuse davantage de lumière à ce sujet.
C] Variété de Big Data
Lorsqu'il y a des charges et des charges de données, il devient important de les organiser de manière à ce que les outils d'analyse puissent facilement traiter les données. Il existe également des outils pour organiser les données. Lors du stockage, les données peuvent être non structurées et de n'importe quelle forme. C'est à vous de déterminer la relation qu'il entretient avec d'autres données. Une fois que vous avez compris la relation, vous pouvez choisir les outils appropriés et convertir les données au format souhaité pour un stockage structuré et trié.
Résumé
En d’autres termes, le modèle 3D de Big Data repose sur trois dimensions: les données USABLE que vous possédez; étiquetage correct des données; et un traitement plus rapide. Si ces trois données sont gérées, vos données peuvent facilement être traitées ou analysées pour déterminer ce que vous voulez.
Ce qui précède explique à la fois les concepts et le modèle 3D du Big Data. Les articles liés dans le deuxième paragraphe constitueront un soutien supplémentaire si vous êtes novice dans le concept.
Si vous souhaitez ajouter quelque chose, veuillez commenter.