Big Data World, Partie 1 : Définitions

Big Data World, Partie 1 : Définitions

Des articles
Outils Big Data

Lisez cet article dans d’autres langues :
Anglais, 简体中文

Cet article est le premier d’une série sur le Big Data. Dans ce document, nous aimerions vous dire comment nous, chez JetBrains, voyons le Big Data et, par conséquent, comment nous créons des produits pour cela.

Prochaines parties :

  1. Cet article
  2. Big Data World, Partie 2 : Rôles
  3. Big Data World, partie 3 : Construire des pipelines de données
  4. Le monde du Big Data : Partie 4. Architecture
  5. Big Data World, Partie 5 : Théorème CAP

Table des matières:

Le monde du big data peut sembler mystérieux, caché derrière un rideau de mots inconnus et étranges. Il est temps d’éclaircir ce mystère et de définir le Big Data.

Comme tout terme qui a été surestimé à un moment donné, le terme “Big Data” est devenu alambiqué avec une vaste signification. J’utiliserai les trois définitions qui me semblent les plus précises :

Données qui ne rentrent pas dans la mémoire du nœud

Cela dépend de chaque élément matériel, nous ne pouvons donc pas définir une valeur universelle et statique pour ce qui constitue le “big data”. Je me souviens de mon ancien Intel 80386 – sa mémoire de 16 Mo signifiait que tout ce qui dépassait 8 Mo serait classé comme “big data”.

100 Mo de données semblent petits maintenant, mais ils étaient considérés comme énormes dans le passé et nécessitaient des algorithmes sophistiqués pour être traités.

Aujourd’hui, le Big Data est beaucoup plus volumineux en termes absolus, mais nécessite toujours un traitement sophistiqué, une informatique distribuée et des formats de stockage spéciaux.

Des données qui évoluent sur 3V

3V (prononcé triple-v) signifie Volume, Vélocité et Variété. La mise à l’échelle sur 3V signifie que vous n’aurez pas à restructurer votre stockage, vos tâches et vos processus si le volume, la vitesse ou la variété augmentent, disons, dix fois.

Il est difficile de dire ce que « dix fois » signifie en termes de variété, mais les données ont tendance à changer fréquemment et rapidement en termes de forme et de vitesse.

Comme vous l’avez peut-être deviné, cette définition est principalement déterminée par le logiciel.

Suffisamment de données pour prendre des décisions commerciales fiables

N’oublions pas pourquoi les données, grandes ou petites, sont importantes en premier lieu – pour faire des affaires. Compte tenu de cela, il est utile de définir le « Big Data » en termes d’applications métier.

Les entreprises qui réussissent sont presque toujours axées sur les données et se concentrent généralement sur la fiabilité, la prévisibilité et la cohérence des activités. Cependant, pour bien faire ces choses, il faut plus de données que les marchands n’en avaient pendant, disons, le Moyen Âge. Le modèle économique moderne, centré sur l’utilisateur et travaillant différemment avec chaque personne, n’est pas possible sans de grandes quantités de données

Par exemple, la plupart des grandes entreprises de commerce électronique ont d’énormes flux de clics (flux d’événements générés par les utilisateurs) basés sur un marketing qui prédit quels produits seront plus populaires que d’autres.

Maintenant que nous comprenons ce qu’est le « Big Data », essayons de comprendre qui sont les consommateurs.

Il existe trois grandes catégories de clients internes :

  1. La gestion
  2. Commercialisation
  3. Analystes

La direction a besoin de rapports pour comprendre ce qui se passe dans l’entreprise, améliorer les plans existants et créer de nouveaux plans.

Les chefs de produit veulent améliorer leurs produits par l’expérimentation et ont besoin de données pour analyser les résultats des expérimentations et proposer de nouvelles idées.

Le marketing a besoin de données pour analyser les métriques marketing, telles que le COA (coût d’acquisition), la LTV (valeur à vie), etc. Ils ont également besoin de données pour créer des entreprises de marketing prospères.

C’est ainsi que nous comprenons ce qu’est le Big Data et qui consomme les résultats du travail avec le Big Data.

Chez JetBrains, nos principaux projets pour le Big Data incluent :

Dans le prochain article, je définirai les types de professionnels qui travaillent avec des données et les qualifications dont ils ont besoin.

Si vous souhaitez lire plus d’articles comme celui-ci, n’oubliez pas de vous abonner à notre blog. S’il vous plaît laissez-nous savoir ce que vous pensez ici dans les commentaires ou dans notre Twitter.

Development Source

Related Posts

RLEC 4.2.1 apporte des contrôles granulaires à la haute disponibilité et aux performances

RLEC 4.2.1 apporte des contrôles granulaires à la haute disponibilité et aux performances

Comment HolidayMe utilise Redis Enterprise comme base de données principale

Comment HolidayMe utilise Redis Enterprise comme base de données principale

Annonce de RedisGears 1.0 : un moteur sans serveur pour Redis

Annonce de RedisGears 1.0 : un moteur sans serveur pour Redis

Clés Redis dans la RAM |  Redis

Clés Redis dans la RAM | Redis

No Comment

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *