Data Cloud présenté à la conférence Digital-Life-Design

Data Cloud présenté à la conférence Digital-Life-Design

Le nuage de données a été présenté lors de l’édition de février de la conférence Digital-Life-Design, une série de rassemblements interdisciplinaires qui se tiendront virtuellement en 2021. Le cofondateur de Snowflake et président des produits, Benoit Dageville, a fourni un aperçu des nouvelles possibilités offertes par l’analyse basée sur le cloud. pour un public de chefs d’entreprise et d’influenceurs.

Dageville a rejoint Christian Teichmann de Burda Principal Investments sur la scène virtuelle pour une session intitulée Analytique et apprentissage automatique : la magie du cloud. Tout au long de la session, Dageville a proposé des exemples et des comparaisons pour illustrer comment les données et le cloud peuvent aider à résoudre de grands défis dans les entreprises et la société en général.

L’évolution de l’analyse des données

Pour les non-initiés, la terminologie analytique peut être un peu déroutante. Dageville a commencé la session par une présentation rapide et claire de l’évolution de l’utilisation des données à grande échelle, en commençant par les entrepôts de données au milieu des années 80. La entrepôt de données a permis de consolider, de résumer et d’analyser des données structurées telles que les enregistrements de transactions.

Puis à la fin des années 2000, a déclaré Dageville, les lacs de données ont émergé grâce à des pionniers comme Hadoop. Les lacs de données peuvent contenir des volumes plus élevés de données semi-structurées avec des relations plus complexes. À titre d’exemple, il a cité les achats sur Amazon. « Vous voulez analyser non seulement ce que vous avez acheté, mais aussi, par exemple, tous les clics que vous avez effectués, en analysant votre expérience », a-t-il déclaré. Les entrepôts de données n’étaient pas en mesure de gérer l’échelle du pétaoctet et la vitesse élevée de ces données, alors « des lacs de données ont été créés pour répondre à cela », a-t-il déclaré.

Cependant, lacs de données étaient complexes à utiliser et devaient faire des compromis sur certaines choses que les entrepôts de données faisaient très bien, comme le stockage efficace des données transactionnelles. En conséquence, les entreprises devaient maintenir les deux types de systèmes.

Le Data Cloud représente la troisième, « et dernière, j’espère », étape évolutive, selon Dageville. La Nuage de données permet aux organisations de gérer efficacement à la fois des entrepôts de données et des lacs de données sur une seule plate-forme.

« Vous ne voulez pas vraiment cloisonner vos données et avoir à gérer de nombreux systèmes différents », a déclaré Dageville.

Pourquoi le Cloud

Dageville a expliqué, en termes simples, trois aspects transformationnels du cloud pour l’analyse : l’échelle, l’élasticité et la collaboration.

Échelle

L’échelle du cloud signifie essentiellement « un accès illimité aux ressources de calcul et de stockage », a noté Dageville. Cette puissance signifie que les organisations peuvent gérer un volume et une vitesse de données sans précédent.

Élasticité

L’élasticité fait référence à la facilité d’appliquer cette puissance de stockage et de calcul massive chaque fois que cela est nécessaire, sans laisser cette même capacité inactive lorsqu’elle n’est pas nécessaire.

« Vous pouvez provisionner une grande quantité de ressources et analyser vos données, faire cette analyse très rapidement car vous avez beaucoup de ressources, et lorsque vous avez terminé, vous pouvez restituer ces ressources de calcul afin de ne pas les payer », dit Dageville. Cette élasticité offre puissance, vitesse et efficacité.

Pour illustrer, il a souligné les changements radicaux affectés par la pandémie de COVID-19 et les blocages.

« Les entreprises doivent s’adapter très rapidement. Zoom a dû se développer de façon spectaculaire. D’autres, comme les entreprises basées sur les voyages, ont dû contracter, et si vous avez besoin de contracter, vous allez payer moins cher, immédiatement. C’est encore une fois l’élasticité du nuage », a-t-il déclaré.

Collaboration

Par collaboration, Dageville faisait référence non seulement à la possibilité pour plusieurs utilisateurs d’accéder aux mêmes données, mais également à la capacité de partager en toute sécurité des ensembles de données au-delà des frontières organisationnelles traditionnelles. À titre de comparaison simple, il a mentionné Google Docs, qui permet aux personnes de différentes entreprises de travailler simultanément sur le même document.

« Cet aspect collaboratif du cloud va vraiment transformer les données et l’analyse des données », a-t-il déclaré.

IA et apprentissage automatique

Teichmann a posé plusieurs questions sur le rôle du cloud dans l’apprentissage automatique et les applications d’IA en particulier. Au début de la conversation, il a soulevé l’affirmation d’un orateur précédent selon laquelle l’IA automatisera de nombreux travaux actuellement effectués par des personnes.

« Je ne crois pas trop à l’idée pessimiste que les machines vont remplacer les êtres humains », a répondu Dageville. « La façon dont je vois les choses, c’est que les machines vont vraiment élargir ce que nous pouvons comprendre à partir de ces données, en automatisant de nombreuses choses qui ne peuvent pas être faites par un être humain. Lorsque vous avez des données à l’échelle du pétaoctet, vous ne pouvez pas les analyser en tant qu’humain.

Dageville a cité des exemples de plusieurs industries différentes, y compris Roche noire, identifier de nouvelles façons d’investir dans les entreprises; Hymne analysant les résultats des programmes de soins préventifs ; et l’ensemble de la communauté des soins de santé travaillant en collaboration pour analyser les besoins et les effets de la vaccination.

Il a mentionné les défis actuels de santé publique à titre d’illustration. De la création du vaccin à sa distribution, la pandémie de COVID-19 a généré une énorme quantité de données avec lesquelles de nombreuses parties différentes doivent travailler.

« Les données doivent être consommées par de nombreux acteurs. Et l’aspect de l’apprentissage automatique va être très puissant », a déclaré Dageville.

« Vous cherchez des connexions entre ces données qui sont vraiment impossibles à trouver pour les êtres humains. Et la machine peut trouver ces connexions.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.