Innovation implacable : Tour d’horizon des produits pour le Snowflake Summit 2019

Innovation implacable : Tour d’horizon des produits pour le Snowflake Summit 2019

6.4.19 8

C’est maintenant vendredi matin, officiellement la fin du Snowflake Summit 2019. Bien que l’événement soit passé sous sa forme physique, l’excitation et l’optimisme que nous ressentons en tant qu’entreprise restent forts. Cet optimisme repose sur la confiance que les clients nous ont témoignée en fonction des résultats qu’ils ont obtenus. Nous ne pourrions pas être plus excités pour ce qui nous attend. Mais d’abord, examinons rapidement les annonces de produits de cette semaine.

Chez Snowflake, nous nous engageons à donner la priorité aux clients. Lors de son discours d’ouverture, Christian Kleinerman, vice-président des produits, a évoqué le terme « innovation implacable ». C’est au cœur de ce que représente Snowflake, car nous évoluons et affinons constamment le produit pour aider les organisations à résoudre leurs défis commerciaux et technologiques les plus urgents. Notre mission est de permettre aux organisations de devenir davantage axées sur les données, en utilisant toutes leurs données pour en tirer des informations approfondies afin de prendre de meilleures décisions commerciales plus rapidement.

Vous trouverez ci-dessous une liste des produits actuellement disponibles et de ceux qui sont actuellement en avant-première. Il y a 4 thèmes principaux : Global Snowflake, Core Data Warehouse, Data Pipelines et Data Exchange.

Disponible dès maintenant

Gouvernement Microsoft Azure

Microsoft Azure Government fournit un cloud dédié, limité aux agences gouvernementales américaines et à leurs partenaires, et exploité par des citoyens américains sélectionnés. Désormais, avec la disponibilité de Snowflake sur Microsoft Azure Government, les clients fédéraux peuvent profiter des avantages de l’entrepôt de données Snowflake en tant que service sur une instance dédiée d’Azure réservée aux agences gouvernementales américaines et à leurs partenaires. Pour plus d’informations, cliquez ici.

Vues matérialisées

Snowflake propose désormais une nouvelle approche moderne des fonctionnalités de vues matérialisées (MV) grâce à une version qui résout les problèmes des approches traditionnelles. MV Snowflake :

  • Assurer une vitesse optimale (pas de ralentissements)
  • Fournir des résultats de requête via des MV qui sont toujours à jour et cohérents avec la table de données principale
  • Fournit une facilité d’utilisation exceptionnelle grâce à un service de maintenance qui exécute et met à jour en continu les MV en arrière-plan. Pour plus d’informations, veuillez lire ici.

Fonctionnalités SQL

Nous améliorons le produit en nous concentrant sur les performances, la sécurité et l’étendue des nouvelles fonctionnalités afin que Snowflake puisse être utilisé par les clients pour un ensemble encore plus large de entrepôt de données charges de travail. Connect BY et CTE récursif sont des syntaxes de requête SQL hiérarchiques proposées par les solutions d’entrepôt de données sur site et sont des enjeux de table pour les grandes entreprises. Ces fonctionnalités renforcent encore notre position en tant qu’entrepôt de données d’entreprise conçu pour le cloud, et elles rendent possible la migration à partir des anciens produits d’entrepôt de données sur site.

Aperçus et pré-annonces

Plate-forme Google Cloud

Nous avons annoncé un partenariat stratégique avec Google Cloud Platform qui permettra aux clients d’utiliser Snowflake avec l’ensemble complet de solutions avancées d’analyse et d’apprentissage automatique de Google Cloud pour obtenir des informations significatives à partir de diverses sources de données. Snowflake sur Google Cloud devrait être lancé en avant-première à l’automne 2019, avec une disponibilité générale prévue pour début 2020.

Réplication de la base de données Snowflake

Global Snowflake est un thème central de la stratégie produit de Snowflake visant à devenir la solution de données cloud mondiale de nos clients dans toutes les régions et tous les fournisseurs de cloud. Snowflake Database Replication permet aux clients de répliquer des bases de données et de les maintenir synchronisées sur plusieurs comptes dans différentes régions et/ou fournisseurs de cloud. Les modifications peuvent être synchronisées avec une région ou un fournisseur de cloud différent, garantissant ainsi la durabilité et la disponibilité des données à tout moment.

La réplication et le basculement de la base de données Snowflake se produisent en temps réel et le temps de récupération ne dépend pas de la taille des données. Pour plus d’informations, cliquez ici.

Des feuilles de calcul

En février 2019, Snowflake a acquis Numératie, une entreprise qui a créé un éditeur de requêtes SQL unique et convaincant. Le produit prend en charge des fonctionnalités supplémentaires telles que la saisie semi-automatique SQL, le partage de requêtes et de feuilles de calcul, les visualisations dans les feuilles de calcul et la navigation et la recherche rapides dans le catalogue.

Nous apporterons ces fonctionnalités à une nouvelle version de Worksheets pour tous les clients Snowflake.

Provisionnement Okta

Okta Provisioning pour Snowflake permet aux clients d’externaliser automatiquement la gestion des utilisateurs et des rôles via Okta et Active Directory (AD). Par exemple, lorsqu’un utilisateur est résilié, il est automatiquement désactivé dans Snowflake. Inversement, lorsqu’un utilisateur est ajouté à un groupe AD, un rôle lui est automatiquement attribué dans Snowflake. Ceci est important pour deux raisons principales :

  1. Les clients utilisant Okta pour gérer les utilisateurs et les groupes dans diverses applications SaaS (telles que Salesforce, Slack, Dropbox et autres) attendent la même expérience de Snowflake.
  2. Les clients souhaitent gérer les utilisateurs et les rôles Snowflake via Active Directory (AD). Grâce à cette intégration, les clients peuvent utiliser Okta comme outil intermédiaire pour lire les utilisateurs et les groupes d’AD, puis les provisionner dans Snowflake.

Canalisations de données : Ingestion automatique

AWS et Azure fournissent des mécanismes de notification pour avertir les utilisateurs chaque fois qu’un objet est créé. Auto-Ingest utilise ces mécanismes en les superposant au service d’ingestion afin que le service d’ingestion puisse détecter et récupérer automatiquement les fichiers créés sous une étape et les ingérer dans leurs tables appropriées. Ceci est important car cela réduit la latence des requêtes en ingérant et en transformant les données à mesure qu’elles arrivent. Lire la suite ici et ici.

Flux et tâches

La fonctionnalité Streams and Tasks est fondamentale pour la construction de bout en bout pipelines de données et l’orchestration dans Snowflake. Bien que les clients puissent utiliser Snowpipe ou le fournisseur ELT de leur choix, cette approche se limite au simple chargement des données dans Snowflake. Streams and Tasks vise à fournir un mécanisme de planification des tâches afin que les clients n’aient plus à recourir à des tâches externes pour leurs besoins de planification les plus courants pour les tâches Snowflake SQL. La fonctionnalité permet également aux clients de connecter leurs tables de staging et leurs tables cibles en aval avec une logique régulièrement traitée qui récupère de nouvelles données de la table de staging et les transforme en la forme requise pour la table cible.

Connecteur flocon de neige pour Kafka

Apache Kafka est une plate-forme permettant de créer des pipelines pour gérer des flux continus d’enregistrements. Ce connecteur facilite et accélère la publication fiable de ces enregistrements sur votre instance Snowflake à des fins de stockage et d’analyse. En savoir plus sur les pipelines de données ici.

Tableaux externes

Les tables externes référencent les fichiers de données dans un lac de données de stockage cloud (par exemple, AWS S3, Google Cloud Storage ou Microsoft Azure). Les tables externes stockent des métadonnées de niveau fichier sur les fichiers de données, telles que le chemin d’accès au fichier, un identificateur de version et des informations de partitionnement. Cela permet d’interroger les données stockées dans les fichiers d’un lac de données comme s’il se trouvait dans une base de données.

Intégration Hive Metastore

Avec l’intégration du métastore Hive, les clients peuvent désormais intégrer un métastore Hive à Snowflake à l’aide de tables externes. Le connecteur Hive dans Snowflake écoute les événements du metastore et les transmet à Snowflake pour maintenir les tables externes synchronisées avec le metastore Hive. Cela permet aux utilisateurs de gérer leurs tables dans Hive tout en les interrogeant à partir de Snowflake.

Étapes externes sans informations d’identification

Les étapes externes sans informations d’identification offrent une option où les clients n’ont pas à transmettre de clés secrètes ou à accéder à des jetons pour les comptes de stockage. Ils peuvent être créés sur des comptes de stockage cloud à partir des clouds GCP, Azure et AWS. De plus, les administrateurs des comptes clients peuvent restreindre l’utilisation d’étapes externes pour certains emplacements de stockage dans le cloud, empêchant ainsi l’exfiltration de données.

L’échange de données

La Échange de données de flocon de neige est actuellement disponible en avant-première privée, avec un aperçu public qui devrait être lancé plus tard cette année.

Le Snowflake Data Exchange est un marché gratuit qui permet aux utilisateurs de Snowflake de connectez-vous avec des fournisseurs de données pour découvrir, accéder et générer des informations de manière transparente à partir des données de chacun. Contrairement au transfert de données traditionnel effectué via des API ou en extrayant des données vers un stockage dans le cloud, Snowflake Data Exchange améliore le contrôle et la sécurité de l’échange de données.

Les clients de Snowflake pourront accéder facilement à Data Exchange depuis leur compte Snowflake et rechercher un catalogue de données pour découvrir et accéder en toute sécurité à des données en temps réel qu’ils pourront joindre à leurs ensembles de données existants dans Snowflake. Les clients de Data Exchange n’encourront aucun frais de stockage de données, car les données restent stockées en toute sécurité dans le compte Snowflake du fournisseur.

Les fournisseurs de données peuvent partager des ensembles de données en direct, publics ou privés de manière entièrement régie et promouvoir leurs services de données auprès de plus de 1 500 clients Snowflake afin de créer de nouvelles sources de revenus. Les fournisseurs obtiennent également des informations sur les types de données consultées et utilisées par leurs consommateurs.

Et après?

Nous travaillons déjà à rendre le prochain sommet encore meilleur. Rendez-vous à Las Vegas à Sommet des flocons de neige en 2020!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.