Conseil technique : Démarrage rapide pour obtenir vos premières données dans Snowflake

Conseil technique : Démarrage rapide pour obtenir vos premières données dans Snowflake


Si vous êtes comme moi et que vous êtes relativement novice dans le domaine du cloud, l’une de vos principales questions est probablement la suivante :

« Comment puis-je obtenir des données de mon bureau (ou serveur) dans Snowflake afin de pouvoir les interroger? »

Ce qui, en réalité, se traduit par :

« Comment puis-je charger des données dans le cloud ? »

Eh bien, il existe plusieurs méthodes, y compris une variété d’intégration et Outils ETL. Dans ce conseil technique, je vais vous montrer le moyen le plus simple d’y parvenir via l’interface utilisateur Web de Snowflake.

Nos brillants ingénieurs ont créé un joli petit assistant pour permettre aux novices du cloud (comme moi) de télécharger facilement un fichier de données depuis votre bureau et de le charger dans une table dans Snowflake.

Commencer

Tout d’abord, vous avez besoin d’une table dans la base de données qui corresponde à la structure du fichier de données que vous allez charger (vous avez modélisé cette table, n’est-ce pas ?). Vous pouvez créer cela en exécutant un DDL de création de table dans une feuille de calcul une fois que vous êtes connecté.

Donc quelque chose comme ça :

CREATE TABLE Region_t1


  (

    Name               VARCHAR2 (200) NOT NULL ,

    Code               VARCHAR2 (2) NOT NULL ,

    Abbreviation       VARCHAR2 (2) NOT NULL ,

    Sort_Order         NUMBER (2) NOT NULL ,

    External_Reference VARCHAR2 (1000) NOT NULL ,

    Record_Source      VARCHAR2 (100) NOT NULL ,

    Record_Owner       NUMBER (1) NOT NULL ,

    Comments           VARCHAR2 (2000)

  ) ;

ALTER TABLE Region_t1 ADD CONSTRAINT PK_Region_t1 PRIMARY KEY ( Code ) ;

ALTER TABLE Region_t1 ADD CONSTRAINT UK_Region_t1 UNIQUE ( Name ) ;

Appeler l’assistant de chargement

Pour commencer le processus de chargement, accédez au Base de données dans l’interface utilisateur, explorez votre base de données, puis cliquez sur le nom de la table. Une fois que vous faites cela, le Tableau de charge widget est affiché (quatrième à partir de la gauche sur la barre d’outils). Cliquez sur le widget, et le Charger les données l’assistant s’ouvre et demande un entrepôt. Sélectionnez un entrepôt virtuel à utiliser dans la liste déroulante. (Remarque : la liste affiche tous les entrepôts pour lesquels vous disposez du privilège USAGE.)

select-wh

Sélectionnez le fichier à charger

À l’étape suivante, vous sélectionnez le fichier source à charger. Vous avez la possibilité d’obtenir un fichier à partir de votre système de fichiers ou d’un compartiment AWS S3 si vous avez déjà déplacé certains fichiers vers le cloud.

fichier sélectionné

Notez que vous pouvez également charger plusieurs fichiers ! La boîte de dialogue de sélection prend en charge la sélection multiple. Mais gardez à l’esprit que les fichiers devoir être tous du même type avec la même structure car ils vont tous dans la même table.

À l’étape suivante, vous choisissez un format de fichier dans la liste déroulante. Dans ce cas, j’ai sélectionné un format qui spécifie un fichier de type CSV avec des délimiteurs virgules.

choisir-le-format-de-fichier-pour-le-chargement

Création d’un format de fichier (si nécessaire)

Si vous n’avez pas encore de format de fichier approprié, cliquez simplement sur le signe plus (+) à côté de la flèche déroulante dans l’interface utilisateur pour en définir un nouveau. Pour un fichier CSV standard qui utilise des virgules comme délimiteur, il vous suffit de donner un nom au format de fichier et de cliquer sur Finir. Toutefois, si la première ligne du fichier comprend des en-têtes de colonne, veillez à définir Lignes d’en-tête à ignorer à 1.

créer-format-fichier

Définition des options de chargement

L’étape suivante de l’assistant vous permet de choisir comment gérer les erreurs de chargement. Il y a quatre options. J’ai choisi de continuer le chargement en sautant tous les enregistrements problématiques (que je traiterai après le chargement).

options de chargement

À ce stade, vous êtes prêt à partir. Si vous voulez voir le code pour le chargement (afin que vous puissiez apprendre quelque chose de nouveau, n’est-ce pas ?), cliquez simplement sur le Afficher SQL lien avant de cliquer Charger.

load-sql

Exécution de la charge

Une fois que vous avez cliqué Chargerle processus démarre et effectue les opérations suivantes :

  1. Les usages METTRE pour copier automatiquement le fichier dans une zone de stockage interne Snowflake cryptage les données au cours du processus.
  2. Les usages COPIE pour charger les données dans la table cible et supprime le fichier de la zone de préparation une fois terminé.
  3. Rapporte les résultats.

charge-succès

Et voilà, vous avez maintenant chargé les données de votre bureau dans l’entrepôt de données Snowflake Elastic Data Warehouse natif du cloud. Toutes nos félicitations.

Pour une plongée beaucoup plus approfondie dans le chargement de données dans Snowflake, consultez le Chargement des données sujet dans notre guide de l’utilisateur.

Comme toujours, gardez un œil sur ce site de blog, nos flux Twitter Snowflake (@SnowflakeDB), (@kentgraziano), et (@cloudsommelier) pour plus de trucs et astuces, ainsi que des mises à jour sur toutes les actions et activités ici à Snowflake Computing.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.