Comment créer des applications de données réussies sur Snowflake

Comment créer des applications de données réussies sur Snowflake

Il n’y a jamais eu de meilleur moment pour créer du SaaS applications de données. International Data Corporation (IDC) affirme que les solutions de big data et d’analyse commerciale connaîtront une croissance annuelle à deux chiffres au cours des trois prochaines années, et que les revenus mondiaux de la BDA atteindront 274,3 milliards de dollars d’ici 2022. Mais pour réussir, les applications doivent être capables d’ingérer et d’analyser rapidement et facilement de gros volumes de données.

Une plate-forme de données basée sur le cloud fournit l’infrastructure de développement pour les applications de données afin de gérer les demandes des clients modernes. Aujourd’hui, de nombreuses applications de données reposent sur des piles de données traditionnelles, y compris des entrepôts de données hérités sur site et « lavés dans le cloud ». Celles-ci manquent des attributs qui font le succès des applications modernes.

Snowflake Cloud Data Platform fournit la pile dont vous avez besoin pour développer et faire évoluer des applications de données modernes. Snowflake est construit sur et pour le cloud, qui fournit avantages fondamentaux cela devient clair lorsque vous examinez son architecture, son déploiement et ses opérations.

Si vous cherchez à créer vos applications de données sur Snowflake Cloud Data Platform, voici trois bonnes pratiques qui vous aideront à offrir des expériences client remarquables tout en garantissant le bon cadre et le bon support pour votre propre croissance organique.

  1. SÉLECTIONNEZ DES TAILLES D’ENTREPÔTS VIRTUELS STRATÉGIQUES PAR SERVICE OU CARACTÉRISTIQUE

Lorsque vous configurez et personnalisez votre solution Snowflake, dédiez des entrepôts virtuels Snowflake distincts (clusters de calcul) à vos charges de travail, en fonction des besoins d’utilisation. Cette pratique permet de réduire l’utilisation du calcul en allouant les ressources de calcul correctement dimensionnées à des services, des fonctionnalités ou des charges de travail spécifiques.

Par exemple, plutôt que d’utiliser un grand entrepôt virtuel (huit crédits par heure), vous découvrirez peut-être qu’un entrepôt virtuel de taille moyenne (quatre crédits par heure) et un entrepôt virtuel de petite taille (deux crédits par heure) correspondent aux besoins de votre application. meilleur. Cette stratégie permet d’économiser deux crédits par heure sans sacrifier les performances.

Et, pour les moments où une analyse ponctuelle lourde est nécessaire, vous pouvez exécuter des requêtes sur un entrepôt séparé de bonne taille qui n’a pas d’impact sur les autres requêtes. S’il y a une quantité de travail fixe, il est souvent judicieux d’utiliser la plus grande taille d’entrepôt. Les performances des requêtes ont tendance à évoluer de manière linéaire, de sorte qu’un grand entrepôt finira par fournir une analyse plus rapide et coûtera le même prix qu’un entrepôt plus petit qui prend plus de temps.

  1. AJUSTER LES NOMBRE MINIMUM ET MAXIMUM DE CLUSTER POUR CORRESPONDRE AUX CHARGES DE TRAVAIL ATTENDUES

Sélectionnez une taille d’entrepôt (petite, moyenne, grande) qui fournit des performances adéquates pour chaque requête individuelle qui s’exécute, en gardant à l’esprit qu’une taille d’entrepôt donnée peut exécuter des requêtes individuelles deux fois plus vite que la taille en dessous, et chaque cluster supplémentaire permet à l’entrepôt pour exécuter plus de requêtes en parallèle afin d’augmenter la simultanéité. Ensuite, pour maximiser les performances et minimiser les coûts, il est important d’ajuster le nombre minimal et maximal de clusters d’un entrepôt virtuel en fonction du débit simultané correspondant que vous attendez pour la charge de travail. Gardez à l’esprit que, à mesure que les charges de travail diminuent, un cluster à la fois s’arrête, vous ne payez donc que pour les ressources nécessaires à un moment donné. Cette stratégie Snowflake offre des performances constantes quel que soit le nombre de requêtes.

  1. CIBLEZ LES CHARGES DE TRAVAIL SUR LES BONS SERVICES

Si vous ingérez plusieurs types de données provenant de plusieurs sources, il est important de reconnaître ce dont vos données ont besoin et de configurer votre architecture pour prendre en charge des charges de travail distinctes ciblées sur les technologies les plus pertinentes. Par exemple, vous souhaiterez peut-être traiter certaines données en continu en temps quasi réel et agir dessus, tandis que d’autres types de données pourraient ne pas nécessiter une attention immédiate et devraient plutôt être envoyés directement au stockage pour une future segmentation analytique complexe.

En intégrant ces fonctionnalités dans votre architecture dès le début, vous accélérez la capacité de gérer vos données et obtenez des informations rapides exactement là où elles sont nécessaires. Avec Snowflake, chaque élément de données peut être envoyé à deux endroits, ce qui facilite le traitement et le stockage immédiats, et il est facile de gérer des données non structurées sans imposer de schémas aux clients.

Ce ne sont là que quelques-unes des meilleures pratiques qui vous permettront de développer des applications de données modernes sur Snowflake Cloud Data Platform. Pour plus de bonnes pratiques, téléchargez notre ebook, 7 bonnes pratiques pour créer des applications de données sur Snowflake.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.