Comment rendre la protection des données et la haute disponibilité pour l’analyse rapides et faciles

Comment rendre la protection des données et la haute disponibilité pour l’analyse rapides et faciles


Lors du déplacement des charges de travail analytiques de l’entrepôt de données d’entreprise vers le cloud, il est important de prendre en compte les services de protection des données et de haute disponibilité (HA) qui préserveront vos précieuses données et assureront l’exécution de vos analyses. Des événements possibles tels qu’une erreur humaine, une panne d’infrastructure, un acte de nature malheureux ou toute activité qui met vos données en danger ne peuvent être ignorés.

Pendant tout ce temps, la protection des données et la haute disponibilité doivent être rapides et faciles. Cela ne devrait pas prendre des jours, des semaines ou des mois, ni une armée de spécialistes techniques ou un gros budget, pour mettre en place ces mesures de sécurité critiques.

De quoi dépendent les entreprises axées sur les données

Avec des tableaux de bord en temps réel, les organisations dépendent de l’analyse des données pour communiquer l’état des opérations commerciales. De plus en plus, les entreprises intègrent l’analyse en libre-service dans les applications destinées aux clients. Par conséquent, les entreprises dépensent énormément d’efforts, d’énergie et de ressources pour collecter et cultiver des données sur leurs clients. Avec toute cette activité autour des données, la perte de toute donnée ou capacité de traitement pourrait avoir des conséquences catastrophiques pour une organisation.

Comment Snowflake protège vos données et vos services

Pour ces raisons, Snowflake innove et intègre la protection des données et la haute disponibilité en tant que fonctionnalités essentielles de notre entrepôt de données en tant que service basé sur le cloud. Dans la figure 1, vous verrez ce qui rend Snowflake différent. Nos capacités de protection sont toutes intégrées et orchestrées avec des métadonnées sur l’ensemble de votre service. La figure illustre également comment la résilience Snowflake est automatiquement répartie sur trois zones de disponibilité.

Cela apporte des avantages significatifs aux analystes commerciaux qui effectuent des analyses basées sur des scénarios sur des ensembles de données modifiés, ou aux scientifiques des données qui souhaitent former de nouveaux modèles et algorithmes sur d’anciennes données.

  • Protection de service intégrée contre les pannes de nœud : L’impact des défaillances de nœuds peut être difficile à comprendre avec différentes implémentations cloud proposées par différents fournisseurs d’entrepôts de données cloud. Alors que d’autres entrepôts de données cloud ou services d’interrogation peuvent fournir un certain niveau de redondance pour les données actuelles, des mécanismes de protection contre la corruption des données ou perte de données en cas de défaillance d’un nœud varient.

    Dans la plupart des cas, il vous incombe de créer un cluster (c’est-à-dire un système avec un nombre de nœuds supérieur à un) pour vous protéger contre les pannes de nœud. En règle générale, cela signifie un coût supplémentaire (instances matérielles, de stockage et logicielles), ainsi qu’une complexité accrue, pour tenir compte des nœuds supplémentaires. Certains services concurrents peuvent avoir une pénalité de performance sur les écritures de données. Cela existe parce que, sous les couvertures, des nœuds redondants sont écrits à l’aide de ressources de calcul. Nous le constatons le plus souvent avec les environnements d’entrepôt de données sur site mis à niveau pour le cloud. De plus, il pourrait également y avoir des coûts cachés sous la forme de votre cluster qui tombe en panne et qui n’est pas accessible pour les requêtes ou les mises à jour pendant la reconstruction d’un nœud défaillant.

    Étant donné que l’architecture Snowflake sépare les couches de calcul, de stockage et de service, Snowflake assure la résilience et la cohérence des données en cas de défaillance des nœuds. En fonction de la gravité des échecs, Snowflake peut automatiquement réémettre (réessayer) sans l’implication des utilisateurs. Et il n’y a pas non plus d’impact sur les performances d’écriture (ou de lecture). De plus, vous pouvez profiter d’un stockage à moindre coût. Les services concurrents peuvent fortement vous encourager ou vous restreindre à utiliser un stockage à coût élevé.
  • Haute disponibilité intégrée : Offrant un degré encore plus élevé de protection des données et de résilience des services, dans la même région de déploiement, Snowflake fournit une protection de basculement standard sur trois zones de disponibilité (y compris la zone active principale). Vos données et votre entreprise sont protégées. Lorsque vous ingérez vos données, elles sont répliquées de manière synchrone et transparente dans les zones de disponibilité. Cette protection est automatiquement étendue de Snowflake aux clients, sans frais supplémentaires.

    De plus, toutes les métadonnées, la magie des services Snowflake, sont également protégées.
DR and HA Table
Tableau 1. Protection des données Snowflake et haute disponibilité

Sommaire

En fin de compte, dans la même région de déploiement, vous n’avez pas à configurer ou à vous débattre avec la construction manuelle d’une infrastructure HA. Notre entrepôt de données en tant que service s’en charge automatiquement pour vous. Snowflake rend la protection des données et la haute disponibilité rapides et faciles. Vous pouvez atténuer les risques avec rapidité, rentabilité, confiance et tranquillité d’esprit.



Abonnez-vous au blog du flocon de neige

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.