Des données pour l’humanité – Snowflake Blog

Des données pour l’humanité – Snowflake Blog

J’ai envisagé d’autres titres pour ce blog. Au début, « Data for Good » semblait approprié. Mais le COVID-19 a touché presque toute l’humanité. Il a tué plus de 200 000 personnes, infecté plus de trois millions de personnes et affecté la vie de milliards de personnes à la fois émotionnellement et financièrement. Nous sommes sur un nouveau territoire, et non pas en tant que nations ou continents, mais en tant que toute l’humanité. Au centre des efforts de chacun se trouvent les données. Snowflake a été occupé à activer des solutions et des ensembles de données gratuits pour aider à lutter contre le coronavirus et aider à prévenir de nouvelles épidémies alors que les communautés du monde entier commencent à assouplir les mesures de distanciation sociale.

Les défis des données que nous devons surmonter

Des milliers d’organisations – gouvernements, prestataires de soins de santé et entreprises – se posent toutes les mêmes questions alors que la propagation du virus ralentit : quelles mesures de distanciation sociale devrions-nous assouplir, quand et à quelle cadence ? Comment prévenir de futures épidémies ? Si cela se produit, de quelles ressources une zone locale aura-t-elle besoin pour arrêter une autre épidémie ?

Les données répondront à ces questions et susciteront d’autres questions de la part de ces organisations, telles que : À quel point sera-t-il difficile d’acquérir ces données ? Est-il prêt pour l’analyse ? À quelle fréquence est-il mis à jour ? Combien ça coûtera? Y a-t-il un endroit où nous pouvons trouver ces données et acquérir de nouveaux ensembles de données à mesure qu’ils émergent ? Pouvons-nous facilement les combiner avec nos propres données pour révéler des informations supplémentaires qui nous étaient auparavant inaccessibles ?

Les fournisseurs de données et les fournisseurs de services d’analyse de données continuent de monter en puissance. Ils mettent à disposition une myriade de solutions et d’ensembles de données qui s’appuient sur des données sur les taux d’infection, les densités de population, l’impact des mesures de distance sociale et même les conditions météorologiques. Chaque jour, de nouveaux ensembles de données deviennent disponibles gratuitement pour aider à assurer une société sûre dans les mois et les années à venir après que nous ayons pris le contrôle de COVID-19 et d’autres similaires.

Mais ces fournisseurs de données et de solutions se posent leurs propres questions pour que cela se produise : comment permettre aux consommateurs de ces ensembles de données, et rapidement ? Quelles mesures de sécurité des données devons-nous prendre ? Qu’en est-il de la gouvernance et de la confidentialité des données ? Combien d’informations pouvons-nous partager ? Quelles parties de ces informations ne pouvons-nous pas partager et comment procédons-nous ?

Snowflake Cloud Data Platform est devenue la plateforme de choix pour créer ces solutions et stocker ces ensembles de données. Snowflake Data Marketplace est devenu le marché pour partager ces ensembles de données gratuitement. Ensemble, notre plateforme et notre place de marché constituent la combinaison idéale pour charger, stocker, intégrer et partager en toute sécurité toute quantité ou tout type de données afin de prévenir de futures épidémies de coronavirus alors que les communautés du monde entier assouplissent les politiques de distanciation sociale. Lisez la suite pour savoir qui est impliqué et comment tout cela fonctionne.

Le problème d’analyse de données que Snowflake résout

Lorsque mes co-fondateurs et moi avons lancé Snowflake en 2012, notre vision était de rendre plus de données plus facilement accessibles pour l’analyse. Nous nous sommes engagés à créer une architecture et une technologie qui perturberaient l’industrie de l’analyse de données, qui a maintenant quatre décennies. Ce qui a émergé est Snowflake Cloud Data Platform, qui permet à toute organisation d’analyser les données de manière exponentielle plus rapide que d’autres solutions. Nous avons également rendu notre plate-forme mondiale, afin que les organisations puissent travailler et partager des données de manière transparente et sécurisée entre différentes régions et différents fournisseurs de cloud. À ce jour, Snowflake couvre environ 20 régions cloud dans le monde et est hébergé par les trois principaux fournisseurs d’infrastructure cloud. Les données peuvent être facilement répliquées dans n’importe laquelle de ces régions, indépendamment de la région ou du cloud où se trouvent les données. Ce qui nous a inspirés, c’est ce que cela ferait pour les entreprises et comment cela pourrait avoir un impact sur les soins de santé, la science et d’autres efforts axés sur l’humanité. Plus de 4 000 organisations à travers le monde font confiance à Snowflake Cloud Data Platform, et ce nombre ne cesse de croître.

Snowflake Data Marketplace est né du travail que nous avons effectué sur Snowflake Cloud Data Platform. C’est là que les fournisseurs de données proposent les données stockées sur notre plateforme aux consommateurs de données. Mais nous voulions rendre notre place de marché aussi révolutionnaire que notre plateforme. Nous avons donc activé le partage de données en direct, gouverné, sécurisé et instantané comme base de notre place de marché. Les fournisseurs de données partagent l’accès aux vues en lecture seule de leurs ensembles de données répertoriés sur le marché. Cela signifie que les données n’ont pas à être déplacées pour que les consommateurs de données puissent accéder aux données. Il est toujours en direct, de sorte que les consommateurs de données reçoivent immédiatement des mises à jour du fournisseur de données. Spécifique à COVID-19, Snowflake Data Marketplace permet aux consommateurs de données d’utiliser n’importe lequel de ces ensembles de données, et même de les combiner avec leurs propres données pour acquérir des informations auparavant inaccessibles. Pendant ce temps, les fonctionnalités de sécurité, de gouvernance et de confidentialité des données de Snowflake permettent aux fournisseurs de données et aux consommateurs de respecter les réglementations sectorielles et régionales en matière de conformité des données.

Comment Snowflake aide à arrêter une autre épidémie de coronavirus

Le flocon de neige est un Alliance COVID partenaire, fournissant Snowflake Cloud Data Platform comme base d’un certain nombre d’outils que l’Alliance continue de créer afin que les gouvernements et les organisations de santé puissent les utiliser pour prévoir, détecter et contenir les futures épidémies. Notre plate-forme et notre marché permettent à ces organisations d’assembler ces applications et ensembles de données, de créer ces outils et de les rendre disponibles en quelques jours, et non en semaines ou en mois, afin qu’ils puissent avoir un impact maintenant. Et ils se connectent mutuellement aux données et aux outils via Snowflake Data Marketplace pour améliorer leurs solutions au-delà de ce qui est possible en travaillant seuls.

En plus de ce que Snowflake permet à l’Alliance COVID, une solution similaire est en cours de déploiement dans l’Union européenne (UE). Keboola, client de Snowflake, a construit son Quarantaine intelligente solution sur Snowflake Cloud Data Platform pour aider les pays à assouplir progressivement les mesures de quarantaine pour relancer leurs économies, tout en évitant une résurgence de l’épidémie. Les républiques tchèque et slovaque ont déjà déployé la solution. Keboola s’est associé au fournisseur mondial de services technologiques, Capgemini, pour l’aider à le déployer dans d’autres pays de l’UE.

Snowflake fait également partie d’une coalition de plus de 30 entreprises de soins de santé et de technologie à l’origine de l’effort visant à fournir un référentiel hautement sécurisé de données anonymisées et conformes à la loi HIPAA. La Base de données de recherche COVID-19 comprend des données longitudinales anonymisées sur les réclamations médicales, les réclamations pharmaceutiques, les dossiers de santé électroniques, les données de laboratoire, les données démographiques et bien d’autres sources de données, car de plus en plus d’entreprises de soins de santé proposent d’ajouter leurs données à cet ensemble de données. Les chercheurs auront également accès à des outils pour extraire les informations les plus approfondies de cet ensemble de données afin d’aider à comprendre COVID-19 et d’autres similaires. Avec autant de données en un seul endroit, les professionnels de la santé seront en mesure de révéler des informations qui n’étaient pas possibles auparavant pour aider à combattre la pandémie mondiale de COVID-19 et, espérons-le, d’autres affections graves qui pourraient survenir à l’avenir.

En outre, Snowflake et ses partenaires ont mis à disposition un certain nombre d’ensembles de données et de tableaux de bord COVID-19 prêts pour l’analyse et gratuits sur Snowflake Data Marketplace. Ils comprennent:

  • Starschema COVID-19 – Données épidémiologiques anonymisées, densités de population et données de géolocalisation provenant de plusieurs sources et rassemblées dans un seul ensemble de données prêt pour l’analyse. Plus de 2 000 organisations ont déjà demandé l’accès à cet ensemble de données.
  • Ensemble de données météorologiques COVID-19 – Weather Source a rassemblé des données météorologiques horaires et mondiales avec des données épidémiologiques pour déterminer les climats où le COVID-19 est plus ou moins actif dans les zones locales.

Certains des autres ensembles de données COVID-19 alimentés par Snowflake incluent :

  • Indice de risque critique COVID-19 – Créé par Carrot Health et totalisant plus de 100 sources de données qui fournissent des données anonymes sur la santé, le mode de vie et d’autres données sur plus de 260 millions d’adultes vivant aux États-Unis. L’ensemble de données est conçu pour déterminer le risque pour les communautés locales et les soins médicaux requis si une épidémie émerge.
  • AirDNA – Cette société de services de données et d’analyse basée à Denver suit l’activité quotidienne de plus de 10 millions de locations à court terme, qui couvrent plus de 800 000 marchés de location dans le monde, et fournit cet ensemble de données anonymisées pour déterminer les mouvements vers et depuis les zones rurales, suburbaines, et les zones urbaines qui connaissent une baisse ou une augmentation des cas de COVID-19.

Protéger l’humanité, protéger les données

Pour aider à contenir le COVID-19 maintenant et à l’avenir, nous avons besoin de données et d’outils facilement accessibles qui auront un impact immédiat aux niveaux local, étatique, national et mondial. Nous savons également que la protection des données nécessaires pour atteindre cet objectif est tout aussi importante. C’est pourquoi tous les ensembles de données COVID-19 anonymisés situés sur Snowflake Cloud Data Platform et hébergés sur Snowflake Data Marketplace sont gérés par les organisations qui les compilent et les organisations tierces avec lesquelles ils se sont associés pour examiner ces initiatives pour l’exactitude des données, consentement, anonymat, gouvernance et fugacité. Il est important que les entreprises technologiques ne soient pas propriétaires de ces données. Au lieu de cela, nous devons permettre à ces solutions de rendre ces ensembles de données et ces outils facilement disponibles.

Pour vaincre complètement le COVID-19, il faudra bien plus que des données. Mais jusqu’à ce que nous ayons un vaccin, les données resteront au centre de cet effort. Et tout aussi important, ces ensembles de données et ces outils aideront à lutter contre la prochaine épidémie potentielle. Aux côtés de tant d’autres, Snowflake est très fier de jouer son rôle dans ce combat. N’oublions pas que c’est le combat de l’humanité. Être prudent!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.