San Francisco et Datavant combattent le Covid-19 avec Data

San Francisco et Datavant combattent le Covid-19 avec Data

Lors du Snowflake Healthcare and Life Sciences Forum 2021, Snowflake a rencontré Blake Valenta de la ville de San Francisco et Jason Labonte de Datavant pour savoir comment la Bay Area a utilisé la science des données dans sa lutte contre la pandémie de COVID-19.

La pandémie de COVID-19 a perturbé tous les aspects de la vie quotidienne, les entreprises de toutes tailles essayant de s’adapter à de nouvelles façons de travailler et de servir leurs clients. Les changements spectaculaires étaient également évidents dans le domaine de la science des données, où les leaders de l’informatique et de l’analyse se sont efforcés de devancer la cascade de nouveaux défis.

La ville de San Francisco offre un excellent exemple de la façon dont une volonté de s’adapter peut avoir des effets durables. Lorsque la pandémie a commencé, la ville a créé un centre interinstitutions appelé Centre des opérations d’urgence (COU). L’un de ses plus grands défis initiaux était la pénurie critique d’équipements de protection individuelle (EPI) – masques, gants, blouses et autres articles – dont les hôpitaux de la région de la baie avaient désespérément besoin. La ville centralisait les achats via le COU, mais différentes organisations utilisaient différents systèmes de commande et de suivi, chacun avec son propre schéma.

« Il était difficile d’avoir une vue d’ensemble de la quantité disponible, de la bonne qualité médicale et de la quantité supplémentaire que nous devions acheter », a déclaré Blake Valenta, analyste stratège chez DataSF, le nom familier de le Bureau du directeur des données.

Son équipe a été amenée à le réparer. Ils envisageaient déjà le Snowflake Data Cloud, et l’épidémie les a convaincus qu’il était temps d’adopter la solution.

« Grâce au Snowflake Data Cloud, nous avons pu rassembler les données et les harmoniser afin que les décideurs puissent aller de l’avant et résoudre le problème d’EPI de San Francisco. Nous l’avons monté en moins d’une semaine.

—Blake Valenta, analyste stratège, DataSF

Un environnement de recherche médicale unique

Juste en bas de la rue, dans le quartier financier de San Francisco, se trouve Datavant, une société de technologie de la santé qui se concentre sur la résolution des problèmes de connectivité et de fragmentation des données dans les soins de santé. L’un des plus grands défis de l’industrie est que chaque fois que les patients voient leur médecin, leurs données sont saisies dans différents systèmes de dossiers de santé électroniques. Les résultats des tests de laboratoire sont stockés dans les systèmes de laboratoire, les ordonnances dans les systèmes de pharmacie, etc. Les données sont là, mais elles sont cloisonnées.

Jason Labonte, directeur de la stratégie de Datavant, savait que Snowflake permettait de capturer ces données, de les échanger en privé et de les relier en aval. Depuis début 2020, lui et son équipe travaillent sur un projet avec Snowflake appelé la base de données de recherche COVID-19, un référentiel unique de toutes les données médicales du monde réel.

Au début, Datavant ne disposait pas d’une infrastructure de données nationale lui permettant d’extraire toutes ces données dans un environnement unique, mais elle savait où se trouvaient les données et à qui elles appartenaient. «Nous avons réuni une coalition de volontaires», a déclaré Labonte, «d’organisations qui disposaient des données et d’organisations comme Snowflake qui disposaient de la technologie pour créer cette base de données. C’était une entreprise formidable, et nous l’avons tenue en 60 jours.

La base de données comprend des données provenant de 13 sources privées et de 55 ensembles de données publiques (dossiers de santé, réclamations médicales, données sur les consommateurs, données sur la mobilité mondiale, capacité de soins de santé par État, etc.), le tout chargé dans un environnement de recherche unique. Il est régi par une couche de confidentialité et de sécurité construite avec des composants Snowflake pour garantir que toutes les données sont anonymisées conformément aux réglementations HIPAA.

« Nous avons un vaste référentiel de données très sécurisé et bien configuré dans l’environnement Snowflake, y compris un wiki avec des dispositions de données et des descriptions des ensembles de données. Et il est disponible gratuitement pour les chercheurs en santé publique travaillant sur la pandémie. Jusqu’à présent, nous avons plus de 2 000 utilisateurs enregistrés.

—Jason Labonte, directeur de la stratégie, Datavant

Une seule source d’information fiable

Après que DataSF ait résolu le problème d’EPI de la ville, il s’est lancé dans une mission similaire à celle de Datavant. Les données provenant de sources fragmentées devaient être unifiées et standardisées, non seulement pour les services internes de la ville mais aussi pour le grand public. Les organisations communautaires, les journalistes et les résidents devaient participer à la conversation, et tout le monde devait être sur la même longueur d’onde.

« Nous utilisons Snowflake pour récupérer les données des départements et les centraliser dans un catalogue que les analystes de chaque département peuvent utiliser pour créer les rapports et les tableaux de bord dont ils ont besoin. Nous avons dû proposer des normes de gouvernance des données sur ce qui pouvait être publié et ce qui ne pouvait pas l’être, mais les points de vue internes et externes sont basés sur les mêmes données. Les résidents de San Francisco, les organisations communautaires et les journalistes peuvent également en dépendre. Toute notre communauté est en mesure d’examiner les mêmes sources de données fiables et d’avancer ensemble de la manière la plus efficace et la plus sûre possible. »

—Blake Valenta, analyste stratège, DataSF

Datavant et la ville de San Francisco ne travaillent pas directement ensemble, mais ce n’est pas un hasard s’ils travaillent en parallèle et résolvent certains des mêmes problèmes de la même manière en utilisant Snowflake.

« De nombreuses personnes travaillant dans le domaine des mégadonnées considèrent l’intelligence artificielle et l’apprentissage automatique comme la prochaine grande chose, mais le fruit à portée de main, ce sont les tonnes de données que nous avons déjà stockées dans des silos inaccessibles. Si nous pouvons résoudre ce problème, nous obtiendrons beaucoup d’élan au début. Nous avons juste besoin de partenaires technologiques comme Snowflake qui facilitent le déplacement de grands ensembles de données dans des environnements accessibles et le partage de ces données tout en protégeant la sécurité et la confidentialité.

—Jason Labonte, directeur de la stratégie, Datavant

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.