Prévision d’une activité très variable

Prévision d’une activité très variable

Le défi était clair : Pour devenir une société cotée en bourse nous devions constamment prévoir nos paramètres financiers de base dans une fourchette étroite. Pour ce faire, nous devions utiliser la science des données et l’apprentissage automatique (ML) et tirer parti de notre propre produit pour prévoir avec précision les revenus de l’entreprise.

Le fait que Snowflake soit aujourd’hui une entreprise publique est la preuve à la fois de la puissance de la science des données et de notre produit. Pour l’équipe de science des données du service financier de Snowflake, nous avons constaté que les clés du développement de prévisions auxquelles notre équipe et le marché peuvent faire confiance sont le partenariat, la plate-forme et, bien sûr, les données.

Chaque Snowflake (client) est unique

Snowflake est une entreprise basée sur la consommation ou l’utilisation, ce qui signifie que nos revenus sont intrinsèquement liés à la valeur que nous offrons aux consommateurs. La tarification basée sur la consommation sert à la fois nos intérêts et ceux de nos consommateurs; Cependant, avec un modèle commercial basé sur la consommation, la prévision des revenus et d’autres mesures de haut niveau peut être loin d’être simple. Ces défis ne sont pas propres à Snowflake. Des entreprises basées sur la publicité aux organisations de services professionnels, toutes les entreprises ont un certain niveau de variabilité.

Lorsque nous avons entrepris de prévoir des mesures commerciales clés, nous avons dû faire face à quelques défis :

Variabilité des clients

Tout d’abord, chaque client est unique. De leurs habitudes d’utilisation à leurs temps de rampe, nous constatons une grande variation dans la façon dont les clients interagissent avec notre plateforme. Deux clients peuvent appartenir au même secteur, utiliser des piles technologiques similaires, être proches de la même taille, partager de nombreux détails de contrat, avoir un cas d’utilisation similaire et consommer de manière très différente.

Si vous tracez l’utilisation quotidienne de nombreux clients par rapport au temps, cela ressemble aux mouvements quotidiens typiques du marché boursier – beaucoup de bruit et de variabilité. Même lors de l’agrégation sur des périodes plus longues ou parmi des groupes de clients, une variabilité importante demeure.

L’utilisation historique n’indique pas l’utilisation future

Deuxièmement, de nombreux facteurs déterminant la consommation future d’un client ne peuvent être prédits à partir de sa seule utilisation. Et parce que chaque client est unique, nous ne pouvons souvent pas non plus nous tourner vers les comportements d’autres clients Snowflake ayant des caractéristiques similaires pour obtenir des réponses. Des événements clés tels que de nouvelles initiatives stratégiques, des réorganisations, des fusions ou des cessions, des retards et des accélérations de programmes clients majeurs, la perte ou l’ajout de talents clés chez le client, de nouveaux contrôles des coûts et des changements réglementaires affectant le marché du client sont autant de facteurs qui peuvent créer des discontinuités. de consommation qui ne sont pas prévisibles à partir de données facilement disponibles.

Dans une entreprise grand public comptant des millions de clients, le volume de données permet souvent à une solution d’apprentissage automatique de bout en bout d’apprendre et de faire face à de nombreux types d’événements à forte variance. De plus, les erreurs de prédiction flagrantes d’un petit pourcentage de clients n’ont pas le potentiel d’avoir un impact significatif sur les prévisions de chiffre d’affaires. En revanche, dans un environnement comptant plusieurs milliers de clients, dont chacun consomme à un rythme qui peut ne pas être prévisible par rapport à leur utilisation passée, et où des erreurs de prédiction importantes sur seulement un petit nombre de ces clients pourraient entraîner des écarts importants par rapport aux prévisions globales, un approche différente est nécessaire. L’apprentissage automatique, bien que vital, n’est qu’une partie de la solution.

Efficacité accrue = variabilité accrue

Troisièmement, à mesure que nos ingénieurs améliorent continuellement notre produit et que nos équipes d’ingénierie commerciale et de services aident à optimiser les charges de travail des clients, la consommation de crédit client peut chuter.

Par exemple, plus tôt cette année, nos professionnels du service ont aidé à optimiser un large éventail de charges de travail chez l’un de nos clients. Le client avait auparavant besoin d’augmenter rapidement les charges de travail, sacrifiant l’efficacité à la vitesse. Suite aux optimisations, la consommation de ces charges de travail a considérablement diminué, ce qui s’est traduit par une forte baisse de l’utilisation totale de Snowflake par le client. Des améliorations comme celle-ci sont excellentes pour nos clients et pour notre entreprise à long terme ; cependant, du point de vue des prévisions, cela crée une source supplémentaire de variabilité future qui peut ne pas être capturée dans nos données internes d’utilisation des produits. Par conséquent, nous devons constamment ajuster nos prévisions.

Notre processus de prévision

Notre solution à ces défis de prévision est un processus qui combine les prédictions d’une collection de modèles d’apprentissage automatique avec des connaissances sur le terrain d’autres départements, y compris les ventes et les produits, qui ne peuvent pas être déduites des données. L’utilisation de la plate-forme Snowflake accélère ce processus, nous permettant de reprévoir quotidiennement notre activité, des revenus des produits de haut niveau à la consommation de chaque client individuel, sur de nombreux horizons temporels.

Les étapes suivantes sont très efficaces pour générer des prévisions précises pour notre activité basée sur la consommation :

  1. Générez une prévision ML préliminaire. Chaque jour, nous établissons une prévision ascendante de notre activité, en prédisant la consommation de chaque compte client, à l’aide d’une série de modèles d’apprentissage automatique. Ces modèles s’appuient sur les données d’utilisation des produits ainsi que sur les informations de vente et de marketing. Au fil du temps, les comptes passent de modèles reposant exclusivement sur des statistiques historiques à des modèles d’apprentissage automatique plus personnalisés à mesure que nous obtenons davantage de données sur chaque client et que leurs modèles d’utilisation évoluent.
  2. Sollicitez des commentaires et recueillez des contributions. Pour compléter les prévisions ML brutes quotidiennes avec des informations sur le terrain, une fois par trimestre, nous distribuons les prévisions quotidiennes les plus récentes à l’équipe de vente et sollicitons leur avis sur les changements attendus dans le comportement des clients qui ne sont pas évidents dans l’historique d’utilisation. Nous recueillons également des informations sur les modifications à venir du produit ainsi que sur le traitement comptable de divers facteurs. La combinaison de ces informations détermine le type d’ajustements dont la prévision ML aura besoin. Ces ajustements sont des montants en dollars qui peuvent être appliqués au niveau du compte pour chaque jour des mois, trimestres et années spécifiés. Nous effectuons également des ajustements supérieurs qui sont répartis sur tous les comptes ou groupes de comptes.
  3. Générez et ajustez une prévision ML d’enregistrement. Armés des entrées nécessaires, nous prenons ensuite la prévision ML la plus récente et la transmettons à notre pipeline d’ajustement.
  4. Analysez, examinez et mettez à jour les prévisions ajustées. Nous soumettons les prévisions ajustées à un processus d’examen rigoureux qui implique un certain nombre de vérifications d’intégrité ainsi qu’une analyse des biais de prévision historiques, des tendances de consommation et de la saisonnalité. Ce processus informera souvent des ajustements supplémentaires à la prévision.
  5. Déployez les prévisions finales parallèlement aux mises à jour quotidiennes. Une fois les examens finaux passés, la prévision est désignée comme notre plan de revenus trimestriel et est déployée. Cela inclut la poussée vers nos tableaux de bord de rapports quotidiens, qui affichent le plan trimestriel aux côtés des prévisions les plus récentes. Les ajustements déterminés au cours de ce processus trimestriel sont également apportés aux prévisions quotidiennes brutes ultérieures. Certains des ajustements apportés aux reprévisions quotidiennes diminueront au fur et à mesure que le trimestre progresse à mesure que nous obtenons de nouvelles informations, tandis que d’autres, tels que les ajustements comptables, conserveront leur ampleur jusqu’à la fin du trimestre. De plus, nous effectuons des mises à jour au milieu du trimestre des ajustements si nécessaire.
er0IXFHZGwa8deles7rCdnfvMHIGLXq56MGiUF72lmD4kV930ECV6fLhlFEh btXpFusLzD Lgnvg10xCvZjBKX9LoAAyyh 0pVrnq9cRm5IG5uaSqweDAiQ99rR m210OzESNr

Notre processus de prévision

Les clés d’une prévision réussie : données, partenariat, plateforme

Données, données, données

En tant que scientifiques des données, nous préférons généralement nous concentrer sur les aspects du processus de modélisation – métriques, ingénierie des fonctionnalités, sélection de modèles, réglage des hyperparamètres, méthodologie de validation – qui sont tous des sujets importants, mais nous ne pouvons pas perdre de vue l’importance d’avoir tous les bonnes données facilement accessibles en un seul endroit.

Au sein de Snowflake, nous centralisons les données de notre ERP, les données des systèmes d’entreprise tels que Salesforce, les données tierces des partenaires Snowflake Data Marketplace tels que Dun & Bradstreet, ainsi que des sources de données développées en interne, telles que notre moteur de facturation et la vaste mine de métadonnées générées par notre produit. Une source de vérité centralisée nous permet de développer une vue holistique de l’entreprise qui est mise à jour quotidiennement.

rk k5fNJbDJNrF69qicCtHk8MBoOr3l27kSKmHnVADqhzGWjGQfg HteO8X 0JZW7wSf5XyMSi07nCls3nmXS5CFh

Snowflake est une source de vérité centralisée pour toutes les données pertinentes

Partenariat avec diverses fonctions commerciales

Avec une telle variabilité dans nos activités, le processus de prévision repose sur un partenariat avec les équipes de Snowflake. Comme je l’ai souligné plus tôt, nous travaillons en étroite collaboration avec l’équipe des ventes pour recueillir des commentaires sur la façon dont nos prévisions s’alignent sur ce qu’ils voient. Cela nous aide à identifier et à comprendre tout changement inattendu dans la consommation des clients qui ne peut être prédit à partir des données disponibles.

En plus des ventes, nous travaillons avec des fonctions telles que les produits, la comptabilité et la planification financière de l’entreprise pour comprendre d’autres facteurs influençant la consommation.

Une plate-forme de données offrant évolutivité, flexibilité et contrôle

Disposer de la bonne plate-forme de cloud de données permet à notre équipe d’évoluer plus rapidement et de collaborer facilement entre les équipes et les sources de données. Plusieurs aspects de Snowflake font une grande différence pour notre équipe :

  • Performant à grande échelle : Étant donné que de nombreuses personnes utilisent Snowflake, il est important que nous ne rencontrions pas de conflit de ressources avec d’autres services ou que nous rencontrions des requêtes lentes pendant les moments critiques. Grâce au calcul multicluster et à la mise à l’échelle automatique, Snowflake a pu gérer n’importe quelle quantité de données ou d’utilisateurs que nous lui avons lancés.
  • Sécurisé et gouverné : Notre équipe travaille avec de nombreuses données financières sensibles. Les contrôles de gouvernance multipartites tels que les politiques d’accès au niveau des lignes et le masquage des données nous donnent un contrôle précis sur le partage des bonnes données, avec les bonnes personnes.
  • Source de vérité centralisée : J’en ai parlé plus haut, mais le fait de pouvoir accéder instantanément aux données pertinentes, qu’elles proviennent de notre ERP ou de fournisseurs de données tiers, dans un endroit centralisé nous permet de développer une vue à 360 degrés de notre entreprise.
  • Automatisation: Nous reprévisions quotidiennement une multitude d’indicateurs. Les performances incroyables de Snowflake permettent toutes les transformations très complexes à grande échelle nécessaires tout au long de la journée. De plus, la facilité d’utilisation de Snowflake permet à une petite équipe de maintenir ce gros pipeline de données, qui est largement libre de se concentrer sur le fond de son travail au lieu de faire face à la complexité de la plateforme sous-jacente.

Alors que les entreprises adoptent de plus en plus modèles économiques basés sur la consommation, trois choses leur permettront de prévoir avec précision les indicateurs financiers clés : 1) Intégrer des scientifiques des données au sein de votre organisation financière ; 2) utiliser le Cloud de données pour pouvoir centraliser, utiliser et gouverner les données de manière transparente ; et 3) établir et maintenir des relations étroites avec les équipes de votre organisation.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.