Le leader européen du bricolage, de la maison et du jardin en ligne a fait le choix de la solution Snowflake pour concevoir une plateforme data orientée utilisateurs dans une approche data self serve. Résultat : une solution calibrée aux besoins de l’entreprise et des utilisateurs à la fois autonomes et responsabilisés dans leurs usages de la data.

ManoMano : un contexte d’hyper croissance

Fondée en 2013 et fort de 725 millions d’euros de fonds levés, ManoMano a connu depuis ses débuts une croissance particulièrement rapide. Marketplace verticale spécialiste du bricolage, de la maison et du jardin, ManoMano réunit plus de 4 000 marchands, et référence 16 millions de produits. Depuis leurs bureaux de Paris, Bordeaux et Barcelone, les quelque 1 000 collaborateurs que compte l’entreprise couvrent les besoins de 7 millions de clients actifs sur toute l’Europe. Depuis 2019, la plateforme ManoMano, qui attire plus de 50 millions de visiteurs uniques par mois, s’est également lancée sur le marché du B2B avec le lancement de sa plateforme ManoManoPro

Compte tenu de son positionnement exclusivement en ligne, ManoMano est plus qu’une entreprise « data driven » : la data est inévitablement au cœur de l’activité et du succès de la marketplace. Quel que soit son métier, chaque collaborateur est amené à utiliser la donnée chez ManoMano. Et notamment pour les opérations de scraping, à savoir le recueil d’informations automatisé sur la concurrence, et le tracking des comportements des usagers. Objectif : comprendre la navigation usagers, rester compétitif sur le marché, élargir le catalogue, identifier de nouveaux leads, ou encore renforcer le positionnement de ManoMano auprès des professionnels. 

En comptant également les données internes (volumes de ventes, promotions, etc.), les volumes de données stockées et traitées sont colossales : en moyenne, 2 millions de requêtes de type Select sont opérées chaque semaine chez ManoMano, pour permettre à chaque collaborateur, dans son périmètre propre, d’élaborer de nouvelles données pour améliorer les performances de l’entreprise. Au total, pas moins de 200 KPI, dont une trentaine de « golden KPI » sont ainsi délivrées à la direction quotidiennement. Enfin,  machine learning et data science complètent le dispositif data de ManoMano :  catégorisation, extraction automatique des caractéristiques produits, recommandations de produits, cross-selling, etc. 

La donnée, vecteur de performances business

Dans un tel contexte d’hyper croissance, la gestion des données se complique progressivement jusqu’à créer de véritables risques.  « Nous faisions face à 2 problèmes : une dégradation des performances et de la qualité des données dans notre data warehouse existant, et une dette technique en hausse en raison d’un trop grand nombre d’outils utilisés. De fait, l’organisation des données étaient de moins en moins alignée avec des besoins métiers en progression exponentielle » se souvient Cédric Cormont, Senior Lead Data Architect chez ManoMano.

En 2020, l’entreprise se tourne donc vers Snowflake pour déployer une plateforme de données en phase avec ses besoins actuels et surtout futurs, en corrélation avec les objectifs importants de croissance de ManoMano. Un projet qui s’inscrit, selon l’architecte data, dans un processus en 4 étapes : « dans un premier temps, il s’agissait de renforcer les performances techniques puis de définir rapidement une organisation des données en phase avec la croissance des volumes de data. Après une troisième étape de rationalisation et de stabilisation de la plateforme, la finalisation du projet doit permettre une organisation des données au sein du nouveau data warehouse, afin de renforcer la data quality ». 

La migration de l’ancien data warehouse vers la plateforme Snowflake s’opère en 6 mois, dont un dernier mois de double run. Pour cette première phase, ManoMano fait le choix d’une copie de l’existant, sans travail d’optimisation ou de remodélisation particulier. Cette solution était suffisante, dans un premier temps, pour résoudre nos problèmes de performances », précise Cédric Cormont. Le déploiement de Snowflake était surtout, pour ManoMano, l’élément indispensable pour entreprendre une refonte totale de la stratégie et de la gouvernance data orientées usages.

Avant cela, ManoMano repense son approche organisationnelle. Jusque-là empirique autour d’une organisation centralisée et d’équipes multi-tâches, avec le risque d’être submergées par les problématiques techniques, la structure organisationnelle se spécialise, avec d’une part des équipes techniques, et d’autre part des équipes métiers. « Une organisation qui n’était pas possible avant le déploiement de Snowflake » précise le data architect.

Snowflake, pour une data en self-service

En s’appuyant sur l’audit Snowflake 360, réalisée par les équipes Snowflake chez ManoMano en une semaine d’observations et d’analyses, l’entreprise lance une approche de type FinOps, avec un objectif très clair : maîtriser les coûts du cloud en responsabilisant les utilisateurs, en particulier les data scientists eux-mêmes, à l’aide de dashboards ou encore d’alertes de consommation.

Les questions de gouvernance des données peuvent alors être soulevées. « Avec Snowflake, nous avons dès le départ envisagé d’impliquer les métiers, afin qu’ils s’emparent des sujets data, poursuit Cédric Cormont. Dans une entreprise, la donnée n’a pas pour objet de faire plaisir aux équipes data mais bien de servir le business, qui doit être en mesure de l’utiliser en self service ». Un data catalogue est donc mis à disposition de tous les utilisateurs sur la plateforme Snowflake, afin de permettre aux métiers de découvrir et comprendre les data existantes : qui en est responsable ? Quel SLA (niveau de fraîcheur) ? Comment et qui doit gérer les incidents ? Etc. 

Et les résultats ne se font pas attendre : les usages de BI bien sûr, mais également de data discovery, de data visualisation et de dashboarding (avec SnowSite) se multiplient. Et les projets faisant appel au machine learning ou au data sharing (partage de données entre applications) se développent également. Pour aller encore plus loin, ManoMano s’appuie sur l’orchestrateur AirFlow de Snowflake pour développer une architecture Event driven. « Avec cette approche, Snowflake nous a permis de casser notre monolithe de data mais aussi et surtout de concevoir des microservices capables de publier des business events, pour éviter de casser les pipelines lors de la modification de schémas de données, y compris avec des outils SaaS », se félicite Cédric Cormont.

Pour finaliser son approche data self serve sans risquer de complexifier la plateforme data, ManoMano fait appel aux design layers de Snowflake qui permettent de construire des tables business, de les documenter et de les verser au catalogue pour une future réutilisation. Tandis qu’une data academy permet aujourd’hui d’accompagner et de certifier les utilisateurs dans leur usage de la data en self service.

Aujourd’hui parfaitement stable et très utilisée par l’ensemble des collaborateurs, Snowflake permet à ManoMano d’aller plus loin dans son approche data en valorisant les données de son écosystème (marchands de sa marketplace).