La place de marché ManoMano spécialisée dans le bricolage et la maison, plonge ses équipes dans des défaillances techniques contrôlées afin de les entraîner à être plus efficaces en cas de vrais problèmes. La continuité d’activité et la bonne marche du site sont des enjeux clés pour cette plateforme européenne qui est visitée par 50 millions de personnes chaque mois.
Simulation de plusieurs incidents techniques sur la plateforme
Le 2 décembre dernier, les équipes de ManoMano ont ainsi du réagir lors de la simulation de plusieurs incidents. Il y a eu un verrouillage aléatoire de certaines tables de bases de données en pré-production, des pages produits ont été dégradées sur le site e-commerce et il y a eu des problèmes générés sur le système de paiement et dans la gestion des stocks. La journée a été concluante car elle a permis de montrer la qualité des outils de suivi, la réactivité des équipements et a aidé à améliorer la façon d’atténuer l’impact de telles pannes.
Les échanges ont accru le partage des bonnes pratiques et amélioré les interactions avec les nouveaux arrivants
Ces événements permettent de se former à la façon dont les systèmes techniques réagissent au stress. Ils servent également à améliorer la compréhension des problèmes et favorisent une culture de communication et de solidarité lors des incidents. Chaque équipe est composée de participants issus de départements différents au sein de ManoMano.
Les gens apprennent à utiliser les outils de monitoring
« Notre but n’est pas de provoquer un chaos dans notre production, ni un sentiment de malaise pour nos collaborateurs » prévient Clément Hussenot, Platform Engineering Manager chez ManoMano. D’ailleurs, ces journées sont baptisées Game Days. « Ces événements permettent la mise en place de situations contrôlées pour que chacun apprenne à naviguer dans nos outils de monitoring, effectuer une remédiation [NDLR : correction des erreurs] rapide et durable des incidents qui pourraient arriver en conditions réelles » poursuit-il.
L’objectif de ManoMano est de libérer ses collaborateurs du stress des incidents de production
« Nous sommes convaincus que l’humain doit être au cœur de notre stratégie, y compris à la tech » commente Stéphane Priolet, Chief Technology Officer de ManoMano. « Nous voulons donner toutes les clés à nos collaborateurs pour qu’ils puissent développer les meilleures solutions et services en tenant compte de la résilience de leur code, de la stabilité de la plateforme et au final de l’expérience des clients » dit-il.
Le trafic a été multiplié par 4 au printemps 2020
Il faut dire que ManoMano est en forte croissance. Il y a eu 100% de croissance en 2020 et le trafic a été multiplié par 4 au printemps 2020. Côté technique, il faut assurer la production et la stabilité de la plateforme. Dans le même temps, il faut conserver de la flexibilité pour développer de nouvelles fonctions techniques et anticiper la croissance à venir. Les journées de Chaos Engineering servent à sensibiliser tous les employés aux problèmes de résilience, de fiabilité et de disponibilité des déploiements techniques.
ManoMano emploie aujourd’hui 900 personnes en France et en Espagne. La moitié des effectifs sont techniques. ManoMano a fait le choix de construire sa propre plateforme technologique pour s’assurer d’une autonomie de déploiement et d’actions.