Comment faire quand on doit faire le suivi de toute l’infrastructure du plus grand fournisseur de cloud Européen ? Comment choisir un outil quand les plus populaires ne tient pas la marée à cette échelle ? Comment construire une plateforme Metrics pour unifier, concilier et remplacer des années de legacy fragmenté et des solutions partielles ?
Dans ce talk nous racontons notre expérience sur la construction et la maintenance d’OVH Metrics, la plateforme utilisée pour monitorer toute l’infrastructure OVH. Nous avions besoin d’aller à des endroits où la plupart des solutions de monitoring ne sont jamais allées, opérer à l’échelle du plus grand fournisseur Européen de cloud et hosting : 27 data centers, plus de 300k serveurs (physiques !) et des centaines de produits pour accomplir notre mission avec nos 1,3 millions de clients.
Venez pour entendre cette histoire de séries temporelles, de solutions open-sources poussées à l’extrême, de clusters HBase opérés en limite de capacité, et de comment une petite équipe s’est appuyée sur une poignée de solutions open-source et une bonne dose de code maison pour construire une des solutions de monitoring parmi les plus performantes au monde.