A presentation at Internal by Seb Ferrer
Saviez-vous qu’il existe des équipes dont le but est de s’occuper des outils internes de votre entreprise ?
Ces équipes, souvent un peu cachées dans l’ombre, gèrent le développement, intégrations et synchronisations des outils que vous utilisez au quotidien dans votre travail.
Maintenant, si je vous dis que ces équipes ne sont souvent composées que de peu d’effectifs, et opèrent sur des dizaines de projets différents, avez-vous une idée de comment elles font pour réagir en cas d’incident ?
Comment sauver sa production efficacement ?
Au travers de mon expérience dans mon équipe chez OVHcloud, je vais vous raconter comment nous faisons pour être réactif en production en cas d’alerte.
Nous verrons quels sont les moyens qui ont été mis en place afin de nous permettre de trouver des indices en un temps record sur les problèmes qui surviennent au quotidien.
Vous découvrirez alors qu’une gestion d’incident ressemble parfois à une enquête digne d’une partie de Cluedo, et peut-être réaliserez -vous à quel point la gestion d’incident est un domaine passionnant.
Si vous voulez en apprendre plus sur les bonnes pratiques de troubleshooting, logging, ou encore monitoring, vous êtes au bon endroit !