Site Reliability Engineer

En ma qualité d'ingénieur en fiabilité des sites (SRE), je vous propose un aperçu des outils techniques et logiciels que j'emploie quotidiennement dans mes fonctions.
Mon objectif principal est de garantir la disponibilité, la performance et la résilience des services. Il est également nécessaire de s'assurer de la sécurité de tous ces systèmes.

Les missions que j'accomplis gravitent principalement autour de deux pôles : la surveillance et le stockage de données, toujours associés à des outils d'automatisation pour la gestion de configuration as code ou d'infrastructure as code.

Monitoring

Le monitoring permet de surveiller en temps réel les performances et les éventuelles anomalies, afin de pouvoir intervenir rapidement en cas de problème. La surveillance continue d'un système informatique est cruciale pour garantir sa fiabilité et sa disponibilité. Le monitoring permet de détecter les erreurs et les pannes avant qu'elles ne deviennent critiques, et ainsi de minimiser les interruptions de service.

Zabbix

Un outil puissant pour la surveillance des systèmes et des applications, permettant la détection de l'usage, la découverte des services ainsi que la visualisation des données, et supportant l'envoi d'alertes lorsque des seuils sont dépassés.

Datacenter

La température, la consommation d'énergie, la ventilation et le contrôle d'accès sont des indicateurs importants pour la vie d'un datacenter. D'autres protocoles spécifiques (SNMP/Modbus) doivent être utilisés pour obtenir les informations nécessaires.

Grafana

Une plateforme open source de visualisation de données qui permet de créer des tableaux de bord interactifs pour suivre et analyser ses données en temps réel.

Data Storage and Processing

Le stockage de données sous forme de logs ou de données temporelles offre une visibilité complète sur les activités passées et présentes d'un système. De larges volumes de données nécessites des solutions appropriés que ce soit pour absorber, traiter, stocker et permettre des recherches efficacement. 
Elasticsearch
Un outil puissant pour l'indexation et la recherche de données, utilisé avec la stack ECK, il fournit une infrastructure évolutive.
KeyDB
Solution de stockage de données clé-valeur distribuée, il permet de gérer facilement des volumes importants de données ou d'obtenir du cache.
Graphite
Un logiciel pour recevoir et stocker de grandes quantités de données de manière optimale. Il est nécessaire de mettre en place une infrastructure HA qui n'est pas nativement disponible.

Bases de données

Les bases de données relationnelles offrent une structure de données flexible et évolutive, adaptée aux besoins des entreprises modernes. Pour tirer pleinement parti de cette flexibilité, il est important de disposer d'une infrastructure fiable et performante. Cela comprend des solutions de haute disponibilité, telles que la mise en cluster des serveurs de base de données, ainsi que des stratégies de sauvegarde et de restauration efficaces.
Une base de données reconnue pour sa scalabilité exceptionnelle et ses performances élevées. Elle offre une solution robuste pour gérer des volumes importants de données tout en maintenant des temps de réponse rapides.

Une solution de mise en haute disponibilité de SGBD mysql/mariadb. Automatisant l'élection d'un nouveau primary en cas de problème ou pour une maintenance, il limite les durées d'indisponibilités

MySQL, tout comme MariaDB, est un système de gestion de base de données relationnelle open source largement utilisé.

Automation tools :

Recherche