Comment sont détectées les anomalies serveur sur un hébergement infogéré ?

Écran de supervision affichant des alertes de monitoring sur un serveur infogéré

Pour différentes raisons, un serveur peut tomber. Cela peut venir d’une saturation mémoire, d’un service qui ne répond plus, d’un disque plein, d’un certificat SSL expiré… Grâce à un hébergement infogéré, ce genre d’anomalies est généralement détecté et traité avant que vous n’en constatiez les effets. C’est ce que le monitoring continu permet lorsqu’une équipe technique est disponible pour agir derrière les alertes. Mais comment cette surveillance fonctionne-t-elle ?

Qu’est-ce que couvre le monitoring sur un hébergement infogéré ?

Le monitoring est souvent résumé à tort à une vérification de disponibilité : le serveur répond ? Alors tout va bien ! En réalité, le monitoring est un dispositif sérieux qui surveille bien plus. Il couvre l’état des ressources système, le comportement des services applicatifs, les seuils d’alerte configurés et la cohérence des sauvegardes.

Sur un hébergement infogéré, le dispositif tourne en continu pour repérer les anomalies. Des sondes actives interrogent le serveur à intervalles réguliers, collectent des métriques et les comparent à des seuils définis. Quand une valeur sort de la plage normale, une alerte est ainsi générée. Ce n’est évidemment pas un humain qui surveille un écran en permanence, c’est le système automatisé qui remonte les signaux et une équipe technique qui les traite.

La différence entre un hébergement mutualisé standard et un hébergement infogéré tient largement à ce point. Sur un mutualisé, personne ne surveille spécifiquement votre site internet. En revanche, sur un infogéré, le périmètre de surveillance est défini contractuellement et l’équipe technique est engagée à réagir dans des délais courts.

Les métriques surveillées en temps réel par l’hébergeur infogérant

Les sondes de monitoring collectent en permanence un ensemble de métriques système. Chacune renseigne sur un aspect de l’état du serveur et permet alors d’anticiper les anomalies sur votre hébergement infogéré avant qu’elles n’affectent les utilisateurs et votre activité.

MétriqueCe qui est mesuréSignal d’alerte
Charge CPU / load averageSollicitation du processeur et file d’attente des processusLoad average durablement supérieur au nombre de cœurs disponibles : le serveur absorbe plus de requêtes qu’il ne peut en traiter
RAMMémoire consommée par les processus actifsConsommation qui approche la limite allouée : risque de rejet de nouvelles requêtes et d’instabilité des services
I/O disqueDébit en lecture et en écriture sur le stockageSaturation des I/O : ralentissement de tous les services dépendants du stockage (base de données, logs, cache, fichiers de session)
Espace disqueVolume de stockage consomméApproche du quota : risque de blocage des écritures et d’indisponibilité des services
Quota d’inodesNombre de fichiers présents sur le systèmeQuota atteint malgré de l’espace disponible : création de nouveaux fichiers impossible, erreurs silencieuses difficiles à diagnostiquer
Saturation réseauDébit entrant et sortantPic de bande passante inhabituel : trafic mal anticipé, tentative de déni de service ou fuite de données

La surveillance des services applicatifs

Les métriques système ne suffisent pas à garantir qu’un hébergement fonctionne correctement. En effet, un serveur peut afficher une charge CPU normale et un service applicatif critique en état d’échec. La surveillance des processus et des services est un second niveau de monitoring.

Technicien consultant un terminal SSH affichant l'état des services d'un serveur

Le serveur web, qu’il s’agisse d’Apache ou de Nginx, est le premier maillon à surveiller. Une sonde vérifie à intervalles réguliers que le serveur répond aux requêtes HTTP et HTTPS dans des délais normaux. Un processus bloqué ou un worker saturé peut faire chuter les temps de réponse sans que les métriques CPU ou RAM n’affichent d’anomalie évidente sur votre hébergement infogéré.

Le PHP-FPM fait également l’objet d’une surveillance lors d’une infogérance. Le nombre de workers actifs, le taux de requêtes en attente et les éventuels crashes de processus sont des indicateurs de la santé de la couche applicative. En cas de saturation du pool PHP-FPM, des erreurs 502 ou 504 apparaissent côté utilisateur.

MySQL ou MariaDB est surveillé sur sa disponibilité mais aussi sur ses performances (nombre de connexions actives, requêtes lentes, verrous en attente…). Une base de données qui répond peut accumuler des slow queries qui viennent dégrader l’expérience utilisateur sans déclencher d’alerte de disponibilité.

Les certificats SSL sont également surveillés par un hébergement infogéré. Une expiration coupe drastiquement l’accès HTTPS et génère des alertes de sécurité dans les navigateurs, ce qui est bien évidemment très mauvais signe. La sonde vérifie la date d’expiration et déclenche une alerte suffisamment en amont pour permettre un renouvellement sans interruption.

Les sauvegardes sont aussi vérifiées. Qu’elles soient quotidiennes ou plus fréquentes, leur bonne exécution est contrôlée pour éviter qu’un échec de sauvegarde ne survienne au pire moment.

Comment l’équipe technique d’un hébergeur infogéré réagit face à une anomalie ?

Savez-vous ce qu’il se passe après le déclenchement d’une alerte générée par une sonde lors de l’infogérance ? Eh bien on vous explique tout !

Distinction entre une alerte préventive et un incident critique

Il existe plusieurs niveaux d’alerte qu’un système de monitoring distingue. Il ne traitera pas chaque dépassement de seuil comme une urgence. Par exemple, une utilisation CPU à 85% pendant deux minutes est un signal à surveiller, mais pas une urgence. Un service MySQL qui ne répond plus est quant à lui un incident critique qui impacte directement les utilisateurs. Sans gradation du genre, l’équipe technique se noierait dans des alertes peu significatives.

Le circuit d’intervention

Lorsqu’une alerte critique est déclenchée, elle remonte vers l’équipe d’astreinte par plusieurs canaux simultanés quelle que soit l’heure : notification dans l’outil de supervision, SMS, appel si nécessaire. La prise en charge suit un ordre logique :

  • identification de la source de l’anomalie
  • évaluation de l’impact
  • action corrective

Selon la nature de l’incident ou de l’anomalie sur votre hébergement infogéré, cela peut aller d’un redémarrage de service à une intervention plus profonde sur la configuration ou les ressources. Le client est informé dès lors que l’incident affecte la disponibilité ou les performances de son hébergement.

Une disponibilité 24h/24 côté équipe ne signifie pas qu’un ingénieur surveille activement chaque serveur à toute heure. Cela signifie qu’une personne compétente est joignable et en capacité d’intervenir à tout moment, y compris la nuit et le week-end.

Smartphone affichant une notification d'alerte posé sur un bureau à côté d'un ordinateur

Ce que Gladhost met en place pour ses clients infogérés

L’infogérance chez Gladhost est réalisée par une équipe technique française, joignable et en capacité d’intervenir à tout moment. Nos techniciens connaissent donc les environnements qu’ils administrent et interviennent directement sur les serveurs de nos clients.

Le périmètre d’intervention de Gladhost couvre l’ensemble de la couche système :

  • configuration et optimisation du serveur
  • mises à jour de sécurité
  • gestion des services applicatifs
  • surveillance continue des métriques et des processus…

En cas d’incident, le diagnostic et la résolution sont pris en charge sans que le client ait à intervenir ou à ouvrir un terminal.

La communication est aussi un point sur lequel Gladhost s’engage. Le client est informé de la nature du problème, des actions engagées et du retour à la normale pour éviter que le site soit indisponible pendant des heures sans que son propriétaire en soit averti.

Les limites du monitoring automatique

Un dispositif de monitoring sur un hébergement infogéré ne détecte les anomalies que s’il est bien configuré pour surveiller. Les sondes mesurent des métriques système et vérifient que les services répondent. Elles ne comprennent pas ce qui se passe à l’intérieur de l’application.

Une boutique PrestaShop qui affiche des erreurs sur le tunnel de commande à cause d’un module mal configuré ne déclenchera malheureusement pas d’alerte système. Le serveur web répond, PHP-FPM tourne, MySQL est disponible : tout est vert côté monitoring, mais l’utilisateur ne peut pas finaliser son achat. Ce type d’anomalie relève du diagnostic applicatif, pas de la surveillance infrastructure.

Les lenteurs liées à des requêtes SQL sont dans le même cas. Une requête qui met trois secondes à s’exécuter à cause d’un index manquant ne génère pas d’alerte de disponibilité mais dégrade l’expérience utilisateur. L’identifier nécessite une analyse des slow query logs, ce qui sort du périmètre du monitoring automatique et suppose une intervention humaine.

L’infogérance couvre la stabilité et la disponibilité de l’infrastructure. Elle ne se substitue pas au développeur ou à l’intégrateur responsable de l’application.

Notre FAQ à propos des anomalies sur un hébergement infogéré

Quelle est la différence entre un hébergement infogéré et un hébergement managé ?

Les deux termes désignent globalement la même chose : un hébergement dont l’administration système est prise en charge par l’hébergeur. En pratique, le périmètre exact varie d’un prestataire à l’autre. Certains limitent l’infogérance aux mises à jour et à la surveillance, d’autres incluent l’optimisation des performances, la gestion des sauvegardes et le support applicatif.

Les sauvegardes font-elles partie du périmètre d’infogérance ?

Chez Gladhost, la gestion et la vérification des sauvegardes sont incluses dans l’infogérance. L’exécution des sauvegardes est contrôlée et une alerte est générée en cas d’échec. Il est toutefois conseillé de conserver une copie distante de vos données dans un espace de stockage distinct de votre hébergeur. Nous accompagnons nos clients dans ce processus de copie distante afin de vous rendre davantage souverain.

Un hébergement infogéré convient-il à tous les types de sites ?

L’infogérance est pertinente dès lors que la disponibilité de votre site a un impact direct sur votre activité. Une boutique e-commerce, une application métier ou un site à fort trafic ont tout intérêt à s’appuyer sur une équipe technique disponible en permanence plutôt que de gérer les incidents en autonomie.

Un hébergement infogéré protège-t-il contre les attaques DDoS ?

Le monitoring détecte une saturation réseau anormale, ce qui peut signaler une attaque en cours. Si votre site est une cible potentielle, vérifiez que votre hébergeur propose un filtrage du trafic malveillant en amont du serveur.

Quelle est la différence entre un monitoring passif et un monitoring actif ?

Le monitoring passif collecte les métriques que le serveur remonte de lui-même : logs système, métriques d’utilisation, événements applicatifs. Le monitoring actif envoie des requêtes régulières vers les services pour vérifier qu’ils répondent correctement.

Un incident sur le serveur d’un autre client peut-il affecter mon hébergement infogéré ?

Sur un serveur dédié infogéré, non. Vous êtes seul sur la machine, aucune ressource n’est partagée avec d’autres clients. Sur un VPS infogéré, une activité anormale sur un autre VPS hébergé sur le même hyperviseur peut théoriquement générer de la contention. C’est l’un des arguments techniques qui justifie le fait de passer à un serveur dédié infogéré.

Baptiste Laparlière membre de l'équipe Gladhost
Baptiste Laparlière Associé et Directeur clientèle chez Gladhost

Je suis Baptiste Laparlière, cofondateur de Gladhost. J’accompagne le développement de l’entreprise sur les volets commerciaux, financiers et administratifs. Depuis plusieurs années, j’évolue dans l’univers du digital, du e-commerce et de l’hébergement infogéré, avec une approche stratégique et tournée vers les besoins réels des entreprises.

Partager :