Ceux qui travaillent dans un service informatique savent que la disponibilité des serveurs est cruciale. Les temps d'arrêt du serveur peuvent entraîner des problèmes majeurs, allant d'une productivité réduite à des problèmes qui affectent l'expérience client et peuvent même entraîner une perte de ventes. Mais réduire au minimum les temps d'arrêt n'est pas aussi simple que de résoudre les problèmes au fur et à mesure qu'ils surviennent. Pour garder vos serveurs en ligne et éviter les temps d'arrêt, vous devez comprendre ce qui se passe avec eux.
C'est là qu'intervient la supervision du réseau.
La supervision de toutes les ressources système associées à un serveur vous aidera à mieux comprendre les modèles d'utilisation des ressources qui vous permettront de savoir quand les choses fonctionnent correctement et quand elles commencent à mal tourner. De cette façon, vous pouvez toujours vous assurer que vos serveurs sont optimisés, résoudre les problèmes avant qu'ils ne surviennent et offrir une meilleure expérience à l'utilisateur final. Mais accéder à toutes ces informations et les synthétiser en alertes et rapports compréhensibles et exploitables est plus facile à dire qu'à faire.
Dans cet article, je vais vous présenter quelques-unes des façons dont vous pouvez utiliser WhatsUp Gold pour surveiller les serveurs physiques, de la santé du serveur à son utilisation. Si vous recherchez un examen plus approfondi des sujets abordés ici, ainsi qu'une démonstration des capacités de surveillance des serveurs de WUG, consultez notre récent webinaire Server Monitoring, maintenant disponible à la demande.
Surveillance de la santé de votre serveur
Parfois, il peut sembler qu’il y a toujours un problème avec le matériel du serveur. Des erreurs de processeur aux surcharges de mémoire, des problèmes peuvent fréquemment survenir lors d'une utilisation normale et ne deviennent de plus en plus fréquents à mesure que votre entreprise se développe et intègre de plus en plus de périphériques, qui ne fonctionnent pas toujours bien les uns avec les autres.
La meilleure façon de rester au courant de tout cela est de surveiller les indicateurs essentiels de la santé du serveur - utilisation du processeur, de la mémoire et du disque, avec des moniteurs actifs et configurer des alertes qui vous permettront de savoir quand les choses ne vont pas bien.
Cela signifie que vous pouvez faire des choses comme suivre la charge du processeur à travers des périodes spécifiques afin que vous puissiez voir quand la charge du processeur a atteint un pic inattendu (peut-être en raison de goulots d'étranglement du processeur, d'attaques de service ou d'autres incidents de service) ou vous pouvez voir quand il est anormalement inactif, donc si un serveur est tombé de la configuration de l'équilibreur de charge ou de la panique du noyau, vous le saurez également. Et bien sûr, vous pouvez être alerté lorsque l'utilisation dépasse le seuil que vous avez choisi.
Vous pouvez faire de même pour l'utilisation de la mémoire et configurer des rapports qui compareront la capacité de stockage sur disque à l'utilisation réelle des périphériques avec stockage sur disque, ce qui est utile pour la planification de la capacité.
Surveillance des composants matériels
Les composants matériels sont un autre bon moyen de suivre l'état de santé de vos serveurs - si votre serveur fonctionne à une température élevée pendant une période prolongée, cela peut indiquer des problèmes plus profonds. Si possible, vous devez configurer un moniteur de température qui vérifiera l’état des capteurs de température d’un appareil - si le capteur renvoie un indicateur d’état «normal» ou «ok», il est considéré comme actif. Sinon, il est en panne.
WhatsUp Gold peut également être configuré pour afficher des détails tels que l'état du ventilateur et de l'alimentation. Les informations disponibles sur le serveur dépendent de l'appareil surveillé. En règle générale, WhatsUp Gold est capable de surveiller toutes ces informations pour les périphériques Dell, Cisco, HP et EMC.
Configurer des alertes critiques
Bien sûr, aucune de ces fonctionnalités de surveillance intéressantes n’a d’importance si vous ne pouvez pas savoir quand quelque chose ne va pas. C’est là que l’alerte entre en jeu. Dans le cas où un serveur ou tout votre réseau est sous tension, WUG vous le dira tout de suite - via des alertes personnalisables envoyées par e-mail, SMS ou même slack. Vous pouvez donc intervenir rapidement et éviter à votre entreprise de devoir faire face à des conséquences potentiellement graves.
Mais les alertes peuvent également être un casse-tête si elles sont mal configurées. Vous ne devez pas, par exemple, recevoir d'alertes pour chaque appareil dépendant qui tombe en panne. Si un appareil de passerelle tombe en panne, c'est la seule alerte dont vous avez besoin, vous n'avez pas besoin d'une alerte de chaque appareil connecté, au-delà de celle vous indiquant que sa connexion a été perdue.
Avec WUG, ces tempêtes d'alerte sont facilement évitées, car il applique automatiquement des règles de dépendances aux périphériques de couche 2 et 3 pour éviter les tempêtes d'alerte. Ces paramètres peuvent également être définis manuellement.
Avec l'escalade d'alertes, les règles de notification dans le centre d'alerte peuvent être configurées pour escalader les alertes en fonction de la criticité des composants du réseau - les alertes peuvent passer de la génération automatique de tickets d'incident à l'envoi d'alertes aux administrateurs pré-désignés.
Avec la fonction d'accusé de réception d'alerte, l'accusé de réception d'une alerte par le premier répondeur est considéré comme une indication que le problème est en cours de traitement, et aucune autre alerte n'est envoyée, à moins qu'elle ne soit déclenchée par les règles de notification ou sous forme de messages de journal une fois le problème résolu. Cela garantit que les problèmes qui ne sont pas résolus dans le délai imparti sont traités de manière appropriée. De même, des informations sur l'action entreprise peuvent être ajoutées au processus d'accusé de réception, fournissant ainsi des données de résolution de problème qui peuvent être utilisées en cas de réapparition du problème.
Voyez par vous-même et essayez Whatsup Gold aujourd'hui!