Los ávidos jugadores de PC saben que si quieres un rendimiento óptimo, tienes que llevar tu computadora a sus límites. Y si su "plataforma" de juegos no está equipada adecuadamente con un gran ventilador interior, su PC puede sobrecalentarse, lo que resulta en más de unos pocos rendimientos. cuestiones.
Es lo mismo para dispositivos de nivel empresarial o piezas de hardware: el sobrecalentamiento crea problemas. Una de esas piezas de hardware de nivel empresarial (y posiblemente la pieza más crucial del equipo) es un servidor. Como era de esperar, las empresas conocidas tienen un abundancia de servidores.
Según The Verge, Netflix tiene más de 17,000 servidores en las oficinas del gigante de la transmisión y otras ubicaciones en todo el mundo. En un par A mayor escala, Time informa que Google tiene un poco más de dos millones de servidores que se encuentran en casi 30 centros de datos. Con esos números en Tenga en cuenta que tanto Netflix como los respectivos equipos de TI de Google deben monitorear todo ese hardware.
Con los entornos de trabajo híbridos y remotos de hoy en día, mantenerse al día con la salud de sus servidores es más importante que nunca, especialmente porque los servidores son propensos a sobrecalentarse si no se toma el cuidado adecuado. Para la letra H en nuestro ABC de ITIM, estamos discutiendo qué es la supervisión de hardware, por qué es tan importante y qué pueden hacer los profesionales de TI para resolver posibles problemas de rendimiento de hardware.
¿Qué es la supervisión de hardware y por qué debería importarme?
La supervisión de hardware es la práctica en la que un profesional de TI utiliza una herramienta o método para recopilar y analizar datos de los sensores disponibles en un sistema. Muchos componentes físicos (servidores, ventiladores, baterías, etc.) tienen sensores en su interior que pueden detectar o medir cambios. Estos son muy útiles cuando se monitorea hardware para una empresa.
Los profesionales de TI y redes obtienen varios beneficios al utilizar prácticas de monitoreo de hardware, incluida la capacidad de:
- Identifique inmediatamente los problemas de estado del hardware del servidor, como altas temperaturas, discos defectuosos o alto uso de CPU
- Proporcionar alertas y notificaciones de problemas de servidor y hardware
- Previsión y planificación de los límites de capacidad energética
- Reduzca el tiempo de inactividad de servidores y aplicaciones
Como mencionamos anteriormente, el sobrecalentamiento es uno de los problemas más comunes para el hardware empresarial. Por ejemplo, cada vez que un servidor comienza a sobrecalentarse, puede dar lugar a una variedad de problemas a corto y largo plazo que van desde CPU apagadas, dañadas memoria del programa, apagados del sistema (que resultan en otros problemas relacionados con la memoria) y rendimiento mediocre del hardware.
Prestar atención a los componentes del hardware es una forma eficiente de realizar un seguimiento de la salud de sus servidores. Por ejemplo, si su servidor está funcionando a una temperatura alta durante un período prolongado, eso puede indicar problemas más profundos. Si es posible, usted Debe configurar un monitor de temperatura que verifique el estado de los sensores de temperatura de un dispositivo: si el indicador de estado del sensor devuelve un "normal" u "ok", se considera activo.
El mejor método es monitorear los indicadores esenciales del estado del servidor, que incluye la utilización de la CPU, la memoria y el disco. Al utilizar monitores activos y alertas automatizadas, los usuarios recibirán notificaciones que indican lo que está sucediendo con el hardware. Estos no son mutuamente excluyentes para los servidores: cualquier pieza de hardware de nivel empresarial con sensores e indicadores puede ser monitoreada.
Las soluciones de monitoreo de hardware de Progress WhatsUp Gold también se pueden configurar para mostrar información como el estado del ventilador y la fuente de alimentación. La información disponible sobre el servidor depende del dispositivo que se está supervisando. Por lo general, somos capaces de supervise toda esta información para dispositivos Dell, Cisco, HP y EMC.
Monitoreo de servidores, ventiladores y otros tipos de hardware con WhatsUp Gold
Disponibles desde el primer momento, las capacidades de monitoreo de hardware de WhatsUp Gold pueden ayudar a mitigar los problemas que involucran un rendimiento mediocre antes de que comiencen. Las capacidades principales de WhatsUp Gold con el monitoreo de hardware incluyen las siguientes:
- WhatsUp Gold envía alertas cuando la capacidad de la batería del UPS está por debajo de un umbral configurable, si la temperatura dentro de la batería es demasiado alta o si una batería entra en modo de derivación como resultado de una sobrecarga de la batería.
- Los monitores de rendimiento y los gráficos ayudan a rastrear los dispositivos que tienden a experimentar altas temperaturas.
- WhatsUp Gold puede identificar posibles problemas relacionados con el funcionamiento del ventilador, incluida la inacción o el reemplazo.
Las alertas automatizadas en WhatsUp Gold ayudan a los usuarios finales a saber dónde y cuándo solucionar problemas de hardware. Con Alert Escalation, los usuarios pueden configurar directivas de notificación en el Centro de alertas para escalar alertas basadas en la criticidad de los componentes de red. Las alertas pueden pasar de la generación automática de tickets de problemas al envío de advertencias a administradores previamente designados.
La confirmación de alerta, una función de notificación adicional, notifica a los usuarios cuando se soluciona un problema de hardware en curso. Si WhatsUp Gold ya no envía alertas (a menos que se active por la política de notificación o como mensajes de registro después), el problema ha sido resuelto. La herramienta de confirmación de alertas también garantiza que los problemas no solucionados dentro del plazo se aborden adecuadamente.
Descubrimiento de hardware automatizado, disponible desde el primer momento
Si bien los clientes siempre han podido usar WhatsUp Gold para monitorear el estado del hardware a través de configuraciones manuales, a partir de octubre de 2022 (versión 2022.1) ahora tiene la funcionalidad de monitoreo del estado del hardware disponible "lista para usar". Para hacer esto, WhatsUp Gold utiliza la herramienta de descubrimiento Redfish, como puede ver en el breve video "cómo hacerlo" a continuación.
El monitoreo de hardware es beneficioso para su infraestructura de TI y red
Monitorear una pieza física de hardware en la oficina ya no es un sueño imposible. Si una empresa tiene una multitud de servidores, la monitorización de hardware es ahora más importante que nunca. Al implementar una solución de monitoreo de hardware, los profesionales de TI comienzan a analizar uso de recursos del sistema e identificar fácilmente los problemas causados por un rendimiento deficiente del hardware.
La próxima vez que ocurra un problema de rendimiento con un servidor sobrecalentado o un error del programa, la implementación de una solución de supervisión de infraestructura de TI puede marcar la diferencia para el éxito operativo de su entorno de trabajo. Obtenga más información sobre cómo WhatsUp Gold puede ayudarlo con sus necesidades de monitoreo de hardware.
Ver todo el ABC de la supervisión de infraestructuras
¿Desea comenzar con los conceptos básicos del monitoreo de la infraestructura de TI? Nuestro índice alfabético es un excelente lugar para comenzar o extender su educación. Vea todos nuestros temas actuales.