martes, 27 de septiembre de 2016

check_esxi_hardware.py (Service check timed out after 60.01 seconds)

Tenemos en la empresa 4 ESXi configurados de igual forma y en uno de ellos empecé a recibir la siguiente alarma de monitoreo en nagios:



Al ejecutar el check_esxi_hardware.py desde la cli de nagios obtenía que se quedaba trabado en lo siguiente y no seguía:

root@nagios:~# ./check_esxi_hardware.py -H mi_server_esxi -U root -P mi_passguord -V marca_server -v
20160927 15:22:24 Connection to https://mi_server_esxi
20160927 15:22:24 Check classe OMC_SMASHFirmwareIdentity

En los logs del vmware aparecía el siguiente error:

esxi@agios:~# tail -f /var/log/syslog.log
sfcb-vmware_base[2954690]: Timeout (or other socket error) sending request to provider

Nos logueamos al VCenter y vamos a: 
 1. Configuration
 2. Security Profile
 3. Properties



Luego seleccionamos "Servidor CIM" -> Options:



Seleccionamos seguimos los pasos:

 1- Start and stop manually
 2- Ok
 3- Restart



Volvemos a ejecutar el ./check_esxi_hardware.py y veremos que devuelve el valor, luego de unos minutos se fue la alarma del nagios.