+ All Categories
Home > Documents > Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de...

Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de...

Date post: 15-Jun-2018
Category:
Upload: vanxuyen
View: 214 times
Download: 0 times
Share this document with a friend
105
Panel de monitorización de servicios enfocado a usuarios Maria Isabel Belijar Sánchez [email protected] Francisco Yepes Candel [email protected]
Transcript
Page 1: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios enfocado a usuarios

Maria Isabel Belijar Sá[email protected]

Francisco Yepes [email protected]

Page 2: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Índice de contenidos

1) Antecedentes2) Motivación (gore)3) Panel actual4) Experiencia de uso5) Futuro

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 3: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Antecedentes

Page 4: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Sistema de monitorización de la UM

• Noviembre 2005: herramientas propias (SNMP, scripts, Cacti, ...)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 5: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Sistema de monitorización de la UM

• Noviembre 2005: herramientas propias (SNMP, scripts, Cacti, ...)

• Mayo 2007: Nagios

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 6: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Sistema de monitorización de la UM

• Noviembre 2005: herramientas propias (SNMP, scripts, Cacti, ...)

• Mayo 2007: Nagios• Desde junio de 2009 plataforma estable:

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 7: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Sistema de monitorización de la UM

• Noviembre 2005: herramientas propias (SNMP, scripts, Cacti, ...)

• Mayo 2007: Nagios• Desde junio de 2009 plataforma estable:

– Nagios (núcleo de monitorización)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 8: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Sistema de monitorización de la UM

• Noviembre 2005: herramientas propias (SNMP, scripts, Cacti, ...)

• Mayo 2007: Nagios• Desde junio de 2009 plataforma estable:

– Nagios (núcleo de monitorización)

– Centreon (configuración de Nagios)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 9: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Sistema de monitorización de la UM

• Noviembre 2005: herramientas propias (SNMP, scripts, Cacti, ...)

• Mayo 2007: Nagios• Desde junio de 2009 plataforma estable:

– Nagios (núcleo de monitorización)

– Centreon (configuración de Nagios)

– PNP4Nagios (gráficas)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 10: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Sistema de monitorización de la UM

• Noviembre 2005: herramientas propias (SNMP, scripts, Cacti, ...)

• Mayo 2007: Nagios• Desde junio de 2009 plataforma estable:

– Nagios (núcleo de monitorización)

– Centreon (configuración de Nagios)

– PNP4Nagios (gráficas)

– Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 11: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Sistema de monitorización de la UM

• Noviembre 2005: herramientas propias (SNMP, scripts, Cacti, ...)

• Mayo 2007: Nagios• Desde junio de 2009 plataforma estable:

– Nagios (núcleo de monitorización)

– Centreon (configuración de Nagios)

– PNP4Nagios (gráficas)

– Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 12: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Los mapas facilitan la comprensión del estado de los servicios y aplicaciones

Page 13: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Ejemplo 1

Page 14: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

¡Ayyy … intehn !éééé

Ejemplo 1

Page 15: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Ejemplo 2

Page 16: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Ejemplo 3

Page 17: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Ejemplo 4

Page 18: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Ejemplo 5

Page 19: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

… hasta ahora, mapas de estado enfocados a técnicos, no a usuarios ...

Page 20: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Ejemplo 6

Page 21: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Ejemplo 7

Page 22: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Ejemplo 8

Page 23: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosAntecedentes – Nagvis (mapas de estado)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

… los mapas de Nagvis enfocados a usuarios tienen limitaciones ...

Page 24: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación(para buscar un panel más

completo)

Page 25: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 26: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 27: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Page 28: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

¡ saltan las alarmas !

¡ no hay correo !

Page 29: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo”

Page 30: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo”

Page 31: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo”

Page 32: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo”

Page 33: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

Page 34: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 35: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

?

Page 36: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

?

Page 37: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 38: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 39: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 40: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 41: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

??

Page 42: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

???

Page 43: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

? ?? ?

Page 44: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

? ??

Page 45: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

? ?

Page 46: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 47: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

Page 48: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 49: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 50: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 51: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

?

Page 52: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

Page 53: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

?

Page 54: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Ejemplo: caída del correo (gore)

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

“el del correo” CAU

Page 55: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Moraleja

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

… hay que dedicar recursos técnicos para solucionar el problema, sí ...

Page 56: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Moraleja

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

… hay que dedicar recursos técnicos para solucionar el problema, sí ...

… pero también hay que gestionar el problema desde el punto de vista no-técnico (o más cercano al usuario)

Page 57: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación - Moraleja

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

… hay que dedicar recursos técnicos para solucionar el problema, sí ...

… pero también hay que gestionar el problema desde el punto de vista no-técnico (o más cercano al usuario)

Hay que comunicar el problema de manera adecuada

Page 58: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – cuidar al usuario

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 1: mantener informados a los usuarios, cuidarles

Page 59: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – cuidar al usuario

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 1: mantener informados a los usuarios, cuidarles

Dar información precisa, completa y entendible de:

Page 60: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – cuidar al usuario

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 1: mantener informados a los usuarios, cuidarles

Dar información precisa, completa y entendible de:

1) El problema (qué ha dejado de funcionar, desde cuando, motivos, ...)

Page 61: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – cuidar al usuario

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 1: mantener informados a los usuarios, cuidarles

Dar información precisa, completa y entendible de:

1) El problema (qué ha dejado de funcionar, desde cuando, motivos, ...)2) Si es posible, plazos de solución (cuándo se prevé que vuelva a funcionar)

Page 62: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – cuidar al usuario

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 1: mantener informados a los usuarios, cuidarles

Dar información precisa, completa y entendible de:

1) El problema (qué ha dejado de funcionar, desde cuando, motivos, ...)2) Si es posible, plazos de solución (cuándo se prevé que vuelva a funcionar)3) Si procede, alternativas, acciones paliativas, … (qué otros medios o servicios puede usar, consejos, workarounds, ...)

Page 63: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar al CAU

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 2: ayudar al CAU en su trabajo

Page 64: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar al CAU

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 2: ayudar al CAU en su trabajo

1) “los primeros usuarios del panel de monitorización”

Page 65: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar al CAU

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 2: ayudar al CAU en su trabajo

1) “los primeros usuarios del panel de monitorización”

2) Reduciendo llamadas al CAU y, por tanto, descongestionando su trabajo

Page 66: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar al CAU

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 2: ayudar al CAU en su trabajo

1) “los primeros usuarios del panel de monitorización”

2) Reduciendo llamadas al CAU y, por tando, descongestionando su trabajo

3) Evitando explicaciones largas y tediosas (remitir al usuario al panel)

Page 67: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar a los administradores

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 3: ayudar a los administradores en su trabajo

Page 68: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar a los administradores

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 3: ayudar a los administradores en su trabajo

1) El panel se actualiza automáticamente

Page 69: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar a los administradores

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 3: ayudar a los administradores en su trabajo

1) El panel se actualiza automáticamente2) Cada estado (ok, warning, fallo, …) tiene un texto por defecto asociado que da la información mínima imprescindible sobre el estado del servicio

Page 70: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar a los administradores

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 3: ayudar a los administradores en su trabajo

1) El panel se actualiza automáticamente2) Cada estado (ok, warning, fallo, …) tiene un texto por defecto asociado que da la información mínima imprescindible sobre el estado del servicio3) Ahorrando esfuerzo (sólo se introduce información en el panel)

Page 71: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosMotivación – ayudar a los administradores

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Motivación 3: ayudar a los administradores en su trabajo

1) El panel se actualiza automáticamente2) Cada estado (ok, warning, fallo, …) tiene un texto por defecto asociado que da la información mínima imprescindible sobre el estado del servicio3) Ahorrando esfuerzo (sólo se introduce información en el panel) 4) Evitando confusiones (¿avisar por correo a quién?, ¿cuántos mensajes de aviso?, ¿en todos el mismo texto?, …)

Page 72: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Panel actual

Page 73: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Características

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

• Versión modificada del Stashboard de Twilio

Page 74: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Características

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

• Versión modificada del Stashboard de Twilio• Funciona en la plataforma App Engine de Google

Page 75: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Características

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

• Versión modificada del Stashboard de Twilio• Funciona en la plataforma App Engine de Google• Similar a las páginas de monitorización de Amazon AWS Status Page o a la deGoogle Apps Status Page

Page 76: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Características

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

• Versión modificada del Stashboard de Twilio• Funciona en la plataforma App Engine de Google• Similar a las páginas de monitorización de Amazon AWS Status Page o a la deGoogle Apps Status Page• Permite cambiar manualmente el estado de los servicios, así como añadir notas aclarativas

Page 77: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Características

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

• Versión modificada del Stashboard de Twilio• Funciona en la plataforma App Engine de Google• Similar a las páginas de monitorización de Amazon AWS Status Page o a la deGoogle Apps Status Page• Permite cambiar manualmente el estado de los servicios, así como añadir notas aclarativas• Muestra un histórico del estado de los servicios

Page 78: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Características

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

• Versión modificada del Stashboard de Twilio• Funciona en la plataforma App Engine de Google• Similar a las páginas de monitorización de Amazon AWS Status Page o a la deGoogle Apps Status Page• Permite cambiar manualmente el estado de los servicios, así como añadir notas aclarativas• Muestra un histórico del estado de los servicios• REST para recibir y actualizar cambios de estado desde un sistema de monitorización (p. ej. Nagios)

Page 79: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Características

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

• Versión modificada del Stashboard de Twilio• Funciona en la plataforma App Engine de Google• Similar a las páginas de monitorización de Amazon AWS Status Page o a la deGoogle Apps Status Page• Permite cambiar manualmente el estado de los servicios, así como añadir notas aclarativas• Muestra un histórico del estado de los servicios• REST para recibir y actualizar cambios de estado desde un sistema de monitorización (p. ej. Nagios)• Programado en Python

Page 80: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Adaptación

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Nagios Panel Icono

OK up

WARNING warning

CRITICAL down

UNKNOWN warning

ACKNOWLEDGEMENT work

● Mapeo de estados de Nagios a estados del panel

Page 81: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Adaptación

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Nagios Panel Icono

OK up

WARNING warning

CRITICAL down

UNKNOWN warning

ACKNOWLEDGEMENT work

● Mapeo de estados de Nagios a estados del panel

● Panel pasivo: espera POST de Nagios

Page 82: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Adaptación

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Nagios Panel Icono

OK up

WARNING warning

CRITICAL down

UNKNOWN warning

ACKNOWLEDGEMENT work

● Mapeo de estados de Nagios a estados del panel

● Panel pasivo: espera POST de Nagios● Los administradores necesitan cuenta en Google

Page 83: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Adaptación

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Nagios Panel Icono

OK up

WARNING warning

CRITICAL down

UNKNOWN warning

ACKNOWLEDGEMENT work

● Mapeo de estados de Nagios a estados del panel

● Panel pasivo: espera POST de Nagios● Los administradores necesitan cuenta en Google● Dos urls: una pública (http://monitorumu.um.es) y otra privada para los administradores del panel (https://pservstatus2.appspot.com)

Page 84: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Modificaciones

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

La UM usa este panel desde finales de 2010. Modificaciones efectuadas desde entonces:

Page 85: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Modificaciones

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

La UM usa este panel desde finales de 2010. Modificaciones efectuadas desde entonces:

1) Inserción, borrado y modificación manual de eventos con carácter retroactivo

Page 86: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Modificaciones

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

La UM usa este panel desde finales de 2010. Modificaciones efectuadas desde entonces:

1) Inserción, borrado y modificación manual de eventos con carácter retroactivo2) Adición de un campo orden para decidir el orden en que se muestran los servicios

Page 87: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Modificaciones

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

La UM usa este panel desde finales de 2010. Modificaciones efectuadas desde entonces:

1) Inserción, borrado y modificación manual de eventos con carácter retroactivo2) Adición de un campo orden para decidir el orden en que se muestran los servicios3) Nuevos iconos de información para el estado actual de los servicios que han sufrido cambios de estado

Page 88: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Modificaciones

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

La UM usa este panel desde finales de 2010. Modificaciones efectuadas desde entonces:

1) Inserción, borrado y modificación manual de eventos con carácter retroactivo2) Adición de un campo orden para decidir el orden en que se muestran los servicios3) Nuevos iconos de información para el estado actual de los servicios que han sufrido cambios de estado4) Adición del atributo title para el nombre de los servicios (descripción detallada)

Page 89: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Modificaciones

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

La UM usa este panel desde finales de 2010. Modificaciones efectuadas desde entonces:

1) Inserción, borrado y modificación manual de eventos con carácter retroactivo2) Adición de un campo orden para decidir el orden en que se muestran los servicios3) Nuevos iconos de información para el estado actual de los servicios que han sufrido cambios de estado4) Adición del atributo title para el nombre de los servicios (descripción detallada)5) Adición del atributo title para los nuevos iconos de información con el texto del último cambio de estado

Page 90: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Estadísticas de uso

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Experiencia de uso

Page 91: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Experiencia de uso

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

En circustancias normales (todos los servicios ok) el número de accesos al panel es muy bajo, no llega a 0,2 peticiones por segundo.

Seguramente los accesos no son de usuarios, sino de refrescos de Nagios … pero ...

Page 92: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Experiencia de uso

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

● … pero cuando hay algún fallo en un servicio importante (LDAP, SSO/CAS, correo electrónico, ... ) el número de consultas al panel aumenta considerablemente y se superaban los límites que Google pone para uso gratuito del App Engine

Page 93: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Experiencia de uso

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

● … pero cuando hay algún fallo en un servicio importante (LDAP, SSO/CAS, correo electrónico, ... ) el número de consultas al panel aumenta considerablemente y se superaban los límites que Google pone para uso gratuito del App Engine

● Desde el 12/03/2013 pagamos a Google por ampliar las cuotas (Maximum Daily Budget: $5.00, Maximum Weekly Spend: $35.00)

Page 94: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Experiencia de uso

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

● … pero cuando hay algún fallo en un servicio importante (LDAP, SSO/CAS, correo electrónico, ... ) el número de consultas al panel aumenta considerablemente y se superaban los límites que Google pone para uso gratuito del App Engine

● Desde el 12/03/2013 pagamos a Google por ampliar las cuotas (Maximum Daily Budget: $5.00, Maximum Weekly Spend: $35.00)

● En particular superábamos la cuota de “Datastore requests”

Page 95: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Experiencia de uso

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Recomendaciones generales

• El panel debe apoyarse sobre un sistema de monitorización “bien montado”

• Si no vas a dar información correcta del estado de tus servicios: no montes el panel de usuarios

• Mejor chequeos que simulen el acceso de un usuario (webinject.pl, Selenium, ...) que chequeos apoyados sobre dependencias (hosts, servicios, metaservicios)

Page 96: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Experiencia de uso

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Importante

Aunque los estados de los servicios del panel se actualizan de manera automática, el verdadero potencial del panel se encuentra en la posibilidad de introducir texto específico del problema que nos ocupa:

● Los administradores del panel deben ser metódicos y disciplinados a la hora de insertar y actualizar información en el panel● La información suministrada debe redactarse en un estilo sencillo y fácil de comprender por el usuario (evitar tecnicismos)

Page 97: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Experiencia de uso

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Administradores del panel de la UM

Actualmente están dados de alta los responsables de las distintas secciones (Desarrollo, Redes, Telemática, Sistemas y Soporte al Usuario).

Se pretende que los responsables de aplicaciones (Sakai, Escritorios Virtuales, Administración Electrónica, …) también sean dados de alta.

Page 98: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Futuro

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Futuro

Page 99: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Futuro

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Mejoras factibles:

● Desarrollo del panel en entorno LAMP (¿Perl | Python?) para ejecución en local

Page 100: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Futuro

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Mejoras factibles:

● Desarrollo del panel en entorno LAMP (¿Perl | Python?) para ejecución en local

• Texto enriquecido en las notas manuales, inclusión de urls, …

Page 101: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Futuro

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

Mejoras factibles:

● Desarrollo del panel en entorno LAMP (¿Perl | Python?) para ejecución en local

● Texto enriquecido en las notas manuales, inclusión de urls, …

• Área de texto para notificaciones importantes de carácter general

Page 102: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Futuro

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

¿Otras mejoras?

• Suscripción (RSS, ATOM, …) a eventos de un servicio por parte de los compis del CAU, usuarios “normales”, ...

Page 103: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Futuro

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

¿Otras mejoras?

● Suscripción (RSS, ATOM, …) a eventos de un servicio por parte de los compis del CAU, usuarios “normales”, ...

● Notificación de eventos a los usuarios suscritos vía email, twitter, xmpp, …

Page 104: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios para usuariosPanel actual – Futuro

XXIV Jornadas Técnicas de RedIRIS Madrid, 21-25 de octubre de 2013

¿Otras mejoras?

● Suscripción (RSS, ATOM, …) a eventos de un servicio por parte de los compis del CAU, usuarios “normales”, ...

● Notificación de eventos a los usuarios suscritos vía email, twitter, xmpp, …

● Posibilidad de paquetizarlo para ponerlo a disposición de la comunidad

Page 105: Panel de monitorización de servicios enfocado a usuarios · – Nagios (núcleo de monitorización)

Panel de monitorización de servicios enfocado a usuarios

Maria Isabel Belijar Sá[email protected]

Francisco Yepes [email protected]

GRACIAS


Recommended