Runbook – Incidente Crítico: Sistema Caído

Objetivo

Restablecer el servicio lo más rápido posible minimizando impacto a clientes.

Definición

Pasos Inmediatos

  1. Verificar alertas en monitoreo
  2. Confirmar si el problema es:
    • Infraestructura
    • Base de datos
    • Red / proveedor externo
  3. Ver logs del servicio principal

Acciones Permitidas

Acciones NO Permitidas

Escalamiento

Escalar si:

Contacto emergencia: +51940907431

Comunicación

Referencias

Servidores: 10.100.128.7 10.100.128.10 10.100.128.11 10.100.128.12 10.100.128.15 Usuario: azure Password: SSH Keys registradas en idbi/public/authorized_keys