[R-010725] Reporte de Estado de Servidores
Resumen Ejecutivo – Estado de Servidores y API
Durante el período evaluado (últimas 24 horas), los cuatro servidores de producción se han mantenido activos y funcionales, procesando solicitudes HTTP con alta disponibilidad y mostrando tendencias positivas de estabilidad y balanceo de carga.
La tendencia general es favorable: la mayoría de instancias presentan baja a moderada ocupación de recursos, especialmente fuera de picos habituales de tráfico. El sistema de balanceo está operando correctamente, distribuyendo la carga entre las instancias.
Disponibilidad elevada: se observa una frecuencia sostenida de respuestas HTTP 200 (OK) en incremento durante la ventana diurna, evidenciando buena respuesta y operación normal de la plataforma y sus servicios principales.
Redirecciones (HTTP 301/302) y errores de cliente (HTTP 4xx) en niveles normales: su volumen es bajo y atribuible a flujos de autenticación, errores de usuario o solicitudes no válidas propias de un entorno en operación.
Sin embargo:
Se ha detectado la presencia de respuestas HTTP 5xx (principalmente 500/504) dispersas en endpoints estratégicos (impresión de comprobantes electrónicos, estado de impresoras, exportaciones y webhooks de integración externa). Estas incidencias, si bien puntuales y de frecuencia limitada respecto al total de tráfico, requieren seguimiento para evitar acumulación de cuellos de botella.
A pesar de estos eventos, la tendencia global en cuanto a capacidad de respuesta, balanceo y operación del sistema es positiva, sin indicadores de falla sistemática o degradación masiva. El monitoreo sostiene que el servicio se encuentra en un estado saludable, aunque se recomienda mantener vigilancia proactiva para controlar el crecimiento de carga o la recurrencia de errores en momentos pico.
Acciones inmediatas sugeridas para asegurar esta tendencia:
Revisión periódica de logs asociados a errores 500/504.
Validación de las reglas del balanceador de carga y monitoreo de su comportamiento en horas pico.
Preparar alertas tempranas en CPU/carga >70% y HTTP 5xx para poder actuar de inmediato si cambian las tendencias.
Reporte de 24 horas
Período Evaluado: Últimas 24 horas
Total de Servidores Activos: 4
Resumen General
Cantidad de instancias activas: 4
Nombre de instancias:
vm-idbi-backend-scale-3b157a8a_10vm-idbi-backend-scale-3b157a8a_11vm-idbi-backend-scale-3b157a8a_8vm-idbi-backend-scale-3b157a8a_9
Uso de Carga del Servidor (Load Average)
Tendencia general:
De 18:00 a 10:00: carga baja (<20%) con picos esporádicos.
Desde 11:00: aumento progresivo con varios picos entre 40% y 80%.
Picos máximos: alrededor de las 14:00 y 16:00.
Estado actual: carga moderada-alta, especialmente en instancias
_10y_9.
Actividad HTTP
HTTP 200 (OK):
Alta frecuencia sostenida, en aumento desde las 06:00.
Indica buena disponibilidad de los servicios.
HTTP 302 / 301 (Redirecciones):
Presentes en menor volumen, comportamiento normal.
HTTP 4xx (Errores del cliente):
Diversas respuestas 401, 403, 404 y 422.
Posibles errores de autenticación o solicitudes incorrectas.
HTTP 5xx (Errores del servidor):
Presencia de códigos 500 y 504 de forma aleatoria.
Observaciones Críticas
Aumento de carga desde media mañana: posible incremento de tráfico o degradación.
Errores 5xx durante el día: deben ser revisados con urgencia.
Buena distribución de carga entre instancias: balanceo parece estar funcionando, pero con límites alcanzados en momentos clave.
Recomendaciones
Analizar logs de errores HTTP 5xx en horas pico.
Verificar balanceador de carga para asegurar distribución uniforme.
Evaluar escalamiento vertical u horizontal si la carga persiste.
Configurar alertas tempranas para errores 5xx y cargas superiores al 70%.
Generado a partir de datos visualizados en el dashboard de monitoreo.
Análisis de Errores Detectados
1. Tipos y Volumen de Errores
HTTP 500 (Internal Server Error)
Endpoints afectados:
/api/v6/electronic-bills/*/print/api/v6/orders/*/print-ticket/api/v6/printers/*/status/api/v4/venues/*/printers/*/ping/api/v6/providers/*/purchase-documents/api/v6/deposits/*/deposit-transactions/api/v6/stores/*/purchase-documents/export-details/api/v6/organizations/*/dashboards/products/top/api/v6/stores/el-pozito/integrations/erp-sync/webhook/api/v6/orders/*/print-ticket/api/v6/tags,/api/v6/detraction-groups,/api/v6/products/*/recipe
Frecuencia: varios errores repetidos.
Origen distribuido entre clientes web, apps móviles y llamadas desde sistemas integradores como MercadoPago y RestSharp.
HTTP 504 (Gateway Timeout)
Endpoints afectados:
/api/v6/dashboards/products/top/api/v5/venues/*/orders/*/finish/api/v6/providers/*/purchase-documents/api/v6/organizations/*/reports/sales/export/api/v6/stores/*/purchase-documents/export-details
Frecuencia: reiterada, especialmente en operaciones de exportación o consultas de gran volumen.
2. Rutas y Funcionalidades Críticas Impactadas
Facturación electrónica y tickets:
Fallos masivos en endpointsprintpara electrónicas y tickets indican disrupción directa en la generación de comprobantes, lo que puede bloquear ventas, impedir entregas y generar problemas legales o de auditoría.Integración con proveedores y pagos:
Los webhooks de sistemas ERP con errores 500 pueden ocasionar desincronización de pagos, rechazos o doble procesamiento.Impresoras y operaciones físicas:
El endpoint/api/v6/printers/*/statuscon errores 500 genera incertidumbre sobre el estado real de hardware en los puntos de venta, con potencial impacto operativo.Dashboards y reportes:
Errores 504 recurrentes en dashboards de productos y ventas sugieren cuellos de botella en procesamiento de consultas, especialmente en períodos de corte o fin de mes.
3. Posibles Causas
Sobrecarga o saturación de backend:
El volumen de solicitudes y coincidencia de múltiples fallos sugiere que el backend experimentó saturación, cuellos de botella en concurrencia, acceso a base de datos o recursos de red/infraestructura insuficiente.Procesos de impresión y generación de reportes:
El endpointprint– tanto para comprobantes como tickets – implica operaciones complejas (acceso a datos, generación de PDFs/archivos, interfase con hardware), lo cual puede fallar si hay lentitud en la base de datos, falta de recursos, o errores de código.Operaciones de exportación masiva:
Los endpoints/export-detailsy/reports/sales/exportsuelen procesar grandes volúmenes de datos; errores 504 sugieren que el tiempo configurado para procesamiento es insuficiente para la carga o hay queries subóptimos.Fallo en dependencias externas o bloqueos:
Algunos errores pueden estar motivados por bloqueos de IP, timeouts hacia servicios externos, o cambios recientes de infraestructura (como migración o rotación de certificados).
Conclusiones y Recomendaciones
Conclusiones
El patrón recurrente de errores 500 y 504 impactan tanto flujos críticos de facturación e impresión como integraciones externas clave, con potencial afectación operativa y en la percepción de confiabilidad del sistema.
La reiteración de los errores en intervalos cortos y acciones similares evidencia problemas estructurales en procesos intensivos de I/O (DB, impresoras, exportadores, webhooks).
Puede haber impacto en la generación, entrega y validez legal de comprobantes, cierre correcto de cajas y conciliación de pagos.
Recomendaciones Técnicas
Monitorear exhaustivamente el backend (CPU, memoria, base de datos, red) en los horarios de alta concurrencia.
Optimizar consultas y procesamiento en endpoints de uso masivo (
print,export, dashboards), aplicando paginación, reducción de payloads y mejoras en índices SQL.Revisar logs y stack traces de errores 500: identificar patrones de excepción y errores repetidos para bugs de aplicación, deadlocks o falta de manejo de errores.
Analizar concurrencia en webhooks/integraciones externas: aplicar colas o políticas de reintento y mitigar doble procesamiento.
Generado a partir de datos visualizados en el periodo de 24h.
Reporte Detallado de Errores API – Última Hora (01/Jul/2025 21:41–22:38 UTC)
Resumen Ejecutivo
Se detectaron 51 errores HTTP en la última hora:
45 errores 500 (Internal Server Error)
6 errores 504 (Gateway Timeout)
Los endpoints afectados están ligados a funciones críticas:
Impresión de comprobantes electrónicos
Estado de impresoras
Finalización y pagos de órdenes
Exportación de reportes
Estadísticas Generales
Métrica | Valor |
|---|---|
Total de errores registrados | 51 |
Errores 500 (Internal Server Error) | 45 |
Errores 504 (Gateway Timeout) | 6 |
Rango horario analizado | 21:41–22:38 |
IPs distintas afectadas | 15+ |
Endpoints distintos involucrados | 8+ |
Distribución por Endpoint
1. /api/v6/electronic-bills/{id}/print
Errores: 23 (500)
Descripción: Fallo masivo al intentar imprimir comprobantes electrónicos.
Impacto: Interrupción en el flujo de facturación y atención al cliente.
IPs frecuentes:
38.253.188.50,38.25.29.121,161.132.89.56,179.6.16.87,38.210.243.33,179.7.226.111,190.82.72.47
2. /api/v6/printers/{id}/status
Errores: 13 (500)
Descripción: Falla en la verificación del estado de las impresoras.
Impacto: Posible bloqueo en la validación antes de emitir comprobantes.
IPs frecuentes:
179.6.16.87,38.210.243.33,190.236.159.15
3. /api/v6/orders/{id}/finish
Errores: 4 (504)
Descripción: Timeout al finalizar una orden.
Impacto: Posible pérdida de sincronización con sistemas de facturación o caja.
IPs frecuentes:
190.119.167.70,190.119.139.58
4. /api/v6/orders/{id}/pay
Errores: 2 (504)
Descripción: Timeout al registrar pago de orden.
Impacto: Riesgo de duplicación o fallas en conciliación.
IPs frecuentes:
190.119.167.70
5. /api/v6/dashboards/products/top
Errores: 1 (504)
Descripción: Timeout en carga del dashboard de productos más vendidos.
Impacto: Lentitud en módulos analíticos.
6. /api/v6/reports/sales/export
Errores: 1 (500)
Descripción: Falla en exportación de reporte de ventas.
Impacto: Reportes incompletos para toma de decisiones.