SLA v1.0 · vigente desde 2026-05-16
Acuerdo de Nivel de Servicio
Compromisos formales de Nexus Legal por tier de API key. Forma parte integral de los Términos del Servicio. Los créditos compensatorios se acreditan automáticamente al saldo del cliente al cierre de cada mes en el que se incumpla cualquiera de los compromisos.
Standard
Uptime
99.5 %
Latencia p50
≤ 3 s
Latencia p95
≤ 12 s
Rate limit
10 rpm
Soporte
Email · respuesta ≤ 3 días laborables
Credit-back
10 % del consumo mensual si uptime < 99.5 %
Premium
Uptime
99.9 %
Latencia p50
≤ 2 s
Latencia p95
≤ 8 s
Rate limit
200 rpm
Soporte
Email + Slack compartido · respuesta ≤ 4 h laborables
Credit-back
25 % del consumo mensual si uptime < 99.9 %
Enterprise
Uptime
99.95 % (objetivo) · 99.9 % garantizado
Latencia p50
≤ 1.5 s
Latencia p95
≤ 6 s
Rate limit
1 000 rpm (configurable)
Soporte
Slack dedicado + phone · respuesta ≤ 1 h laborables · DRI nombrado
Credit-back
50 % del consumo mensual si uptime < 99.9 % · 100 % si < 99 %
Definiciones
Uptime mensual: porcentaje del mes natural durante el que la API responde con códigos HTTP < 500 a peticiones válidas. Se excluyen del cómputo: (a) ventanas de mantenimiento anunciadas con ≥ 48 h de antelación (máximo 4 h/mes total), (b) incidencias atribuibles a sub-encargados aguas arriba (OpenRouter, Anthropic, Supabase) cuando dichos sub-encargados también incumplan su propio SLA, (c) ataques DDoS o tráfico abusivo desde la propia cuenta del cliente.
Latencia p50 / p95: tiempo de respuesta del endpoint `POST /api/v1/analyze` medido en el percentil 50 / 95 durante el mes natural, para documentos de hasta 30 000 caracteres y modo `standard`. Se excluyen los análisis que toquen el fallback Kimi K2.6 (proveedor con latencia más alta).
Rate limit: límite por minuto por API key. El cliente puede solicitar elevación temporal mediante ticket de soporte; aplica el límite efectivo configurado en `api_keys.rate_limit_rpm`.
Credit-back: compensación automática en forma de créditos Nexus que se acreditan al saldo del cliente al cierre del mes natural en el que se haya incumplido el compromiso. Calculado como porcentaje del consumo (en €) del mes incumplido.
Mantenimiento programado
- Notificación con ≥ 48 horas de antelación por email + banner en el Developer Portal.
- Máximo 4 horas/mes acumuladas.
- Ventanas preferentes: domingos 02:00-06:00 UTC.
- Migraciones de base de datos zero-downtime cuando sea técnicamente posible.
Reporte de incidencias
El cliente debe reportar la incidencia en un plazo máximo de 7 días desde su ocurrencia para tener derecho a compensación automática. Reportes vía:
- Tickets de soporte: nexusquantum.legal/support
- Email: support@nexusquantum.legal
- Slack compartido (Premium / Enterprise): canal acordado al contratar el tier
Status page
Próximamente: status.nexusquantum.legal con uptime histórico mensual, incidentes pasados y mantenimientos programados.
Hasta que esté disponible, los incidentes se anuncian por email a los clientes con tier Premium/Enterprise y en el banner del Developer Portal.
Limitaciones
- Los compromisos de latencia aplican solo a peticiones bien formadas dentro del rate limit del tier.
- El uptime se mide a nivel global del backend; rutas específicas pueden tener disponibilidad ligeramente distinta (ej. `/api/v1/sandbox/analyze` no entra en el cómputo porque no consume créditos).
- Eventos de fuerza mayor (causas geopolíticas que corten conectividad regional, bloqueos por sanciones a sub-encargados, etc.) suspenden temporalmente los compromisos sin que generen credit-back.
Cambios al SLA
Cualquier modificación al SLA se notifica con 60 días de antelación a los clientes con tier Premium/Enterprise. Cambios beneficiosos para el cliente (mejor uptime, menor latencia, mejor support) pueden aplicarse inmediatamente.
¿Tu organización necesita un SLA personalizado con cláusulas adicionales (residencia de datos específica, DRI dedicado, integración con tu status page interno, etc.)? Contacta con enterprise@nexusquantum.legal.