← Developer Portal

SLA v1.0 · vigente desde 2026-05-16

Acuerdo de Nivel de Servicio

Compromisos formales de Nexus Legal por tier de API key. Forma parte integral de los Términos del Servicio. Los créditos compensatorios se acreditan automáticamente al saldo del cliente al cierre de cada mes en el que se incumpla cualquiera de los compromisos.

Standard

Uptime

99.5 %

Latencia p50

≤ 3 s

Latencia p95

≤ 12 s

Rate limit

10 rpm

Soporte

Email · respuesta ≤ 3 días laborables

Credit-back

10 % del consumo mensual si uptime < 99.5 %

Premium

Uptime

99.9 %

Latencia p50

≤ 2 s

Latencia p95

≤ 8 s

Rate limit

200 rpm

Soporte

Email + Slack compartido · respuesta ≤ 4 h laborables

Credit-back

25 % del consumo mensual si uptime < 99.9 %

Enterprise

Uptime

99.95 % (objetivo) · 99.9 % garantizado

Latencia p50

≤ 1.5 s

Latencia p95

≤ 6 s

Rate limit

1 000 rpm (configurable)

Soporte

Slack dedicado + phone · respuesta ≤ 1 h laborables · DRI nombrado

Credit-back

50 % del consumo mensual si uptime < 99.9 % · 100 % si < 99 %

Definiciones

Uptime mensual: porcentaje del mes natural durante el que la API responde con códigos HTTP < 500 a peticiones válidas. Se excluyen del cómputo: (a) ventanas de mantenimiento anunciadas con ≥ 48 h de antelación (máximo 4 h/mes total), (b) incidencias atribuibles a sub-encargados aguas arriba (OpenRouter, Anthropic, Supabase) cuando dichos sub-encargados también incumplan su propio SLA, (c) ataques DDoS o tráfico abusivo desde la propia cuenta del cliente.

Latencia p50 / p95: tiempo de respuesta del endpoint `POST /api/v1/analyze` medido en el percentil 50 / 95 durante el mes natural, para documentos de hasta 30 000 caracteres y modo `standard`. Se excluyen los análisis que toquen el fallback Kimi K2.6 (proveedor con latencia más alta).

Rate limit: límite por minuto por API key. El cliente puede solicitar elevación temporal mediante ticket de soporte; aplica el límite efectivo configurado en `api_keys.rate_limit_rpm`.

Credit-back: compensación automática en forma de créditos Nexus que se acreditan al saldo del cliente al cierre del mes natural en el que se haya incumplido el compromiso. Calculado como porcentaje del consumo (en €) del mes incumplido.

Mantenimiento programado

  • Notificación con ≥ 48 horas de antelación por email + banner en el Developer Portal.
  • Máximo 4 horas/mes acumuladas.
  • Ventanas preferentes: domingos 02:00-06:00 UTC.
  • Migraciones de base de datos zero-downtime cuando sea técnicamente posible.

Reporte de incidencias

El cliente debe reportar la incidencia en un plazo máximo de 7 días desde su ocurrencia para tener derecho a compensación automática. Reportes vía:

Status page

Próximamente: status.nexusquantum.legal con uptime histórico mensual, incidentes pasados y mantenimientos programados.

Hasta que esté disponible, los incidentes se anuncian por email a los clientes con tier Premium/Enterprise y en el banner del Developer Portal.

Limitaciones

  • Los compromisos de latencia aplican solo a peticiones bien formadas dentro del rate limit del tier.
  • El uptime se mide a nivel global del backend; rutas específicas pueden tener disponibilidad ligeramente distinta (ej. `/api/v1/sandbox/analyze` no entra en el cómputo porque no consume créditos).
  • Eventos de fuerza mayor (causas geopolíticas que corten conectividad regional, bloqueos por sanciones a sub-encargados, etc.) suspenden temporalmente los compromisos sin que generen credit-back.

Cambios al SLA

Cualquier modificación al SLA se notifica con 60 días de antelación a los clientes con tier Premium/Enterprise. Cambios beneficiosos para el cliente (mejor uptime, menor latencia, mejor support) pueden aplicarse inmediatamente.

¿Tu organización necesita un SLA personalizado con cláusulas adicionales (residencia de datos específica, DRI dedicado, integración con tu status page interno, etc.)? Contacta con enterprise@nexusquantum.legal.