Invarra
Menú

Aseguramiento de IA mediante invariancia

Los sistemas de IA deben mantener la decisión correcta cuando el prompt cambia de forma.

Invarra audita si los LLM preservan el comportamiento correcto a través de variación que conserva el significado, presión, cambios de contexto, parecidos benignos y reformulación adversaria.

El problema

Los prompts limpios no prueban preparación para producción.

Los sistemas modernos de IA suelen probarse con prompts individuales, filas de referencia o demostraciones curadas. Los usuarios reales no interactúan así: reformulan, añaden contexto, presionan, escalan, insertan instrucciones en documentos recuperados y enrutan la misma decisión por herramientas, soporte o políticas.

Un modelo que supera la versión limpia puede fallar cuando la misma decisión subyacente se presenta de otra manera.

variación

Prompt limpio

variación

Prompt reformulado

variación

Presión de contexto

variación

Parecido benigno

variación

Envoltura de uso de herramientas

variación

Inyección RAG

variación

Presión de escalamiento

variación

Ambigüedad en límite de política

Qué mide Invarra

Invarra convierte la incertidumbre de comportamiento en evidencia inspeccionable.

Las auditorías de Invarra no reducen todo a un número de tabla de clasificación. Separan corrección conductual, estabilidad bajo variación, cobertura de evidencia, geometría del fallo, salvedades y postura de decisión.

¿Qué se probó?¿Qué debería haber hecho el sistema?¿Qué hizo realmente?¿Fue estable bajo variación?¿La evidencia basta para confiar en la conclusión?

Corrección

¿El modelo hizo lo que debía hacer?

Estabilidad

¿La decisión sobrevivió a variación válida?

Cobertura

¿Hubo suficiente comportamiento clasificado para sustentar el informe?

Salvedades

¿Qué no debe afirmarse a partir de la evidencia?

Cómo funciona

De demos de prompts a auditorías respaldadas por artefactos.

El mismo comportamiento esperado se prueba mediante variación controlada y luego se puntúa como evidencia conductual, manteniendo separadas corrección, estabilidad, cobertura y salvedades.

  1. 01

    Definir el comportamiento esperado.

  2. 02

    Generar realizaciones semánticas controladas.

  3. 03

    Ejecutar el corpus congelado contra uno o más modelos.

  4. 04

    Clasificar el comportamiento real frente al esperado.

  5. 05

    Separar corrección, estabilidad y cobertura.

  6. 06

    Preservar evidencia, salvedades y artefactos reproducibles.

IPB

IPB es el programa público de Invarra para evidencia de comportamiento por dominio bajo variación controlada.

Invariance Phenomena Benchmark mide si los modelos hacen lo esperado y si siguen haciéndolo cuando el mismo caso subyacente cambia de forma. Los informes IPB publicarán tarjetas de informe acotadas por modelo, gráficos comparativos, resúmenes de geometría del fallo, salvedades, estado de respuesta de proveedores y muestras de evidencia públicas seguras sin exponer maquinaria privada de corpus.

Explorar IPB

Seguridad de copilotos empresariales

Prueba si asistentes empresariales conservan límites de política bajo presión de instrucciones, contexto, parecidos benignos y escalamiento.

Inyección en contexto RAG

Prueba si la presión del contexto recuperado, conflictos de jerarquía de fuentes o intentos de anulación cambian el comportamiento esperado.

Seguridad en uso de herramientas

Prueba decisiones simuladas de autorización y rechazo de llamadas a herramientas sin credenciales ni herramientas reales.

Seguridad en soporte al cliente

Prueba consistencia de asistentes de soporte sintéticos bajo presión de reembolso, tono frustrado y límites de cuenta.

Asistente de cumplimiento

Prueba interpretación sintética de políticas bajo ambigüedad, escalamiento y preguntas benignas de política.

Servicios de auditoría

Auditorías privadas para equipos que despliegan sistemas reales de IA.

Los benchmarks públicos crean visibilidad. Las auditorías privadas crean valor operativo. Invarra ayuda a evaluar comportamiento contra los límites reales de cada flujo: copilotos internos, RAG, agentes con herramientas, soporte y asistentes cercanos a cumplimiento.

Solicitar una auditoría

Auditoría de selección de modelo

Comparar modelos dentro de un dominio declarado o límite privado de flujo.

Auditoría de asistente privado

Auditar un límite de asistente específico de cliente con plantillas privadas y contratos de comportamiento esperado.

Remediación y reevaluación

Medir si cambios de prompt, política, recuperación, envoltura o modelo mejoraron realmente el comportamiento.

Paquete de publicación IPB

Preparar artefactos candidatos a publicación bajo metodología IPB y límites de divulgación.

Base de investigación

La base de investigación: LIP y CSR.

El Principio de Invariancia Latente explica por qué la corrección en una sola representación es insuficiente bajo observación indirecta. La Realización Semántica Canónica aporta el andamiaje de medición: el significado es la unidad, la realización es variación controlada y el resultado es medición empírica.

Principio de Invariancia Latente

Correcto una vez no basta. La estabilidad bajo variaciones válidas es evidencia.

Realización Semántica Canónica

El significado es la unidad. La realización es variación controlada. El resultado es medición empírica.

Solicitar evidencia antes del despliegue

Sepa dónde se rompe el modelo antes de que lo haga el despliegue.