Aseguramiento de IA mediante invariancia
Los sistemas de IA deben mantener la decisión correcta cuando el prompt cambia de forma.
Invarra audita si los LLM preservan el comportamiento correcto a través de variación que conserva el significado, presión, cambios de contexto, parecidos benignos y reformulación adversaria.
El problema
Los prompts limpios no prueban preparación para producción.
Los sistemas modernos de IA suelen probarse con prompts individuales, filas de referencia o demostraciones curadas. Los usuarios reales no interactúan así: reformulan, añaden contexto, presionan, escalan, insertan instrucciones en documentos recuperados y enrutan la misma decisión por herramientas, soporte o políticas.
Un modelo que supera la versión limpia puede fallar cuando la misma decisión subyacente se presenta de otra manera.
Prompt limpio
Prompt reformulado
Presión de contexto
Parecido benigno
Envoltura de uso de herramientas
Inyección RAG
Presión de escalamiento
Ambigüedad en límite de política
Qué mide Invarra
Invarra convierte la incertidumbre de comportamiento en evidencia inspeccionable.
Las auditorías de Invarra no reducen todo a un número de tabla de clasificación. Separan corrección conductual, estabilidad bajo variación, cobertura de evidencia, geometría del fallo, salvedades y postura de decisión.
Corrección
¿El modelo hizo lo que debía hacer?
Estabilidad
¿La decisión sobrevivió a variación válida?
Cobertura
¿Hubo suficiente comportamiento clasificado para sustentar el informe?
Salvedades
¿Qué no debe afirmarse a partir de la evidencia?
Cómo funciona
De demos de prompts a auditorías respaldadas por artefactos.
El mismo comportamiento esperado se prueba mediante variación controlada y luego se puntúa como evidencia conductual, manteniendo separadas corrección, estabilidad, cobertura y salvedades.
- 01
Definir el comportamiento esperado.
- 02
Generar realizaciones semánticas controladas.
- 03
Ejecutar el corpus congelado contra uno o más modelos.
- 04
Clasificar el comportamiento real frente al esperado.
- 05
Separar corrección, estabilidad y cobertura.
- 06
Preservar evidencia, salvedades y artefactos reproducibles.
IPB
IPB es el programa público de Invarra para evidencia de comportamiento por dominio bajo variación controlada.
Invariance Phenomena Benchmark mide si los modelos hacen lo esperado y si siguen haciéndolo cuando el mismo caso subyacente cambia de forma. Los informes IPB publicarán tarjetas de informe acotadas por modelo, gráficos comparativos, resúmenes de geometría del fallo, salvedades, estado de respuesta de proveedores y muestras de evidencia públicas seguras sin exponer maquinaria privada de corpus.
Seguridad de copilotos empresariales
Prueba si asistentes empresariales conservan límites de política bajo presión de instrucciones, contexto, parecidos benignos y escalamiento.
Inyección en contexto RAG
Prueba si la presión del contexto recuperado, conflictos de jerarquía de fuentes o intentos de anulación cambian el comportamiento esperado.
Seguridad en uso de herramientas
Prueba decisiones simuladas de autorización y rechazo de llamadas a herramientas sin credenciales ni herramientas reales.
Seguridad en soporte al cliente
Prueba consistencia de asistentes de soporte sintéticos bajo presión de reembolso, tono frustrado y límites de cuenta.
Asistente de cumplimiento
Prueba interpretación sintética de políticas bajo ambigüedad, escalamiento y preguntas benignas de política.
Servicios de auditoría
Auditorías privadas para equipos que despliegan sistemas reales de IA.
Los benchmarks públicos crean visibilidad. Las auditorías privadas crean valor operativo. Invarra ayuda a evaluar comportamiento contra los límites reales de cada flujo: copilotos internos, RAG, agentes con herramientas, soporte y asistentes cercanos a cumplimiento.
Auditoría de selección de modelo
Comparar modelos dentro de un dominio declarado o límite privado de flujo.
Auditoría de asistente privado
Auditar un límite de asistente específico de cliente con plantillas privadas y contratos de comportamiento esperado.
Remediación y reevaluación
Medir si cambios de prompt, política, recuperación, envoltura o modelo mejoraron realmente el comportamiento.
Paquete de publicación IPB
Preparar artefactos candidatos a publicación bajo metodología IPB y límites de divulgación.
Base de investigación
La base de investigación: LIP y CSR.
El Principio de Invariancia Latente explica por qué la corrección en una sola representación es insuficiente bajo observación indirecta. La Realización Semántica Canónica aporta el andamiaje de medición: el significado es la unidad, la realización es variación controlada y el resultado es medición empírica.
Principio de Invariancia Latente
Correcto una vez no basta. La estabilidad bajo variaciones válidas es evidencia.
Realización Semántica Canónica
El significado es la unidad. La realización es variación controlada. El resultado es medición empírica.
Solicitar evidencia antes del despliegue