Blog de Invarra

Notas sobre aseguramiento de IA.

Notas breves de investigación sobre invariancia, evaluación semántica y por qué los sistemas de IA fiables deben conservar el comportamiento correcto cuando cambia el lenguaje.

28 de junio de 20264 min de lectura

Acertar una vez no es suficiente

Una respuesta correcta a un prompt no demuestra que el modelo haya seguido el objetivo subyacente. La pregunta más fuerte es qué ocurre cuando el significado se mantiene y la representación cambia.

Leer artículo

Notas recientes

Notas de investigación

Seguir @invarra

Realización Semántica Canónica28 de junio de 2026

La fila suele ser la unidad equivocada

La evaluación semántica suele empezar con una fila. Las unidades semánticas canónicas dan una mejor unidad de análisis cuando el mismo significado tiene varias formas de superficie.

3 min de lecturaLeer artículo

Principio de Invariancia Latente28 de junio de 2026

El desacuerdo es dato

Cuando representaciones válidas del mismo caso subyacente producen resultados distintos, el desacuerdo puede no ser ruido. Puede ser la señal de medición.

3 min de lecturaLeer artículo

Realización Semántica Canónica28 de junio de 2026

La variación válida necesita un contrato

Los contratos de preservación semántica hacen interpretable la variación al declarar qué debe permanecer fijo, qué puede cambiar y cómo se comprueba la validez.

3 min de lecturaLeer artículo

Principio de Invariancia Latente28 de junio de 2026

La hipótesis nula correcta para la observación indirecta

Cuando un objetivo no puede observarse directamente, los evaluadores deberían asumir que el comportamiento observado puede depender de la representación hasta que la variación válida sostenga una afirmación más fuerte.

3 min de lecturaLeer artículo

Realización Semántica Canónica28 de junio de 2026

La fragilidad semántica debe ser atribuible

Una evaluación útil no debería limitarse a decir que un sistema semántico es frágil. Debe ayudar a localizar dónde entra la fragilidad en la estructura de medición.

3 min de lecturaLeer artículo