Prinzip der latenten Invarianz

Eine epistemische Einschränkung für Messung unter indirekter Beobachtung

Öffentliche Notiz: 24. April 2026

Zusammenfassung

Viele wichtige Phänomene können nicht direkt beobachtet werden. Absicht, Überzeugung, Verständnis, Risikozustand, rechtlicher Umfang, Krankheitszustand und konzeptuelle Beherrschung werden in der Regel über Repräsentationen zugänglich: Sprache, Dokumente, Prompts, Symptome, Tests, Schnittstellen, Umfragen oder Sensorkanäle.

Das Prinzip der latenten Invarianz (LIP) besagt: Wenn ein Phänomen nur über Repräsentationen beobachtbar ist, ist Stabilität des Verhaltens unter bedeutungserhaltender repräsentationaler Variation zulässige empirische Evidenz dafür, dass ein System das latente Phänomen verfolgt und nicht die Repräsentation.

LIP ist keine Modellarchitektur, Lernregel, Scoring-Produkt oder Wahrheitstheorie. Es ist eine Einschränkung der Messvalidität. Es erklärt, warum Korrektheit unter einer einzigen Repräsentation schwächer ist, als sie erscheint, und warum Uneinigkeit zwischen gültigen äquivalenten Repräsentationen als Evidenz und nicht als Rauschen behandelt werden sollte.

1. Das Messproblem

In vielen Evaluationen ist der Gegenstand des Interesses nicht die beobachtbare Form. Ein Prompt ist nicht selbst eine Absicht. Ein Umfrage-Item ist nicht selbst eine Überzeugung. Eine Symptombeschreibung ist nicht selbst ein Krankheitszustand. Ein Rechtssatz ist nicht selbst der volle Umfang, den er auszudrücken versucht.

Die beobachtbare Form ist ein Kanal. Sie ist die Art, wie ein latentes Phänomen messbar wird.

Sei $\Phi$ ein latentes Phänomen. Sei $c$ ein Repräsentationskanal oder eine Oberflächenbedingung, und sei $\epsilon$ residuale Variation. Eine beobachtbare Repräsentation $r$ kann abstrakt geschrieben werden als:

r = g(\Phi, c, \epsilon).

Beobachtetes Verhalten unter dieser Repräsentation wird als $B(r)$ geschrieben. Der Evaluator beobachtet $B(r)$ , möchte aber Evidenz darüber, ob das Verhalten $\Phi$ verfolgt.

Da $r$ sowohl phänomenabhängige als auch kanalabhängige Struktur enthält, kann Verhalten unter einer einzigen Repräsentation nicht feststellen, welchem Teil das System folgt.

2. Evidenz aus einer einzigen Repräsentation ist nicht identifizierend

Angenommen, ein Evaluator beobachtet nur eine einzige Repräsentation:

r = g(\Phi, c, \epsilon)

und ein einziges Verhalten:

B(r) = b.

Dieselbe Beobachtung ist mit mindestens zwei Erklärungen vereinbar. Das Verhalten kann vom latenten Phänomen abhängen:

b = F_{\Phi}(\Phi),

oder es kann vom Repräsentationskanal abhängen:

b = F_c(c).

Mit nur einer Repräsentation sind diese Erklärungen beobachtungsmäßig nicht unterscheidbar. Die Aussage ist nicht, dass jedes System kanalsensitiv ist. Die Aussage ist, dass Korrektheit unter einer einzigen Repräsentation Kanalsensitivität nicht ausschließen kann.

3. Das Prinzip

Das Prinzip der latenten Invarianz kann so formuliert werden:

Wenn ein Phänomen nur über Repräsentationen beobachtbar ist,
ist Stabilität des Verhaltens unter bedeutungserhaltender
repräsentationaler Variation zulässige empirische Evidenz dafür,
dass ein System das latente Phänomen und nicht die Repräsentation verfolgt.

Die praktische Folgerung lautet:

Einmal korrekt reicht nicht.
Stabilität über gültige Variationen ist Evidenz.

Das Prinzip sagt nicht, dass stabiles Verhalten wahres Verhalten ist. Ein System kann stabil und falsch sein. LIP trennt zwei Fragen:

Ist das Verhalten wahr, korrekt oder normativ akzeptabel?
Ist das Verhalten in Bezug auf das latente Phänomen stabil?

LIP behandelt die zweite Frage. Für die erste werden andere Standards benötigt.

4. Zielrelative Invarianz

Keine Repräsentation ist in jeder Hinsicht invariant. Eine Paraphrase kann faktischen Inhalt erhalten und den Ton verändern. Eine Übersetzung kann die wörtliche Bedeutung erhalten und kulturelle Implikationen verändern. Eine Formatänderung kann Wörter erhalten und die Salienz verändern.

LIP verlangt daher eine zielrelative Frage:

Was muss fest bleiben, damit diese Messung gültig ist?

Wenn das Ziel semantischer Inhalt ist, muss Variation die relevante Bedeutung erhalten. Wenn das Ziel praktische Absicht ist, muss Variation die praktische Kraft erhalten. Wenn das Ziel die Behandlung einer Richtlinie ist, muss Variation die maßgebliche Bedingung erhalten.

Ungültige Variation ist ein Messfehler. Gültige Variation plus verändertes Verhalten ist Messevidenz.

5. Invarianzlücke

LIP verlangt keine universelle Metrik. Verschiedene Domänen können Uneinigkeit unterschiedlich definieren. Eine allgemeine diagnostische Form ist nützlich.

Sei $E(\Phi)$ die Menge gültiger bedeutungserhaltender Repräsentationen von $\Phi$ , und sei $d$ ein Uneinigkeitsmaß über beobachtete Verhaltensweisen. Die Invarianzlücke für $\Phi$ kann geschrieben werden als:

G(\Phi) = \mathbb{E}_{r_i,r_j \sim E(\Phi)} \left[ d\left(B(r_i), B(r_j)\right) \right].

Eine Größe auf Populationsebene kann geschrieben werden als:

G = \mathbb{E}_{\Phi} \left[ G(\Phi) \right].

Diese Größen sind diagnostisch. Sie messen, ob Verhalten sich ändert, wenn das relevante Phänomen festgehalten und die Repräsentation verändert wird. Für sich allein bestimmen sie nicht, ob ein Ergebnis wahr, akzeptabel oder optimal ist.

6. Interpretation

Wenn zwei gültige Repräsentationen dasselbe latente Phänomen erhalten und unterschiedliches Verhalten erzeugen, sollte die Uneinigkeit erhalten und analysiert werden. Sie kann hinweisen auf:

repräsentationale Sensitivität;
Ambiguität im Zielphänomen;
schwache oder ungültige Variation;
Grenzinstabilität;
Mess- oder Mapping-Unsicherheit;
domänenspezifische Unsicherheit.

Diese Fälle zu verwerfen kann eine Evaluation sauberer erscheinen lassen und sie zugleich weniger valide machen. Die schwierigen Fälle können die informativsten sein.

7. Verhältnis zu CSR

Kanonische semantische Realisierung (CSR) ist ein Messrahmen, der die LIP-Perspektive auf semantische Systeme anwendet. LIP liefert das Prinzip: Unter indirekter Beobachtung ist gültige Variation Teil zulässiger Evidenz. CSR liefert ein öffentliches Vokabular für semantische Messung: kanonische semantische Einheit, Realisierung und beobachtetes Ergebnis.

Die beiden Ideen sind verschieden. LIP ist das Messprinzip. CSR ist eine Möglichkeit, semantische Beobachtungen unter diesem Prinzip zu strukturieren.

8. Öffentliche Grenze

Diese Notiz stellt den öffentlichen Forschungsrahmen dar. Sie veröffentlicht absichtlich keine operativen Audit-Assets, privaten Corpora, Validierungsverfahren, Scoring-Logik, Evaluator-Konfiguration, Schwellenwerte, Berichtsvorlagen, kundenspezifischen Protokolle oder Details zur Laufzeitkontrolle.

Der Zweck der öffentlichen Notiz ist es, das Messargument verständlich zu machen, ohne die Produktionsmethode offenzulegen, die Invarra verwendet.

9. Nicht-Behauptungen

LIP behauptet nicht, dass Invarianz Wahrheit beweist.

LIP behauptet nicht, dass jede Domäne stabile Bedeutung hat.

LIP schreibt kein Modelldesign und keine Implementierung vor.

LIP ersetzt nicht Domänenexpertise, normatives Urteil, Kausalanalyse oder statistische Validierung.

LIP behauptet enger gefasst: Wo ein Phänomen latent ist und über Repräsentationen beobachtet wird, ist gültige repräsentationale Variation Teil dessen, was empirische Inferenz zulässig macht.