Zum Inhalt springen

Methodik

Lage der Gesetze nutzt eine KI-Pipeline zur Erzeugung von Synopsen. Damit das nicht zu einer Black Box wird, ist jede Stufe dokumentiert und überprüfbar.

Datenfluss

  1. auto-fetch — Bundestags-DIP-API + gesetze-im-internet.de täglich abrufen

  2. gesetzes-diff — Drucksachen-Plaintext bereinigen, Änderungsbefehle klassifizieren (deterministisch nach Handbuch der Rechtsförmlichkeit + LLM-Fallback für Mehrdeutiges)

  3. gegen-check — Dual-KI-Vergleich + Reverse-Generation + Goldstandard-Tests

  4. Veröffentlichung — Pull-Request gegen den aktuellen Gesetzes-Stand, mit Confidence-Score

Vier Validations-Strategien gegen Halluzinationen

  1. Deterministischer Vorfilter — Standard-Änderungsbefehle aus dem Handbuch der Rechtsförmlichkeit werden mechanisch erkannt und appliziert. ~70 % der Befehle sind deterministisch lösbar — diese brauchen kein LLM.

  2. Dual-KI — wo das LLM eingreift, laufen zwei unabhängige Modelle (typisch Anthropic Claude + OpenAI GPT) parallel. Divergenzen werden in der Synopse sichtbar markiert.

  3. Reverse-Generation — aus der erzeugten Synopse + dem Original-Gesetzes-Stand wird der Änderungsbefehl rekonstruiert. Wenn der Rekonstruktion dem Original-Befehl entspricht (Token-Overlap > 90 %), ist die Synopse vermutlich korrekt.

  4. Goldstandard-Tests — eine wachsende Suite historischer Drucksachen mit manuell verifiziertem Soll-Output. Jede Pipeline-Änderung muss diese Suite weiter bestehen.

Confidence-Stufen

Jede Synopse trägt eine Confidence-Markierung:

ConfidenceBedeutungVeröffentlichungs-Verhalten
HIGHAlle vier Strategien bestandenAuto-Publish mit „Vorläufig”-Marker bis manuelle Review
MEDIUMMind. eine Divergenz; LLM-Fallback hat appliziertManual-Review-Queue, nicht öffentlich
LOWMehrere Divergenzen; oder Tabellen/Anlagen-PatchesBlockiert, manuelle Investigation
UNCLEARDrucksache strukturell un-parsbarPipeline-Issue

Audit-Trail

Pro Synopse wird eine .audit.json mit allen Pipeline-Schritten dokumentiert. Diese Datei enthält:

  • Verwendete LLM-Modelle (Provider + Versions-ID)

  • Prompt-Versionen (versioniert im Repo)

  • Quell-URLs (Drucksache, Norm-Stand, Vorgang)

  • Validation-Ergebnisse (alle vier Strategien)

  • Manuell-verifiziert-Marker + Reviewer-ID + Timestamp

Damit ist jede Synopse forensisch rekonstruierbar.

Was wir explizit NICHT garantieren

Lage der Gesetze ist ein journalistisches und zivilgesellschaftliches Transparenz-Werkzeug, keine amtliche Rechtsfassung. Für rechtlich belastbare Aussagen ist immer das Bundesgesetzblatt (bgbl.de) maßgeblich.

Bei Fehlern: Erratum-Workflow — die korrigierte Version ersetzt das Original am gleichen URL, die alte Version bleibt versioniert zugänglich mit „Korrigiert”-Banner, und der Korrektur-Eintrag landet auf der öffentlichen Erratum-Seite.