Lage der Gesetze nutzt eine KI-Pipeline zur Erzeugung von Synopsen. Damit das nicht zu einer Black Box wird, ist jede Stufe dokumentiert und überprüfbar.
Datenfluss
auto-fetch — Bundestags-DIP-API + gesetze-im-internet.de täglich abrufen
gesetzes-diff — Drucksachen-Plaintext bereinigen, Änderungsbefehle klassifizieren (deterministisch nach Handbuch der Rechtsförmlichkeit + LLM-Fallback für Mehrdeutiges)
gegen-check — Dual-KI-Vergleich + Reverse-Generation + Goldstandard-Tests
Veröffentlichung — Pull-Request gegen den aktuellen Gesetzes-Stand, mit Confidence-Score
Vier Validations-Strategien gegen Halluzinationen
Deterministischer Vorfilter — Standard-Änderungsbefehle aus dem Handbuch der Rechtsförmlichkeit werden mechanisch erkannt und appliziert. ~70 % der Befehle sind deterministisch lösbar — diese brauchen kein LLM.
Dual-KI — wo das LLM eingreift, laufen zwei unabhängige Modelle (typisch Anthropic Claude + OpenAI GPT) parallel. Divergenzen werden in der Synopse sichtbar markiert.
Reverse-Generation — aus der erzeugten Synopse + dem Original-Gesetzes-Stand wird der Änderungsbefehl rekonstruiert. Wenn der Rekonstruktion dem Original-Befehl entspricht (Token-Overlap > 90 %), ist die Synopse vermutlich korrekt.
Goldstandard-Tests — eine wachsende Suite historischer Drucksachen mit manuell verifiziertem Soll-Output. Jede Pipeline-Änderung muss diese Suite weiter bestehen.
Confidence-Stufen
Jede Synopse trägt eine Confidence-Markierung:
| Confidence | Bedeutung | Veröffentlichungs-Verhalten |
|---|---|---|
| HIGH | Alle vier Strategien bestanden | Auto-Publish mit „Vorläufig”-Marker bis manuelle Review |
| MEDIUM | Mind. eine Divergenz; LLM-Fallback hat appliziert | Manual-Review-Queue, nicht öffentlich |
| LOW | Mehrere Divergenzen; oder Tabellen/Anlagen-Patches | Blockiert, manuelle Investigation |
| UNCLEAR | Drucksache strukturell un-parsbar | Pipeline-Issue |
Audit-Trail
Pro Synopse wird eine .audit.json mit allen Pipeline-Schritten dokumentiert. Diese Datei enthält:
Verwendete LLM-Modelle (Provider + Versions-ID)
Prompt-Versionen (versioniert im Repo)
Quell-URLs (Drucksache, Norm-Stand, Vorgang)
Validation-Ergebnisse (alle vier Strategien)
Manuell-verifiziert-Marker + Reviewer-ID + Timestamp
Damit ist jede Synopse forensisch rekonstruierbar.
Was wir explizit NICHT garantieren
Lage der Gesetze ist ein journalistisches und zivilgesellschaftliches Transparenz-Werkzeug, keine amtliche Rechtsfassung. Für rechtlich belastbare Aussagen ist immer das Bundesgesetzblatt (bgbl.de) maßgeblich.
Bei Fehlern: Erratum-Workflow — die korrigierte Version ersetzt das Original am gleichen URL, die alte Version bleibt versioniert zugänglich mit „Korrigiert”-Banner, und der Korrektur-Eintrag landet auf der öffentlichen Erratum-Seite.