Scanner#
Quadrant IntegrityLens verwendet eine Sammlung regelbasierter Scanner, um Muster zu erkennen, die typisch für KI-generierten Text sind. Jeder Scanner konzentriert sich auf einen bestimmten Indikatortyp.
Die Scanner sind in fünf Kategorien unterteilt:
- Unicode-Zeichen — Sonderzeichen, die KI einfügt, Lernende aber kaum tippen
- Deutsche Sprache — Umlaut-Digraphen und KI-typische Vokabularmuster
- Schweizer Hochdeutsch — Eszett-Erkennung für das Schweizer Hochdeutsch
- Rhetorische Muster — von KI überstrapazierte Schreibmuster im Deutschen
- Strukturelle Muster — Formatierungsspuren, die typisch für KI-Ausgaben sind
Wahrscheinlichkeitsstufen#
Jeder Befund hat eine Wahrscheinlichkeitsstufe:
| Stufe | Bedeutung |
|---|---|
| Hoch | Starker Hinweis auf KI-generierten Text |
| Mittel | Wahrscheinlich KI-generiert, kann aber natürlich vorkommen |
| Tief | Schwacher Hinweis — nur zusammen mit weiteren Befunden aussagekräftig |
Ein einzelner Befund mit tiefer Wahrscheinlichkeit hat wenig Aussagekraft. Mehrere Befunde aus verschiedenen Scannern ergeben ein deutlicheres Bild.
Scanner deaktivieren#
Jeder Scanner kann mit der --disable-Option deaktiviert werden. Dabei kann
entweder die Scanner-ID (deaktiviert den gesamten Scanner) oder eine
Regel-ID (filtert einzelne Befunde) verwendet werden:
integritylens --disable swiss-german dokument.pdf
integritylens --disable eszett dokument.pdf