Scanner#

Quadrant IntegrityLens verwendet eine Sammlung regelbasierter Scanner, um Muster zu erkennen, die typisch für KI-generierten Text sind. Jeder Scanner konzentriert sich auf einen bestimmten Indikatortyp.

Die Scanner sind in fünf Kategorien unterteilt:

Unicode-Zeichen — Sonderzeichen, die KI einfügt, Lernende aber kaum tippen
Deutsche Sprache — Umlaut-Digraphen und KI-typische Vokabularmuster
Schweizer Hochdeutsch — Eszett-Erkennung für das Schweizer Hochdeutsch
Rhetorische Muster — von KI überstrapazierte Schreibmuster im Deutschen
Strukturelle Muster — Formatierungsspuren, die typisch für KI-Ausgaben sind

Wahrscheinlichkeitsstufen#

Jeder Befund hat eine Wahrscheinlichkeitsstufe:

Stufe	Bedeutung
Hoch	Starker Hinweis auf KI-generierten Text
Mittel	Wahrscheinlich KI-generiert, kann aber natürlich vorkommen
Tief	Schwacher Hinweis — nur zusammen mit weiteren Befunden aussagekräftig

Ein einzelner Befund mit tiefer Wahrscheinlichkeit hat wenig Aussagekraft. Mehrere Befunde aus verschiedenen Scannern ergeben ein deutlicheres Bild.

Scanner deaktivieren#

Jeder Scanner kann mit der --disable-Option deaktiviert werden. Dabei kann entweder die Scanner-ID (deaktiviert den gesamten Scanner) oder eine Regel-ID (filtert einzelne Befunde) verwendet werden:

integritylens --disable swiss-german dokument.pdf
integritylens --disable eszett dokument.pdf