Analyse#

Nach der Textextraktion parst Quadrant IntegrityLens die Dokumentstruktur und führt die Scanner parallel aus.

Strukturanalyse#
Der extrahierte Markdown-Text wird analysiert, um Seitengrenzen (aus -Markierungen), Überschriften (Markdown-Überschriften jeder Ebene) und Abschnitte (Text zwischen Überschriften) zu identifizieren. Diese Struktur ermöglicht es, jeden Befund mit einer präzisen Position zu versehen: Seitenzahl, Überschrift und umgebender Abschnittstext.
Parallele Scanner#
Alle aktivierten Scanner laufen parallel über den gesamten Text. Jeder Scanner ist unabhängig und konzentriert sich auf einen bestimmten KI-Indikatortyp. Scanner deklarieren, welche Sprachen sie unterstützen — bei Setzen von --language laufen nur passende Scanner. Sprachunabhängige Scanner (Unicode und Struktur) laufen immer.
Befund-Annotation#
Jeder Rohbefund eines Scanners wird mit Positionsinformationen angereichert: Seite (welche Seite des Original-PDFs), Überschrift (die letzte Überschrift vor dem Befund) und Kontext (ein Textauszug, der den Befund im Zusammenhang zeigt). Die Terminalausgabe und der PDF-Bericht zeigen dadurch immer genau, wo im Dokument jeder Indikator gefunden wurde.

Strukturanalyse#