Analyse#

Nach der Textextraktion parst Quadrant IntegrityLens die Dokumentstruktur und führt die Scanner parallel aus.

  1. Strukturanalyse#

    Der extrahierte Markdown-Text wird analysiert, um Seitengrenzen (aus <!-- page N -->-Markierungen), Überschriften (Markdown-Überschriften jeder Ebene) und Abschnitte (Text zwischen Überschriften) zu identifizieren. Diese Struktur ermöglicht es, jeden Befund mit einer präzisen Position zu versehen: Seitenzahl, Überschrift und umgebender Abschnittstext.

  2. Parallele Scanner#

    Alle aktivierten Scanner laufen parallel über den gesamten Text. Jeder Scanner ist unabhängig und konzentriert sich auf einen bestimmten KI-Indikatortyp. Scanner deklarieren, welche Sprachen sie unterstützen — bei Setzen von --language laufen nur passende Scanner. Sprachunabhängige Scanner (Unicode und Struktur) laufen immer.

  3. Befund-Annotation#

    Jeder Rohbefund eines Scanners wird mit Positionsinformationen angereichert: Seite (welche Seite des Original-PDFs), Überschrift (die letzte Überschrift vor dem Befund) und Kontext (ein Textauszug, der den Befund im Zusammenhang zeigt). Die Terminalausgabe und der PDF-Bericht zeigen dadurch immer genau, wo im Dokument jeder Indikator gefunden wurde.