<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Architektur on Quadrant IntegrityLens</title><link>https://docs.integritylens.quadrant.tools/de/architektur/</link><description>Recent content in Architektur on Quadrant IntegrityLens</description><generator>Hugo</generator><language>de</language><atom:link href="https://docs.integritylens.quadrant.tools/de/architektur/index.xml" rel="self" type="application/rss+xml"/><item><title>Textextraktion</title><link>https://docs.integritylens.quadrant.tools/de/architektur/extraktion/</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://docs.integritylens.quadrant.tools/de/architektur/extraktion/</guid><description>&lt;h1 id="textextraktion"&gt;Textextraktion&lt;a class="anchor" href="#textextraktion"&gt;#&lt;/a&gt;&lt;/h1&gt;
&lt;p&gt;Quadrant IntegrityLens verwendet eine intelligente Extraktionsstrategie, die je nach
PDF-Typ Geschwindigkeit und Genauigkeit abwägt.&lt;/p&gt;
&lt;div class="book-steps"&gt;
&lt;ol&gt;
&lt;li&gt;
&lt;h2 id="eingebetteter-text-schneller-pfad"&gt;Eingebetteter Text (schneller Pfad)&lt;a class="anchor" href="#eingebetteter-text-schneller-pfad"&gt;#&lt;/a&gt;&lt;/h2&gt;
&lt;p&gt;Die meisten PDFs aus Textverarbeitungsprogrammen haben eine eingebettete Textebene. Die Extraktion dieses Textes ist sehr schnell (~0.2 Sekunden) und liefert qualitativ hochwertige Ergebnisse. Dies ist der Standardpfad für die meisten Schülerarbeiten.&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;h2 id="erkennung-defekter-textebenen"&gt;Erkennung defekter Textebenen&lt;a class="anchor" href="#erkennung-defekter-textebenen"&gt;#&lt;/a&gt;&lt;/h2&gt;
&lt;p&gt;Manche PDFs — insbesondere von LaTeX erzeugte — haben eine Textebene mit verfälschten Zeichen. Quadrant IntegrityLens erkennt dies automatisch anhand spezifischer Unicode-Indikatoren (alleinstehende Trema-Zeichen), die auf eine defekte Textebene hinweisen. Wird eine defekte Textebene erkannt, wechselt Quadrant IntegrityLens automatisch zu OCR. Ein manuelles Eingreifen ist nicht nötig.&lt;/p&gt;</description></item><item><title>Analyse</title><link>https://docs.integritylens.quadrant.tools/de/architektur/analyse/</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://docs.integritylens.quadrant.tools/de/architektur/analyse/</guid><description>&lt;h1 id="analyse"&gt;Analyse&lt;a class="anchor" href="#analyse"&gt;#&lt;/a&gt;&lt;/h1&gt;
&lt;p&gt;Nach der Textextraktion parst Quadrant IntegrityLens die Dokumentstruktur und führt
die Scanner parallel aus.&lt;/p&gt;
&lt;div class="book-steps"&gt;
&lt;ol&gt;
&lt;li&gt;
&lt;h2 id="strukturanalyse"&gt;Strukturanalyse&lt;a class="anchor" href="#strukturanalyse"&gt;#&lt;/a&gt;&lt;/h2&gt;
&lt;p&gt;Der extrahierte Markdown-Text wird analysiert, um &lt;strong&gt;Seitengrenzen&lt;/strong&gt; (aus &lt;code&gt;&amp;lt;!-- page N --&amp;gt;&lt;/code&gt;-Markierungen), &lt;strong&gt;Überschriften&lt;/strong&gt; (Markdown-Überschriften jeder Ebene) und &lt;strong&gt;Abschnitte&lt;/strong&gt; (Text zwischen Überschriften) zu identifizieren. Diese Struktur ermöglicht es, jeden Befund mit einer präzisen Position zu versehen: Seitenzahl, Überschrift und umgebender Abschnittstext.&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;h2 id="parallele-scanner"&gt;Parallele Scanner&lt;a class="anchor" href="#parallele-scanner"&gt;#&lt;/a&gt;&lt;/h2&gt;
&lt;p&gt;Alle aktivierten Scanner laufen parallel über den gesamten Text. Jeder Scanner ist unabhängig und konzentriert sich auf einen bestimmten KI-Indikatortyp. Scanner deklarieren, welche Sprachen sie unterstützen — bei Setzen von &lt;code&gt;--language&lt;/code&gt; laufen nur passende Scanner. Sprachunabhängige Scanner (Unicode und Struktur) laufen immer.&lt;/p&gt;</description></item></channel></rss>