Verwendung#

Grundlegende Verwendung#

Dokument analysieren#
Übergeben Sie eine PDF-Datei als Argument:
```
integritylens dokument.pdf
```
Quadrant IntegrityLens extrahiert den Text, führt alle aktivierten Scanner aus und zeigt die Befunde im Terminal an. Jeder Befund enthält den Scanner, der ihn ausgelöst hat, eine Wahrscheinlichkeitsstufe (Tief, Mittel oder Hoch), die Seitenzahl und Überschrift der betroffenen Stelle sowie einen Textauszug mit dem markierten Inhalt im Kontext.
PDF-Bericht erstellen#
Mit --report wird zusätzlich zur Terminalausgabe ein PDF-Bericht erstellt:
```
integritylens --report bericht.pdf dokument.pdf
```
Der Bericht enthält dieselben Befunde wie die Terminalausgabe, formatiert zum Ausdrucken oder Weitergeben.
Analyse verfeinern#
Einzelne Scanner oder Regeln können mit --disable deaktiviert werden, wenn ein Scanner bei einem bestimmten Dokument zu viele Fehlalarme produziert:
```
integritylens --disable swiss-german dokument.pdf
integritylens --disable eszett dokument.pdf
integritylens --disable eszett --disable em-dash dokument.pdf
```

Sprachauswahl#

Standardmässig analysiert Quadrant IntegrityLens Text als Deutsch (deu). Mit --language kann die Dokumentsprache geändert werden:

integritylens --language fra dokument.pdf

Sprachunabhängige Scanner (Unicode-Zeichen, strukturelle Muster) laufen immer, unabhängig von der gewählten Sprache.

Sprache der Oberfläche#

Quadrant IntegrityLens erkennt automatisch die Sprache Ihres Betriebssystems und zeigt alle Terminalausgaben, Statusmeldungen und PDF-Berichte in dieser Sprache an. Aktuell unterstützt: Englisch und Deutsch.

Die automatische Erkennung kann mit --ui-language überschrieben werden:

integritylens --ui-language en dokument.pdf

`--language` bestimmt, welche dokumentsprachlichen Scanner verwendet werden (z.B. deutsche Umlaut-Erkennung). `--ui-language` bestimmt die Anzeigesprache des Programms selbst. Beide Einstellungen sind unabhängig voneinander.

OCR erzwingen#

Quadrant IntegrityLens erkennt automatisch, ob ein PDF eine brauchbare Textebene hat. Ist die Textebene defekt (häufig bei LaTeX-PDFs), wird automatisch auf OCR zurückgegriffen. OCR kann auch manuell erzwungen werden:

integritylens --force-ocr dokument.pdf

Dies dauert länger (~25 Sekunden), kann aber bei manchen Dokumenten bessere Ergebnisse liefern.

Alle Optionen#

Flag	Alias	Umgebungsvariable	Beschreibung
`--disable`	`-d`	`INTEGRITYLENS_DISABLE`	Scanner- oder Regel-IDs deaktivieren (wiederholbar)
`--report`	`-r`	`INTEGRITYLENS_REPORT`	Pfad für PDF-Bericht
`--verbose`	`-v`	`INTEGRITYLENS_VERBOSE`	Abschnittstext bei Befunden anzeigen
`--log-level`		`INTEGRITYLENS_LOG_LEVEL`	Log-Stufe: `debug`, `info`, `warn`, `error` (Standard: `warn`)
`--language`	`-l`	`INTEGRITYLENS_LANGUAGE`	ISO 639-3 Sprachcode (Standard: `deu`)
`--ui-language`		`INTEGRITYLENS_UI_LANGUAGE`	Anzeigesprache: `en`, `de` (Standard: automatisch)
`--force-ocr`		`INTEGRITYLENS_FORCE_OCR`	Immer OCR verwenden, automatische Erkennung überspringen

Jede Option kann auch über die zugehörige INTEGRITYLENS_-Umgebungsvariable gesetzt werden.

Verwendung#

Grundlegende Verwendung#

Dokument analysieren#

PDF-Bericht erstellen#

Analyse verfeinern#

Sprachauswahl#

Sprache der Oberfläche#

OCR erzwingen#

Alle Optionen#