Verwendung#
Grundlegende Verwendung#
Dokument analysieren#
Übergeben Sie eine PDF-Datei als Argument:
integritylens dokument.pdfQuadrant IntegrityLens extrahiert den Text, führt alle aktivierten Scanner aus und zeigt die Befunde im Terminal an. Jeder Befund enthält den Scanner, der ihn ausgelöst hat, eine Wahrscheinlichkeitsstufe (Tief, Mittel oder Hoch), die Seitenzahl und Überschrift der betroffenen Stelle sowie einen Textauszug mit dem markierten Inhalt im Kontext.
PDF-Bericht erstellen#
Mit
--reportwird zusätzlich zur Terminalausgabe ein PDF-Bericht erstellt:integritylens --report bericht.pdf dokument.pdfDer Bericht enthält dieselben Befunde wie die Terminalausgabe, formatiert zum Ausdrucken oder Weitergeben.
Analyse verfeinern#
Einzelne Scanner oder Regeln können mit
--disabledeaktiviert werden, wenn ein Scanner bei einem bestimmten Dokument zu viele Fehlalarme produziert:integritylens --disable swiss-german dokument.pdf integritylens --disable eszett dokument.pdf integritylens --disable eszett --disable em-dash dokument.pdf
Sprachauswahl#
Standardmässig analysiert Quadrant IntegrityLens Text als Deutsch (deu). Mit
--language kann die Dokumentsprache geändert werden:
integritylens --language fra dokument.pdfSprachunabhängige Scanner (Unicode-Zeichen, strukturelle Muster) laufen immer, unabhängig von der gewählten Sprache.
Sprache der Oberfläche#
Quadrant IntegrityLens erkennt automatisch die Sprache Ihres Betriebssystems und zeigt alle Terminalausgaben, Statusmeldungen und PDF-Berichte in dieser Sprache an. Aktuell unterstützt: Englisch und Deutsch.
Die automatische Erkennung kann mit --ui-language überschrieben werden:
integritylens --ui-language en dokument.pdf`--language` bestimmt, welche dokumentsprachlichen Scanner verwendet werden (z.B. deutsche Umlaut-Erkennung). `--ui-language` bestimmt die Anzeigesprache des Programms selbst. Beide Einstellungen sind unabhängig voneinander.
OCR erzwingen#
Quadrant IntegrityLens erkennt automatisch, ob ein PDF eine brauchbare Textebene hat. Ist die Textebene defekt (häufig bei LaTeX-PDFs), wird automatisch auf OCR zurückgegriffen. OCR kann auch manuell erzwungen werden:
integritylens --force-ocr dokument.pdfDies dauert länger (~25 Sekunden), kann aber bei manchen Dokumenten bessere Ergebnisse liefern.
Alle Optionen#
| Flag | Alias | Umgebungsvariable | Beschreibung |
|---|---|---|---|
--disable | -d | INTEGRITYLENS_DISABLE | Scanner- oder Regel-IDs deaktivieren (wiederholbar) |
--report | -r | INTEGRITYLENS_REPORT | Pfad für PDF-Bericht |
--verbose | -v | INTEGRITYLENS_VERBOSE | Abschnittstext bei Befunden anzeigen |
--log-level | INTEGRITYLENS_LOG_LEVEL | Log-Stufe: debug, info, warn, error (Standard: warn) | |
--language | -l | INTEGRITYLENS_LANGUAGE | ISO 639-3 Sprachcode (Standard: deu) |
--ui-language | INTEGRITYLENS_UI_LANGUAGE | Anzeigesprache: en, de (Standard: automatisch) | |
--force-ocr | INTEGRITYLENS_FORCE_OCR | Immer OCR verwenden, automatische Erkennung überspringen |
Jede Option kann auch über die zugehörige INTEGRITYLENS_-Umgebungsvariable
gesetzt werden.