Verwendung#

Grundlegende Verwendung#

  1. Dokument analysieren#

    Übergeben Sie eine PDF-Datei als Argument:

    integritylens dokument.pdf

    Quadrant IntegrityLens extrahiert den Text, führt alle aktivierten Scanner aus und zeigt die Befunde im Terminal an. Jeder Befund enthält den Scanner, der ihn ausgelöst hat, eine Wahrscheinlichkeitsstufe (Tief, Mittel oder Hoch), die Seitenzahl und Überschrift der betroffenen Stelle sowie einen Textauszug mit dem markierten Inhalt im Kontext.

  2. PDF-Bericht erstellen#

    Mit --report wird zusätzlich zur Terminalausgabe ein PDF-Bericht erstellt:

    integritylens --report bericht.pdf dokument.pdf

    Der Bericht enthält dieselben Befunde wie die Terminalausgabe, formatiert zum Ausdrucken oder Weitergeben.

  3. Analyse verfeinern#

    Einzelne Scanner oder Regeln können mit --disable deaktiviert werden, wenn ein Scanner bei einem bestimmten Dokument zu viele Fehlalarme produziert:

    integritylens --disable swiss-german dokument.pdf
    integritylens --disable eszett dokument.pdf
    integritylens --disable eszett --disable em-dash dokument.pdf

Sprachauswahl#

Standardmässig analysiert Quadrant IntegrityLens Text als Deutsch (deu). Mit --language kann die Dokumentsprache geändert werden:

integritylens --language fra dokument.pdf

Sprachunabhängige Scanner (Unicode-Zeichen, strukturelle Muster) laufen immer, unabhängig von der gewählten Sprache.

Sprache der Oberfläche#

Quadrant IntegrityLens erkennt automatisch die Sprache Ihres Betriebssystems und zeigt alle Terminalausgaben, Statusmeldungen und PDF-Berichte in dieser Sprache an. Aktuell unterstützt: Englisch und Deutsch.

Die automatische Erkennung kann mit --ui-language überschrieben werden:

integritylens --ui-language en dokument.pdf
`--language` bestimmt, welche dokumentsprachlichen Scanner verwendet werden (z.B. deutsche Umlaut-Erkennung). `--ui-language` bestimmt die Anzeigesprache des Programms selbst. Beide Einstellungen sind unabhängig voneinander.

OCR erzwingen#

Quadrant IntegrityLens erkennt automatisch, ob ein PDF eine brauchbare Textebene hat. Ist die Textebene defekt (häufig bei LaTeX-PDFs), wird automatisch auf OCR zurückgegriffen. OCR kann auch manuell erzwungen werden:

integritylens --force-ocr dokument.pdf

Dies dauert länger (~25 Sekunden), kann aber bei manchen Dokumenten bessere Ergebnisse liefern.

Alle Optionen#

FlagAliasUmgebungsvariableBeschreibung
--disable-dINTEGRITYLENS_DISABLEScanner- oder Regel-IDs deaktivieren (wiederholbar)
--report-rINTEGRITYLENS_REPORTPfad für PDF-Bericht
--verbose-vINTEGRITYLENS_VERBOSEAbschnittstext bei Befunden anzeigen
--log-levelINTEGRITYLENS_LOG_LEVELLog-Stufe: debug, info, warn, error (Standard: warn)
--language-lINTEGRITYLENS_LANGUAGEISO 639-3 Sprachcode (Standard: deu)
--ui-languageINTEGRITYLENS_UI_LANGUAGEAnzeigesprache: en, de (Standard: automatisch)
--force-ocrINTEGRITYLENS_FORCE_OCRImmer OCR verwenden, automatische Erkennung überspringen

Jede Option kann auch über die zugehörige INTEGRITYLENS_-Umgebungsvariable gesetzt werden.