Scanner für strukturelle Muster#

Diese Scanner erkennen Formatierungsmuster und textuelle Artefakte, die typisch für KI-generierten Inhalt sind. Sie laufen unabhängig von der gewählten Sprache.

Label-Listen (label-list)#

Erkennt KI-typische Listen, bei denen jeder Eintrag mit einem fetten Label beginnt, gefolgt von einer Beschreibung:

Klarheit: Der Text sollte verständlich sein. Kürze: Sätze kurz halten. Genauigkeit: Fakten müssen überprüft werden.

Lernende verwenden bei Listen typischerweise einfache Aufzählungszeichen ohne fette Labels.

Übermässige Fettschrift (bold-overuse)#

Erkennt Absätze mit übermässigem **Fett**-Markup (drei oder mehr fette Phrasen pro Absatz). KI-Modelle, insbesondere ChatGPT, neigen dazu, Schlüsselbegriffe durchgehend fett zu markieren.

Thematische Trennlinien (thematic-break)#

Erkennt Markdown-Trennlinien (---, ***, ___). Diese erscheinen, wenn KI-generiertes Markdown ohne Bereinigung in ein Dokument eingefügt wird.

Wahrscheinlichkeit: Mittel bei einem Vorkommen, Hoch bei mehreren.

Emoji (emoji)#

Erkennt Emoji-Zeichen in akademischem Text. Behandelt komplexe Emoji-Sequenzen (ZWJ-Sequenzen, Hauttöne) korrekt.

Wahrscheinlichkeit: Hoch — Emoji haben in akademischen Arbeiten nichts zu suchen.

Übersprungene Überschriftenebenen (skipping-heading-levels)#

Erkennt, wenn Markdown-Überschriften Ebenen überspringen (z.B. von # direkt zu ### ohne ##). Dies ist ein strukturelles Artefakt von KI-generierten Gliederungen.

Wahrscheinlichkeit: Mittel bei einem Sprung, Hoch bei mehreren.

Dreierregel (rule-of-three)#

Erkennt die KI-Tendenz, Punkte in Gruppen von genau drei zu präsentieren. Wenn ein unverhältnismässig grosser Anteil der Listen in einem Dokument genau drei Einträge hat, wird dieses Muster erkannt.

Der Scanner berechnet das Verhältnis von Dreierlisten zu allen Listen und löst basierend auf Verhältnis und absoluter Anzahl aus.

ChatGPT-Artefakte (chatgpt-artifacts)#

Erkennt Markup-Rückstände von ChatGPT, Grok und Copilot, die Lernende häufig zu löschen vergessen:

  • turn0search0, turn0search1 (ChatGPT-Websuchmarkierungen)
  • oaicite:-Referenzen
  • <tool_call> und ähnliche XML-artige Tags
  • Grok-spezifische Markierungen

Wahrscheinlichkeit: Hoch — diese sind ein definitiver Nachweis der KI-Nutzung.

Chatbot-Phrasen (chatbot-phrases)#

Erkennt kollaborative Sprache typisch für Chatbot-Konversationen:

  • „I hope this helps"
  • „Feel free to ask"
  • „als KI-Sprachmodell"
  • „Gerne! Hier ist…"

Wahrscheinlichkeit: Hoch — diese Phrasen verraten direkt eine Chatbot-Interaktion.

Platzhaltertext (placeholder-text)#

Erkennt nicht ausgefüllte Vorlagen-Platzhalter aus KI-generiertem Text:

  • [Describe your...]
  • INSERT_URL
  • [TODO]
  • [Your name here]

Wahrscheinlichkeit: Hoch — diese zeigen an, dass eine KI-Vorlage ohne vollständige Anpassung verwendet wurde.

Doppelpunkt-Listen-Übergang (colon-bullet-cascade)#

Erkennt das Darstellungsmuster, bei dem ein Fliesstextzeilen-Ende mit Doppelpunkt unmittelbar von einer Aufzählungs- oder nummerierten Liste gefolgt wird, und zwar mehrfach im Dokument. KI-Modelle gliedern Erklärungen standardmässig auf diese Weise: Jede Idee wird mit einer kurzen „Einleitungszeile:" vorgestellt und als Aufzählung entfaltet.

Ein einzelner Doppelpunkt-zu-Liste-Übergang ist völlig normal. Drei oder mehr im Dokument sind ein starkes strukturelles Signal.

Wahrscheinlichkeit: Tief bei 3–4 Übergängen, Mittel bei 5–7, Hoch bei 8+.

KI-Meta-Disclaimer (meta-disclaimer-signature)#

Erkennt Einleitungs- und Schluss-Phrasen, die KI-Chatassistenten reflexartig um ihre Antworten herum erzeugen. Nutzerinnen und Nutzer kopieren diese Artefakte regelmässig zusammen mit dem eigentlichen Inhalt in Dokumente:

  • „Natürlich! Hier ist…" / „Gerne! Hier findest du…"
  • „Ich hoffe, das hilft" / „Bei weiteren Fragen…"
  • „Lass mich wissen…" / „Zögere nicht zu fragen…"
  • „Als KI-Sprachmodell…"

Der Scanner deckt sowohl englische als auch deutsche Varianten ab, weil englische Chat-Antworten häufig unverändert in deutsche Dokumente eingefügt werden.

Wahrscheinlichkeit: Hoch, wenn ein Treffer innerhalb der ersten oder letzten 300 Zeichen liegt (wo diese Artefakte überwiegend erscheinen) oder wenn zwei oder mehr Treffer auftreten; Mittel bei einem einzelnen Treffer im Fliesstext.