Skip to main content

Symptom

Der Agent kann Inhalte aus einem hochgeladenen Dokument nicht korrekt wiedergeben, überspringt Abschnitte oder gibt verstümmelte Texte zurück.

Mögliche Ursachen

  • Der gewählte Parser passt nicht zum Dokumenttyp (z.B. ein regelbasierter Parser für ein gescanntes PDF).
  • Das Dokument enthält Bilder statt Text (Scans), aber es wird kein OCR-Parser verwendet.
  • Komplexe Layouts (mehrspaltig, verschachtelte Tabellen) werden vom Parser nicht korrekt erkannt.

Lösung

1

Parser-Zuordnung prüfen

Öffnen Sie Space-Einstellungen → Parser und prüfen Sie, welcher Parser dem Dateityp zugewiesen ist.
2

Passenden Parser wählen

Wählen Sie einen besser geeigneten Parser:
  • Gescannte PDFs / Bilder mit Textmistral_ocr
  • PDFs mit Tabellen und komplexem Layoutpdf_docling
  • Einfache Text-PDFspdf_pymupdf (schnellste Option)
3

Dokument erneut hochladen

Nach dem Wechsel des Parsers muss das Dokument erneut hochgeladen werden, damit es mit dem neuen Parser verarbeitet wird.
4

Ergebnis prüfen

Testen Sie mit einer gezielten Frage an den Agenten, ob die relevanten Inhalte jetzt korrekt gefunden werden.
Die mit Standard gekennzeichneten Parser sind für die meisten Anwendungsfälle die beste Wahl. Wechseln Sie nur bei konkreten Problemen zu einer anderen Variante.