Symptom
Der Agent kann Inhalte aus einem hochgeladenen Dokument nicht korrekt wiedergeben, überspringt Abschnitte oder gibt verstümmelte Texte zurück.Mögliche Ursachen
- Der gewählte Parser passt nicht zum Dokumenttyp (z.B. ein regelbasierter Parser für ein gescanntes PDF).
- Das Dokument enthält Bilder statt Text (Scans), aber es wird kein OCR-Parser verwendet.
- Komplexe Layouts (mehrspaltig, verschachtelte Tabellen) werden vom Parser nicht korrekt erkannt.
Lösung
Parser-Zuordnung prüfen
Öffnen Sie Space-Einstellungen → Parser und prüfen Sie, welcher Parser dem Dateityp zugewiesen ist.
Passenden Parser wählen
Wählen Sie einen besser geeigneten Parser:
- Gescannte PDFs / Bilder mit Text →
mistral_ocr - PDFs mit Tabellen und komplexem Layout →
pdf_docling - Einfache Text-PDFs →
pdf_pymupdf(schnellste Option)
Dokument erneut hochladen
Nach dem Wechsel des Parsers muss das Dokument erneut hochgeladen werden, damit es mit dem neuen Parser verarbeitet wird.
