Skip to main content
Unter Dokumente: Verarbeitung steuern Sie, wie viele Dokumente gleichzeitig verarbeitet werden, wie die Warteschlange funktioniert und wann Jobs abgebrochen oder wiederholt werden. Diese Einstellungen sind entscheidend für die Performance und Fairness der gesamten Organisation.
Erfordert die Rolle Org Admin.

Wann sollte ich das ändern?

  • Wenn die Dokumentenverarbeitung zu langsam ist oder Jobs sich stauen
  • Wenn einzelne Benutzer die Pipeline blockieren
  • Wenn große Dokumente regelmäßig Timeouts verursachen
  • Beim Skalieren der Organisation (mehr Benutzer, mehr Daten)

Aktueller Status

Die Statusanzeige zeigt in Echtzeit:
MetrikBeschreibung
Aktive JobsAktuell laufende Verarbeitungsaufträge
Jobs in WarteschlangeAufträge, die auf Verarbeitung warten
AuslastungProzentuale Auslastung der Pipeline
Aktionen:
  • Aktualisieren — Lädt die Statusanzeige neu
  • Alle Jobs abbrechen — Bricht alle laufenden und wartenden Jobs ab
Alle Jobs abbrechen stoppt die gesamte Verarbeitung. Verwenden Sie diese Aktion nur im Notfall (z.B. bei einem fehlerhaften Massenimport, der die Pipeline blockiert).

Einstellungen

Verarbeitung

EinstellungBeschreibungEmpfehlung
Max. gleichzeitige JobsMaximale Anzahl parallel laufender VerarbeitungsaufträgeAn die verfügbare Serverleistung anpassen. Zu hoch: Systemlast. Zu niedrig: lange Wartezeiten.
Max. Jobs pro BenutzerMaximale Anzahl gleichzeitiger Jobs, die ein einzelner Benutzer auslösen kannSetzen Sie diesen Wert deutlich unter dem Gesamtlimit, damit ein einzelner Benutzer die Pipeline nicht monopolisiert.
Max. WarteschlangentiefeMaximale Anzahl von Jobs in der WarteschlangeNicht zu groß wählen – eine volle Queue bedeutet lange Wartezeiten für alle.
VerarbeitungsprioritätReihenfolge, in der Jobs abgearbeitet werden

Upload-Ratenbegrenzung

EinstellungBeschreibungEmpfehlung
Upload-RatenlimitMaximale Anzahl von Uploads pro ZeitfensterVerhindert Überlastung durch Massenimports. Moderat setzen – zu restriktiv frustriert Benutzer.

Job-Timeouts

EinstellungBeschreibungEmpfehlung
Parsing-TimeoutMaximale Dauer für das Parsen eines DokumentsGroß genug für umfangreiche PDFs (100+ Seiten), aber begrenzt, um hängende Jobs zu stoppen.
Chunking-TimeoutMaximale Dauer für das Aufteilen in ChunksIn der Regel kürzer als Parsing, da Chunking weniger rechenintensiv ist.
Embedding-TimeoutMaximale Dauer für die VektorgenerierungAbhängig vom Embedding-Modell und der Dokumentgröße.

Wiederholungskonfiguration

EinstellungBeschreibungEmpfehlung
Parsing-WiederholungenAnzahl automatischer Neuversuche bei fehlgeschlagenem Parsing1–2 Wiederholungen reichen. Mehr erhöht Last und Kosten ohne wesentlichen Mehrwert.
Chunking-WiederholungenAnzahl automatischer Neuversuche bei fehlgeschlagenem Chunking1–2 Wiederholungen.
Embedding-WiederholungenAnzahl automatischer Neuversuche bei fehlgeschlagenem Embedding1–2 Wiederholungen. Bei externen Modell-APIs ggf. etwas höher (transiente Fehler).

Auswirkungen

  • Max. Jobs pro Benutzer ist die wichtigste Fairness-Einstellung: Sie verhindert, dass ein einzelner Massenimport alle anderen Benutzer blockiert.
  • Zu niedrige Timeouts führen dazu, dass große Dokumente nie erfolgreich verarbeitet werden.
  • Zu viele Wiederholungen erhöhen die Systemlast und Kosten – besonders bei Embedding-Modellen, die pro Token abgerechnet werden.
Fairness-Strategie: Setzen Sie „Max. Jobs pro Benutzer” auf etwa ein Drittel der „Max. gleichzeitigen Jobs”. So bleibt für andere Benutzer immer Kapazität frei, auch wenn ein Benutzer viele Dokumente auf einmal hochlädt.