Unter Dokumente: Verarbeitung steuern Sie, wie viele Dokumente gleichzeitig verarbeitet werden, wie die Warteschlange funktioniert und wann Jobs abgebrochen oder wiederholt werden. Diese Einstellungen sind entscheidend für die Performance und Fairness der gesamten Organisation.
Erfordert die Rolle Org Admin.
Wann sollte ich das ändern?
- Wenn die Dokumentenverarbeitung zu langsam ist oder Jobs sich stauen
- Wenn einzelne Benutzer die Pipeline blockieren
- Wenn große Dokumente regelmäßig Timeouts verursachen
- Beim Skalieren der Organisation (mehr Benutzer, mehr Daten)
Aktueller Status
Die Statusanzeige zeigt in Echtzeit:
| Metrik | Beschreibung |
|---|
| Aktive Jobs | Aktuell laufende Verarbeitungsaufträge |
| Jobs in Warteschlange | Aufträge, die auf Verarbeitung warten |
| Auslastung | Prozentuale Auslastung der Pipeline |
Aktionen:
- Aktualisieren — Lädt die Statusanzeige neu
- Alle Jobs abbrechen — Bricht alle laufenden und wartenden Jobs ab
Alle Jobs abbrechen stoppt die gesamte Verarbeitung. Verwenden Sie diese Aktion nur im Notfall (z.B. bei einem fehlerhaften Massenimport, der die Pipeline blockiert).
Einstellungen
Verarbeitung
| Einstellung | Beschreibung | Empfehlung |
|---|
| Max. gleichzeitige Jobs | Maximale Anzahl parallel laufender Verarbeitungsaufträge | An die verfügbare Serverleistung anpassen. Zu hoch: Systemlast. Zu niedrig: lange Wartezeiten. |
| Max. Jobs pro Benutzer | Maximale Anzahl gleichzeitiger Jobs, die ein einzelner Benutzer auslösen kann | Setzen Sie diesen Wert deutlich unter dem Gesamtlimit, damit ein einzelner Benutzer die Pipeline nicht monopolisiert. |
| Max. Warteschlangentiefe | Maximale Anzahl von Jobs in der Warteschlange | Nicht zu groß wählen – eine volle Queue bedeutet lange Wartezeiten für alle. |
| Verarbeitungspriorität | Reihenfolge, in der Jobs abgearbeitet werden | |
Upload-Ratenbegrenzung
| Einstellung | Beschreibung | Empfehlung |
|---|
| Upload-Ratenlimit | Maximale Anzahl von Uploads pro Zeitfenster | Verhindert Überlastung durch Massenimports. Moderat setzen – zu restriktiv frustriert Benutzer. |
Job-Timeouts
| Einstellung | Beschreibung | Empfehlung |
|---|
| Parsing-Timeout | Maximale Dauer für das Parsen eines Dokuments | Groß genug für umfangreiche PDFs (100+ Seiten), aber begrenzt, um hängende Jobs zu stoppen. |
| Chunking-Timeout | Maximale Dauer für das Aufteilen in Chunks | In der Regel kürzer als Parsing, da Chunking weniger rechenintensiv ist. |
| Embedding-Timeout | Maximale Dauer für die Vektorgenerierung | Abhängig vom Embedding-Modell und der Dokumentgröße. |
Wiederholungskonfiguration
| Einstellung | Beschreibung | Empfehlung |
|---|
| Parsing-Wiederholungen | Anzahl automatischer Neuversuche bei fehlgeschlagenem Parsing | 1–2 Wiederholungen reichen. Mehr erhöht Last und Kosten ohne wesentlichen Mehrwert. |
| Chunking-Wiederholungen | Anzahl automatischer Neuversuche bei fehlgeschlagenem Chunking | 1–2 Wiederholungen. |
| Embedding-Wiederholungen | Anzahl automatischer Neuversuche bei fehlgeschlagenem Embedding | 1–2 Wiederholungen. Bei externen Modell-APIs ggf. etwas höher (transiente Fehler). |
Auswirkungen
- Max. Jobs pro Benutzer ist die wichtigste Fairness-Einstellung: Sie verhindert, dass ein einzelner Massenimport alle anderen Benutzer blockiert.
- Zu niedrige Timeouts führen dazu, dass große Dokumente nie erfolgreich verarbeitet werden.
- Zu viele Wiederholungen erhöhen die Systemlast und Kosten – besonders bei Embedding-Modellen, die pro Token abgerechnet werden.
Fairness-Strategie: Setzen Sie „Max. Jobs pro Benutzer” auf etwa ein Drittel der „Max. gleichzeitigen Jobs”. So bleibt für andere Benutzer immer Kapazität frei, auch wenn ein Benutzer viele Dokumente auf einmal hochlädt.