Output-Qualität optimieren

Die Qualität der KI-Ausgaben lässt sich über technische Parameter des Modells steuern. Diese Parameter steuerst du bei API-Nutzung – siehe OpenAI-kompatible API; in der Web-App wählt Localmind sinnvolle Voreinstellungen. Diese Seite erklärt die wichtigsten Einstellungen und gibt Empfehlungen für verschiedene Anwendungsfälle.

Die drei wichtigsten Parameter

Parameter	Was er steuert	Bereich	Standard
Temperature	Kreativität vs. Vorhersagbarkeit	0.0 – 2.0	0.7–1.0
Top-P	Breite des Wortschatzes	0.0 – 1.0	0.9–1.0
Max Tokens	Maximale Länge der Antwort	1 – Modelllimit	Variiert

Ob temperature und top_p tatsächlich wirken, ist modellabhängig: Localmind reicht die Parameter an das jeweils gewählte Modell durch, aber nicht jedes Modell unterstützt beide. Nicht unterstützte Parameter werden ohne Fehlermeldung ignoriert. Welches Modell du wählst, erfährst du unter Modellauswahl.

Temperature

Temperature bestimmt, wie “kreativ” (= unvorhersagbar) das Modell antwortet:

Wert	Verhalten	Geeignet für
0.0	Determiniert – immer die gleiche Antwort	Datenextraktion, Klassifikation, Faktenabfragen
0.1 – 0.3	Niedrig – kaum Variation	Zusammenfassungen, technische Texte, Code
0.5 – 0.7	Mittel – ausgewogen	Allgemeine Texte, E-Mails, Berichte
0.8 – 1.2	Hoch – kreativ und divers	Brainstorming, kreatives Schreiben, Marketing-Texte
1.5 – 2.0	Sehr hoch – unvorhersagbar	Experimentell, oft qualitativ schlechter

Faustregel: Für faktenbasierte Aufgaben: Temperature 0–0.3. Für kreative Aufgaben: Temperature 0.7–1.0. Werte über 1.2 sind selten sinnvoll.

Top-P (Nucleus Sampling)

Top-P begrenzt die Auswahl der möglichen nächsten Wörter auf die wahrscheinlichsten, bis die kumulative Wahrscheinlichkeit den Top-P-Wert erreicht:

Wert	Effekt
0.1	Nur die wahrscheinlichsten 10% der Wörter → Sehr fokussiert
0.5	Die wahrscheinlichsten 50% → Guter Mittelweg
0.9	Die wahrscheinlichsten 90% → Breiter Wortschatz, mehr Variation
1.0	Alle Wörter möglich → Maximum an Diversität

Temperature und Top-P beeinflussen ähnliche Aspekte. Empfehlung: Einen Parameter anpassen, den anderen auf Standard belassen – nicht beide gleichzeitig.

Max Tokens

Begrenzt die maximale Länge der Antwort:

Max Tokens ≠ garantierte Länge: Das Modell kann kürzer antworten
Zu niedrig: Die Antwort wird mitten im Satz abgeschnitten
Zu hoch: Kein Nachteil, aber unnötig hohe Werte können die Kosten erhöhen
Empfehlung: Wert ~20% über der erwarteten Antwortlänge setzen

Ausgabeformat steuern

Die Qualität hängt auch davon ab, wie klar du das gewünschte Format definierst:

Formatieren Sie die Ausgabe als Markdown-Tabelle mit folgenden Spalten:
| Name | Abteilung | Aufgabe | Deadline | Status |

Antworte ausschließlich in diesem JSON-Format, kein Text davor oder danach:
{
  "zusammenfassung": "string (max. 100 Wörter)",
  "kernpunkte": ["string"],
  "empfehlung": "string",
  "konfidenz": "hoch | mittel | niedrig"
}

Quickstart

Navigation

Arbeiten mit KI

Ressourcen

Library

Apps

Integrationen

Datenschutz & Compliance

Output-Qualität optimieren

Die drei wichtigsten Parameter

Temperature

Top-P (Nucleus Sampling)

Max Tokens

Ausgabeformat steuern

Nächste Schritte

Halluzinationen vermeiden

Modellauswahl

​Die drei wichtigsten Parameter

​Temperature

​Top-P (Nucleus Sampling)

​Max Tokens

​Ausgabeformat steuern

​Nächste Schritte

Halluzinationen vermeiden

Modellauswahl

Die drei wichtigsten Parameter

Temperature

Top-P (Nucleus Sampling)

Max Tokens

Ausgabeformat steuern

Nächste Schritte