Die Qualität der KI-Ausgaben lässt sich über technische Parameter des Modells steuern. Diese Seite erklärt die wichtigsten Einstellungen und gibt Empfehlungen für verschiedene Anwendungsfälle.
Die drei wichtigsten Parameter
| Parameter | Was er steuert | Bereich | Standard |
|---|
| Temperature | Kreativität vs. Vorhersagbarkeit | 0.0 – 2.0 | 0.7–1.0 |
| Top-P | Breite des Wortschatzes | 0.0 – 1.0 | 0.9–1.0 |
| Max Tokens | Maximale Länge der Antwort | 1 – Modelllimit | Variiert |
Temperature
Temperature bestimmt, wie “kreativ” (= unvorhersagbar) das Modell antwortet:
| Wert | Verhalten | Geeignet für |
|---|
| 0.0 | Determiniert – immer die gleiche Antwort | Datenextraktion, Klassifikation, Faktenabfragen |
| 0.1 – 0.3 | Niedrig – kaum Variation | Zusammenfassungen, technische Texte, Code |
| 0.5 – 0.7 | Mittel – ausgewogen | Allgemeine Texte, E-Mails, Berichte |
| 0.8 – 1.2 | Hoch – kreativ und divers | Brainstorming, kreatives Schreiben, Marketing-Texte |
| 1.5 – 2.0 | Sehr hoch – unvorhersagbar | Experimentell, oft qualitativ schlechter |
Faustregel: Für faktenbasierte Aufgaben: Temperature 0–0.3. Für kreative Aufgaben: Temperature 0.7–1.0. Werte über 1.2 sind selten sinnvoll.
Top-P (Nucleus Sampling)
Top-P begrenzt die Auswahl der möglichen nächsten Wörter auf die wahrscheinlichsten, bis die kumulative Wahrscheinlichkeit den Top-P-Wert erreicht:
| Wert | Effekt |
|---|
| 0.1 | Nur die wahrscheinlichsten 10% der Wörter → Sehr fokussiert |
| 0.5 | Die wahrscheinlichsten 50% → Guter Mittelweg |
| 0.9 | Die wahrscheinlichsten 90% → Breiter Wortschatz, mehr Variation |
| 1.0 | Alle Wörter möglich → Maximum an Diversität |
Temperature und Top-P beeinflussen ähnliche Aspekte. Empfehlung: Einen Parameter anpassen, den anderen auf Standard belassen – nicht beide gleichzeitig.
Max Tokens
Begrenzt die maximale Länge der Antwort:
- Max Tokens ≠ garantierte Länge: Das Modell kann kürzer antworten
- Zu niedrig: Die Antwort wird mitten im Satz abgeschnitten
- Zu hoch: Kein Nachteil, aber unnötig hohe Werte können die Kosten erhöhen
- Empfehlung: Wert ~20% über der erwarteten Antwortlänge setzen
Die Qualität hängt auch davon ab, wie klar Sie das gewünschte Format definieren:
Formatieren Sie die Ausgabe als Markdown-Tabelle mit folgenden Spalten:
| Name | Abteilung | Aufgabe | Deadline | Status |
Antworte ausschließlich in diesem JSON-Format, kein Text davor oder danach:
{
"zusammenfassung": "string (max. 100 Wörter)",
"kernpunkte": ["string"],
"empfehlung": "string",
"konfidenz": "hoch | mittel | niedrig"
}
Nächste Schritte