Skip to main content
Diese Übersicht erklärt die wichtigsten Begriffe, die Ihnen bei der Arbeit mit KI-Agenten begegnen – alphabetisch sortiert.
Das Modell wird angewiesen, seinen Denkprozess offenzulegen – Schritt für Schritt.Trigger-Phrase: “Denke Schritt für Schritt” oder “Erkläre deinen Denkweg”
Numerische Repräsentationen von Text als Vektoren (Listen von Zahlen). Ähnliche Texte haben ähnliche Vektoren.Verwendet für:
  • Semantische Suche
  • Dokumenten-Ähnlichkeit
  • RAG-Systeme
Dem Modell werden Beispiele gezeigt, bevor es die eigentliche Aufgabe löst.
Beispiel 1: Input → Output
Beispiel 2: Input → Output
Ihre Anfrage: Input → ?
Vorteil: Modell versteht das gewünschte Format besser.
Wenn ein Modell falsche Informationen überzeugend präsentiert – Fakten erfindet, die nicht existieren.Ursachen:
  • Frage liegt außerhalb des Trainingswissens
  • Modell “füllt Lücken” mit plausibel klingendem Text
Gegenmaßnahmen:
  • RAG verwenden (Dokumente als Quelle)
  • Modell anweisen: “Sage wenn du unsicher bist”
  • Quellen/Zitate einfordern
Die maximale Textmenge, die ein Modell gleichzeitig verarbeiten kann – gemessen in Tokens.
GrößeEntspricht ca.
8k Tokens12 Seiten Text
32k Tokens50 Seiten Text
128k Tokens200 Seiten Text
1M+ Tokens1.500+ Seiten Text
Wichtig: Das Kontextfenster umfasst sowohl Ihre Eingabe als auch die Antwort des Modells.
Modelle, die verschiedene Medientypen verarbeiten können:
  • Text
  • Bilder
  • Audio
  • Video (bei einigen Modellen)
Beispiel: GPT-4o, Gemini 3 Pro
Eine Technik, bei der das Modell zuerst relevante Dokumente abruft und dann basierend auf diesen antwortet.
Frage → Dokumente durchsuchen → Relevante Stellen finden → Antwort generieren
Vorteile:
  • Antworten basieren auf Ihren Daten
  • Reduziert Halluzinationen
  • Aktuellere Informationen als das Trainings-Cutoff
In Localmind aktivieren Sie RAG über das Hybrid Search Tool.
Modelle mit Reasoning denken schrittweise nach, bevor sie antworten. Sie zerlegen komplexe Probleme in Teilschritte.Ideal für:
  • Mathematische Berechnungen
  • Logische Schlussfolgerungen
  • Mehrstufige Analysen
  • Wissenschaftliche Probleme
Ohne Reasoning: Modell antwortet direkt. Mit Reasoning: Modell plant → denkt → prüft → antwortet.
Die grundlegende Anweisung, die das Verhalten des Agenten definiert. Wird vor jeder Konversation geladen.Enthält typischerweise:
  • Rolle des Agenten
  • Verhaltensregeln
  • Ausgabeformat
  • Einschränkungen
Steuert die Kreativität der Antworten.
WertVerhalten
0.0Deterministisch – immer die gleiche Antwort
0.3–0.7Ausgewogen – leichte Variation
1.0+Kreativ – unvorhersehbare, diverse Antworten
Empfehlung: 0.3–0.5 für sachliche Aufgaben, 0.7–1.0 für kreatives Schreiben.
Die Grundeinheit, in der KI-Modelle Text verarbeiten. Ein Token ist ungefähr:
  • 4 Zeichen im Englischen
  • 3 Zeichen im Deutschen
  • 1 häufiges Wort oder Wortteil
Beispiel: “Localmind ist großartig” ≈ 5 Tokens
Begrenzt die Auswahl auf die K wahrscheinlichsten nächsten Wörter.
WertVerhalten
1Nur das wahrscheinlichste Wort
40Auswahl aus den Top 40 Optionen
100+Sehr breite Auswahl
Empfehlung: 40–50 als Standard. Niedriger für fokussierte Antworten.
Begrenzt die Auswahl auf die wahrscheinlichsten Wörter, deren kumulierte Wahrscheinlichkeit den Wert P erreicht.
WertVerhalten
0.1Sehr fokussiert – nur die sichersten Optionen
0.9Breite Auswahl – mehr Variation
1.0Keine Einschränkung
Empfehlung: 0.9 als Standard. Reduzieren für präzisere Antworten.
Eine Datenbank, die Embeddings speichert und schnelle Ähnlichkeitssuchen ermöglicht.Localmind verwaltet dies automatisch im Hintergrund.
Das Modell löst eine Aufgabe ohne Beispiele – nur basierend auf der Anweisung.