Skip to main content
KI-Modelle haben kein eigenes Wissen über Ihr Unternehmen, Ihre Produkte oder Ihre internen Prozesse. Sie können ihnen aber gezielt Wissen bereitstellen – durch Dokumente, die dem Modell als Kontext mitgegeben werden. Die dafür eingesetzte Technologie heißt RAG (Retrieval-Augmented Generation). Die Idee: Statt sich auf das Trainingswissen des Modells zu verlassen, werden relevante Dokumente automatisch gesucht und dem Modell mitgegeben, bevor es antwortet.
Analogie: Ein Modell ohne Wissensquelle ist wie ein Mitarbeiter, der alles aus dem Gedächtnis beantworten muss. Ein Modell mit Wissensquelle ist wie ein Mitarbeiter, der vor der Antwort die passende Akte aus dem Archiv holt.

Wie funktioniert RAG?

1

Frage stellen

Sie stellen Ihre Frage im Chat – z.B. “Was ist unsere Urlaubsregelung für Teilzeitkräfte?”
2

Relevante Dokumente suchen

Das System durchsucht automatisch die angebundenen Dokumente und findet die relevantesten Passagen (z.B. aus dem HR-Handbuch).
3

Kontext an das Modell übergeben

Die gefundenen Textpassagen werden zusammen mit Ihrer Frage an das KI-Modell gesendet.
4

Fundierte Antwort generieren

Das Modell antwortet basierend auf den bereitgestellten Dokumenten – nicht aus dem Gedächtnis, sondern mit Quellenangabe.

Warum reduziert RAG Halluzinationen?

Ohne RAG muss das Modell auf sein Trainingswissen zurückgreifen – dabei kann es plausibel klingende aber falsche Informationen generieren (Halluzinationen). Mit RAG:
  • Das Modell antwortet auf Basis Ihrer verifizierten Dokumente, nicht aus dem Gedächtnis
  • Quellen können zitiert und überprüft werden
  • Fragen außerhalb der Wissensbasis können erkannt werden (“Dazu liegen mir keine Informationen vor”)
RAG reduziert Halluzinationen erheblich, eliminiert sie aber nicht vollständig. Das Modell kann Passagen falsch interpretieren oder irrelevante Dokumente heranziehen. Prüfen Sie kritische Antworten immer.

RAG in Localmind einrichten

In Localmind nutzen Sie die Hybrid Search, um Agenten mit Dokumenten zu verbinden:
1

Ordner mit Dokumenten anlegen

Erstellen Sie in Ihrem Space einen Ordner und laden Sie die relevanten Dokumente hoch (PDF, DOCX, TXT, etc.).
2

Agent öffnen oder erstellen

Navigieren Sie zu Space → Ressourcen → Agenten und öffnen oder erstellen Sie einen Agenten.
3

Hybrid Search aktivieren

Klicken Sie auf Edit Agent → Hybrid Search Tool und wählen Sie den Ordner mit Ihren Dokumenten aus.
4

Testen

Stellen Sie dem Agenten Fragen zu Ihren Dokumenten und prüfen Sie, ob die Antworten korrekt und mit Quellenangaben versehen sind.
Aktivieren Sie Zitate anzeigen in den Agent-Einstellungen, damit der Agent bei jeder Antwort die genutzten Quellen anzeigt. Das erleichtert die Überprüfung.

Wann RAG vs. Chat-Upload?

Chat-UploadRAG (Hybrid Search)
Geeignet fürEinzelne Dokumente, einmalige AnalyseWiederkehrende Fragen an eine Wissensbasis
Dokumente1–3 Dateien direkt im Chat hochladenBeliebig viele Dateien in einem Ordner
PersistenzNur für diese eine KonversationDauerhaft für alle Konversationen mit dem Agenten
EinrichtungKeine – einfach hochladenOrdner erstellen + Hybrid Search zuweisen
Typischer Einsatz”Fasse dieses PDF zusammen""HR-Bot für alle Mitarbeiter-Fragen”
Beide Ansätze können kombiniert werden: Ein Agent mit Hybrid Search kann zusätzlich Dokumente im Chat erhalten, z.B. für Ad-hoc-Analysen.

Best Practices für RAG

  • Dokumentqualität ist entscheidend: Gut strukturierte, aktuelle Dokumente liefern bessere Ergebnisse als unformatierte Textdateien
  • Ordnerstruktur planen: Thematisch gruppierte Ordner (z.B. “HR-Richtlinien”, “Produktdokumentation”) ermöglichen gezieltere Suche
  • System-Prompt ergänzen: Weisen Sie den Agenten im System-Prompt an, nur basierend auf den bereitgestellten Dokumenten zu antworten
  • Regelmäßig aktualisieren: Ersetzen Sie veraltete Dokumente, da das Modell sonst mit veralteten Informationen antwortet

Nächste Schritte