Retrieval-Augmented Generation
Retrieval-Augmented Generation (kurz RAG) bezeichnet einen KI-Ansatz, bei dem die reine Textgenerierung eines Sprachmodells mit einer gezielten Informationsbeschaffung verbunden wird.
Hierbei erweitert RAG die Wissensbasis eines Sprachmodells, da es vor der eigentlichen Antwort relevante Inhalte aus einer Datenbank oder einem externen Wissensspeicher holt. Diese werden dann in die Antwort eingeflochten, so dass die Ergebnisse nicht nur aktueller, sondern auch genauer und faktenbasierter sind.
Der Prozess gestaltet sich so, dass in einem ersten Schritt passende Dokumente oder Textabschnitte gesucht werden (engl. retrieval), im zweiten Schritt wird mit Hilfe des Sprachmodells eine Antwort generiert, die diese Informationen berücksichtigt (engl. generation).
Auf diese Weise können beispielsweise auch firmeninterne Dokumente, Bedienungsanleitungen oder Echtzeitdaten in die Antworten eines Chatbots gelangen.