Die RAG-Architektur ermöglicht nicht nur Systeme wie Chatbots, sondern auch die Umsetzung von zuvor schwierigen oder unmöglichen Features auf der Grundlage von internen, unstrukturierten Daten.
In diesem Primer führen Robert Glaser, Alexander Kniesz, Hermann Schmidt und Marco Steinke systematisch in die Konzepte und Architektur von RAG ein. Die Autoren behandeln sowohl theoretische Grundlagen als auch praktische Implementierungsaspekte wie Chunking, Embedding und Vektordatenbanken. Außerdem teilen wir unsere Praxiserfahrung aus echten Projekten. Für Softwarearchitekt:innen und -entwickler:innen, die einen kompakten, aber fundierten Einstieg ins Thema suchen und den Einsatz von RAG in der eigenen Organisation bewerten wollen.
Viele Fachartikel zu RAG behandeln die Vektorsuche. Doch eine gute RAG-Architektur erfordert mehr als interne Unternehmensdaten in eine Vektordatenbank zu überführen und einem LLM die Suchergebnisse zuzuführen. In diesem Primer geben wir einen Überblick und teilen unsere Erfahrungen aus Kundenprojekten.
Hermann SchmidtCo-Autor, Senior Consultant bei INNOQ