RAG — afbeelding

RAG

Retrieval-Augmented Generation (RAG) is een AI-framework dat twee technieken combineert: het ophalen van relevante informatie uit externe of interne kennisbronnen en het genereren van tekst door een groot taalmodel (LLM). Het uitgangspunt is dat een taalmodel niet alleen afgaat op de kennis die tijdens training is opgeslagen, maar actief aanvullende informatie opvraagt voordat het een antwoord formuleert. Bij RAG wordt eerst een zoekopdracht uitgevoerd in een kennisbasis, waarna de gevonden documenten of passages als context aan het taalmodel worden meegegeven. Zo kan het model nauwkeurigere en actuele antwoorden geven, ook over onderwerpen die buiten de trainingsdata vallen. RAG wordt ingezet door bedrijven die generatieve AI willen verbinden met interne gegevens, zoals bedrijfsdocumenten of klanteninformatie, zonder het model opnieuw te hoeven trainen.

Begrip of vakterm

Geraadpleegde bronnen

Favicon van website GartnerGartner
Favicon van website CIOCIO