Twee mensen die samen documenten doornemen aan een tafel
Gids19 juni · 23:059 min leestijd

Hoe je AI-output verifieert vóór je hem verstuurt of publiceert

Een verzonnen bron of een net-niet-kloppend cijfer ziet er even overtuigend uit als de waarheid. Dit is een praktisch vijf-staps protocol om AI-output te controleren voordat hij de deur uit gaat.

Een AI-model levert zijn antwoord met precies dezelfde zelfverzekerde toon, of het nu klopt of niet. Dat is het venijnige aan de fout: een verzonnen bronvermelding, een net-niet-kloppend bedrag of een niet-bestaand wetsartikel leest even overtuigend als de waarheid. Zolang die output binnen je eigen muren blijft, is dat hooguit vervelend. Op het moment dat je hem verstuurt naar een klant of publiceert onder je eigen naam, wordt het jouw verantwoordelijkheid en jouw risico.

Dat risico is geen theorie meer. KPMG moest een onderzoeksrapport intrekken nadat er verzonnen bronnen in werden gevonden, het soort fout dat inmiddels 'vibe citing' heet. Het patroon erachter is dat hallucinaties geen incidentele bug zijn maar een structureel bedrijfsrisico: zolang een taalmodel woorden voorspelt in plaats van feiten opzoekt, hoort het verzinnen er gewoon bij.

Deze handleiding is voor iedereen die teksten, rapporten, offertes of klantantwoorden met AI maakt en ze daarna de deur uit doet: marketeers, juristen, finance, klantenservice, en de ondernemer die zelf even snel iets laat opstellen. Het idee is simpel: je vertrouwt de output niet, je verifieert hem, en je richt dat zo in dat het een vaste stap wordt in plaats van een toevallige controle. Ik loop het protocol stap voor stap door, met de valkuilen en een eerlijke afweging tussen een kant-en-klare oplossing en maatwerk.

Wat je nodig hebt

Je hoeft hier geen heel apparaat voor op te tuigen, maar een paar bouwstenen moeten op orde zijn voordat het protocol werkt:

  • Je bronnen op een rij. De documenten, prijslijsten, contracten of databases waarop het antwoord gebaseerd hoort te zijn, in een vorm die je aan het model kunt voeren (een AI-chatbot op je eigen data via RAG is hiervoor de gangbare aanpak).
  • Een model of API met bronvermelding. Niet alleen een chatvenster, maar een functie die claims aan brondocumenten koppelt (zie stap 1).
  • Een schema-validator. Een stukje code (Pydantic in Python, Zod in TypeScript, of kale JSON Schema) dat de output op vorm en waarden controleert.
  • Een review-plek. Een wachtrij, een gedeeld document of een tab in je tool waar een mens de output naast de bronnen ziet voordat hij akkoord geeft.
  • Een logboek en versiebeheer. Ergens om vast te leggen wat erin ging, wat eruit kwam en wie akkoord gaf, plus een manier om gepubliceerde tekst terug te draaien (een CMS met versies, of git).

Het vijf-staps verificatieprotocol

Het doel: elke AI-output die je extern gebruikt, doorloopt vijf vaste controles, van bronverificatie tot een rollback-plan, zodat een fout wordt gevangen voordat hij bij een klant landt in plaats van erna. De stappen bouwen op elkaar voort; sla er geen over voor publicaties met juridische of financiële lading.

Doorloop deze vijf stappen in volgorde:

Stap 1 - Claim-check met bronverwijzing

Laat het model niet zichzelf controleren uit zijn losse pols. Vraag je een tweede AI om de tekst te 'fact-checken' zonder bronnen, dan krijg je simpelweg een tweede zelfverzekerde gok. De enige betrouwbare claim-check koppelt elke bewering aan een echte bron die jij hebt aangeleverd.

Geef het model dus de brondocumenten mee en dwing het te citeren. De Citations-functie van Anthropic koppelt elke bewering in het antwoord aan de exacte zin of pagina in je brondocument, en garandeert dat die verwijzing daadwerkelijk naar de aangeleverde tekst wijst, niet naar iets verzonnens. Werk je met OpenAI of Gemini, dan doen grounding-met-zoeken en vergelijkbare bron-features hetzelfde principe: geen claim zonder vindplaats. Alles wat het model beweert zonder bron, behandel je als onbevestigd en markeer je voor stap 3.

Denk niet dat dit overbodig is zodra je een bron meegeeft. Uit de hallucinatie-ranglijst van Vectara blijkt dat zelfs de best scorende modellen nog enkele procenten van de feiten verkeerd weergeven wanneer ze niets anders doen dan een aangeleverd document samenvatten.

Hallucinatiepercentage bij het samenvatten van een aangeleverd document (bron: Vectara)

Stap 2 - Structured output validatie

Een gegeven dat een machine verder verwerkt, hoort nooit als losse zin uit een model te komen. Voor een bedrag, een datum, een IBAN, een productcode of een blok JSON dat je doorgeeft aan een ander systeem, gebruik je structured outputs. Met strikte structured outputs van OpenAI (strict: true) dwing je het model in een vast JSON-schema, zodat de uitvoer altijd de juiste velden en types heeft en je niet hoeft te hopen dat het netjes parseert.

Maar let op: een geldig schema garandeert de vorm, niet de waarheid. Daarom volgt na het schema je eigen validatie. Controleer met je validator de inhoudelijke regels die het model niet kent: valt het bedrag binnen een logische bandbreedte, telt het factuurtotaal op uit de regels, ligt de leverdatum in de toekomst, bestaat het ordernummer echt in je database? Het schema bewaakt de vorm, jouw validatie bewaakt de betekenis. Wat door beide komt, mag door naar de mens.

Stap 3 - Het menselijke review-moment

Voor alles met gewicht zet een mens de laatste handtekening. Dat hoeft geen rem te zijn als je het slim inricht: toon de output naast de geciteerde bronnen uit stap 1, en markeer elke bewering zonder bron in een opvallende kleur. De reviewer leest dan niet de hele tekst opnieuw, maar controleert gericht de onbevestigde punten.

Werk met een drempel op basis van risico. Een interne samenvatting mag automatisch door; een offerte, een juridisch advies of een publieke publicatie krijgt altijd een mens. Dat de prijs van overslaan reëel is, lieten zowel de Duitse rechter die Google aansprakelijk stelde voor onjuiste AI-overzichten als Tesla, dat de RDW misleidende cijfers over zijn rijhulp gaf zien: een onjuiste, naar buiten gebrachte claim wordt jouw probleem, ongeacht of een model of een leverancier hem produceerde.

Stap 4 - Audit-trail voor de AI Act

Leg van elke uitgaande output vast hoe hij tot stand kwam. Een bruikbaar logboek bevat per item: de prompt, het model en de versie, de gebruikte bronnen, de ruwe output, wie akkoord gaf en wanneer, en het besluit. Dat is niet alleen netjes, het wordt voor een groeiende groep systemen verplicht: artikel 12 van de AI Act eist dat hoog-risico AI-systemen gebeurtenissen automatisch loggen gedurende hun hele levensduur, zodat de werking achteraf te herleiden is.

Ook als jouw toepassing niet onder 'hoog risico' valt, is dit logboek je bewijslast op het moment dat iemand een claim betwist: je laat zien op welke bron een uitspraak rustte en wie hem goedkeurde. Wil je weten of jouw systemen onder de verplichtingen vallen, loop dan de AI Act-nalevingschecklist voor het MKB langs. Bewaar de logs met een vaste bewaartermijn en zonder onnodige persoonsgegevens, anders ruil je het ene risico in voor een AVG-risico.

Stap 5 - Rollback bij een gepubliceerde fout

Bedenk de terugdraai-procedure voordat je hem nodig hebt. Er glipt er ooit eentje door, en dan telt hoe snel en compleet je hem rechtzet. Zorg voor drie dingen: versiebeheer op je content (een CMS met versies of git), zodat je de vorige versie terugzet; een manier om te traceren waar een claim allemaal terechtkwam (welke mailing, welke pagina, welk document); en een vast correctie-format zodat de rechtzetting niet zelf weer een improvisatie is.

Sluit de lus door de oorzaak aan te pakken: pas de bron, de prompt of het schema aan zodat dezelfde fout niet terugkomt. KPMG moest een heel rapport intrekken; met een rollback-plan was dat een procedure geweest in plaats van een crisis.

Valkuilen

  • AI die AI controleert zonder bron. Een tweede model dat 'meekijkt' zonder toegang tot de echte bronnen levert geen controle op, maar een tweede mening die net zo goed verzonnen kan zijn. Controle bestaat alleen tegen een bron, niet tegen een ander model.
  • Citaties en strikt schema in één call. Bij Anthropic kun je de Citations-functie en structured outputs niet combineren in dezelfde aanroep; dat geeft een 400-fout, omdat citaten tussen de tekst worden geweven en een strikt JSON-schema dat juist uitsluit. Splits het daarom in twee passes: eerst de inhoudelijke claim-check met bronnen, dan een aparte call die het resultaat in je schema giet.
  • Geldig schema verward met juiste inhoud. Een perfect geformatteerd bedrag dat gewoon fout is, komt moeiteloos door de schema-check. De vorm zegt niets over de waarheid; daarvoor heb je stap 2's inhoudelijke validatie en stap 3's mens nodig.
  • Review-moeheid. Als alles even zwaar gereviewd moet worden, gaan mensen blind aftekenen. Differentieer naar risico, zodat de aandacht naar de stukken gaat die ertoe doen.
  • Logs zonder beleid. Een audit-trail vol persoonsgegevens zonder bewaartermijn is zelf een datalek-in-wording. Log wat je nodig hebt voor herleidbaarheid, niet meer.

Kant-en-klaar vs. maatwerk

Moet je hiervoor zelf bouwen, of kan een bestaand pakket het? Dat hangt af van wat er op het spel staat als een fout doorglipt.

AanpakWat je krijgtGeschikt voorLet op
Kant-en-klaar (ChatGPT Enterprise, Microsoft 365 Copilot, Gemini Enterprise)Ingebouwde guardrails, bronvermelding in de chat, een beheerconsole met loggingTeams die vooral concepten en interne stukken makenJe verificatie leunt op de leverancier; je hebt weinig grip op het schema, de validatieregels en de bewaartermijn van logs
Maatwerk (eigen pijplijn met API's, schema-validatie, self-hosted logs)Volledige controle over claim-check, schema, review-stap en audit-trailExterne publicaties, juridische of financiële output, hoog-risico onder de AI ActBouw- en onderhoudswerk; je richt de vijf stappen zelf in en moet ze testen

Voor het gros van de interne tekst is een kant-en-klaar pakket met een vaste reviewstap ruim voldoende, en zonde om voor te gaan bouwen. Zodra de output je organisatie verlaat met juridische, financiële of merkrisico's eraan, win je met een eigen pijplijn precies de controle die je bij een leverancier mist: jouw bronnen, jouw schema, jouw bewaarbeleid. De meeste organisaties belanden op een mix: kant-en-klaar voor het dagelijkse werk, maatwerk-verificatie om de stukken die de deur uit gaan.

Tot slot

De vraag is niet langer of je AI mag inzetten voor je teksten, maar of je de uitkomst kunt verdedigen op het moment dat iemand ernaar vraagt. Een model dat overtuigend klinkt, geeft je geen enkele garantie; een protocol dat elke bewering aan een bron koppelt, in vorm en waarde controleert, langs een mens leidt, vastlegt en kan terugdraaien, geeft die garantie wel. Verificatie is geen rem op AI. Het is precies wat AI bruikbaar maakt voor het werk dat ertoe doet.

Veelgestelde vragen

Alisina Nawabi
Geschreven doorAlisina Nawabi

AI Product Engineer & Solutions Architect

Verificatie ingebouwd, niet erbij

Ik denk met je mee over waar AI in je workflow fout kan gaan, ontwerp het verificatieprotocol en bouw de claim-check, schema-validatie en audit-trail end-to-end in je eigen pijplijn. Zo wordt controle een vaste stap in plaats van een naverwerking.

Meer informatie

Genoemde integraties

Dit artikel noemt deze tools. Ik koppel ze op maat aan je eigen systemen.

Gerelateerde artikelen

SpaceX gaat public met xAI erbij: de grootste beursgang ooit en wat het betekent voor de AI-markt
Nieuws
4 min

13 jun 05:12

SpaceX gaat public met xAI erbij: de grootste beursgang ooit en wat het betekent voor de AI-markt

SpaceX begon vrijdag te handelen op Nasdaq onder tickersymbool SPCX, met een beursgang van 75 miljard dollar en een startwaardering van 1,75 biljoen dollar. Inbegrepen in het bedrijf: AI-startup xAI met de Grok-chatbot.

OpenAI brengt Codex naar ChatGPT: AI die zelf code schrijft, nuchter bekeken
Nieuws
6 min

2 jun 16:09

OpenAI brengt Codex naar ChatGPT: AI die zelf code schrijft, nuchter bekeken

OpenAI kondigde op 2 juni 2026 aan dat Codex, zijn AI die zelf code schrijft, naar de ChatGPT-app komt met zes rol-plugins. Wat betekent 'AI die bouwt' echt voor het MKB?

OpenAI kaapt Noam Shazeer weg bij Google: de mede-uitvinder van de transformer stapt over
Nieuws
4 min

18 jun 08:13

OpenAI kaapt Noam Shazeer weg bij Google: de mede-uitvinder van de transformer stapt over

Noam Shazeer, mede-uitvinder van de transformer-architectuur en co-lead van Google Gemini, ruilt Google in voor OpenAI. De overstap legt bloot hoe de macht over AI zich concentreert bij een handvol labs, en waarom dat jouw keuzes raakt.

AI-kosten lopen op: bedrijven wijken uit naar open source en Chinese modellen
Nieuws
5 min

13 jun 18:18

AI-kosten lopen op: bedrijven wijken uit naar open source en Chinese modellen

AI-abonnementen worden snel duurder terwijl de prijs per token nauwelijks meedaalt. Steeds meer bedrijven schuiven routinetaken naar goedkopere open-weight of Chinese modellen om hun budget te rekken.

42 staten onderzoeken OpenAI: wat het zegt over leunen op ChatGPT
Nieuws
5 min

13 jun 16:05

42 staten onderzoeken OpenAI: wat het zegt over leunen op ChatGPT

Een coalitie van 42 Amerikaanse procureurs-generaal dagvaardde OpenAI over data, veiligheid en kwetsbare gebruikers. Geen aanklacht, wel een signaal over hoe afhankelijk je bedrijf wil zijn van een leverancier.

AI en de AVG: het risico zit niet in het model, maar in je data
Artikel
7 min

19 jun 19:05

AI en de AVG: het risico zit niet in het model, maar in je data

Bedrijven die AI weghouden van klantdata uit angst voor de AVG lossen het verkeerde probleem op. Het risico zit niet in de AI, maar in slordige dataomgang die AI alleen uitvergroot.