Hoe betrouwbaar zijn AI-chatbots voor gezondheidsvragen?

Een studie in BMJ Open (2025) toonde dat bijna de helft van de antwoorden van vijf grote chatbots problematisch was. Bovendien verzonnen alle vijf chatbots citaties en weigerde slechts 0,8% van de antwoorden een vraag te beantwoorden.

Waarom geven AI-chatbots soms foute medische adviezen?

Taalmodellen voorspellen het meest waarschijnlijke volgende woord op basis van patronen, ze begrijpen geen geneeskunde. Als ze iets niet weten, vullen ze de gaten in met iets wat plausibel klinkt maar niet per se klopt.

Is AI dan helemaal nutteloos in de gezondheidszorg?

Nee. AI is nuttig voor het samenvatten van documenten, het helpen formuleren van vragen voor een arts, of als ondersteuning van een professional die de uitkomst zelf controleert. Het gevaar zit in blind vertrouwen zonder verificatie.

Wat moet ik doen bij acute gezondheidsklachten in plaats van een chatbot raadplegen?

Bel direct een arts of hulpdienst. Bij pijn op de borst, plotselinge uitval of een kind met hoge koorts is elke seconde aan een chatbot een verloren seconde.

Digitale kwakzalverij: de onbetrouwbaarheid van AI-gezondheidsadvies

Terug naar Inzicht

Inzicht18 maart · 08:187 min leestijd

Digitale kwakzalverij: de onbetrouwbaarheid van AI-gezondheidsadvies

Een chatbot klinkt als een arts, en juist dat is het gevaar. Wat recent onderzoek laat zien over AI en gezondheidsvragen, waarom het misgaat, en hoe je deze tools verantwoord inzet.

Alisina Nawabi

Vraag een chatbot 's avonds laat naar die rare uitslag op je arm, en je krijgt binnen vijf seconden een keurig, zelfverzekerd antwoord terug. Netjes geformuleerd, met opsommingstekens, in perfect Nederlands. Het klinkt als een arts. En precies daar zit het probleem. Want hoe overtuigender het klinkt, hoe minder je geneigd bent te controleren of het ook klopt. Ik bouw zelf AI-producten voor klanten, dus ik ben de laatste die roept dat AI onzin is. Maar gezondheid is nu juist het domein waar blind vertrouwen het hardst terugkomt. Laten we nuchter kijken naar wat AI in de zorg wel en niet kan, waarom het misgaat, en hoe je deze tools verantwoord gebruikt.

De cijfers zijn minder geruststellend dan de toon

De toon van een chatbot suggereert autoriteit. De data zegt iets anders.

In februari 2026 publiceerden onderzoekers van de Universiteit van Oxford een gerandomiseerde studie in Nature Medicine met bijna 1.300 deelnemers. De opzet was slim: mensen kregen een medisch scenario en moesten bepalen welke aandoening erachter zat en wat ze moesten doen. De ene groep mocht een AI-chatbot gebruiken, de andere mocht alles behalve dat (Google, eigen oordeel, wat dan ook).

Het opvallende resultaat: de groep met AI deed het niet beter dan de controlegroep. En dat terwijl dezelfde taalmodellen, los van menselijke gebruikers getest, de aandoeningen in 94,9% van de gevallen correct herkenden. De kennis zit dus wel in het model. Ze vertaalt alleen niet naar bruikbaar advies zodra een echt mens er tegenaan praat. Mensen wisten vaak niet welke informatie ze moesten geven, en de antwoorden mengden goede en slechte adviezen door elkaar.

Dat mengen is een terugkerend patroon. Een audit gepubliceerd in BMJ Open (2025, geleid vanuit UCLA) legde vijf chatbots, waaronder ChatGPT, Gemini, Grok en Meta AI, vijftig gezondheidsvragen voor. Bijna de helft van de antwoorden was problematisch: zo'n 30% deels en bijna 20% sterk problematisch. De bronvermelding scoorde nog slechter, met een mediane volledigheid van 40%, en alle vijf de chatbots verzonnen citaties. Slechts 0,8% van de antwoorden bevatte een weigering om te antwoorden. Met andere woorden: ze gokken liever zelfverzekerd dan dat ze "dat weet ik niet" zeggen.

En het wordt scherper als de inzet hoger is. Een studie in JAMA Oncology (augustus 2023, vanuit Brigham and Women's Hospital) liet ChatGPT kankerbehandelingen voorstellen voor borst-, prostaat- en longkanker. In 34% van de antwoorden zat minstens één aanbeveling die niet klopte met de behandelrichtlijnen. In 12,5% van de gevallen verzon het model behandelingen die helemaal niet bestaan, inclusief "genezende" therapieën voor niet te genezen kanker. Tegelijk bevatte 98% van de antwoorden óók correct advies. Juist die mix maakt het gevaarlijk: foute adviezen verstopt tussen goede zijn voor een leek niet te herkennen.

Waarom een taalmodel hierin de mist in gaat

Dit zijn geen kinderziektes die met de volgende update verdwijnen. Ze komen voort uit hoe deze systemen werken.

Een taalmodel voorspelt woorden, het begrijpt geen geneeskunde. Het kiest het meest waarschijnlijke volgende woord op basis van patronen in zijn trainingsdata. Dat levert vloeiende, plausibele tekst op. Maar plausibel en correct zijn niet hetzelfde. De patiëntsafety-organisatie ECRI verwoordt het droog: deze tools zijn "geprogrammeerd om zelfverzekerd te klinken en altijd een antwoord te geven", ook als dat antwoord nergens op slaat.

Hallucinaties zijn ingebakken. Als het model iets niet weet, vult het de gaten op met iets dat eruitziet alsof het klopt. Bij het schrijven van een productbeschrijving is dat hooguit vervelend. Bij een medicijndosering of een interactie tussen twee middelen kan het gevaarlijk zijn.

Het mist jouw context. Een chatbot kent je medische voorgeschiedenis niet, ziet je niet, kan niet doorvragen op het ene detail dat alles verandert. De Oxford-studie liet precies daar de communicatie stuklopen: gebruikers wisten niet wat het model nodig had, en het model vroeg er niet naar.

De trainingsdata is een momentopname. Richtlijnen veranderen, nieuwe onderzoeken verschijnen, middelen worden teruggetrokken. Een model dat getraind is op gisteren weet niets van vandaag, tenzij het expliciet actuele bronnen mag raadplegen.

Het is geen reden om AI uit de zorg te bannen

Belangrijk: dit is geen pleidooi tegen AI in de gezondheidszorg. Onder de juiste voorwaarden is het waardevol. AI is sterk in het samenvatten van een berg documenten, het helpen formuleren van een vraag voor je huisarts, of het ondersteunen van een professional die de uitkomst zelf controleert. Het verschil zit hem niet in de technologie, maar in hoe je hem inzet.

ECRI plaatste het misbruik van AI-chatbots in januari 2026 bovenaan zijn jaarlijkse lijst van grootste risico's in de gezondheidstechnologie. Niet omdat de tools waardeloos zijn, maar omdat meer dan 40 miljoen mensen er dagelijks gezondheidsvragen aan stellen (volgens een analyse van OpenAI zelf), terwijl ze niet als medisch hulpmiddel zijn gecertificeerd of gevalideerd. Het advies van ECRI is nuchter en bruikbaar: ken de grenzen van de tool, en verifieer wat je leest altijd bij een betrouwbare bron.

Zo gebruik je AI voor gezondheidsvragen zonder jezelf in de vingers te snijden

Een paar concrete vuistregels:

Gebruik het om vragen te formuleren, niet om diagnoses te stellen. "Wat zou ik mijn huisarts hierover kunnen vragen?" is een prima prompt. "Wat heb ik?" niet.
Vraag altijd om bronnen, en klik erop. Verzonnen citaties zijn eerder regel dan uitzondering. Een bron die niet bestaat of niet zegt wat het model beweert, is een rode vlag.
Vertrouw zelfverzekerde toon niet als bewijs. Hoe gladder het antwoord, hoe kritischer je mag zijn. Overtuiging is geen accuratesse.
Houd een mens in de lus bij alles wat ertoe doet. Een arts, apotheker of specialist. De chatbot is een startpunt voor het gesprek, niet de vervanging ervan.
Bij acute klachten: bel, niet chat. Pijn op de borst, plotselinge uitval, een kind met hoge koorts. Dan is elke seconde aan een chatbot een verloren seconde.

Wat dit betekent voor iedereen die met AI bouwt

Ik trek deze les bewust breder dan de zorg, want hij geldt voor elke AI die je in je bedrijf loslaat. De fouten die chatbots in gezondheidsvragen maken (zelfverzekerd hallucineren, bronnen verzinnen, context missen) maken ze in elk domein. Bij een offerte, een juridische tekst of een financieel advies zijn de gevolgen alleen minder zichtbaar, tot het misgaat.

Daarom bouw ik AI-oplossingen met een paar harde principes. Een mens in de lus bij alles wat onomkeerbaar of risicovol is. Verplichte bronvermelding, zodat een antwoord controleerbaar is en niet zomaar geloofd hoeft te worden. En een afgebakende taak met echte data eronder, in plaats van een algemeen model dat over alles een mening heeft. Een AI die op jouw eigen, gecontroleerde bronnen werkt en netjes laat zien waar een antwoord vandaan komt, is iets heel anders dan een chatbot die uit het niets put. Dat is het verschil tussen verantwoord gereedschap en digitale kwakzalverij.

AI inzetten waar hij sterk is, en een mens neerzetten waar de inzet te hoog is om te gokken: dat is geen voorzichtigheid, dat is strategie.

Veelgestelde vragen

Geschreven doorAlisina Nawabi

AI Product Engineer & Solutions Architect

AI inzetten zonder de risico's

Ik denk mee over hoe je AI verantwoord integreert in je organisatie: van keuze en ontwerp tot een werkend systeem met de juiste checks eromheen.

Meer informatie

Dit artikel is geproduceerd samen met het Agent Team. Meer over de redactie.

AI in de zorg Hallucinaties AI-betrouwbaarheid Verantwoorde AI Mens-in-de-lus Chatbots AI-risico's

Verder met dit onderwerp

Werkende voorbeelden en wat ik hierin voor je kan bouwen.

Voorbeeld

Antwoorden met bronnen die je kunt naklikken

Chatbots klinken zelfverzekerd, ook als ze citaties verzinnen, zo blijkt uit dit artikel. Dit voorbeeld laat zien hoe het anders kan: een orkestrator verdeelt het werk over gespecialiseerde agents, voert echte tools uit en onderbouwt elk antwoord met bronnen die je zelf kunt naklikken. Je ziet live waar een antwoord vandaan komt, in plaats van dat je op goed vertrouwen moet aannemen dat het klopt.

Bekijk de case

Dienst

Antwoorden die steunen op jouw eigen documenten

Het artikel laat zien hoe makkelijk een taalmodel plausibele onzin verkoopt als feit. Ik bouw kennissystemen die antwoorden baseren op jouw eigen documenten en bronnen, met een duidelijke verwijzing naar waar elk stukje informatie vandaan komt. Zo krijg je AI die nuttig is zonder de verzonnen citaties uit dit verhaal.

Bekijk de dienst

Genoemde integraties

Dit artikel noemt deze tools. Ik koppel ze op maat aan je eigen systemen.

Gemini

Verken verder

In dit artikel

Hoofdonderwerpen

FLOH

Ook belangrijk

ChatGPTUniversiteit van OxfordOxford-studie

Kort genoemd

OpenAIGoogleGoogle GeminiGrokMeta AI ModeECRIUCLABMJ Open

Thema's

AI-strategie in de schijnwerpers: machtsstrijd en open alternatieven herdefiniëren de markt Concentratie en koerswijzigingen in AI: wat dit betekent voor Nederlandse ondernemers AI-aansprakelijkheid en concurrentie: Google als testcase AI-gedreven zichtbaarheid en aansprakelijkheid: ondernemers in een nieuw speelveld AI-zichtbaarheid en juridische valkuilen: navigeren in het nieuwe zoeklandschap

Concepten

AI-hallucinatiesAI-gezondheidsadviesVerantwoord AI-gebruikDigitale kwakzalverijRisicomanagement in gezondheidstechnologieVertrouwen in AIMedische contextPatiëntveiligheid

Gerelateerde artikelen

AI-agent wint in scamstudie meer vertrouwen dan getrainde oplichter

Nieuws

5 min

1 aug 16:14

AI-agent wint in scamstudie meer vertrouwen dan getrainde oplichter

Een AI-agent haalde bij 46 procent van de deelnemers een app-installatie binnen, tegen 18 procent bij een getrainde oplichter. De filters van Meta, OpenAI en Google zagen nul van de 250 scamgesprekken.

Meta metselt zich in, en de open fakkel verhuist

Signaal

7 min

17 jul 16:01

Meta metselt zich in, en de open fakkel verhuist

Meta ruilde zijn open Llama in voor een gesloten Muse Spark en metselt er een eigen chip, cloud en app-laag omheen. Los is het bedrijfsnieuws, samen een beweging. En de open fakkel? Die verhuist gewoon.

Google's Gemini Spark landt op de Mac en mag nu aan je lokale bestanden

Nieuws

6 min

2 jul 18:09

Google's Gemini Spark landt op de Mac en mag nu aan je lokale bestanden

Google brengt zijn autonome AI-agent Gemini Spark naar macOS, waar hij voor het eerst lokale bestanden mag lezen en ordenen. Met MCP-ondersteuning, real-time tracking en een prijskaartje van 99 dollar per maand.

Gids

9 min

2 jul 09:00

AI-crawlers toelaten of blokkeren: een keuzegids voor je robots.txt en Cloudflare-instellingen

Geef je GPTBot, ClaudeBot en soortgenoten toegang of hou je ze buiten? Een stappenplan om per crawler te beslissen, het correct in te stellen en de impact te meten.

Cloudflare blokkeert AI-crawlers standaard op advertentiepagina's vanaf 15 september

Nieuws

5 min

1 jul 21:23

Cloudflare blokkeert AI-crawlers standaard op advertentiepagina's vanaf 15 september

Cloudflare zet vanaf 15 september 2026 de standaard om: AI-crawlers die trainen of vragen beantwoorden worden geblokkeerd op advertentiepagina's, zoek-crawlers niet. Voor Nederlandse webshops en uitgevers wordt de standaardinstelling een strategische keuze.

AI-toolbeleid opstellen voor je bedrijf: van goedgekeurde lijst tot AVG-conforme gebruiksregels

Gids

9 min

26 jun 21:02

AI-toolbeleid opstellen voor je bedrijf: van goedgekeurde lijst tot AVG-conforme gebruiksregels

Je mensen gebruiken al AI, met of zonder toestemming. Zo stel je een werkbaar AI-toolbeleid op: breng het gebruik in kaart, kies goedgekeurde tools, leg vast welke data erin mag en rol het uit zonder weerstand.

Bekijk alle artikelen