De meeste AI-projecten mislukken niet door het model, maar door rommelige, verspreide data eronder. Wat data op orde concreet betekent voor het MKB, en een nuchtere eerste stap.
"Welk AI-model gebruiken we?" Het is vaak de eerste vraag die ik krijg, en bijna altijd de verkeerde. Want de meeste AI-projecten die mislukken, stranden niet op het model. Ze stranden op de data. Op data die verspreid staat over zeven systemen, in net iets andere formaten, half ingevuld, met klantnamen die in het ene systeem "Jan de Vries" heten en in het andere "J. devries". Daar gaat het mis, lang voordat er ook maar één AI-model aan te pas komt. Mijn stelling: data op orde krijgen is het saaie, onzichtbare werk dat het verschil maakt tussen een AI-project dat iets oplevert en eentje dat na drie maanden stilletjes wordt afgeschoten. En het goede nieuws is dat je daar vandaag al aan kunt beginnen.
Het model is het makkelijke deel
Er bestaat een hardnekkig misverstand dat AI moeilijk is omdat de modellen moeilijk zijn. Dat klopte misschien tien jaar geleden, nu niet meer. De modellen van vandaag zijn verbluffend goed, betaalbaar en met een paar regels code aan te roepen. Het slimste deel van de hele keten is inmiddels het deel waar je het minst over hoeft na te denken.
Het echte werk zit ervoor. Een AI-model is namelijk niets meer dan een hele snelle, hele gretige stagiair. Geef hem rommelige of onvolledige informatie, en hij produceert met volle overtuiging rommelige, onvolledige antwoorden. "Garbage in, garbage out" is geen cliché, het is gewoon hoe het werkt. En de meeste MKB-bedrijven hebben, zonder dat het iemands schuld is, behoorlijk wat garbage in.
Dat is geen verwijt, het is volkomen logisch. Je bedrijf is gegroeid, er kwam een boekhoudpakket bij, toen een CRM, toen een webshop, ondertussen een paar slimme spreadsheets en een gedeelde map met offertes. Elk systeem op zich werkt prima. Maar samen vormen ze geen geheel, ze vormen een archipel van eilandjes die elkaars taal niet spreken. En dat is precies het probleem dat AI niet voor je oplost. Dat moet je eerst zelf oplossen.
Wat "data op orde" concreet betekent
"Data op orde" klinkt als een consultantsterm, dus laat ik concreet maken wat ik ermee bedoel. Voor een MKB-bedrijf komt het neer op vier dingen.
Eén: je data is vindbaar. Je weet waar wat staat. Klantgegevens hier, facturen daar, voorraad ergens anders, maar je weet het. Geen verborgen Excel-bestanden op de laptop van iemand die met vakantie is. Geen kennis die alleen in iemands hoofd zit.
Twee: je data is consistent. Eén klant is één klant, niet drie verschillende records omdat de naam steeds anders is gespeld. Een datum is overal een datum in hetzelfde formaat. Een bedrag is een getal, niet soms "1.250" en soms "1250 euro" en soms "ongeveer 1,3k". Consistentie is saai om aan te brengen en goud waard zodra het er is.
Drie: je data is toegankelijk. Niet alleen voor mensen die toevallig de juiste software-licentie hebben, maar ook voor systemen. Kan een ander programma er netjes bij, via een koppeling of een export, zonder dat iemand handmatig moet kopiëren en plakken? Data die opgesloten zit in een systeem dat niets naar buiten laat, is half zo veel waard.
Vier: je data is actueel. Informatie die een half jaar oud is, leidt tot beslissingen van een half jaar geleden. Een AI die op verouderde data draait, geeft je vol vertrouwen antwoorden over een werkelijkheid die niet meer bestaat.
Merk op dat geen van deze vier punten over AI gaat. Het gaat over orde, over fundament. Maar zonder deze vier is elk AI-project een huis op drijfzand.
Waarom dit zo vaak misgaat
De reden dat data zelden op orde is, is niet incompetentie. Het is dat orde aanbrengen geen leuk werk is en zelden urgent voelt. Het levert deze week niets op, er is geen klant die erom vraagt, het staat op geen enkele to-do-lijst bovenaan. Dus het blijft liggen, jaar na jaar, terwijl de rommel zich opstapelt als ongeopende post.
En dan komt AI in beeld. Iedereen is enthousiast, er is budget, er is een mooie demo gezien op een congres. Het project start, en pas dán ontdekt iedereen dat de helft van de tijd opgaat aan het bij elkaar harken en schoonmaken van data. Het project loopt uit, het enthousiasme zakt, en uiteindelijk wordt geconcludeerd dat "AI nog niet zover is". Terwijl AI prima zover was. De data was het niet.
Ik zeg dit niet om somber te doen, maar om je een dure les te besparen. Als je dit van tevoren weet, kun je de volgorde omdraaien: eerst orde, dan AI. Saai eerst, slim daarna.
De nuchtere eerste stap
Goed, genoeg over wat er misgaat. Wat doe je eraan? Niet wat je verwacht. Je hoeft niet je hele IT-landschap om te gooien, geen groot migratieproject te starten en zeker geen AI in te kopen. De eerste stap is veel kleiner en saaier dan dat.
Maak een inventaris. Pak een uur, pak een vel papier of een leeg document, en schrijf op: waar staat welke data? Welke systemen gebruik je, wat zit erin, en, dit is de cruciale vraag, kunnen die systemen bij elkaar? Welke gegevens type je nu nog met de hand over van het ene scherm naar het andere? Dat overtypen is namelijk de rode vlag die je naar de grootste problemen wijst. Waar mensen handmatig data verplaatsen, zit gegarandeerd inconsistentie, vertraging en ergernis.
Die inventaris is verrassend krachtig. Hij maakt het abstracte probleem ("onze data is een rommeltje") opeens concreet en oplosbaar.
De tweede stap volgt daar logisch uit: kies één plek waar je betrouwbare data samenkomt. Voor sommige bedrijven is dat verrassend simpel. Een goed opgezette Google Sheets kan voor een klein bedrijf prima dienstdoen als centraal, gedeeld overzicht, mits je hem netjes en consistent inricht. Groei je daar overheen of wordt het serieuzer, dan is een echte database de logische volgende stap. Ik bouw die vaak op Supabase, een open, self-hosted fundament waar je eigenaar van blijft en dat moeiteloos meegroeit. Welke kant het opgaat, het principe is hetzelfde: één bron van waarheid, in plaats van zeven half-waarheden.
En dan pas AI
Als je data vindbaar, consistent, toegankelijk en actueel is, gebeurt er iets moois: AI wordt opeens makkelijk. Niet omdat het model beter is geworden, maar omdat het eindelijk fatsoenlijk eten krijgt. Een assistent die klantvragen beantwoordt, een systeem dat offertes voorbereidt, een rapportage die zichzelf schrijft: het wordt allemaal haalbaar zodra het fundament klopt.
Dit is precies de volgorde die ik aanhoud in mijn werk. Ik begin niet bij het meest spannende maar bij het meest saaie, want daar zit de winst. Eerst de data ontsluiten en op één plek krijgen, de koppelingen leggen tussen je systemen zodat ze elkaars taal gaan spreken, en pas daarna de slimme laag erbovenop. Met slim werken, loont hard werken, en het saaie voorwerk is wat dat slimme werk later mogelijk maakt.
De verleiding is groot om die eerste stappen over te slaan en meteen naar het spannende deel te springen. Doe het niet. Een AI-product bovenop chaos is niet slim, het is dure chaos.
Tot slot
De saaie waarheid is dus dit: AI-projecten mislukken zelden door het model en bijna altijd door de data eronder. Vindbaar, consistent, toegankelijk, actueel. Dat is geen sexy lijstje, maar het is het verschil tussen een investering die rendeert en een experiment dat doodbloedt.
Begin klein. Maak die inventaris, kijk waar je overtypt, kies één bron van waarheid. Dat alleen al levert vaak meer rust op dan welke AI-tool dan ook. En als het fundament er ligt, dan praten we over het leuke deel.
