Claude Opus 4.8 is uit: eerlijker, zelfstandiger, en wat jij ermee kunt

Claude Opus 4.8 is uit: eerlijker, zelfstandiger, en wat jij ermee kunt

NieuwsAlisina NawabiAlisina Nawabi28 mei · 17:455 min leestijd

Anthropic bracht op 28 mei 2026 Claude Opus 4.8 uit. De cijfers zijn bescheiden, maar het model werkt langer zelfstandig door en is eerlijker over wat het niet weet. Wat betekent dat voor het MKB?

Op 28 mei 2026 bracht Anthropic Claude Opus 4.8 uit, de nieuwe topversie van zijn AI-modellen. Op het eerste gezicht een routineklus: een nummer hoger, weer wat betere scores. Maar de echte verschuiving zit niet in de benchmarks. Hij zit in wat het model nu zelfstandig durft te doen, en in hoe eerlijk het is over wat het niet weet. Voor jou als ondernemer is dat interessanter dan welke ranglijst dan ook.

Wat is er aangekondigd

Anthropic noemt Claude Opus 4.8 zelf een 'bescheiden maar voelbare' verbetering ten opzichte van de vorige versie, Opus 4.7 van zes weken eerder. Bescheiden in de cijfers, voelbaar in de praktijk. Drie dingen springen eruit.

Ten eerste de eerlijkheid. Volgens Anthropic laat dit model ongeveer vier keer minder vaak een fout in zijn eigen code passeren zonder die te benoemen. Het geeft vaker aan waar het onzeker over is, en doet minder ongefundeerde beweringen. Testers omschrijven het als een model dat scherper oordeelt, eerder tegengas geeft als een plan niet klopt, en zijn eigen werk durft te corrigeren in plaats van te doen alsof alles in orde is.

Ten tweede de nieuwe functie 'dynamic workflows'. Daarmee kan het model een grote opdracht zelf opknippen en honderden deeltaken parallel laten uitvoeren binnen een sessie. Het voorbeeld dat Anthropic geeft: een verbouwing van een codebase van honderden duizenden regels, van start tot oplevering. Dat is een ander type werk dan een vraag beantwoorden. Het is een opdracht uitvoeren.

Ten derde de prijs en snelheid. De prijs per token blijft gelijk aan die van de vorige versie (5 dollar per miljoen tokens invoer, 25 dollar per miljoen uitvoer). De 'fast mode' draait op 2,5 keer de snelheid en is nu drie keer goedkoper dan bij eerdere modellen. In de benchmarks scoort Opus 4.8 op SWE-Bench Pro, een test voor echte programmeerproblemen, 69,2% tegenover 64,3% voor de vorige versie en 58,6% voor GPT-5.5 van OpenAI. Mooi om te weten, maar voor de meeste bedrijven zijn een paar procentpunten op een testset niet de reden om iets te veranderen.

Waarom de richting belangrijker is dan het cijfer

De interessante trend zit niet in 'het model is slimmer'. Hij zit in 'het model werkt langer zelfstandig door en is eerlijker over wat het niet weet'. Dat zijn precies de twee eigenschappen die bepalen of je AI veilig in een bedrijfsproces kunt zetten.

Een model dat bij twijfel gewoon iets verzint, kun je niet loslaten op je facturen, je voorraad of je klantmails. Je moet dan alles dubbelchecken, en netto ben je niets opgeschoten. Een model dat zegt 'dit klopt niet, kijk hier even naar' is een collega waar je iets aan hebt. Die verschuiving, van een gladde prater naar een eerlijke meedenker, is voor het echte werk belangrijker dan de zoveelste recordscore.

Wat betekent dit voor jouw bedrijf

Even nuchter, want hier wordt vaak overheen gehypet. Een sterker model maakt je bedrijf niet vanzelf efficienter. Het rauwe model is een motor, geen auto. Je hebt er nog steeds een koppeling omheen nodig die het verbindt met jouw systemen, jouw data en jouw manier van werken. Daar zit het echte werk, en daar zit ook de winst. Drie punten om mee te nemen.

Taken die eerst te riskant waren, komen binnen bereik. Door die betere eerlijkheid is het verantwoorder om een model dingen te laten doen waar een foutje geld of vertrouwen kost: offertes voorbereiden, klantgegevens opschonen, inkomende mails classificeren. Niet omdat het nooit meer fout gaat, maar omdat het eerder zelf aan de bel trekt.

De prijs blijft gelijk, dus de rekensom verandert. Je krijgt meer kwaliteit voor hetzelfde tarief, en de snelle modus is goedkoper geworden. Automatiseringen die vorig jaar net niet uit konden, kunnen dit jaar wel rendabel zijn.

De koppeling is en blijft het echte werk. Een AI die offertes voorbereidt is pas nuttig als hij je Moneybird of Exact kent, je productcatalogus uit Shopify trekt en het antwoord op de juiste plek terugzet. Dat bouw je een keer goed, en daarna draait het. Het model eronder kun je later vervangen door een betere versie zonder de hele constructie opnieuw te maken.

Dat laatste is het rustige nieuws onder het luide nieuws. Modellen vervangen elkaar inmiddels om de paar weken: Opus 4.7 was zes weken oud toen 4.8 verscheen. Klink je je proces vast aan een specifiek model, dan loop je continu achter de feiten aan. Bouw je het slim, met het model als vervangbaar onderdeel, dan profiteer je automatisch van elke nieuwe versie. Met slim werken, loont hard werken.

Wat ik zou doen

Ga niet jagen op het nieuwste model. Begin bij een taak die in jouw bedrijf echt tijd of geld kost en die zich herhaalt. Bekijk of die taak afgebakend genoeg is om aan een AI over te laten, en of een fout op te vangen is. Bouw daar een nette koppeling omheen, met een controlemoment op de plekken die ertoe doen. Welk model er onder de motorkap draait, Opus 4.8 of de versie van volgende maand, is dan een detail dat je achteraf bijstelt.

Welk model er onder de motorkap draait is dan een detail dat je achteraf bijstelt, niet de fundering waarop je bouwt.

Veelgestelde vragen

Alisina Nawabi
Geschreven doorAlisina Nawabi

AI Product Engineer & Solutions Architect

Bij FLOH ontwerp en bouw ik complete software, integraties en AI op maat, van eerste idee tot werkend product, en jij blijft eigenaar. Hier schrijf ik nuchter over bouwen met AI en software voor ondernemers en organisaties.

Meer over mij

Genoemde integraties

Dit artikel noemt deze tools. Ik koppel ze op maat aan je eigen systemen.

Gerelateerde artikelen

Claude Fable 5 uitgeschakeld door VS-exportcontrole: wat het voor jouw bedrijf betekentNieuws

Claude Fable 5 uitgeschakeld door VS-exportcontrole: wat het voor jouw bedrijf betekent

Op 13 juni schakelde de Amerikaanse overheid zonder waarschuwing Claude Fable 5 en Mythos 5 uit voor alle gebruikers wereldwijd. Wat er precies is gebeurd en wat elk ondernemer nu moet weten.

Lees artikel
Claude Fable 5 en Mythos 5: Anthropics sterkste model, nu deels publiekNieuws

Claude Fable 5 en Mythos 5: Anthropics sterkste model, nu deels publiek

Anthropic bracht op 9 juni 2026 zijn krachtigste model naar buiten in twee vormen: Claude Fable 5 voor algemeen gebruik en het afgeschermde Mythos 5 voor cyberdefensie. De benchmarks, de demo’s en wat het betekent.

Lees artikel
GLM-5.2 klopt GPT-5.5 op coding, en kost een zesdeNieuws

GLM-5.2 klopt GPT-5.5 op coding, en kost een zesde

Het open-weight model GLM-5.2 van Z.ai verslaat GPT-5.5 op meerdere langlopende coding-benchmarks tegen ongeveer een zesde van de prijs. Wat dat betekent voor jouw AI-codeerkosten.

Lees artikel
Kimi K2.7-Code: een open codeermodel dat fors onder GPT-5.5 en Claude duiktNieuws

Kimi K2.7-Code: een open codeermodel dat fors onder GPT-5.5 en Claude duikt

Het Chinese Moonshot AI bracht Kimi K2.7-Code uit, een open-weight codeermodel met 1 biljoen parameters. Op de prijs per token gaat het tot 12 keer onder de duurste Claude. Wat betekent dat voor jouw bedrijf?

Lees artikel
OpenAI brengt Codex naar ChatGPT: AI die zelf code schrijft, nuchter bekekenNieuws

OpenAI brengt Codex naar ChatGPT: AI die zelf code schrijft, nuchter bekeken

OpenAI kondigde op 2 juni 2026 aan dat Codex, zijn AI die zelf code schrijft, naar de ChatGPT-app komt met zes rol-plugins. Wat betekent 'AI die bouwt' echt voor het MKB?

Lees artikel
Zo bouw je een leverancier-onafhankelijke AI-stackGids

Zo bouw je een leverancier-onafhankelijke AI-stack

Eén AI-leverancier die zijn prijzen verhoogt of een model offline haalt, kan je operatie platleggen. Ik laat je een dunne routerlaag bouwen met open-weight achtervang en budgetbewaking, zodat je nooit aan één aanbieder vastzit.

Lees artikel