Anthropic bracht op 28 mei 2026 Claude Opus 4.8 uit. De cijfers zijn bescheiden, maar het model werkt langer zelfstandig door en is eerlijker over wat het niet weet. Wat betekent dat voor het MKB?
Op 28 mei 2026 bracht Anthropic Claude Opus 4.8 uit, de nieuwe topversie van zijn AI-modellen. Op het eerste gezicht een routineklus: een nummer hoger, weer wat betere scores. Maar de echte verschuiving zit niet in de benchmarks. Hij zit in wat het model nu zelfstandig durft te doen, en in hoe eerlijk het is over wat het niet weet. Voor jou als ondernemer is dat interessanter dan welke ranglijst dan ook.
Wat is er aangekondigd
Anthropic noemt Claude Opus 4.8 zelf een 'bescheiden maar voelbare' verbetering ten opzichte van de vorige versie, Opus 4.7 van zes weken eerder. Bescheiden in de cijfers, voelbaar in de praktijk. Drie dingen springen eruit.
Ten eerste de eerlijkheid. Volgens Anthropic laat dit model ongeveer vier keer minder vaak een fout in zijn eigen code passeren zonder die te benoemen. Het geeft vaker aan waar het onzeker over is, en doet minder ongefundeerde beweringen. Testers omschrijven het als een model dat scherper oordeelt, eerder tegengas geeft als een plan niet klopt, en zijn eigen werk durft te corrigeren in plaats van te doen alsof alles in orde is.
Ten tweede de nieuwe functie 'dynamic workflows'. Daarmee kan het model een grote opdracht zelf opknippen en honderden deeltaken parallel laten uitvoeren binnen een sessie. Het voorbeeld dat Anthropic geeft: een verbouwing van een codebase van honderden duizenden regels, van start tot oplevering. Dat is een ander type werk dan een vraag beantwoorden. Het is een opdracht uitvoeren.
Ten derde de prijs en snelheid. De prijs per token blijft gelijk aan die van de vorige versie (5 dollar per miljoen tokens invoer, 25 dollar per miljoen uitvoer). De 'fast mode' draait op 2,5 keer de snelheid en is nu drie keer goedkoper dan bij eerdere modellen. In de benchmarks scoort Opus 4.8 op SWE-Bench Pro, een test voor echte programmeerproblemen, 69,2% tegenover 64,3% voor de vorige versie en 58,6% voor GPT-5.5 van OpenAI. Mooi om te weten, maar voor de meeste bedrijven zijn een paar procentpunten op een testset niet de reden om iets te veranderen.
Waarom de richting belangrijker is dan het cijfer
De interessante trend zit niet in 'het model is slimmer'. Hij zit in 'het model werkt langer zelfstandig door en is eerlijker over wat het niet weet'. Dat zijn precies de twee eigenschappen die bepalen of je AI veilig in een bedrijfsproces kunt zetten.
Een model dat bij twijfel gewoon iets verzint, kun je niet loslaten op je facturen, je voorraad of je klantmails. Je moet dan alles dubbelchecken, en netto ben je niets opgeschoten. Een model dat zegt 'dit klopt niet, kijk hier even naar' is een collega waar je iets aan hebt. Die verschuiving, van een gladde prater naar een eerlijke meedenker, is voor het echte werk belangrijker dan de zoveelste recordscore.
Wat betekent dit voor jouw bedrijf
Even nuchter, want hier wordt vaak overheen gehypet. Een sterker model maakt je bedrijf niet vanzelf efficienter. Het rauwe model is een motor, geen auto. Je hebt er nog steeds een koppeling omheen nodig die het verbindt met jouw systemen, jouw data en jouw manier van werken. Daar zit het echte werk, en daar zit ook de winst. Drie punten om mee te nemen.
Taken die eerst te riskant waren, komen binnen bereik. Door die betere eerlijkheid is het verantwoorder om een model dingen te laten doen waar een foutje geld of vertrouwen kost: offertes voorbereiden, klantgegevens opschonen, inkomende mails classificeren. Niet omdat het nooit meer fout gaat, maar omdat het eerder zelf aan de bel trekt.
De prijs blijft gelijk, dus de rekensom verandert. Je krijgt meer kwaliteit voor hetzelfde tarief, en de snelle modus is goedkoper geworden. Automatiseringen die vorig jaar net niet uit konden, kunnen dit jaar wel rendabel zijn.
De koppeling is en blijft het echte werk. Een AI die offertes voorbereidt is pas nuttig als hij je Moneybird of Exact kent, je productcatalogus uit Shopify trekt en het antwoord op de juiste plek terugzet. Dat bouw je een keer goed, en daarna draait het. Het model eronder kun je later vervangen door een betere versie zonder de hele constructie opnieuw te maken.
Dat laatste is het rustige nieuws onder het luide nieuws. Modellen vervangen elkaar inmiddels om de paar weken: Opus 4.7 was zes weken oud toen 4.8 verscheen. Klink je je proces vast aan een specifiek model, dan loop je continu achter de feiten aan. Bouw je het slim, met het model als vervangbaar onderdeel, dan profiteer je automatisch van elke nieuwe versie. Met slim werken, loont hard werken.
Wat ik zou doen
Ga niet jagen op het nieuwste model. Begin bij een taak die in jouw bedrijf echt tijd of geld kost en die zich herhaalt. Bekijk of die taak afgebakend genoeg is om aan een AI over te laten, en of een fout op te vangen is. Bouw daar een nette koppeling omheen, met een controlemoment op de plekken die ertoe doen. Welk model er onder de motorkap draait, Opus 4.8 of de versie van volgende maand, is dan een detail dat je achteraf bijstelt.
Welk model er onder de motorkap draait is dan een detail dat je achteraf bijstelt, niet de fundering waarop je bouwt.
