laptopscherm met kleurrijke programmeercode

GLM-5.2 klopt GPT-5.5 op coding, en kost een zesde

NieuwsAlisina NawabiAlisina Nawabi17 juni · 02:115 min leestijd

Het open-weight model GLM-5.2 van Z.ai verslaat GPT-5.5 op meerdere langlopende coding-benchmarks tegen ongeveer een zesde van de prijs. Wat dat betekent voor jouw AI-codeerkosten.

Twee dagen geleden bracht het Chinese Z.ai (het vroegere Zhipu AI) GLM-5.2 uit zonder benchmarkcijfers. Die cijfers zijn er nu, en ze zijn opvallend: het open-weight model klopt OpenAI's GPT-5.5 op meerdere langlopende coding-benchmarks, en doet dat naar verluidt voor ongeveer een zesde van de prijs. Voor iedereen die AI laat programmeren, van een solodeveloper tot een engineeringteam binnen een groot bedrijf, is dat geen detail maar een rekensom die de moeite waard is.

Wat Z.ai precies heeft uitgebracht

GLM-5.2 is een Mixture-of-Experts-model met ongeveer 744 tot 753 miljard parameters, waarvan er per token zo'n 40 miljard actief zijn. Dat laatste is wat telt voor de snelheid en de kosten: je betaalt en rekent niet aan het volledige model, maar aan het stukje dat per stap meedraait. De gewichten staan open op Hugging Face onder een MIT-licentie, de meest vrije variant die er is. Je mag het model dus draaien, aanpassen en commercieel inzetten zonder dat een leverancier je achteraf de toegang kan afknijpen.

Het model is sinds de lancering direct beschikbaar in alle tiers van het GLM Coding Plan en kan binnen je eigen coding-agent worden aangezet, volgens de eigen documentatie van Z.ai. Daarbij hoort een contextvenster van een miljoen tokens, ruim genoeg om een hele codebase of een lange reeks taken in één keer te overzien, plus twee niveaus van "denkkracht" (high en max) zodat je de zwaarte van het model afstemt op de klus.

De benchmarks, nuchter bekeken

De headline is dat GLM-5.2 GPT-5.5 verslaat op meerdere langlopende coding-benchmarks, de taken waarbij een model niet één snippet schrijft maar een opdracht over vele stappen volhoudt: een feature bouwen, debuggen, optimaliseren. Op FrontierSWE komt het net boven GPT-5.5 uit, en onder de open modellen is het koploper. De gerapporteerde scores liggen rond 81,0 op Terminal-Bench 2.1 en 62,1 op SWE-bench Pro, dicht in de buurt van de duurste gesloten topmodellen.

Benchmarks zijn geen garantie voor jouw specifieke werk, dat blijft zo. Maar het patroon is inmiddels onmiskenbaar. Z.ai bracht het model twee dagen terug uit en maakte GLM-5.2 open source, wat het gat vulde dat Anthropic met zijn exportbeperkingen achterliet. De benchmarkcijfers maken dat verhaal nu concreet: het is niet alleen een principieel alternatief, het presteert ook.

Waarom een zesde van de prijs het echte nieuws is

Het prestatieverschil is interessant, het prijsverschil is wat je begroting raakt. Volgens de berichtgeving kost GLM-5.2 ongeveer een zesde van wat GPT-5.5 op vergelijkbare coding-taken kost. Als AI een serieus deel van je ontwikkelwerk doet, tikt dat hard aan: dezelfde output voor een fractie van de tokenrekening.

Dit past in een trend die ik de afgelopen weken meerdere keren zag langskomen. Eerder dook Kimi K2.7-Code al op, een open codeermodel dat fors onder de prijs van GPT-5.5 en Claude duikt, en breder zie je dat oplopende AI-abonnementskosten bedrijven richting open source en Chinese modellen duwen. GLM-5.2 zet die beweging door, alleen nu met benchmarkcijfers die de gesloten topmodellen echt naderen of voorbijgaan.

Wat dit voor jouw bedrijf betekent

De winst zit niet alleen in de prijs, maar in de keuzevrijheid. Een open-weight model met een MIT-licentie kun je self-hosted op je eigen infrastructuur draaien. Je code, je klantdata en je prompts verlaten je omgeving dan niet, en je bent niet afhankelijk van één Amerikaanse leverancier die morgen zijn prijzen, voorwaarden of beschikbaarheid kan veranderen. Precies die afhankelijkheid liet Anthropic eerder deze maand zien toen modellen door exportregels ineens onbereikbaar werden.

Tegelijk hoort er een nuchtere kanttekening bij. Een model van 744 miljard parameters self-hosted draaien vraagt serieuze hardware; voor veel teams is een Europese of neutrale hostingpartij die GLM-5.2 aanbiedt praktischer dan eigen GPU's. En een Chinees model brengt zijn eigen vragen mee rond data en governance, afhankelijk van hoe en waar je het draait. De juiste keuze hangt af van je use-case, je gevoeligheid voor data en je budget.

Mijn advies blijft hetzelfde als altijd: bouw je AI-stack zo dat je niet aan één model vastzit. Een nieuw, goedkoper model als dit is dan geen migratieproject van maanden maar een instelling die je omzet. Een leverancier-onafhankelijke AI-stack die je modellen laat wisselen zonder lock-in is precies wat dat mogelijk maakt. Wil je dat soort flexibiliteit in je eigen software ingebouwd hebben, dan help ik je daar graag bij: ik bouw AI en automatisering end-to-end, self-hosted waar het kan, zodat een prijsdaling als deze in jouw voordeel werkt in plaats van langs je heen gaat.

Veelgestelde vragen

Alisina Nawabi
Geschreven doorAlisina Nawabi

AI Product Engineer & Solutions Architect

Bij FLOH ontwerp en bouw ik complete software, integraties en AI op maat, van eerste idee tot werkend product, en jij blijft eigenaar. Hier schrijf ik nuchter over bouwen met AI en software voor ondernemers en organisaties.

Meer over mij

Genoemde integraties

Dit artikel noemt deze tools. Ik koppel ze op maat aan je eigen systemen.

Gerelateerde artikelen

Zhipu maakt GLM-5.2 open source en vult het gat dat Anthropic achterlietNieuws

Zhipu maakt GLM-5.2 open source en vult het gat dat Anthropic achterliet

Het Chinese Zhipu AI geeft zijn krachtigste model GLM-5.2 vrij onder een MIT-licentie, met een context van 1 miljoen tokens. Een gratis inzetbaar alternatief, precies nu Anthropic buiten de VS offline ging.

Lees artikel
Kimi K2.7-Code: een open codeermodel dat fors onder GPT-5.5 en Claude duiktNieuws

Kimi K2.7-Code: een open codeermodel dat fors onder GPT-5.5 en Claude duikt

Het Chinese Moonshot AI bracht Kimi K2.7-Code uit, een open-weight codeermodel met 1 biljoen parameters. Op de prijs per token gaat het tot 12 keer onder de duurste Claude. Wat betekent dat voor jouw bedrijf?

Lees artikel
OpenAI brengt Codex naar ChatGPT: AI die zelf code schrijft, nuchter bekekenNieuws

OpenAI brengt Codex naar ChatGPT: AI die zelf code schrijft, nuchter bekeken

OpenAI kondigde op 2 juni 2026 aan dat Codex, zijn AI die zelf code schrijft, naar de ChatGPT-app komt met zes rol-plugins. Wat betekent 'AI die bouwt' echt voor het MKB?

Lees artikel
Zo bouw je een leverancier-onafhankelijke AI-stackGids

Zo bouw je een leverancier-onafhankelijke AI-stack

Eén AI-leverancier die zijn prijzen verhoogt of een model offline haalt, kan je operatie platleggen. Ik laat je een dunne routerlaag bouwen met open-weight achtervang en budgetbewaking, zodat je nooit aan één aanbieder vastzit.

Lees artikel
76 beveiligingsexperts noemen Anthropic-exportban 'gevaarlijk' voor verdedigersNieuws

76 beveiligingsexperts noemen Anthropic-exportban 'gevaarlijk' voor verdedigers

Een open brief van 76 vooraanstaande CISO’s, onderzoekers en investeerders roept het Witte Huis op de exportban op Anthropics Fable 5 en Mythos 5 in te trekken. Het weghalen van topmodellen bij verdedigers maakt iedereen kwetsbaarder, stellen ze.

Lees artikel
AI-agenten jagen de tokenkosten omhoog: zo houd je je AI-rekening in toomNieuws

AI-agenten jagen de tokenkosten omhoog: zo houd je je AI-rekening in toom

Bedrijven schrikken van hun AI-rekening nu agenten en redeneermodellen enorm veel tokens verstoken. Uber brandde zijn jaarbudget in vier maanden op. Wat betekent dat voor jouw bedrijf?

Lees artikel