Het open-weight model GLM-5.2 van Z.ai verslaat GPT-5.5 op meerdere langlopende coding-benchmarks tegen ongeveer een zesde van de prijs. Wat dat betekent voor jouw AI-codeerkosten.
Twee dagen geleden bracht het Chinese Z.ai (het vroegere Zhipu AI) GLM-5.2 uit zonder benchmarkcijfers. Die cijfers zijn er nu, en ze zijn opvallend: het open-weight model klopt OpenAI's GPT-5.5 op meerdere langlopende coding-benchmarks, en doet dat naar verluidt voor ongeveer een zesde van de prijs. Voor iedereen die AI laat programmeren, van een solodeveloper tot een engineeringteam binnen een groot bedrijf, is dat geen detail maar een rekensom die de moeite waard is.
Wat Z.ai precies heeft uitgebracht
GLM-5.2 is een Mixture-of-Experts-model met ongeveer 744 tot 753 miljard parameters, waarvan er per token zo'n 40 miljard actief zijn. Dat laatste is wat telt voor de snelheid en de kosten: je betaalt en rekent niet aan het volledige model, maar aan het stukje dat per stap meedraait. De gewichten staan open op Hugging Face onder een MIT-licentie, de meest vrije variant die er is. Je mag het model dus draaien, aanpassen en commercieel inzetten zonder dat een leverancier je achteraf de toegang kan afknijpen.
Het model is sinds de lancering direct beschikbaar in alle tiers van het GLM Coding Plan en kan binnen je eigen coding-agent worden aangezet, volgens de eigen documentatie van Z.ai. Daarbij hoort een contextvenster van een miljoen tokens, ruim genoeg om een hele codebase of een lange reeks taken in één keer te overzien, plus twee niveaus van "denkkracht" (high en max) zodat je de zwaarte van het model afstemt op de klus.
De benchmarks, nuchter bekeken
De headline is dat GLM-5.2 GPT-5.5 verslaat op meerdere langlopende coding-benchmarks, de taken waarbij een model niet één snippet schrijft maar een opdracht over vele stappen volhoudt: een feature bouwen, debuggen, optimaliseren. Op FrontierSWE komt het net boven GPT-5.5 uit, en onder de open modellen is het koploper. De gerapporteerde scores liggen rond 81,0 op Terminal-Bench 2.1 en 62,1 op SWE-bench Pro, dicht in de buurt van de duurste gesloten topmodellen.
Benchmarks zijn geen garantie voor jouw specifieke werk, dat blijft zo. Maar het patroon is inmiddels onmiskenbaar. Z.ai bracht het model twee dagen terug uit en maakte GLM-5.2 open source, wat het gat vulde dat Anthropic met zijn exportbeperkingen achterliet. De benchmarkcijfers maken dat verhaal nu concreet: het is niet alleen een principieel alternatief, het presteert ook.
Waarom een zesde van de prijs het echte nieuws is
Het prestatieverschil is interessant, het prijsverschil is wat je begroting raakt. Volgens de berichtgeving kost GLM-5.2 ongeveer een zesde van wat GPT-5.5 op vergelijkbare coding-taken kost. Als AI een serieus deel van je ontwikkelwerk doet, tikt dat hard aan: dezelfde output voor een fractie van de tokenrekening.
Dit past in een trend die ik de afgelopen weken meerdere keren zag langskomen. Eerder dook Kimi K2.7-Code al op, een open codeermodel dat fors onder de prijs van GPT-5.5 en Claude duikt, en breder zie je dat oplopende AI-abonnementskosten bedrijven richting open source en Chinese modellen duwen. GLM-5.2 zet die beweging door, alleen nu met benchmarkcijfers die de gesloten topmodellen echt naderen of voorbijgaan.
Wat dit voor jouw bedrijf betekent
De winst zit niet alleen in de prijs, maar in de keuzevrijheid. Een open-weight model met een MIT-licentie kun je self-hosted op je eigen infrastructuur draaien. Je code, je klantdata en je prompts verlaten je omgeving dan niet, en je bent niet afhankelijk van één Amerikaanse leverancier die morgen zijn prijzen, voorwaarden of beschikbaarheid kan veranderen. Precies die afhankelijkheid liet Anthropic eerder deze maand zien toen modellen door exportregels ineens onbereikbaar werden.
Tegelijk hoort er een nuchtere kanttekening bij. Een model van 744 miljard parameters self-hosted draaien vraagt serieuze hardware; voor veel teams is een Europese of neutrale hostingpartij die GLM-5.2 aanbiedt praktischer dan eigen GPU's. En een Chinees model brengt zijn eigen vragen mee rond data en governance, afhankelijk van hoe en waar je het draait. De juiste keuze hangt af van je use-case, je gevoeligheid voor data en je budget.
Mijn advies blijft hetzelfde als altijd: bouw je AI-stack zo dat je niet aan één model vastzit. Een nieuw, goedkoper model als dit is dan geen migratieproject van maanden maar een instelling die je omzet. Een leverancier-onafhankelijke AI-stack die je modellen laat wisselen zonder lock-in is precies wat dat mogelijk maakt. Wil je dat soort flexibiliteit in je eigen software ingebouwd hebben, dan help ik je daar graag bij: ik bouw AI en automatisering end-to-end, self-hosted waar het kan, zodat een prijsdaling als deze in jouw voordeel werkt in plaats van langs je heen gaat.
