GLM-5.2 klopt GPT-5.5 op coding, en kost een zesde
Het open-weight model GLM-5.2 van Z.ai verslaat GPT-5.5 op meerdere langlopende coding-benchmarks tegen ongeveer een zesde van de prijs. Wat dat betekent voor jouw AI-codeerkosten.
GPT-5.4 (Generative Pre-trained Transformer 5.4) is een groot taalmodel van OpenAI, uitgebracht op 5 maart 2026. Bij de lancering introduceerde OpenAI twee varianten: GPT-5.4 Thinking en GPT-5.4 Pro, beide exclusief beschikbaar voor betalende gebruikers. Op 17 maart volgden GPT-5.4 mini en GPT-5.4 nano; de mini-versie is toegankelijk voor gratis gebruikers, terwijl de nano-versie uitsluitend via de OpenAI API beschikbaar is. Via de API zijn mini en nano viermaal duurder dan hun GPT-5-equivalenten. Volgens OpenAI vertoont GPT-5.4 33 procent minder feitelijke fouten ten opzichte van GPT-5.2, met verbeteringen gericht op professionele workflows. Het model beschikt over ingebouwde computer use-functionaliteit en verbeterde mogelijkheden voor diepgaand onderzoek. In de benchmark OSWorld-Verified, die beoordeelt hoe goed taalmodellen desktopomgevingen kunnen bedienen, behaalde GPT-5.4 een score van 75 procent, vergeleken met 47,3 procent voor GPT-5.2 en 72,4 procent als gemiddelde voor een mens.
Achtergrond via Wikipedia.
scoort 54,6% op de Toolathlon benchmark
“Op de Toolathlon benchmark (54,6%)”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
scoort gemiddeld 87,3% op interne benchmarks voor junior investment banking-taken
“scoort het model gemiddeld 87,3%”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
scoort 91% op de BigLaw Bench
“scoort GPT-5.4 een waanzinnige 91% op de BigLaw Bench”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
ondersteunt afbeeldingen tot 10,24 miljoen pixels
“afbeeldingen tot 10,24 miljoen pixels”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
heeft reasoning levels van none tot xhigh
“Reasoning Efforts: none, light, medium, heavy, xhigh”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
ondersteunt tot 1 miljoen tokens in API en Codex
“GPT-5.4 nu tot 1 miljoen tokens”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
realiseert token-reductie van 47% bij complexe agentic workflows
“token-reductie van 47% bij complexe agentic workflows”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
presteert 27,7% hoger dan GPT-5.2 bij complexe taken
“accuraatheid die 27,7% hoger ligt dan zijn voorganger”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
heeft Native Computer Use
“GPT-5.4 heeft Native Computer Use.”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
heeft een SWE-Bench Pro score van 57.7%
“GPT-5.4 | 57.7%”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
heeft een OSWorld success rate van 75.0%
“GPT-5.4 | 75.0%”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
presteert beter dan een getrainde mens in computerbediening
“Voor het eerst presteert een AI-model beter dan een getrainde mens in het bedienen van een computer”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
scoorde 83.0% op de GDPval-benchmark
“GPT-5.4: 83.0%”GPT-5.4: Van Slimme Chatbot naar Autonome Collega
Onderwerpen die vaak samen met GPT-5.4 voorkomen, ook zonder een vastgelegd verband. Open de gedeelde verhalen voor de context.