Kimi K2.7-Code: een open codeermodel dat fors onder GPT-5.5 en Claude duikt

Kimi K2.7-Code: een open codeermodel dat fors onder GPT-5.5 en Claude duikt

NieuwsAlisina NawabiAlisina Nawabi13 juni · 14:045 min leestijd

Het Chinese Moonshot AI bracht Kimi K2.7-Code uit, een open-weight codeermodel met 1 biljoen parameters. Op de prijs per token gaat het tot 12 keer onder de duurste Claude. Wat betekent dat voor jouw bedrijf?

Het Chinese Moonshot AI heeft deze week Kimi K2.7-Code uitgebracht, een open-weight model dat speciaal is getraind om te programmeren. Het bijzondere zit niet zozeer in de benchmarks, maar in de prijs: per token rekent Moonshot een fractie van wat OpenAI en Anthropic vragen. Voor ondernemers die AI-codering of agent-workflows inzetten, is dat geen detail. Het verandert de rekensom.

Wat er precies is uitgekomen

Kimi K2.7-Code is een zogeheten Mixture-of-Experts-model met 1 biljoen parameters in totaal, waarvan er per token zo'n 32 miljard daadwerkelijk meedoen. Het verwerkt tot 256.000 tokens context in een keer, genoeg om een flinke codebase of een lang document in een prompt te proppen. De gewichten staan open op Hugging Face onder een aangepaste MIT-licentie, en je kunt het model zelf draaien via vLLM, SGLang of KTransformers.

Volgens Moonshot is K2.7-Code een duidelijke stap vooruit op zijn voorganger K2.6. Op de eigen Kimi Code Bench v2 ging de score van 50,9 naar 62,0, en op MCPMark Verified klopt het naar eigen zeggen Claude Opus 4.8 (81,1 tegen 76,4). Tegelijk is het eerlijk om te zeggen dat het model op de meeste standaard codeertests nog achter GPT-5.5 blijft. Dit is geen nieuwe nummer een, maar een sterk alternatief tegen een heel andere prijs.

De prijs is het echte nieuws

Via de Kimi-API kost K2.7-Code ongeveer 0,95 dollar per miljoen invoer-tokens en 4 dollar per miljoen uitvoer-tokens. Ter vergelijking, op basis van de tarieven die in de berichtgeving worden genoemd:

ModelInvoer (per miljoen)Uitvoer (per miljoen)
Kimi K2.7-Code0,95 dollar4 dollar
GPT-5.55 dollar30 dollar
Claude Opus 4.85 dollar25 dollar
Claude Fable 510 dollar50 dollar

De veelgenoemde "tot 12 keer goedkoper" slaat op de uitvoerprijs tegenover het duurste Claude-model: 4 dollar tegen 50 dollar. Vergeleken met GPT-5.5 of Claude Opus 4.8 is het verschil kleiner, maar nog steeds een factor vijf tot zeven op uitvoer. Bij agent-workflows die veel tekst genereren, tikt juist die uitvoerprijs het hardst aan.

Waarom dit voor het MKB telt

Twee dingen maken dit verhaal interessant voorbij de cijfers.

Het eerste is kosten. Als je een chatbot, een code-assistent of een automatisering draait die dag in dag uit tokens verstookt, dan is een factor vijf tot tien op de rekening het verschil tussen "leuk experiment" en "structureel betaalbaar". Je hoeft daar geen serverpark voor neer te zetten: de API werkt en is bovendien compatibel met de OpenAI-standaard, dus bestaande code hoef je nauwelijks aan te passen.

Het tweede is eigenaarschap. Omdat de gewichten openstaan, kun je dit model in principe zelf hosten, op je eigen infrastructuur of bij een Europese aanbieder. Daarmee wordt het een serieus alternatief voor de vraag waar veel ondernemers mee worstelen: hoe voorkom ik dat mijn hele bedrijfsvoering aan een handvol Amerikaanse leveranciers hangt? Dezelfde redenering geldt voor open-weight Chinese modellen die je zelf kunt hosten en die qua codeer- en agent-prestaties dicht bij betaalde alternatieven zitten, en het past in de bredere beweging weg van vendor lock-in.

De nuchtere kanttekeningen

Voordat je je hele stack omgooit: een paar dingen om scherp te houden.

De benchmarks komen grotendeels van Moonshot zelf. Mooie scores op eigen tests zeggen minder dan hoe het model presteert op jouw echte werk. Test het op je eigen code voordat je conclusies trekt.

Zelf hosten klinkt aantrekkelijk, maar de gewichten zijn bijna 600 GB groot. Dat is geen model dat je even op een kantoorlaptop draait, je hebt serieuze GPU-capaciteit nodig. Voor de meeste MKB-bedrijven blijft de API daarom voorlopig de praktische route, en self-hosting iets voor wie er bewust in investeert. Het is precies de afweging tussen self-hosted en cloud die per geval anders uitvalt.

En de prijzen staan in dollars. Een goedkoper model verandert niets aan het feit dat je nog steeds nadenkt over waar je data heen gaat en onder welke voorwaarden. Een Chinees model dat je via een API in de cloud aanroept, is iets anders dan datzelfde model dat binnen je eigen muren draait.

Wat ik ervan zou doen

De winst zit niet in "het nieuwste model", maar in het juiste model voor de juiste taak. Voor routinematig codeerwerk en agent-stappen die veel tekst genereren, kan een goedkoper open model een groot deel van je rekening schrappen, terwijl je een duurder model bewaart voor het echt lastige werk. Met slim werken, loont hard werken, ook als het op je AI-rekening twaalf keer scheelt.

Veelgestelde vragen

Alisina Nawabi
Geschreven doorAlisina Nawabi

AI Product Engineer & Solutions Architect

Bij FLOH ontwerp en bouw ik complete software, integraties en AI op maat, van eerste idee tot werkend product, en jij blijft eigenaar. Hier schrijf ik nuchter over bouwen met AI en software voor ondernemers en organisaties.

Meer over mij

Genoemde integraties

Dit artikel noemt deze tools. Ik koppel ze op maat aan je eigen systemen.

Gerelateerde artikelen

GLM-5.2 klopt GPT-5.5 op coding, en kost een zesdeNieuws

GLM-5.2 klopt GPT-5.5 op coding, en kost een zesde

Het open-weight model GLM-5.2 van Z.ai verslaat GPT-5.5 op meerdere langlopende coding-benchmarks tegen ongeveer een zesde van de prijs. Wat dat betekent voor jouw AI-codeerkosten.

Lees artikel
Zo bouw je een leverancier-onafhankelijke AI-stackGids

Zo bouw je een leverancier-onafhankelijke AI-stack

Eén AI-leverancier die zijn prijzen verhoogt of een model offline haalt, kan je operatie platleggen. Ik laat je een dunne routerlaag bouwen met open-weight achtervang en budgetbewaking, zodat je nooit aan één aanbieder vastzit.

Lees artikel
Zhipu maakt GLM-5.2 open source en vult het gat dat Anthropic achterlietNieuws

Zhipu maakt GLM-5.2 open source en vult het gat dat Anthropic achterliet

Het Chinese Zhipu AI geeft zijn krachtigste model GLM-5.2 vrij onder een MIT-licentie, met een context van 1 miljoen tokens. Een gratis inzetbaar alternatief, precies nu Anthropic buiten de VS offline ging.

Lees artikel
Claude Fable 5 uitgeschakeld door VS-exportcontrole: wat het voor jouw bedrijf betekentNieuws

Claude Fable 5 uitgeschakeld door VS-exportcontrole: wat het voor jouw bedrijf betekent

Op 13 juni schakelde de Amerikaanse overheid zonder waarschuwing Claude Fable 5 en Mythos 5 uit voor alle gebruikers wereldwijd. Wat er precies is gebeurd en wat elk ondernemer nu moet weten.

Lees artikel
76 beveiligingsexperts noemen Anthropic-exportban 'gevaarlijk' voor verdedigersNieuws

76 beveiligingsexperts noemen Anthropic-exportban 'gevaarlijk' voor verdedigers

Een open brief van 76 vooraanstaande CISO’s, onderzoekers en investeerders roept het Witte Huis op de exportban op Anthropics Fable 5 en Mythos 5 in te trekken. Het weghalen van topmodellen bij verdedigers maakt iedereen kwetsbaarder, stellen ze.

Lees artikel
AI-agenten jagen de tokenkosten omhoog: zo houd je je AI-rekening in toomNieuws

AI-agenten jagen de tokenkosten omhoog: zo houd je je AI-rekening in toom

Bedrijven schrikken van hun AI-rekening nu agenten en redeneermodellen enorm veel tokens verstoken. Uber brandde zijn jaarbudget in vier maanden op. Wat betekent dat voor jouw bedrijf?

Lees artikel