Waarom stijgen AI-kosten nu zo snel?

Grote labs verschuiven van vaste abonnementen naar afrekenen per token, terwijl het verbruik hard groeit. De prijs per token daalt niet snel genoeg om dat te compenseren.

Zijn goedkopere AI-modellen wel goed genoeg?

Voor veel taken wel. Juridisch AI-bedrijf Harvey verlaagde zijn inferentiekosten met een factor drie zonder merkbaar kwaliteitsverlies door over te stappen op een efficiënter open model.

Moet ik nu overstappen op een ander model?

Niet blind. Meet eerst je tokenverbruik, verschuif routinetaken naar een goedkoper model en bewaar het topmodel voor complex werk. Houd je processen zo dat wisselen makkelijk blijft.

Wat is het risico van Chinese modellen?

Vooral datasoevereiniteit en AVG: je wilt weten waar je data heen gaat. Een self-hosted open-weight model of een Europees alternatief geeft de kostenvoordelen zonder dat gevoelige data het land uit hoeft.

AI-kosten stijgen: bedrijven kiezen open source

AI-abonnementen worden snel duurder terwijl de prijs per token nauwelijks meedaalt. Steeds meer bedrijven schuiven routinetaken naar goedkopere open-weight of Chinese modellen om hun budget te rekken.

De rekening van AI begint pijn te doen. Waar grote labs als OpenAI en Anthropic klanten binnenhaalden met vlakke abonnementsprijzen, verschuift het model nu naar afrekenen per token, en dat gebruik schiet omhoog. Het probleem volgens Tom's Hardware: de kosten om AI via een abonnement te leveren stijgen gestaag, terwijl de daling van de prijs per token daar geen gelijke tred mee houdt. Het gevolg is een strategische heroverweging die ook voor Nederlandse organisaties relevant is.

Van vaste prijs naar de tikkende teller

Het kantelpunt zit in de verschuiving van flat-rate naar pay-as-you-go. Zolang je een vast bedrag per maand betaalde, was AI een voorspelbare kostenpost. Nu het per verbruik gaat en teams AI intensief inzetten, lopen rekeningen snel op tot bedragen die met salarissen te vergelijken zijn. Volgens Yahoo Finance putten engineers bij Microsoft hun jaarlijkse AI-budget binnen de eerste maanden van 2026 al uit op een enkele codeertool.

Dat verklaart waarom de zoektocht naar goedkopere alternatieven nu serieus wordt. Open-source modellen, waaronder Chinese, zijn volgens dezelfde berichtgeving tot dertig keer goedkoper dan de premium-opties van de grote labs.

Goedkoper hoeft niet slechter te zijn

De vrees is altijd dat je met een goedkoper model inlevert op kwaliteit. In de praktijk valt dat steeds vaker mee. Het juridische AI-bedrijf Harvey wist zijn inferentiekosten met een factor drie te verlagen zonder merkbaar kwaliteitsverlies, door werk te verschuiven naar een efficiënter open-weight model. Co-oprichter Gabe Pereyra vatte de verschuiving zo samen: kwaliteit komt eerst, maar de definitie van kwaliteit evolueert van altijd het krachtigste model gebruiken naar het beste model dat de klus efficiënt klaart.

Die beweging is breder. Coinbase-oprichter Brian Armstrong voorspelt dat binnen 12 tot 18 maanden 80% van de werklasten draait op modellen die 99% goedkoper zijn, en dat slechts een vijfde de nieuwste generatie echt nodig heeft.

Wat betekent dit voor jouw bedrijf

De les is niet dat je morgen je ChatGPT- of Copilot-abonnement moet opzeggen. De les is dat blind leunen op één dure leverancier een kostenrisico is geworden. Drie nuchtere stappen helpen:

Meet je verbruik. Weet je eigenlijk hoeveel tokens je teams maandelijks gebruiken, en waaraan? Zonder dat inzicht stuur je blind.
Splits je taken. Routinewerk zoals samenvatten, classificeren of standaardteksten kan vaak prima op een goedkoper of open model. Bewaar het topmodel voor het echt complexe werk.
Houd de uitgang open. Bouw je processen zo dat je van model kunt wisselen zonder alles om te gooien: wie de broncode en data niet zelf bezit, zit vast zodra een leverancier de voorwaarden wijzigt.

Er zit wel een kanttekening aan de Chinese optie: bij datasoevereiniteit en AVG wil je goed weten waar je data heen gaat. Een open-weight model als MiniMax M3 dat je zelf self-hosted draait, of een Europees alternatief als Mistral, geeft je de kostenvoordelen zonder dat gevoelige data het land uit hoeft.

Bij AI-abonnementen geldt hetzelfde als bij SaaS-stacks waarvan de echte TCO pas zichtbaar wordt als je de abonnementen optelt: de echte rekening is bijna nooit het instapbedrag.

Veelgestelde vragen

AI Open-weight modellen Kostenbesparing Vendor lock-in Self-hosted AI-strategie MKB

AI-kosten lopen op: bedrijven wijken uit naar open source en Chinese modellen

Van vaste prijs naar de tikkende teller

Goedkoper hoeft niet slechter te zijn

Wat betekent dit voor jouw bedrijf

Veelgestelde vragen

Verken verder

In dit artikel

Thema's

Genoemde integraties

Gerelateerde artikelen

42 staten onderzoeken OpenAI: wat het zegt over leunen op ChatGPT

Open-weight of cloud-API: wat kost AI echt per miljoen tokens

Carney waarschuwt: Anthropic-ban legt risico van AI-afhankelijkheid bloot

Nadella waarschuwt: bouw je eigen AI-stack, leun niet op een paar modellen

Meta sluit zijn AI: Muse Spark blijft dicht en de open Llama-strategie sneuvelt

Zo bouw je een leverancier-onafhankelijke AI-stack