AI-abonnementen worden snel duurder terwijl de prijs per token nauwelijks meedaalt. Steeds meer bedrijven schuiven routinetaken naar goedkopere open-weight of Chinese modellen om hun budget te rekken.
De rekening van AI begint pijn te doen. Waar grote labs als OpenAI en Anthropic klanten binnenhaalden met vlakke abonnementsprijzen, verschuift het model nu naar afrekenen per token, en dat gebruik schiet omhoog. Het probleem volgens Tom's Hardware: de kosten om AI via een abonnement te leveren stijgen gestaag, terwijl de daling van de prijs per token daar geen gelijke tred mee houdt. Het gevolg is een strategische heroverweging die ook voor Nederlandse organisaties relevant is.
Van vaste prijs naar de tikkende teller
Het kantelpunt zit in de verschuiving van flat-rate naar pay-as-you-go. Zolang je een vast bedrag per maand betaalde, was AI een voorspelbare kostenpost. Nu het per verbruik gaat en teams AI intensief inzetten, lopen rekeningen snel op tot bedragen die met salarissen te vergelijken zijn. Volgens Yahoo Finance putten engineers bij Microsoft hun jaarlijkse AI-budget binnen de eerste maanden van 2026 al uit op een enkele codeertool.
Dat verklaart waarom de zoektocht naar goedkopere alternatieven nu serieus wordt. Open-source modellen, waaronder Chinese, zijn volgens dezelfde berichtgeving tot dertig keer goedkoper dan de premium-opties van de grote labs.
Goedkoper hoeft niet slechter te zijn
De vrees is altijd dat je met een goedkoper model inlevert op kwaliteit. In de praktijk valt dat steeds vaker mee. Het juridische AI-bedrijf Harvey wist zijn inferentiekosten met een factor drie te verlagen zonder merkbaar kwaliteitsverlies, door werk te verschuiven naar een efficiënter open-weight model. Co-oprichter Gabe Pereyra vatte de verschuiving zo samen: kwaliteit komt eerst, maar de definitie van kwaliteit evolueert van altijd het krachtigste model gebruiken naar het beste model dat de klus efficiënt klaart.
Die beweging is breder. Coinbase-oprichter Brian Armstrong voorspelt dat binnen 12 tot 18 maanden 80% van de werklasten draait op modellen die 99% goedkoper zijn, en dat slechts een vijfde de nieuwste generatie echt nodig heeft.
Wat betekent dit voor jouw bedrijf
De les is niet dat je morgen je ChatGPT- of Copilot-abonnement moet opzeggen. De les is dat blind leunen op één dure leverancier een kostenrisico is geworden. Drie nuchtere stappen helpen:
- Meet je verbruik. Weet je eigenlijk hoeveel tokens je teams maandelijks gebruiken, en waaraan? Zonder dat inzicht stuur je blind.
- Splits je taken. Routinewerk zoals samenvatten, classificeren of standaardteksten kan vaak prima op een goedkoper of open model. Bewaar het topmodel voor het echt complexe werk.
- Houd de uitgang open. Bouw je processen zo dat je van model kunt wisselen zonder alles om te gooien: wie de broncode en data niet zelf bezit, zit vast zodra een leverancier de voorwaarden wijzigt.
Er zit wel een kanttekening aan de Chinese optie: bij datasoevereiniteit en AVG wil je goed weten waar je data heen gaat. Een open-weight model als MiniMax M3 dat je zelf self-hosted draait, of een Europees alternatief als Mistral, geeft je de kostenvoordelen zonder dat gevoelige data het land uit hoeft.
Bij AI-abonnementen geldt hetzelfde als bij SaaS-stacks waarvan de echte TCO pas zichtbaar wordt als je de abonnementen optelt: de echte rekening is bijna nooit het instapbedrag.
