Bureau met smartphone en financiële grafieken

AI-kosten lopen op: bedrijven wijken uit naar open source en Chinese modellen

NieuwsAlisina NawabiAlisina Nawabi13 juni · 18:185 min leestijd

AI-abonnementen worden snel duurder terwijl de prijs per token nauwelijks meedaalt. Steeds meer bedrijven schuiven routinetaken naar goedkopere open-weight of Chinese modellen om hun budget te rekken.

De rekening van AI begint pijn te doen. Waar grote labs als OpenAI en Anthropic klanten binnenhaalden met vlakke abonnementsprijzen, verschuift het model nu naar afrekenen per token, en dat gebruik schiet omhoog. Het probleem volgens Tom's Hardware: de kosten om AI via een abonnement te leveren stijgen gestaag, terwijl de daling van de prijs per token daar geen gelijke tred mee houdt. Het gevolg is een strategische heroverweging die ook voor Nederlandse organisaties relevant is.

Van vaste prijs naar de tikkende teller

Het kantelpunt zit in de verschuiving van flat-rate naar pay-as-you-go. Zolang je een vast bedrag per maand betaalde, was AI een voorspelbare kostenpost. Nu het per verbruik gaat en teams AI intensief inzetten, lopen rekeningen snel op tot bedragen die met salarissen te vergelijken zijn. Volgens Yahoo Finance putten engineers bij Microsoft hun jaarlijkse AI-budget binnen de eerste maanden van 2026 al uit op een enkele codeertool.

Dat verklaart waarom de zoektocht naar goedkopere alternatieven nu serieus wordt. Open-source modellen, waaronder Chinese, zijn volgens dezelfde berichtgeving tot dertig keer goedkoper dan de premium-opties van de grote labs.

Goedkoper hoeft niet slechter te zijn

De vrees is altijd dat je met een goedkoper model inlevert op kwaliteit. In de praktijk valt dat steeds vaker mee. Het juridische AI-bedrijf Harvey wist zijn inferentiekosten met een factor drie te verlagen zonder merkbaar kwaliteitsverlies, door werk te verschuiven naar een efficiënter open-weight model. Co-oprichter Gabe Pereyra vatte de verschuiving zo samen: kwaliteit komt eerst, maar de definitie van kwaliteit evolueert van altijd het krachtigste model gebruiken naar het beste model dat de klus efficiënt klaart.

Die beweging is breder. Coinbase-oprichter Brian Armstrong voorspelt dat binnen 12 tot 18 maanden 80% van de werklasten draait op modellen die 99% goedkoper zijn, en dat slechts een vijfde de nieuwste generatie echt nodig heeft.

Wat betekent dit voor jouw bedrijf

De les is niet dat je morgen je ChatGPT- of Copilot-abonnement moet opzeggen. De les is dat blind leunen op één dure leverancier een kostenrisico is geworden. Drie nuchtere stappen helpen:

  • Meet je verbruik. Weet je eigenlijk hoeveel tokens je teams maandelijks gebruiken, en waaraan? Zonder dat inzicht stuur je blind.
  • Splits je taken. Routinewerk zoals samenvatten, classificeren of standaardteksten kan vaak prima op een goedkoper of open model. Bewaar het topmodel voor het echt complexe werk.
  • Houd de uitgang open. Bouw je processen zo dat je van model kunt wisselen zonder alles om te gooien: wie de broncode en data niet zelf bezit, zit vast zodra een leverancier de voorwaarden wijzigt.

Er zit wel een kanttekening aan de Chinese optie: bij datasoevereiniteit en AVG wil je goed weten waar je data heen gaat. Een open-weight model als MiniMax M3 dat je zelf self-hosted draait, of een Europees alternatief als Mistral, geeft je de kostenvoordelen zonder dat gevoelige data het land uit hoeft.

Bij AI-abonnementen geldt hetzelfde als bij SaaS-stacks waarvan de echte TCO pas zichtbaar wordt als je de abonnementen optelt: de echte rekening is bijna nooit het instapbedrag.

Veelgestelde vragen

Alisina Nawabi
Geschreven doorAlisina Nawabi

AI Product Engineer & Solutions Architect

Bij FLOH ontwerp en bouw ik complete software, integraties en AI op maat, van eerste idee tot werkend product, en jij blijft eigenaar. Hier schrijf ik nuchter over bouwen met AI en software voor ondernemers en organisaties.

Meer over mij

Genoemde integraties

Dit artikel noemt deze tools. Ik koppel ze op maat aan je eigen systemen.

Gerelateerde artikelen

42 staten onderzoeken OpenAI: wat het zegt over leunen op ChatGPTNieuws

42 staten onderzoeken OpenAI: wat het zegt over leunen op ChatGPT

Een coalitie van 42 Amerikaanse procureurs-generaal dagvaardde OpenAI over data, veiligheid en kwetsbare gebruikers. Geen aanklacht, wel een signaal over hoe afhankelijk je bedrijf wil zijn van een leverancier.

Lees artikel
Open-weight of cloud-API: wat kost AI echt per miljoen tokensArtikel

Open-weight of cloud-API: wat kost AI echt per miljoen tokens

Open-weight AI heet gratis, maar de rekening verhuist alleen: van een maandfactuur naar een GPU die dag en nacht stroom vreet. Ik reken voor wanneer self-hosting zich echt terugverdient en wanneer de cloud wint.

Lees artikel
Carney waarschuwt: Anthropic-ban legt risico van AI-afhankelijkheid blootNieuws

Carney waarschuwt: Anthropic-ban legt risico van AI-afhankelijkheid bloot

De Amerikaanse exportban op Anthropics Fable 5 en Mythos 5 maakt premier Carney tot een mondiale waarschuwing: leun niet op een paar AI-leveranciers. Hij vergelijkt het modelrisico met de kredietcrisis van 2008. Wat dit betekent voor jouw bedrijf.

Lees artikel
Nadella waarschuwt: bouw je eigen AI-stack, leun niet op een paar modellenNieuws

Nadella waarschuwt: bouw je eigen AI-stack, leun niet op een paar modellen

Microsoft-CEO Satya Nadella waarschuwt op X tegen een wereld waarin bedrijven hun waarde afstaan aan een handvol AI-modellen. Zijn advies: bouw een eigen agentic systeem rond je eigen kennis.

Lees artikel
Meta sluit zijn AI: Muse Spark blijft dicht en de open Llama-strategie sneuveltNieuws

Meta sluit zijn AI: Muse Spark blijft dicht en de open Llama-strategie sneuvelt

Een jaar na de miljardendeal met Alexandr Wang erkent Meta dat zijn open-source aanpak niet meer werkt. Muse Spark blijft gesloten. Wie Llama als vendor-neutraal alternatief had ingepland, moet nu opnieuw rekenen.

Lees artikel
Zo bouw je een leverancier-onafhankelijke AI-stackGids

Zo bouw je een leverancier-onafhankelijke AI-stack

Eén AI-leverancier die zijn prijzen verhoogt of een model offline haalt, kan je operatie platleggen. Ik laat je een dunne routerlaag bouwen met open-weight achtervang en budgetbewaking, zodat je nooit aan één aanbieder vastzit.

Lees artikel