Hoog kantoorgebouw met het Microsoft-logo bovenop

Microsoft overweegt DeepSeek V4 als goedkoper alternatief voor Claude in Copilot Cowork

NieuwsAlisina NawabiAlisina Nawabi16 juni · 22:125 min leestijd

Microsoft onderzoekt een zelf-gehoste, bijgestelde versie van DeepSeek V4 als goedkopere motor onder Copilot Cowork, naast het dure Claude van Anthropic. Een keuze met gevolgen voor je AI-kosten en je modelafhankelijkheid.

Microsoft kijkt naar een opvallende manier om de kosten van zijn AI-assistent te drukken: het bedrijf overweegt een zelf-gehoste, bijgestelde versie van het Chinese DeepSeek V4 in te zetten als goedkoper alternatief voor de Claude-modellen van Anthropic die nu onder Copilot Cowork draaien. Het is nog geen besluit, maar het signaal is duidelijk. Zelfs de grootste softwareleverancier ter wereld zoekt naar manieren om de rekening van agentic AI beheersbaar te houden, en kijkt daarvoor naar open-weight modellen uit China.

Wat Microsoft precies overweegt

Copilot Cowork is de versie van Copilot die taken niet alleen bedenkt maar ook daadwerkelijk uitvoert, iets dat Copilot Cowork onderscheidt van een gewone chatbot: het voert taken ook daadwerkelijk uit. Die agentic aanpak leunt zwaar op Claude en verbruikt in hoog tempo tokens, en daar wringt het. Microsoft heeft naar verluidt al een bijgestelde versie van DeepSeek V4 klaar, volledig gehost op Azure met waarborgen tegen vertekening. Het model zou optioneel zijn voor klanten, en de data zou binnen de eigen cloudomgeving van Microsoft blijven, onder dezelfde beveiligings- en compliancecontroles als de rest van Azure. Een definitieve keuze wordt binnen enkele weken verwacht.

Belangrijk om te benadrukken: het gaat om een fijn-afgesteld, zelf-gehost model, niet om een directe lijn naar servers in China. Dat onderscheid bepaalt voor veel organisaties of zo'n optie überhaupt bespreekbaar is.

Waarom: de rekening van agentic AI loopt op

De aanleiding is geld. Microsoft schakelt Copilot Cowork over op een prijs per verbruik, een verschuiving die grote gevolgen heeft: Copilot Cowork rekent nu af per verbruik via Copilot Credits, en dat is voor Microsoft de eerste echte breuk met het vaste abonnement in twintig jaar. Een vast tarief houdt geen stand, legt Copilot-topman Charles Lamanna uit, omdat sommige gebruikers honderden taken per week draaien en de kosten daardoor hard oplopen. Dat is op zich goed nieuws, die mensen zijn juist productief, maar bij een model dat per token rekent loopt de meter snel vol.

Een goedkoper modeloptie naast Claude is dan een logische zet. Microsoft deed eerder dit jaar iets vergelijkbaars met GitHub Copilot, dat ook overstapte op afrekenen per token. CEO Satya Nadella schetst intussen een toekomst waarin bedrijven zelf modellen kiezen en bijstellen per gebruik en per budget, en waarin het succes van AI draait om intensief gebruik, niet om het aantal licenties.

Een Chinees model in je Microsoft-stack

Hier zit de gevoelige kant. DeepSeek is een Chinese AI-aanbieder, en een Chinees model als motor onder een westers enterprise-product zal kritiek oproepen, zeker in de Verenigde Staten. Microsoft kadert het als een keuze: optioneel, op Azure, met de data binnen de eigen omgeving. Maar voor een inkoper blijft het een afweging die verder gaat dan alleen prijs en prestaties, ook herkomst, toeleveringsketen en compliance spelen mee.

DeepSeek zelf staat er sterker voor dan ooit. Het bedrijf haalde recent voor het eerst extern kapitaal op, ruim 7 miljard dollar bij een waardering boven de 50 miljard dollar. Dat een speler als Microsoft nu zijn modellen serieus overweegt, laat zien hoe snel open-weight AI uit China volwassen wordt.

Wat dit betekent voor jouw bedrijf

Deze stap past in een bredere beweging: oplopende AI-abonnementskosten drijven bedrijven naar open-source en Chinese modellen. Als zelfs Microsoft de motor onder Copilot wil kunnen wisselen om kosten te drukken, dan is de les voor het MKB en grotere organisaties duidelijk: een AI-product is niet één onlosmakelijk geheel, maar een laag waarvan je het model eronder kunt kiezen.

Drie dingen om mee te nemen. Eén: reken bij agentic AI op verbruik, niet op een vast bedrag, en houd in de gaten wie in je organisatie de zwaarste taken draait. Twee: vraag bij elke AI-leverancier wélk model er onder de motorkap zit, waar het draait en of je kunt wisselen, want dat bepaalt je kosten én je afhankelijkheid. Drie: de keuze tussen een Amerikaans, een Chinees of een Europees model is niet alleen technisch maar ook strategisch, met soevereiniteit en compliance erbij.

Wie nu nadenkt over welk model bij welke taak past, wat er self-hosted kan en hoe je wisselbaarheid inbouwt, staat straks sterker dan wie simpelweg betaalt wat er standaard wordt aangeboden.

Veelgestelde vragen

Alisina Nawabi
Geschreven doorAlisina Nawabi

AI Product Engineer & Solutions Architect

Bij FLOH ontwerp en bouw ik complete software, integraties en AI op maat, van eerste idee tot werkend product, en jij blijft eigenaar. Hier schrijf ik nuchter over bouwen met AI en software voor ondernemers en organisaties.

Meer over mij

Genoemde integraties

Dit artikel noemt deze tools. Ik koppel ze op maat aan je eigen systemen.

Gerelateerde artikelen

Open-weight of cloud-API: wat kost AI echt per miljoen tokensArtikel

Open-weight of cloud-API: wat kost AI echt per miljoen tokens

Open-weight AI heet gratis, maar de rekening verhuist alleen: van een maandfactuur naar een GPU die dag en nacht stroom vreet. Ik reken voor wanneer self-hosting zich echt terugverdient en wanneer de cloud wint.

Lees artikel
Microsoft lanceert eigen AI-modellen, en waarom dat goed nieuws is voor het MKBNieuws

Microsoft lanceert eigen AI-modellen, en waarom dat goed nieuws is voor het MKB

Microsoft onthulde op Build 2026 zeven eigen MAI-modellen om minder afhankelijk te worden van OpenAI, met de claim tot tien keer goedkoper te zijn. We duiden het feit en wat het concreet betekent voor jouw bedrijf.

Lees artikel
Zo bouw je een leverancier-onafhankelijke AI-stackGids

Zo bouw je een leverancier-onafhankelijke AI-stack

Eén AI-leverancier die zijn prijzen verhoogt of een model offline haalt, kan je operatie platleggen. Ik laat je een dunne routerlaag bouwen met open-weight achtervang en budgetbewaking, zodat je nooit aan één aanbieder vastzit.

Lees artikel
GLM-5.2 klopt GPT-5.5 op coding, en kost een zesdeNieuws

GLM-5.2 klopt GPT-5.5 op coding, en kost een zesde

Het open-weight model GLM-5.2 van Z.ai verslaat GPT-5.5 op meerdere langlopende coding-benchmarks tegen ongeveer een zesde van de prijs. Wat dat betekent voor jouw AI-codeerkosten.

Lees artikel
Microsoft Copilot Cowork is nu algemeen beschikbaar, met een prijs per verbruikNieuws

Microsoft Copilot Cowork is nu algemeen beschikbaar, met een prijs per verbruik

Microsoft zet Copilot Cowork wereldwijd open voor alle Microsoft 365 Copilot-klanten. De grote verandering zit in de prijs: je betaalt per verbruik in Copilot Credits, voor Microsoft de eerste prijsbreuk in zo'n twintig jaar.

Lees artikel
Digitale soevereiniteit is risicobeheer, geen politiekArtikel

Digitale soevereiniteit is risicobeheer, geen politiek

Soevereiniteit wordt gevoerd als een principekwestie over Amerika en Big Tech. Daardoor schuift de nuchtere ondernemer het weg. Onterecht: waar je data staat en van wie je software is, is gewoon een bedrijfsrisico.

Lees artikel