Microsoft onderzoekt een zelf-gehoste, bijgestelde versie van DeepSeek V4 als goedkopere motor onder Copilot Cowork, naast het dure Claude van Anthropic. Een keuze met gevolgen voor je AI-kosten en je modelafhankelijkheid.
Microsoft kijkt naar een opvallende manier om de kosten van zijn AI-assistent te drukken: het bedrijf overweegt een zelf-gehoste, bijgestelde versie van het Chinese DeepSeek V4 in te zetten als goedkoper alternatief voor de Claude-modellen van Anthropic die nu onder Copilot Cowork draaien. Het is nog geen besluit, maar het signaal is duidelijk. Zelfs de grootste softwareleverancier ter wereld zoekt naar manieren om de rekening van agentic AI beheersbaar te houden, en kijkt daarvoor naar open-weight modellen uit China.
Wat Microsoft precies overweegt
Copilot Cowork is de versie van Copilot die taken niet alleen bedenkt maar ook daadwerkelijk uitvoert, iets dat Copilot Cowork onderscheidt van een gewone chatbot: het voert taken ook daadwerkelijk uit. Die agentic aanpak leunt zwaar op Claude en verbruikt in hoog tempo tokens, en daar wringt het. Microsoft heeft naar verluidt al een bijgestelde versie van DeepSeek V4 klaar, volledig gehost op Azure met waarborgen tegen vertekening. Het model zou optioneel zijn voor klanten, en de data zou binnen de eigen cloudomgeving van Microsoft blijven, onder dezelfde beveiligings- en compliancecontroles als de rest van Azure. Een definitieve keuze wordt binnen enkele weken verwacht.
Belangrijk om te benadrukken: het gaat om een fijn-afgesteld, zelf-gehost model, niet om een directe lijn naar servers in China. Dat onderscheid bepaalt voor veel organisaties of zo'n optie überhaupt bespreekbaar is.
Waarom: de rekening van agentic AI loopt op
De aanleiding is geld. Microsoft schakelt Copilot Cowork over op een prijs per verbruik, een verschuiving die grote gevolgen heeft: Copilot Cowork rekent nu af per verbruik via Copilot Credits, en dat is voor Microsoft de eerste echte breuk met het vaste abonnement in twintig jaar. Een vast tarief houdt geen stand, legt Copilot-topman Charles Lamanna uit, omdat sommige gebruikers honderden taken per week draaien en de kosten daardoor hard oplopen. Dat is op zich goed nieuws, die mensen zijn juist productief, maar bij een model dat per token rekent loopt de meter snel vol.
Een goedkoper modeloptie naast Claude is dan een logische zet. Microsoft deed eerder dit jaar iets vergelijkbaars met GitHub Copilot, dat ook overstapte op afrekenen per token. CEO Satya Nadella schetst intussen een toekomst waarin bedrijven zelf modellen kiezen en bijstellen per gebruik en per budget, en waarin het succes van AI draait om intensief gebruik, niet om het aantal licenties.
Een Chinees model in je Microsoft-stack
Hier zit de gevoelige kant. DeepSeek is een Chinese AI-aanbieder, en een Chinees model als motor onder een westers enterprise-product zal kritiek oproepen, zeker in de Verenigde Staten. Microsoft kadert het als een keuze: optioneel, op Azure, met de data binnen de eigen omgeving. Maar voor een inkoper blijft het een afweging die verder gaat dan alleen prijs en prestaties, ook herkomst, toeleveringsketen en compliance spelen mee.
DeepSeek zelf staat er sterker voor dan ooit. Het bedrijf haalde recent voor het eerst extern kapitaal op, ruim 7 miljard dollar bij een waardering boven de 50 miljard dollar. Dat een speler als Microsoft nu zijn modellen serieus overweegt, laat zien hoe snel open-weight AI uit China volwassen wordt.
Wat dit betekent voor jouw bedrijf
Deze stap past in een bredere beweging: oplopende AI-abonnementskosten drijven bedrijven naar open-source en Chinese modellen. Als zelfs Microsoft de motor onder Copilot wil kunnen wisselen om kosten te drukken, dan is de les voor het MKB en grotere organisaties duidelijk: een AI-product is niet één onlosmakelijk geheel, maar een laag waarvan je het model eronder kunt kiezen.
Drie dingen om mee te nemen. Eén: reken bij agentic AI op verbruik, niet op een vast bedrag, en houd in de gaten wie in je organisatie de zwaarste taken draait. Twee: vraag bij elke AI-leverancier wélk model er onder de motorkap zit, waar het draait en of je kunt wisselen, want dat bepaalt je kosten én je afhankelijkheid. Drie: de keuze tussen een Amerikaans, een Chinees of een Europees model is niet alleen technisch maar ook strategisch, met soevereiniteit en compliance erbij.
Wie nu nadenkt over welk model bij welke taak past, wat er self-hosted kan en hoe je wisselbaarheid inbouwt, staat straks sterker dan wie simpelweg betaalt wat er standaard wordt aangeboden.
