Het Amerikaanse Baseten haalt naar verluidt 1,5 miljard dollar op, bij een waardering die oploopt tot 13 miljard. Het bedrijf bouwt geen eigen AI-modellen, maar de infrastructuur eromheen: het draait open-source modellen voor andere bedrijven en stuurt elke vraag naar het model dat de klus het goedkoopst en snelst klaart. Dat een inference-bedrijf nu zo'n waardering krijgt, zegt iets groters dan het bedrag zelf. Het draaien van open modellen wordt volwassen, en daarmee een serieus alternatief voor de dure API's van OpenAI en Anthropic.
Wat Baseten precies doet
Inference is het draaien van een getraind model in productie: elke keer dat een chatbot antwoordt of code wordt aangevuld, is dat een inference-aanvraag. Baseten optimaliseert dat proces over GPU's in meerdere clouds, met versiebeheer, observability en automatische uitrol. De kern van het verhaal: het bedrijf zet vooral in op open-source modellen en routeert verkeer naar het model dat per taak het beste presteert, vaak een goedkoper open alternatief in plaats van een gesloten topmodel. Het Wall Street Journal omschrijft Baseten als een weddenschap op goedkopere alternatieven voor OpenAI en Anthropic. Onder druk van de kosten kiezen afnemers steeds vaker voor dat open alternatief: één klant meldde dertig procent lagere kosten dan met closed-source modellen.
Bijna zes keer meer waard in een jaar
De ronde past in wat investeerders de inference gold rush noemen: kapitaal verschuift van het trainen van modellen naar het draaien ervan op schaal. Baseten ging in minder dan een jaar van een waardering van ongeveer 2 miljard dollar (september 2025) naar 5 miljard in januari en nu tot 13 miljard. De huidige ronde is split-priced: een deel van de investeerders stapt in op 11 miljard, het kopcijfer is 13 miljard. Nvidia stak in januari 150 miljoen dollar in Baseten, samen met onder meer Googles groeifonds CapitalG, een teken hoe hard chipmakers en cloudpartijen op deze laag inzetten. De geannualiseerde omzet groeide naar verluidt van ongeveer 200 miljoen naar 600 miljoen dollar.
Wat betekent dit voor jou
Voor een Nederlands bedrijf is de les niet de durfkapitaal-poker, maar de richting. Tot voor kort was de keuze grofweg: een dure gesloten API van OpenAI of Anthropic, of zelf open modellen op je eigen GPU's draaien. Die tweede route klinkt goedkoper, maar zodra je GPU-leegloop, beheer en piekcapaciteit meerekent valt zelf hosten vaak duurder uit dan een cloud-API. Managed inference zoals Baseten zit daar precies tussenin: je krijgt de lagere prijs van open modellen zonder zelf servers te beheren.
Het strategische voordeel zit in onafhankelijkheid. Een AI-stack waarin je modellen kunt wisselen zonder je code te herschrijven maakt je minder afhankelijk van één leverancier en diens prijslijst. Het is dezelfde beweging waarin steeds meer bedrijven uitwijken naar open-source en Chinese modellen om oplopende AI-kosten te drukken.
Een waardering van 13 miljard voor een bedrijf dat zelf geen model maakt, is het duidelijkste signaal tot nu toe dat de echte slag niet om het grootste model gaat, maar om wie het goedkoopst en betrouwbaarst draait. Wie nu vastzit aan één dure API, doet er goed aan die afhankelijkheid te toetsen voordat de rekening verder oploopt.

