Amazon onderzoekt of het zijn zelfontworpen Trainium-AI-chips rechtstreeks aan andere datacenters kan verkopen, in plaats van ze uitsluitend via de cloud van AWS te verhuren. Dat bevestigde Peter DeSantis, de Amazon-topman die de chip-, AI- en quantumdivisie aanstuurt, in gesprekken die deze week naar buiten kwamen. Het is een opvallende koerswijziging: jarenlang weigerde Amazon zijn silicium los te verkopen. Nu mikt het bedrijf op precies de klanten die tot nu toe vrijwel automatisch bij Nvidia terechtkwamen.
Wat Amazon precies van plan is
De plannen zitten nog in een vroege fase en Amazon noemt geen namen van mogelijke kopers. De richting is wel duidelijk. Amazon ontwerpt zijn Trainium-chips zelf via dochteronderneming Annapurna Labs en wil nu hele serverracks aan derden gaan leveren, niet alleen rekentijd in zijn eigen datacenters. DeSantis vatte de logica zo samen: "we kijken constant naar manieren om bij meer klanten te komen". Over het risico dat Amazon daarmee zijn eigen clouddienst kannibaliseert, zei hij nuchter dat er nog zo veel onderbenutting in AI zit dat hij er niet wakker van ligt.
Amazon staat hierin niet alleen. Ook Google kondigde onlangs aan zijn eigen chips aan geselecteerde externe datacenters te willen verkopen. De twee grootste cloudpartijen proberen hun maatwerksilicium dus van een interne kostenpost om te bouwen tot een product op zich.
50 miljard dollar en een orderboek dat al vol zit
De ambitie is geen voetnoot. CEO Andy Jassy schetste de omvang in zijn aandeelhoudersbrief van april: als de chipdivisie een zelfstandig bedrijf zou zijn dat dit jaar aan AWS en aan derden zou leveren, zou de jaaromzet op een tempo van ongeveer 50 miljard dollar liggen. Vandaag draait de chiptak (Trainium, Graviton en Nitro samen) op zo'n 20 miljard dollar. Het orderboek voor Trainium alleen zou inmiddels meer dan 225 miljard dollar aan toezeggingen bevatten.
Dat de vraag de aanbod ruim overtreft, blijkt uit de capaciteit. De derde generatie Trainium kwam recent beschikbaar en is grotendeels uitverkocht. De vierde generatie, die volgend jaar arriveert, kent nu al sterke belangstelling. Een chip die je niet eens aan je eigen cloudklanten kunt leveren, ga je niet lichtvaardig extern verkopen, dus de signaalwaarde van deze stap is groot.
Waarom dit Nvidia raakt
Nvidia controleert grofweg vier vijfde van de markt voor AI-versnellers. Die dominantie vertaalt zich in hoge prijzen, lange wachtlijsten en een softwarelaag (CUDA) waar de hele sector aan vastzit. Elke serieuze alternatieve leverancier knabbelt aan die machtspositie. Amazon heeft een geloofwaardig verhaal: het is, in de woorden van DeSantis, een van de weinige partijen die een chip kan ontwerpen, de fysieke eigenschappen ervan kan bepalen en hem ook daadwerkelijk laat produceren.
De belangrijkste referentieklant zit al binnen. Anthropic traint Claude op een Trainium-cluster van bijna een half miljoen chips en zegde meer dan 100 miljard dollar aan AWS-capaciteit toe, met ingenieurs die bijna dagelijks meedenken over het chipontwerp. Dat is het levende bewijs dat je een frontier-model niet per se op Nvidia hoeft te draaien. Hoe zwaar de modelmakers leunen op schaarse rekenkracht bleek eerder ook uit de strategische compute-alliantie tussen Anthropic en SpaceX om aan voldoende rekencapaciteit te komen.
Wat betekent dit voor jou
Als ondernemer of organisatie koop je geen AI-chips, maar je betaalt wel de rekening die eruit voortkomt: de prijs per miljoen tokens, de kosten van je API-abonnement, de marge die je AI-leverancier doorberekent. Meer concurrentie onder de Nvidia is op termijn goed nieuws, want het drukt precies die rekenkosten en vergroot je keuze in wie je AI-infrastructuur levert. Dat sluit aan op de bredere beweging waarin de oplopende kosten van AI bedrijven richting open source en goedkopere modellen duwen.
Tegelijk is meer leveranciers niet hetzelfde als meer vrijheid. Trainium draait op Amazons eigen softwarestack, niet op CUDA, dus wie ervoor kiest ruilt de ene afhankelijkheid mogelijk in voor de andere. De winst zit niet in blind overstappen, maar in het kunnen vergelijken: weten wat een werklast écht kost op verschillende stacks, zoals het rekensommetje van open-weight modellen zelf draaien tegenover een cloud-API per miljoen tokens laat zien. Hoe meer geloofwaardige alternatieven voor Nvidia ontstaan, hoe meer onderhandelingsruimte je krijgt, mits je je eigen kostenstructuur scherp genoeg kent om die ruimte te benutten.

