Op 1 juni 2026 verscheen MiniMax M3, een open-weight model dat de grote betaalde diensten benadert. Wat betekent open-weight en self-hosted voor jouw bedrijf, en waarom je altijd de licentie moet lezen.
Op 1 juni 2026 lanceerde het Chinese MiniMax zijn nieuwe model M3. Het opvallende: het is een open-weight model dat qua codeer- en agent-prestaties in de buurt komt van de grote betaalde modellen, met een contextvenster van een miljoen tokens en native ondersteuning voor beeld en video. Voor een MKB-team klinkt dat misschien als techniek van een andere planeet. Toch raakt deze release een vraag die ik bij klanten steeds vaker hoor: moet ik mijn AI per se bij een Amerikaanse cloudgigant afnemen, of kan ik het zelf draaien? Ik gebruik dit nieuws als kapstok om uit te leggen wat open-weight modellen zijn, waarom ze interessant zijn voor het MKB, en waar de adder onder het gras zit.
Wat is er aangekondigd
MiniMax bracht M3 uit op 1 juni 2026. Volgens het bedrijf is het het eerste open-weight model dat topprestaties op coderen, een contextvenster van 1 miljoen tokens en native multimodaliteit (beeld en video) in één model combineert. Op de codeer-benchmark SWE-Bench Pro haalt M3 een score van 59,0%, waarmee het volgens MiniMax voorbij GPT-5.5 en Gemini 3.1 Pro gaat en Opus 4.7 benadert.
De winst zit in een nieuwe aandachtsarchitectuur, MSA (MiniMax Sparse Attention). Daardoor zou M3 bij een contextvenster van 1 miljoen tokens nog maar een twintigste van de rekenkracht per token kosten vergeleken met de vorige generatie. In gewone taal: hele documenten of codebases verwerken wordt fors goedkoper.
Eén nuance: bij de lancering was de API meteen live, maar de modelgewichten en het technische rapport zouden pas binnen tien dagen volgen. En de trainingscode en inference-operators heeft MiniMax niet vrijgegeven. Verschillende media wijzen er daarom terecht op dat M3 strikt genomen nog niet 'volledig open source' is. Het is open-weight: je krijgt de gewichten, niet het hele recept.
Open-weight versus open source
Even de begrippen scherp, want hier zit veel verwarring.
- Gesloten model. Je gebruikt het via een API. Je data gaat naar hun servers, je betaalt per gebruik, en je kunt het niet zelf draaien.
- Open-weight model. De aanbieder publiceert de getrainde gewichten. Je mag het downloaden en op je eigen infrastructuur draaien. Je weet alleen niet precies hóe het getraind is.
- Open source model. Ook de trainingscode en aanpak zijn openbaar. Volledige reproduceerbaarheid.
Voor het MKB telt vooral het verschil tussen gesloten en open-weight. Een open-weight model kun je namelijk self-hosted draaien: op je eigen server of bij een Europese hostingpartij. Daar wordt het interessant.
Waarom self-hosted aantrekkelijk is voor het MKB
Ik bouw voor klanten vaak bewust self-hosted. Drie redenen.
Controle. Bij een gesloten API ben je afhankelijk: prijswijzigingen, een model dat plotseling verandert of verdwijnt, of een dienst die in jouw regio stopt. Draai je het model zelf, dan bepaal jij wanneer je upgradet. Wat vandaag werkt, werkt morgen nog precies zo.
Privacy. Voor veel Nederlandse bedrijven de doorslaggevende factor. Verwerk je klantgegevens, contracten of personeelsdossiers? Dan wil je niet dat die data standaard naar een server buiten de EU gaat. Draai je het model zelf, dan blijft de data binnen je eigen omgeving. Dat maakt het gesprek met je AVG-verantwoordelijke een stuk korter.
Kosten. Bij een API betaal je per token, en bij intensief gebruik tikt dat hard aan. Een eigen model draait op vaste infrastructuurkosten. Bij voorspelbaar, hoog gebruik (een chatbot op je eigen data, een verwerkingspijplijn die de hele dag draait) kan self-hosted fors goedkoper zijn. Juist de efficiëntiewinst die MiniMax claimt, maakt die sommen aantrekkelijker.
De adder onder het gras: lees de licentie
Want 'open' is niet altijd wat het lijkt. MiniMax leverde eerder dit jaar een leerzaam voorbeeld. Het bracht model M2.7 uit onder de zeer vrije MIT-licentie, die commercieel gebruik volledig toestaat. Kort daarna paste het bedrijf via een stille aanpassing in de repository de licentie aan: commercieel gebruik vereist sindsdien schriftelijke toestemming. Onderzoek en hobbyprojecten bleven vrij, zakelijke inzet niet meer zomaar. De community sprak van 'schijn-open-source'.
De les is niet dat open-weight onbetrouwbaar is. De les is dat 'open' een spectrum is en dat de licentie bepaalt wat je er écht mee mag. Het maakt een wereld van verschil of een model onder Apache 2.0 of MIT valt (vrij commercieel gebruik) of onder een eigen licentie met beperkingen. Dat hoort tot de basiscontrole vóórdat je iets in productie zet.
Dit is precies het soort afweging waarbij maatwerk loont. Het juiste model kiezen, de licentie checken, het veilig self-hosted draaien en netjes koppelen aan je bestaande systemen: dat is geen knip-en-plakwerk, dat is engineering. Met slim werken, loont hard werken.
Wat betekent dit voor jou
Je hoeft geen eigen AI-lab op te tuigen. Maar de keuze is niet langer 'wel of geen AI', en ook niet 'altijd de grootste Amerikaanse aanbieder'. Concreet zou ik dit meenemen:
- Verwerk je gevoelige data? Dan is een self-hosted, open-weight aanpak het overwegen waard, juist vanwege privacy en controle.
- Heb je voorspelbaar, intensief gebruik? Reken een gesloten API af tegen een eigen opstelling. Het omslagpunt komt sneller dan je denkt.
- Check altijd de licentie. Open-weight is niet automatisch vrij voor commercieel gebruik. Lees wat er staat, of laat iemand het voor je doen.
Geen blackbox, geen vendor lock-in, maar een bewuste keuze die je technisch en juridisch in eigen hand houdt.
