Microsoft Security publiceerde op 18 juni een eigen onderzoek naar een aanvalsketen die het AutoJack noemt. Het komt hierop neer: een AI-agent die zelfstandig webpagina's bezoekt, kan door een kwaadaardige pagina worden verleid om opdrachten uit te voeren op de computer waarop die agent draait. Geen phishingmail, geen kwaadaardige bijlage, alleen een link die de agent opent.
Het doelwit in het onderzoek is AutoGen Studio, de open-source ontwikkelinterface bij Microsofts eigen multi-agent-framework AutoGen. Maar wie de conclusie afdoet als een probleem van één tool, mist het punt. AutoJack laat een structurele zwakte zien in hoe AI-agenten met lokale diensten praten, en dat raakt iedereen die agenten zelf draait.
Hoe de aanval werkt
AutoJack koppelt drie fouten aan elkaar. Stuk voor stuk klein, samen genoeg voor volledige overname.
- Localhost als vals vertrouwen. De MCP-WebSocket van AutoGen Studio accepteert verbindingen van
127.0.0.1enlocalhost, in de veronderstelling dat dit kwaadwillende websites buitensluit. Maar een agent die lokaal draait, voldoet aan die check, ook als hij door een externe pagina wordt aangestuurd. - Authenticatie die wordt overgeslagen. De authenticatielaag sloeg de MCP-paden bewust over, ervan uitgaande dat de handler zelf tokens zou controleren. Dat gebeurde niet: de socket accepteerde onbeveiligde verbindingen, ongeacht de ingestelde authenticatiemodus.
- Opdrachten zonder filter. Het eindpunt nam een parameter aan, decodeerde die en gaf het commando rechtstreeks door aan het besturingssysteem, zonder lijst van toegestane programma's.
In de proof of concept voerde een onschuldige samenvattings-agent het programma calc.exe uit op het bureaublad van de ontwikkelaar, enkel doordat de agent een aanvallers-URL bezocht. Calc.exe is hier het onschuldige bewijs; op die plek had ook elk ander commando kunnen staan, uitgevoerd onder het account van de gebruiker.
Belangrijk: wie liep echt risico
Nuance is hier op zijn plaats, want paniek is niet nodig. De kwetsbare route zat nooit in de stabiele PyPI-release (0.4.2.2). Alleen pre-release ontwikkelbouwsels (0.4.3.dev1 en 0.4.3.dev2) en builds rechtstreeks van de main-branch droegen het lek. Microsoft dichtte het in commit b047730 voordat er een stabiele versie mee uitkwam, kende geen CVE toe en zag geen misbruik in het wild. Wie pip install autogenstudio gebruikt, kreeg altijd de veilige versie; wie van een ontwikkelbouwsel draait, haalt de main-branch op vanaf die hardening-commit of later.
Waarom dit groter is dan AutoGen Studio
De kern is een klassiek beveiligingsprobleem dat in het AI-tijdperk terugkeert: het verwarde-hulpje. Een agent heeft twee bevoegdheden die los van elkaar onschuldig zijn, browsen op het open web en praten met een bevoorrechte lokale dienst, maar samen gevaarlijk worden. De aanvaller heeft zelf geen toegang tot je machine; hij laat de agent, die dat vertrouwen wel heeft, het vuile werk doen.
De les die Microsoft zelf trekt is scherp: localhost is geen vertrouwensgrens zodra een agent niet-vertrouwde inhoud kan laden. Dat is precies het patroon dat dit jaar telkens terugkomt rond zelfgehoste AI-infrastructuur. De kritieke Langflow-kwetsbaarheid CVE-2026-5027 die actief werd misbruikt en de drie LiteLLM-lekken die gewone gebruikers admin-rechten en code-uitvoering op je AI-gateway gaven hebben dezelfde signatuur: een AI-component die te veel vertrouwt en te weinig controleert.
Wat betekent dit voor jou
Draai je AI-agenten zelf, eventueel met lokale MCP-diensten, dan zijn de bouwstenen van AutoJack ook in jouw opstelling mogelijk. Drie dingen die je nu kunt nalopen:
- Zet geen browsende agent op dezelfde machine als bevoorrechte lokale diensten. Scheid agenten die niet-vertrouwde inhoud verwerken in een aparte container of VM, en geef ze een account met minimale rechten.
- Authenticeer elk besturingsvlak, ook op localhost. Een dienst die alleen op je eigen machine luistert is niet automatisch veilig. Zet een allowlist op alles wat opdrachten kan uitvoeren.
- Maak het zichtbaar. Een agent die plots een systeemcommando start, moet een alarm afgaan. Het instellen van logging, budgetten en kill-switches om AI-agenten audit-ready te houden is geen luxe maar de basis, net als het systematisch hardenen van een zelfgehoste AI-gateway van standaardinstellingen naar productie-veilig.
AutoJack is geen incident om wakker van te liggen, maar wel een waarschuwing om serieus te nemen. De aantrekkingskracht van agenten is juist dat ze zelfstandig dingen doen, web bezoeken, tools aanroepen, code draaien. Diezelfde zelfstandigheid is het aanvalsoppervlak. Wie agenten in productie zet, ontwerpt vanaf dag één voor het scenario dat een agent precies datgene doet wat een aanvaller wil, en zorgt dat de schade dan klein blijft.
