2026-05-13
> Multi-agent AI-systeem van Microsoft klopt Mythos van Anthropic op cybersecurity-benchmark
MDASH, het nieuwe scansysteem van Microsoft, scoorde 88,45% op de CyberGym-benchmark voor cybersecurity en liet daarmee losse modellen als Mythos van Anthropic en GPT-5.5 van OpenAI achter zich. Het systeem laat ruim 100 gespecialiseerde AI-agents samenwerken, verdeeld over meerdere modellen: één set agents speurt code af op kwetsbaarheden, een volgende groep beoordeelt of een vondst echt misbruikt kan worden en een laatste stap bouwt proof-of-concept-exploits ter bevestiging. Microsoft gebruikte MDASH meteen om 16 nieuwe Windows-kwetsbaarheden te melden, waaronder vier kritieke remote-code-executionfouten die in de Patch Tuesday van mei zijn gedicht.
→ lees op externe site ↗