AgentFlow автоматически создает многопользовательскую систему для обнаружения уязвимостей нулевого дня в обходе песочницы Chrome

Согласно мониторингу Dongcha Beating, команда UCSB под руководством Фенга Ю, в сотрудничестве с fuzz.land и другими организациями, предложила AgentFlow — автоматический синтез многоагентных систем (программ, которые управляют ролями агентов, передачей информации, распределением инструментов и логикой повторных попыток) для обнаружения уязвимостей. В статье отмечается, что при неизменной модели простое изменение системы управления может значительно повысить показатели успеха, однако существующие решения в основном пишутся вручную или ищут только локальные пространства проектирования. AgentFlow использует типизированный графический DSL для объединения пяти аспектов системы (ролей, топологии, шаблонов сообщений, привязки инструментов и протоколов координации) в редактируемую графическую программу, позволяя одновременно изменять агентов, топологию, подсказки и набор инструментов за один шаг. Внешний цикл выявляет точки сбоя по сигналам выполнения, таким как покрытие целевой программы и отчеты санитайзеров, заменяя бинарную обратную связь pass/fail. На TerminalBench-2, в сочетании с Claude Opus 4.6, достигнута успешность 84,3% (75/89), что является наивысшим результатом в своей категории на этом рейтинге. В кодовой базе Chrome (35 миллионов строк C/C++) система синтезировала систему с 18 ролями и примерно 210 агентами, включая 7 подсистемных анализаторов, 192 параллельных исследователя и четырехступенчатую систему классификации сбоев, где специальные агенты, такие как Crash Filter и Root Cause Analyzer, устраняют дублирование с помощью уникальных подписей сбоев ASAN. Запустив модель Kimi K2.5 с открытым исходным кодом на 192 H100 в течение 7 дней, она обнаружила 10 нулевых дней уязвимостей, все подтвержденные VRP Chrome. Шесть из них получили номера CVE, охватывая WebCodecs, Proxy, Network, Codecs и Rendering, с типами, включая UAF, переполнение целого числа и переполнение буфера в куче, среди которых CVE-2026-5280 и CVE-2026-6297 являются критическими уровнями для обхода песочницы. Соучредитель fuzz.land Шоу Чаофан заявил, что некоторые уязвимости были изначально обнаружены с помощью MiniMax M2.5, который вместе с Opus 4.6 способен находить большинство уязвимостей. AgentFlow был открыт как проект с открытым исходным кодом.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить