OpenAI GPT-5.5 сопоставим с Claude Mythos по возможностям кибератак: Институт безопасности ИИ

Вкратце

  • GPT-5.5 может автономно выполнять сложные кибератаки, завершив симуляцию корпоративной сети из 32 шагов и взломав 12-часовую задачу по безопасности всего за 10 минут.
  • О offensive AI киберспособности быстро улучшаются среди разработчиков, при этом AISI предупреждает, что дальнейшие достижения могут последовать в быстром темпе.
  • Исследователи обнаружили jailbreak, полностью обходящий защитные барьеры GPT-5.5, что вызвало тревогу.

Агентство правительства Великобритании обнаружило, что новейшая модель искусственного интеллекта OpenAI может автономно выполнять сложные кибератаки — и что она взяла задачу обратного проектирования за чуть более 10 минут, тогда как у человека-эксперта по безопасности на это ушло примерно 12 часов. Институт безопасности ИИ (AISI), исследовательский орган в рамках Министерства науки, инноваций и технологий Великобритании, опубликовал в четверг результаты, показывающие, что GPT-5.5 — одна из самых сильных моделей, которые он оценивал по возможностям offensive cyber, примерно сравнимая с прославленным Claude Mythos от Anthropic. В отчёте говорится, что GPT-5.5 — вторая модель, которая прошла самый сложный тест AISI — симуляцию атаки на корпоративную сеть из 32 шагов под названием «Последние» — сделав это автономно в двух из десяти попыток. Первая модель, достигшая этого результата, — Claude Mythos Preview от Anthropic, которая прошла симуляцию в трёх из десяти попыток.

Симуляция корпоративной сети, созданная с помощью кибербезопасной компании SpecterOps, требует, чтобы агент связал разведку, кражу учетных данных, латеральное перемещение по нескольким лесам Active Directory, переключение цепочки поставок через CI/CD pipeline и, в конечном итоге, exfiltration защищенной внутренней базы данных — шаги, которые, по оценкам AISI, заняли бы у человека-эксперта около 20 часов.  Самым поразительным результатом стал очень сложный ребус обратного проектирования. GPT-5.5 решил задачу — которая требовала восстановления набора инструкций пользовательской виртуальной машины, написания дизассемблера с нуля и восстановления криптографического пароля через решение ограничений — за 10 минут и 22 секунды, потратив $1.73 на использование API. Человеческий эксперт, используя профессиональные инструменты, потребовал примерно 12 часов. На серии продвинутых задач по кибербезопасности AISI GPT-5.5 достиг среднего процента успешных решений 71,4% по самому сложному уровню «Эксперт», опередив Mythos Preview с 68,6% и значительно превзойдя GPT-5.4 с 52,4%.

Эти выводы имеют важные последствия для общего направления развития ИИ. AISI заключил, что производительность GPT-5.5 свидетельствует о быстром улучшении киберспособностей, которое может быть частью общего тренда, а не отдельным прорывом — и предупредил, что если offensive cyber навыки развиваются как побочный эффект более широкого прогресса в reasoning, coding и автономном выполнении задач, то дальнейшие достижения могут последовать в быстром темпе. В отчёте также были отмечены серьёзные опасения по поводу защитных барьеров модели. Исследователи обнаружили универсальный jailbreak, вызывающий вредоносный контент во всех тестируемых злонамеренных киберзапросах, включая многократные сессии с агентами. Для разработки этой атаки потребовалось шесть часов работы экспертов по red-teaming. После этого OpenAI обновила свою систему защиты, хотя из-за конфигурационной ошибки AISI не смогла проверить эффективность финальной версии. AISI предупредил, что оценки возможностей проводились в контролируемой исследовательской среде и не обязательно отражают то, что доступно обычному пользователю, отметив, что публичные развертывания включают дополнительные меры безопасности и контроль доступа. Этот отчёт выходит на фоне тревожных новостей для британской кибербезопасности. Ежегодное исследование по кибербезопасности и утечкам, опубликованное в тот же день, показало, что 43% компаний за последние 12 месяцев столкнулись с киберинцидентами или атаками. В ответ правительство объявило о выделении 90 миллионов фунтов стерлингов на новые меры по повышению киберустойчивости и продолжает работу над законом о кибербезопасности и устойчивости, чтобы защитить важнейшие услуги. Также опубликованы рекомендации, призывающие организации подготовиться к возможному росту новых уязвимостей программного обеспечения, поскольку ИИ ускоряет процесс обнаружения и использования уязвимостей.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить