GPT-5.5 của OpenAI Sánh Vai với Claude Mythos về Khả năng Tấn công Mạng: Viện An ninh Trí tuệ Nhân tạo

Tóm tắt ngắn gọn

  • GPT-5.5 có thể tự động thực hiện các cuộc tấn công mạng tinh vi, hoàn thành một mô phỏng mạng doanh nghiệp gồm 32 bước và phá vỡ một câu đố an ninh kéo dài 12 giờ chỉ trong 10 phút.
  • Khả năng tấn công AI đang ngày càng cải thiện nhanh chóng trên các nhà phát triển, với cảnh báo của AISI rằng các tiến bộ tiếp theo có thể đến liên tiếp.
  • Các nhà nghiên cứu đã phát hiện ra một lỗ hổng jailbreak hoàn toàn vượt qua các rào cản an toàn của GPT-5.5, gây lo ngại.

Một cơ quan chính phủ Vương quốc Anh đã phát hiện ra rằng mô hình trí tuệ nhân tạo mới nhất của OpenAI có thể tự động thực hiện các cuộc tấn công mạng phức tạp—và nó đã phá vỡ một thử thách đảo ngược trong chưa đầy 10 phút, trong khi một chuyên gia an ninh con người mất khoảng 12 giờ. Viện An ninh AI (AISI), một tổ chức nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ của Anh, đã công bố kết quả vào thứ Năm cho thấy GPT-5.5 nằm trong số các mô hình mạnh nhất mà họ đã đánh giá về khả năng tấn công mạng, gần như ngang bằng với Claude Mythos của Anthropic. Báo cáo cho biết GPT-5.5 là mô hình thứ hai hoàn thành bài kiểm tra khắt khe nhất của AISI—một cuộc tấn công mô phỏng mạng doanh nghiệp gồm 32 bước gọi là “The Last Ones”—tự động trong hai trong mười lần thử. Mô hình đầu tiên đạt thành tích này là Claude Mythos Preview của Anthropic, hoàn thành mô phỏng trong ba trong mười lần thử.

Mô phỏng mạng doanh nghiệp, được xây dựng cùng công ty an ninh mạng SpecterOps, yêu cầu một tác nhân kết nối các bước trinh sát, đánh cắp thông tin xác thực, di chuyển ngang qua nhiều rừng Active Directory, một bước chuyển hướng chuỗi cung ứng qua pipeline CI/CD, và cuối cùng là rút trích dữ liệu từ một cơ sở dữ liệu nội bộ được bảo vệ—các bước mà AISI ước tính mất khoảng 20 giờ cho một chuyên gia con người.  Có lẽ kết quả ấn tượng nhất là một câu đố đảo ngược cực kỳ khó khăn. GPT-5.5 đã giải quyết thử thách—đòi hỏi phải tái tạo bộ lệnh của một máy ảo tùy chỉnh, viết một trình phân tích mã từ đầu, và khôi phục mật khẩu mã hóa thông qua giải pháp ràng buộc—in 10 phút 22 giây, với chi phí 1,73 đô la Mỹ cho việc sử dụng API. Một chuyên gia con người, sử dụng các công cụ chuyên nghiệp, cần khoảng 12 giờ. Trong loạt các nhiệm vụ an ninh mạng nâng cao của AISI, GPT-5.5 đạt tỷ lệ thành công trung bình 71,4% trên cấp độ “Chuyên gia” khó nhất, vượt xa Mythos Preview với 68,6% và vượt trội rõ rệt so với GPT-5.4 với 52,4%.

Các phát hiện này mang ý nghĩa rõ ràng về hướng phát triển của AI. AISI kết luận rằng hiệu suất của GPT-5.5 cho thấy sự cải thiện nhanh chóng về khả năng tấn công mạng có thể là một xu hướng chung thay vì một bước đột phá đơn lẻ—và cảnh báo rằng nếu kỹ năng tấn công mạng có thể xuất hiện như một sản phẩm phụ của sự tiến bộ trong lý luận, lập trình và hoàn thành nhiệm vụ tự động, thì các tiến bộ tiếp theo có thể đến liên tiếp. Báo cáo cũng nêu lên những lo ngại đáng kể về các rào cản an toàn của mô hình. Các nhà nghiên cứu đã xác định một lỗ hổng jailbreak phổ quát kích thích nội dung có hại trong tất cả các truy vấn tấn công mạng độc hại đã thử nghiệm, kể cả trong các thiết lập đa vòng. Cuộc tấn công này mất sáu giờ của các chuyên gia thử nghiệm đỏ để phát triển. OpenAI sau đó đã cập nhật hệ thống bảo vệ của mình, mặc dù một vấn đề cấu hình đã ngăn AISI xác minh xem phiên bản cuối cùng có hiệu quả hay không. AISI cảnh báo rằng các đánh giá khả năng của họ được thực hiện trong môi trường nghiên cứu có kiểm soát và không nhất thiết phản ánh những gì người dùng bình thường có thể truy cập, lưu ý rằng các triển khai công khai bao gồm các biện pháp bảo vệ và kiểm soát truy cập bổ sung. Báo cáo này diễn ra trong bối cảnh lo ngại về an ninh mạng của Anh. Khảo sát An ninh Mạng Hàng năm của chính phủ Vương quốc Anh, cũng được công bố vào thứ Năm, cho thấy 43% doanh nghiệp đã gặp phải vi phạm hoặc tấn công mạng trong 12 tháng qua. Để đối phó, chính phủ đã công bố 90 triệu bảng Anh trong khoản tài trợ mới nhằm nâng cao khả năng chống chịu mạng, và cho biết đang tiến hành dự luật An ninh Mạng và Khả năng Chống chịu để bảo vệ các dịch vụ thiết yếu. Các quan chức cũng đã công bố hướng dẫn khuyến khích các tổ chức chuẩn bị cho một đợt tăng đột biến các lỗ hổng phần mềm mới được phát hiện khi AI thúc đẩy tốc độ phát hiện và sử dụng các lỗ hổng bảo mật.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim