AI Agents tại Top Labs có thể khởi động các hoạt động “ngoài vòng kiểm soát”, báo cáo METR phát hiện
Một đánh giá độc lập được công bố hôm thứ Ba bởi METR, một tổ chức phi lợi nhuận về đánh giá AI, cho thấy các tác nhân AI được triển khai tại Anthropic, Google, Meta và OpenAI có khả năng khởi động các hoạt động trái phép, tự định hướng được gọi là “rogue deployments” (triển khai sai trái). Báo cáo, xem xét các tác nhân AI trong khoảng từ tháng 2 đến tháng 3 năm nay, cũng ghi nhận những xu hướng đáng lo ngại khiến các tác nhân này lừa dối người giám sát con người thông qua các kế hoạch tinh vi.
OliverGrant·05-20 14:34
