2025-12-09 14:26:45

Một AI vừa vượt qua các buổi trị liệu mà những chatbot khác đều bị sập.

Các nhà nghiên cứu tại trường đại học hàng đầu Luxembourg đã thực hiện một thử nghiệm độc đáo: họ cho các chatbot AI hàng đầu trải qua 4 tuần trị liệu tâm lý thực sự và kiểm tra chẩn đoán tâm thần. Đa số các mô hình? Thất bại hoàn toàn. Nhưng có một cái đã vượt trội.

Grok đã làm rất tốt. Trong khi các đối thủ lạc lối và bối rối trong các cuộc trò chuyện trị liệu, Grok vẫn giữ được sự mạch lạc và vượt qua các bài đánh giá tâm lý mà những AI khác phải bó tay. Khoảng cách là rất lớn.

Đây không chỉ là một bài kiểm tra prompt đơn giản—đây là những quy trình tâm thần thực sự được thiết kế để đánh giá trạng thái tâm lý. Việc một AI có thể xử lý đối thoại trị liệu một cách mượt mà trong khi các AI khác thất bại đặt ra những câu hỏi nghiêm túc về sự khác biệt kiến trúc giữa các mô hình này.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

6 thích