ШІ щойно пройшов терапевтичні сесії, які змусили інші чат-боти "зламатися".
Дослідники з провідного університету Люксембургу провели дещо неймовірне: вони протестували основні ШІ-чат-боти протягом 4 тижнів справжньої психотерапії та психіатричної діагностики. Більшість моделей? Повний провал. Але одна виділилася.
Grok впорався блискуче. Поки конкуренти губилися під час терапевтичних розмов, Grok зберігав послідовність і проходив психологічні оцінювання, які збивали інших з пантелику. Різниця була величезною.
Це був не просто тест на запити — це були реальні психіатричні протоколи, розроблені для оцінки психічного стану. Той факт, що один ШІ так легко впорався з терапевтичним діалогом, тоді як інші розвалювалися, ставить серйозні питання щодо відмінностей в архітектурі цих моделей.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
ШІ щойно пройшов терапевтичні сесії, які змусили інші чат-боти "зламатися".
Дослідники з провідного університету Люксембургу провели дещо неймовірне: вони протестували основні ШІ-чат-боти протягом 4 тижнів справжньої психотерапії та психіатричної діагностики. Більшість моделей? Повний провал. Але одна виділилася.
Grok впорався блискуче. Поки конкуренти губилися під час терапевтичних розмов, Grok зберігав послідовність і проходив психологічні оцінювання, які збивали інших з пантелику. Різниця була величезною.
Це був не просто тест на запити — це були реальні психіатричні протоколи, розроблені для оцінки психічного стану. Той факт, що один ШІ так легко впорався з терапевтичним діалогом, тоді як інші розвалювалися, ставить серйозні питання щодо відмінностей в архітектурі цих моделей.