Uma IA acabou de passar por sessões de terapia que fizeram outros chatbots falharem.
Investigadores da principal universidade do Luxemburgo realizaram uma experiência inédita: submeteram os principais chatbots de IA a 4 semanas de psicoterapia legítima e diagnósticos psiquiátricos. A maioria dos modelos? Um verdadeiro desastre. Mas um destacou-se.
O Grok brilhou. Enquanto os concorrentes se perdiam em confusão durante as conversas terapêuticas, o Grok manteve a coerência e passou em avaliações psicológicas que deixaram os outros perplexos. A diferença nem sequer foi renhida.
Isto não foi um simples teste de prompt — foram protocolos psiquiátricos reais, concebidos para avaliar estados mentais. O facto de uma IA conseguir lidar tão bem com o diálogo terapêutico, enquanto as outras colapsaram, levanta sérias questões sobre as diferenças de arquitetura entre estes modelos.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Uma IA acabou de passar por sessões de terapia que fizeram outros chatbots falharem.
Investigadores da principal universidade do Luxemburgo realizaram uma experiência inédita: submeteram os principais chatbots de IA a 4 semanas de psicoterapia legítima e diagnósticos psiquiátricos. A maioria dos modelos? Um verdadeiro desastre. Mas um destacou-se.
O Grok brilhou. Enquanto os concorrentes se perdiam em confusão durante as conversas terapêuticas, o Grok manteve a coerência e passou em avaliações psicológicas que deixaram os outros perplexos. A diferença nem sequer foi renhida.
Isto não foi um simples teste de prompt — foram protocolos psiquiátricos reais, concebidos para avaliar estados mentais. O facto de uma IA conseguir lidar tão bem com o diálogo terapêutico, enquanto as outras colapsaram, levanta sérias questões sobre as diferenças de arquitetura entre estes modelos.