A OpenAI revelou novos testes internos para desempenho a nível de projeto.
Os benchmarks científicos e matemáticos mostraram pontuações mais altas do que os modelos anteriores.
O anúncio ocorre à medida que a OpenAI faz acordos para integrar o GPT no Governo dos EUA e em Empresas.
Hub de Arte, Moda e Entretenimento da Decrypt.
Descubra SCENE
Apenas semanas após o seu último grande lançamento, a OpenAI está a pivotar agressivamente o seu flagship ChatGPT de uma novidade para consumidores para uma potência empresarial indispensável.
Na quinta-feira, a empresa lançou o GPT-5.2, um novo grande modelo de linguagem que afirma ser mais rápido, mais fiável e projetado para lidar com fluxos de trabalho profissionais complexos.
A atualização indica que a OpenAI está a avançar além de ajudar com tarefas escolares e consultas gerais, visando incorporar a sua tecnologia como uma ferramenta diária essencial no mundo dos negócios, como evidenciam os seus acordos lucrativos com o governo dos EUA e a Disney.
“Projetámos o GPT‑5.2 para desbloquear ainda mais valor económico para as pessoas”, disse a OpenAI numa declaração. “É melhor a criar folhas de cálculo, construir apresentações, escrever código, perceber imagens, entender contextos longos, usar ferramentas e lidar com projetos complexos de múltiplas etapas.”
O novo benchmark para automação no local de trabalho
Ao destacar o desempenho do GPT-5.2, a empresa apresentou um benchmark de avaliação proprietário, GDPval, que simula tarefas em 44 profissões.
O GPT-5.2 igualou ou superou o desempenho de trabalhadores humanos em aproximadamente 71% das comparações, afirma a empresa.
“No GDPval, o modelo de pensamento supera ou empata com especialistas humanos em 70.9% das tarefas profissionais comuns como folhas de cálculo, apresentações e criação de documentos”, escreveu Fidji Simo, CEO de Aplicações da OpenAI, na X. “Também é melhor em inteligência geral, escrever código, chamar ferramentas, visão e compreensão de contexto longo, podendo assim desbloquear ainda mais valor económico para as pessoas.”
Não está claro se o benchmark passou por uma revisão externa, deixando os especialistas da indústria à espera de uma verificação independente das afirmações.
Análise técnica: Três modelos para três empregos
O GPT-5.2 ficou disponível nas camadas de subscrição paga na quinta-feira, com acesso via API a abrir no mesmo dia. Os desenvolvedores podem agora escolher entre três versões distintas, cada uma otimizada para diferentes necessidades profissionais.
Instantâneo: Para tarefas profissionais rápidas e simples.
Pensamento: Para tarefas mais complexas de múltiplas etapas.
Pro: O modelo de topo, construído para pesquisa intensiva e projetos de formato longo.
O preço da API foi definido em $1.75 por milhão de tokens de entrada e $14 por milhão de tokens de saída.
Para além do benchmark GDPval, o GPT-5.2 demonstrou desempenho melhorado em testes técnicos estabelecidos, registando pontuações mais altas no GPQA Diamond e FrontierMath. Reportadamente, também apresentou resultados mais fiáveis em tarefas exigentes como codificação, análise de dados e desenho experimental.
Na anúncio, a empresa apresentou várias declarações de feedback positivas de utilizadores iniciais.
O lançamento de uma IA mais competente para o local de trabalho chega num ambiente laboral já tenso.
Os gestores corporativos parecem em grande parte otimistas, com uma recente pesquisa da Just Capital a mostrar que 93% dos líderes empresariais vêem a IA como uma força positiva. No entanto, o mesmo estudo revelou que quase metade dos americanos espera que a tecnologia elimine empregos, uma preocupação que, segundo relatos, os gestores partilham menos.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
A OpenAI Lança GPT-5.2 em Meio à Expansão de Contratos Principais
Resumo
Hub de Arte, Moda e Entretenimento da Decrypt.
Descubra SCENE
Apenas semanas após o seu último grande lançamento, a OpenAI está a pivotar agressivamente o seu flagship ChatGPT de uma novidade para consumidores para uma potência empresarial indispensável.
Na quinta-feira, a empresa lançou o GPT-5.2, um novo grande modelo de linguagem que afirma ser mais rápido, mais fiável e projetado para lidar com fluxos de trabalho profissionais complexos.
A atualização indica que a OpenAI está a avançar além de ajudar com tarefas escolares e consultas gerais, visando incorporar a sua tecnologia como uma ferramenta diária essencial no mundo dos negócios, como evidenciam os seus acordos lucrativos com o governo dos EUA e a Disney.
“Projetámos o GPT‑5.2 para desbloquear ainda mais valor económico para as pessoas”, disse a OpenAI numa declaração. “É melhor a criar folhas de cálculo, construir apresentações, escrever código, perceber imagens, entender contextos longos, usar ferramentas e lidar com projetos complexos de múltiplas etapas.”
O novo benchmark para automação no local de trabalho
Ao destacar o desempenho do GPT-5.2, a empresa apresentou um benchmark de avaliação proprietário, GDPval, que simula tarefas em 44 profissões.
O GPT-5.2 igualou ou superou o desempenho de trabalhadores humanos em aproximadamente 71% das comparações, afirma a empresa.
“No GDPval, o modelo de pensamento supera ou empata com especialistas humanos em 70.9% das tarefas profissionais comuns como folhas de cálculo, apresentações e criação de documentos”, escreveu Fidji Simo, CEO de Aplicações da OpenAI, na X. “Também é melhor em inteligência geral, escrever código, chamar ferramentas, visão e compreensão de contexto longo, podendo assim desbloquear ainda mais valor económico para as pessoas.”
Não está claro se o benchmark passou por uma revisão externa, deixando os especialistas da indústria à espera de uma verificação independente das afirmações.
Análise técnica: Três modelos para três empregos
O GPT-5.2 ficou disponível nas camadas de subscrição paga na quinta-feira, com acesso via API a abrir no mesmo dia. Os desenvolvedores podem agora escolher entre três versões distintas, cada uma otimizada para diferentes necessidades profissionais.
O preço da API foi definido em $1.75 por milhão de tokens de entrada e $14 por milhão de tokens de saída.
Para além do benchmark GDPval, o GPT-5.2 demonstrou desempenho melhorado em testes técnicos estabelecidos, registando pontuações mais altas no GPQA Diamond e FrontierMath. Reportadamente, também apresentou resultados mais fiáveis em tarefas exigentes como codificação, análise de dados e desenho experimental.
Na anúncio, a empresa apresentou várias declarações de feedback positivas de utilizadores iniciais.
O lançamento de uma IA mais competente para o local de trabalho chega num ambiente laboral já tenso.
Os gestores corporativos parecem em grande parte otimistas, com uma recente pesquisa da Just Capital a mostrar que 93% dos líderes empresariais vêem a IA como uma força positiva. No entanto, o mesmo estudo revelou que quase metade dos americanos espera que a tecnologia elimine empregos, uma preocupação que, segundo relatos, os gestores partilham menos.