OpenAI em 12/12 lançou o GPT-5.2, posicionando-o como a série de modelos de IA mais adequada atualmente para “trabalhos de conhecimento especializado”. A empresa afirmou que o GPT-5.2 consegue produzir diretamente resultados práticos como apresentações, planilhas, códigos e análises de documentos longos, além de suportar tarefas de múltiplas etapas e ferramentas cruzadas, podendo também criar pequenos jogos web front-end e cartões comemorativos. Segundo feedbacks, usuários empresariais do ChatGPT economizam em média entre 40 a 60 minutos de trabalho por dia, enquanto utilizadores altamente engajados economizam mais de 10 horas por semana. O GPT-5.2 é visto como uma versão chave para ampliar ainda mais a produtividade.
Três versões simultâneas lançadas, atendendo diferentes cenários profissionais
OpenAI afirmou que, desta vez, o GPT-5.2 é lançado simultaneamente nas versões Instant, Thinking e Pro, cada uma focada em eficiência diária, raciocínio profundo e resolução de problemas de alta complexidade. Na aplicação do ChatGPT, o GPT-5.2 será disponibilizado inicialmente para usuários de planos pagos. Na plataforma API, já está totalmente acessível aos desenvolvedores.
Avanço significativo na capacidade de trabalho profissional, atingindo nível de especialistas humanos pela primeira vez em GDPval
A OpenAI destacou que o GPT-5.2 Thinking apresentou uma inovação crucial na avaliação GDPval de trabalhos de conhecimento especializado. Essa avaliação cobre 44 profissões e 9 grandes setores, exigindo que o modelo produza entregáveis diretos, como apresentações, planilhas, cronogramas e documentos comerciais.
Os resultados mostraram que, para 70,9% das tarefas, o GPT-5.2 Thinking superou ou empatou com o desempenho de especialistas do setor, produzindo resultados 11 vezes mais rápido que humanos e com custos inferiores a 1%. É a primeira vez que a OpenAI atinge e até supera o nível de expertise profissional humano com um modelo.
Capacidades práticas totalmente aprimoradas, reforço na produção de projetos e desenvolvimento de códigos simultaneamente
Na prática, as apresentações e estruturas de planilhas do GPT-5.2 Thinking são mais completas e logicamente próximas às de consultores e analistas profissionais, podendo lidar com planejamento de recursos humanos, estruturas acionárias e gerenciamento de projetos, entre tarefas complexas. Em tarefas de planilhas de nível de bancos de investimento, o desempenho melhorou cerca de 9% em relação à geração anterior.
No desenvolvimento de software, o GPT-5.2 Thinking alcançou uma precisão de 56% no teste real de manutenção de códigos SWE-Bench Pro, podendo ler repositórios de código, entender problemas técnicos e gerar patches utilizáveis.
(Nota: SWE-Bench Pro é um teste que simula “trabalhos reais de engenharia de software”, exigindo que a IA corrija diretamente problemas de código em projetos reais, não apenas responda questões teóricas. )
Melhoria na confiabilidade e integração, arquivos longos, imagens e colaboração com ferramentas mais maduras
A OpenAI afirmou que a taxa de erro nas respostas do GPT-5.2 Thinking caiu aproximadamente 30% em relação à geração anterior. Nos testes MRCRv2, mesmo com documentos extremamente longos de dezenas de milhares de palavras, consegue manter uma precisão próxima do máximo, sendo útil para análise de contratos, relatórios financeiros e transcrições.
Na compreensão de imagens, o GPT-5.2 apresentou uma redução significativa na taxa de erro na interpretação de gráficos e interfaces de software. Quanto à capacidade de uso de ferramentas, no teste Tau2-bench, sua precisão atingiu 98,7%, podendo completar de forma estável tarefas completas envolvendo múltiplos sistemas e etapas.
GPT-5.2 também pode criar pequenos jogos web e front-end.
(Nota: MRCRv2 é um teste especializado para verificar se a IA consegue identificar corretamente informações-chave em conteúdos extensos e manter o contexto ao longo de múltiplas inferências. Tau2-bench é uma avaliação que simula processos reais de atendimento ao cliente e negócios para testar se a IA consegue chamar ferramentas corretamente, integrar informações e completar tarefas em múltiplas rodadas de interação. )
Este artigo “OpenAI lança GPT-5.2: pode fazer pequenos jogos e cartões comemorativos, economizando 10 horas semanais para empresas” foi publicado originalmente na ABMedia.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
OpenAI lança GPT-5.2: pode criar pequenos jogos e cartões comemorativos, economizando 10 horas de trabalho semanalmente para clientes empresariais
OpenAI em 12/12 lançou o GPT-5.2, posicionando-o como a série de modelos de IA mais adequada atualmente para “trabalhos de conhecimento especializado”. A empresa afirmou que o GPT-5.2 consegue produzir diretamente resultados práticos como apresentações, planilhas, códigos e análises de documentos longos, além de suportar tarefas de múltiplas etapas e ferramentas cruzadas, podendo também criar pequenos jogos web front-end e cartões comemorativos. Segundo feedbacks, usuários empresariais do ChatGPT economizam em média entre 40 a 60 minutos de trabalho por dia, enquanto utilizadores altamente engajados economizam mais de 10 horas por semana. O GPT-5.2 é visto como uma versão chave para ampliar ainda mais a produtividade.
Três versões simultâneas lançadas, atendendo diferentes cenários profissionais
OpenAI afirmou que, desta vez, o GPT-5.2 é lançado simultaneamente nas versões Instant, Thinking e Pro, cada uma focada em eficiência diária, raciocínio profundo e resolução de problemas de alta complexidade. Na aplicação do ChatGPT, o GPT-5.2 será disponibilizado inicialmente para usuários de planos pagos. Na plataforma API, já está totalmente acessível aos desenvolvedores.
Avanço significativo na capacidade de trabalho profissional, atingindo nível de especialistas humanos pela primeira vez em GDPval
A OpenAI destacou que o GPT-5.2 Thinking apresentou uma inovação crucial na avaliação GDPval de trabalhos de conhecimento especializado. Essa avaliação cobre 44 profissões e 9 grandes setores, exigindo que o modelo produza entregáveis diretos, como apresentações, planilhas, cronogramas e documentos comerciais.
Os resultados mostraram que, para 70,9% das tarefas, o GPT-5.2 Thinking superou ou empatou com o desempenho de especialistas do setor, produzindo resultados 11 vezes mais rápido que humanos e com custos inferiores a 1%. É a primeira vez que a OpenAI atinge e até supera o nível de expertise profissional humano com um modelo.
Capacidades práticas totalmente aprimoradas, reforço na produção de projetos e desenvolvimento de códigos simultaneamente
Na prática, as apresentações e estruturas de planilhas do GPT-5.2 Thinking são mais completas e logicamente próximas às de consultores e analistas profissionais, podendo lidar com planejamento de recursos humanos, estruturas acionárias e gerenciamento de projetos, entre tarefas complexas. Em tarefas de planilhas de nível de bancos de investimento, o desempenho melhorou cerca de 9% em relação à geração anterior.
No desenvolvimento de software, o GPT-5.2 Thinking alcançou uma precisão de 56% no teste real de manutenção de códigos SWE-Bench Pro, podendo ler repositórios de código, entender problemas técnicos e gerar patches utilizáveis.
(Nota: SWE-Bench Pro é um teste que simula “trabalhos reais de engenharia de software”, exigindo que a IA corrija diretamente problemas de código em projetos reais, não apenas responda questões teóricas. )
Melhoria na confiabilidade e integração, arquivos longos, imagens e colaboração com ferramentas mais maduras
A OpenAI afirmou que a taxa de erro nas respostas do GPT-5.2 Thinking caiu aproximadamente 30% em relação à geração anterior. Nos testes MRCRv2, mesmo com documentos extremamente longos de dezenas de milhares de palavras, consegue manter uma precisão próxima do máximo, sendo útil para análise de contratos, relatórios financeiros e transcrições.
Na compreensão de imagens, o GPT-5.2 apresentou uma redução significativa na taxa de erro na interpretação de gráficos e interfaces de software. Quanto à capacidade de uso de ferramentas, no teste Tau2-bench, sua precisão atingiu 98,7%, podendo completar de forma estável tarefas completas envolvendo múltiplos sistemas e etapas.
GPT-5.2 também pode criar pequenos jogos web e front-end.
(Nota: MRCRv2 é um teste especializado para verificar se a IA consegue identificar corretamente informações-chave em conteúdos extensos e manter o contexto ao longo de múltiplas inferências. Tau2-bench é uma avaliação que simula processos reais de atendimento ao cliente e negócios para testar se a IA consegue chamar ferramentas corretamente, integrar informações e completar tarefas em múltiplas rodadas de interação. )
Este artigo “OpenAI lança GPT-5.2: pode fazer pequenos jogos e cartões comemorativos, economizando 10 horas semanais para empresas” foi publicado originalmente na ABMedia.