OpenAI ha introducido nuevas pruebas internas para el rendimiento a nivel de proyecto.
Los puntos de referencia científicos y matemáticos mostraron puntuaciones más altas que modelos anteriores.
El anuncio llega mientras OpenAI realiza acuerdos para integrar GPT en el Gobierno de EE. UU. y en empresas.
El Centro de Arte, Moda y Entretenimiento de Decrypt.
Descubre SCENE
Solo unas semanas después de su última gran versión, OpenAI está pivotando agresivamente su buque insignia ChatGPT de una novedad para consumidores a una herramienta corporativa imprescindible.
El jueves, la compañía lanzó GPT-5.2, un nuevo modelo de lenguaje grande que afirma ser más rápido, más fiable y diseñado para manejar flujos de trabajo profesionales complejos.
La actualización indica que OpenAI está yendo más allá de la ayuda con tareas y consultas generales, buscando en cambio integrar su tecnología como una herramienta esencial y diaria en el mundo empresarial, como lo evidencian sus lucrativos acuerdos con el gobierno de EE. UU. y Disney.
“Diseñamos GPT‑5.2 para desbloquear aún más valor económico para las personas”, dijo OpenAI en una declaración. “Es mejor creando hojas de cálculo, creando presentaciones, escribiendo código, percibiendo imágenes, entendiendo contextos largos, usando herramientas y manejando proyectos complejos y de múltiples pasos.”
La nueva referencia para la automatización en el lugar de trabajo
Presumiendo el rendimiento de GPT-5.2, la compañía presentó una referencia de evaluación propia, GDPval, que simula tareas en 44 ocupaciones.
GPT-5.2 igualó o superó el rendimiento de los trabajadores humanos en aproximadamente el 71 % de las comparaciones, afirma la compañía.
“En GDPval, el modelo pensante supera o iguala a expertos humanos en el 70.9 % de tareas profesionales comunes como hojas de cálculo, presentaciones y creación de documentos”, escribió Fidji Simo, CEO de Aplicaciones de OpenAI, en X. “También es mejor en inteligencia general, escritura de código, llamadas a herramientas, visión y comprensión de contextos largos, para que pueda desbloquear aún más valor económico para las personas.”
No está claro si la referencia ha sido sometida a revisión externa, dejando a los expertos de la industria esperar una verificación independiente de las afirmaciones.
Desglose técnico: Tres modelos para tres trabajos
GPT-5.2 estuvo disponible en las distintas categorías de suscripción de pago el jueves, con acceso a la API abriendo el mismo día. Los desarrolladores ahora pueden elegir entre tres versiones distintas, cada una optimizada para diferentes necesidades profesionales.
Instantáneo: Para tareas profesionales rápidas y sencillas.
Pensamiento: Para tareas más complejas y de múltiples pasos.
Pro: El modelo de nivel superior, diseñado para investigaciones intensivas y proyectos de formato largo.
El precio de la API se ha establecido en $1.75 por millón de tokens de entrada y $14 por millón de tokens de salida.
Además de la referencia GDPval, GPT-5.2 mostró un rendimiento mejorado en pruebas técnicas establecidas, obteniendo puntuaciones más altas en GPQA Diamond y FrontierMath. También supuestamente demostró resultados más fiables en tareas exigentes como codificación, análisis de datos y diseño experimental.
En el anuncio, la compañía presentó varias declaraciones positivas de retroalimentación de los primeros evaluadores.
El lanzamiento de una IA más competente para el lugar de trabajo llega en un entorno laboral ya tenso.
Los ejecutivos corporativos parecen en su mayoría optimistas, con una encuesta reciente de Just Capital que muestra que el 93 % de los líderes empresariales ven la IA como una fuerza positiva. Sin embargo, el mismo estudio encontró que casi la mitad de los estadounidenses espera que la tecnología elimine empleos, una preocupación que los ejecutivos aparentemente comparten en menor medida.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
OpenAI lanza GPT-5.2 en medio de la expansión de contratos importantes
En resumen
El Centro de Arte, Moda y Entretenimiento de Decrypt.
Descubre SCENE
Solo unas semanas después de su última gran versión, OpenAI está pivotando agresivamente su buque insignia ChatGPT de una novedad para consumidores a una herramienta corporativa imprescindible.
El jueves, la compañía lanzó GPT-5.2, un nuevo modelo de lenguaje grande que afirma ser más rápido, más fiable y diseñado para manejar flujos de trabajo profesionales complejos.
La actualización indica que OpenAI está yendo más allá de la ayuda con tareas y consultas generales, buscando en cambio integrar su tecnología como una herramienta esencial y diaria en el mundo empresarial, como lo evidencian sus lucrativos acuerdos con el gobierno de EE. UU. y Disney.
“Diseñamos GPT‑5.2 para desbloquear aún más valor económico para las personas”, dijo OpenAI en una declaración. “Es mejor creando hojas de cálculo, creando presentaciones, escribiendo código, percibiendo imágenes, entendiendo contextos largos, usando herramientas y manejando proyectos complejos y de múltiples pasos.”
La nueva referencia para la automatización en el lugar de trabajo
Presumiendo el rendimiento de GPT-5.2, la compañía presentó una referencia de evaluación propia, GDPval, que simula tareas en 44 ocupaciones.
GPT-5.2 igualó o superó el rendimiento de los trabajadores humanos en aproximadamente el 71 % de las comparaciones, afirma la compañía.
“En GDPval, el modelo pensante supera o iguala a expertos humanos en el 70.9 % de tareas profesionales comunes como hojas de cálculo, presentaciones y creación de documentos”, escribió Fidji Simo, CEO de Aplicaciones de OpenAI, en X. “También es mejor en inteligencia general, escritura de código, llamadas a herramientas, visión y comprensión de contextos largos, para que pueda desbloquear aún más valor económico para las personas.”
No está claro si la referencia ha sido sometida a revisión externa, dejando a los expertos de la industria esperar una verificación independiente de las afirmaciones.
Desglose técnico: Tres modelos para tres trabajos
GPT-5.2 estuvo disponible en las distintas categorías de suscripción de pago el jueves, con acceso a la API abriendo el mismo día. Los desarrolladores ahora pueden elegir entre tres versiones distintas, cada una optimizada para diferentes necesidades profesionales.
El precio de la API se ha establecido en $1.75 por millón de tokens de entrada y $14 por millón de tokens de salida.
Además de la referencia GDPval, GPT-5.2 mostró un rendimiento mejorado en pruebas técnicas establecidas, obteniendo puntuaciones más altas en GPQA Diamond y FrontierMath. También supuestamente demostró resultados más fiables en tareas exigentes como codificación, análisis de datos y diseño experimental.
En el anuncio, la compañía presentó varias declaraciones positivas de retroalimentación de los primeros evaluadores.
El lanzamiento de una IA más competente para el lugar de trabajo llega en un entorno laboral ya tenso.
Los ejecutivos corporativos parecen en su mayoría optimistas, con una encuesta reciente de Just Capital que muestra que el 93 % de los líderes empresariales ven la IA como una fuerza positiva. Sin embargo, el mismo estudio encontró que casi la mitad de los estadounidenses espera que la tecnología elimine empleos, una preocupación que los ejecutivos aparentemente comparten en menor medida.