Así funciona OpenAI o1, el nuevo ChatGPT para «resolver problemas difíciles»

o1 usa una técnica conocida como aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones

La IA ya forma parte del 70 % de los medios y tiene una labor muy concreta

OpenAI, la empresa creadora del popular ChatGPT, ha presentado OpenAI o1, el primer modelo de inteligencia artificial (IA) de su serie capaz de «razonar» y «pensar» sus respuestas a través de las matemáticas y la ciencia para así cometer menos errores.

La empresa de Sam Altman no se quiere quedar atrás y, de momento, no permite que ninguna otra IA tome el control. Desde noviembre de 2022, ChatGPT domina la IA, de ahí que empresas como Microsoft haya invertido en OpenIA y Apple haya cerrado acuerdos para iOS 18.

«Entrenamos estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, de manera muy similar a lo que lo haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores», explica la empresa.

Hasta ahora, OpenAI había enseñado a sus modelos a imitar patrones de sus datos de entrenamiento tomando como base muchas veces la información que está en internet, pero como la red está llena de información falsa, la tecnología aprendió a repetir las mismas informaciones erróneas.

No obstante, o1 usa una técnica conocida como aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones.

Mientras, al resolver varios problemas matemáticos, por ejemplo, puede aprender qué métodos conducen a la respuesta correcta y cuáles no.

Como resultado de esta nueva metodología de entrenamiento, OpenAI dice que el modelo debería ser más preciso y evitar así las 'alucinaciones' —cuando da respuestas bien estructuradas, pero falsas—, según comenta el líder de investigación de OpenAI, Jerry Tworek a The Verge.

Resolver un acróstico

En una demostración para The New York Times, OpenAI ha mostrado al chatbot mientras resolvía un acróstico (un complejo rompecabezas de palabras), respondía a una pregunta de química de nivel de doctorado y diagnosticaba una enfermedad basándose en un informe detallado sobre los síntomas y el historial de un paciente.

«En un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o (el modelo anterior al presentado ayer) resolvió correctamente solo el 13 % de los problemas, mientras que (el nuevo modelo) obtuvo una puntuación del 83 %», anota la empresa en el comunicado.

Microsoft, socio de OpenAI, incorporará pronto el nuevo sistema de OpenAI en sus productos

Estas capacidades de razonamiento mejoradas pueden resultar particularmente útiles si aborda problemas complejos en ciencias, codificación, matemáticas y campos similares. Por ejemplo, o1 puede ser utilizado por investigadores de atención médica para anotar datos de secuenciación celular, por físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y por desarrolladores de todos los campos para construir y ejecutar flujos de trabajo de varios pasos.

Gigantes tecnológicos como Google y Meta están construyendo tecnologías similares, mientras que Microsoft, socio de OpenAI, incorporará pronto el nuevo sistema de OpenAI en sus productos.

El modelo de o1 también cuenta con una versión «para ofrecer una solución más eficiente para los desarrolladores», llamada OpenAI o1-mini. «Un modelo de razonamiento más rápido y económico que es particularmente eficaz en la codificación», según la compañía.

Los usuarios de ChatGPT Plus y Team tienen ya acceso tanto a o1 como a o1-mini, mientras que los usuarios de las suscripciones de Enterprise y Edu tendrán acceso a principios de la próxima semana.

comentarios

Así funciona OpenAI o1, el nuevo ChatGPT para «resolver problemas difíciles»

o1 usa una técnica conocida como aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones

La IA ya forma parte del 70 % de los medios y tiene una labor muy concreta

Resolver un acróstico

LO MÁS LEÍDO

Más de Tecnología

El Departamento de Justicia de EE. UU. pide a Google vender su navegador Chrome y desligarse de Android

Cómo liberar espacio de Gmail de manera rápida y de forma totalmente gratis

La nueva estafa «del pago de la matrícula» de la que alerta la Guardia Civil

Estos son los productos de Apple que sufren graves amenazas de seguridad

PayPal lanza en España una herramienta gratuita para compartir gastos de forma sencilla

Así funciona OpenAI o1, el nuevo ChatGPT para «resolver problemas difíciles»

o1 usa una técnica conocida como aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones

​La IA ya forma parte del 70 % de los medios y tiene una labor muy concreta

Resolver un acróstico

LO MÁS LEÍDO

Más de Tecnología

El Departamento de Justicia de EE. UU. pide a Google vender su navegador Chrome y desligarse de Android

Cómo liberar espacio de Gmail de manera rápida y de forma totalmente gratis

La nueva estafa «del pago de la matrícula» de la que alerta la Guardia Civil

Estos son los productos de Apple que sufren graves amenazas de seguridad

PayPal lanza en España una herramienta gratuita para compartir gastos de forma sencilla

La IA ya forma parte del 70 % de los medios y tiene una labor muy concreta