El 12 de septiembre, OpenAI reveló una vista previa de su nuevo modelo, OpenAI o1, diseñado para manejar tareas complejas como escribir código, resolver problemas matemáticos y realizar razonamiento profundo. Es el primero de la familia de IA de próxima generación, de la que se rumorea desde hace mucho tiempo, conocida como “Strawberry”.
ChatGPT Plus, los usuarios del equipo y los desarrolladores con uso de API OpenAI Nivel 5 ahora pueden acceder a la versión preliminar del modelo completo, o1-preview.
Estos usuarios también pueden acceder a o1-mini, una versión más pequeña y rápida del modelo o1 que es particularmente eficaz en la codificación. Como modelo más pequeño, el gigante tecnológico dice que es “80% más barato que o1-preview, lo que lo convierte en un modelo poderoso y rentable para aplicaciones que requieren razonamiento pero no un amplio conocimiento mundial”.
Open AI señaló que los usuarios de ChatGPT Enterprise y Edu tendrán acceso a ambos modelos a partir de la próxima semana.
“También estamos planeando brindar acceso a o1-mini a todos los usuarios de ChatGPT Free”, dijo la compañía en su comunicado.
aquí está o1, una serie de nuestros modelos más capaces y alineados hasta el momento: https://t.co/yzZGNN8HvD
o1 todavía tiene fallas, sigue siendo limitado y todavía parece más impresionante en el primer uso que después de pasar más tiempo con él. pic.twitter.com/Qs1HoSDOz1
—Sam Altman (@sama) 12 de septiembre de 2024
o1 necesita más tiempo para razonar sobre problemas más difíciles
En lugar de ampliar la capacidad lingüística de GPT-4, OpenAI o1 y o1-mini se centran en la ciencia, la creación y depuración de código y las matemáticas. Un vídeo de demostración muestra al modelo construyendo un juego jugable al estilo de los juegos Snake de la década de 1970. Como explicó OpenAI, o1 puede ser utilizado por:
- Investigadores de atención médica para anotar datos de secuenciación celular.
- Los físicos generarán complicadas fórmulas matemáticas necesarias para la óptica cuántica.
- Desarrolladores en todos los campos para crear y ejecutar flujos de trabajo de varios pasos.
OpenAI dice que o1 se ubicó en el percentil 89 en la prueba competitiva de programación Codeforces y se ubicó entre los 500 mejores estudiantes de EE. UU. en una clasificación para la Olimpiada de Matemáticas de EE. UU.
Por naturaleza, o1 tardará más en responder que ChatGPT o GPT-4.
o1-preview puede generar un máximo de 32k tokens, mientras que o1-mini puede generar un máximo de 64k tokens. Un token puede ser tan corto como un carácter o tan largo como una palabra, dependiendo de la complejidad del texto. Ambas versiones del nuevo modelo solo admiten la entrada de texto, no de audio ni de imágenes.
OpenAI creó una guía de mejores prácticas para que los desarrolladores determinen si o1 es adecuado para su trabajo.
En la tarjeta del sistema del modelo, donde OpenAI describe los esfuerzos del equipo rojo y otras consideraciones de seguridad, o1 recibió una calificación de seguridad “media” en dos categorías. El grupo de investigación independiente Apollo Research señaló que o1 “tiene las capacidades básicas necesarias para realizar intrigas simples en contexto”, es decir, “utilizar sus mecanismos de supervisión como un medio para lograr un objetivo”. Por otro lado, el razonamiento más profundo le da al modelo una mejor comprensión de las políticas de seguridad.