Anthropic, respaldado por Google, presenta Claude 3, su chatbot más poderoso hasta el momento

Anthropic presentó el lunes Claude 3, un conjunto de modelos de inteligencia artificial que, según afirma, son los más rápidos y potentes hasta el momento. Las nuevas herramientas se llaman Claude 3 Opus, Sonnet y Haiku.

La compañía dijo que el más capaz de los nuevos modelos, Claude 3 Opus, superó al GPT-4 de OpenAI y al Gemini Ultra de Google en pruebas de referencia de la industria, como conocimientos a nivel de pregrado, razonamiento a nivel de posgrado y matemáticas básicas.

Esta es la primera vez que Anthropic ofrece soporte multimodal. Los usuarios pueden cargar fotografías, gráficos, documentos y otros tipos de datos no estructurados para análisis y respuestas.

Los otros modelos, Sonnet y Haiku, son más compactos y menos costosos que el Opus. Sonnet y Opus están disponibles en 159 países a partir del lunes, mientras que Haiku llegará pronto, según Anthropic. La compañía se negó a especificar cuánto tiempo llevó entrenar a Claude 3 o cuánto costó, pero dijo que compañías como Airtable y Asana ayudaron a A/B a probar los modelos.

El año pasado por estas fechas, Anthropic fue vista como una prometedora startup de IA generativa fundada por ex ejecutivos de investigación de OpenAI. Había completado las rondas de financiación de las Series A y B, pero solo había lanzado la primera versión de su chatbot sin ningún acceso al consumidor ni gran fanfarria.

Doce meses después, es una de las nuevas empresas de inteligencia artificial más populares, con patrocinadores que incluyen a Google, Salesforce y Amazon, y un producto que compite directamente con ChatGPT tanto en el mundo empresarial como en el de consumo. Durante el año pasado, la startup cerró cinco acuerdos de financiación diferentes, por un total de alrededor de 7.300 millones de dólares.

El campo de la IA generativa se ha disparado durante el último año, con una inversión récord de 29.100 millones de dólares en casi 700 acuerdos en 2023, un aumento de más del 260 % en el valor de los acuerdos con respecto al año anterior, según PitchBook. Se ha convertido en la frase más comentada en las llamadas sobre resultados corporativos trimestre tras trimestre. Académicos y especialistas en ética han expresado importantes preocupaciones sobre la tendencia de la tecnología a propagar prejuicios, pero aun así, rápidamente se abrió paso en las escuelas, los viajes en línea, la industria médica, la publicidad en línea y más.

Entre 60 y 80 personas trabajaron en el modelo central de IA, mientras que entre 120 y 150 personas trabajaron en sus aspectos técnicos, dijo a CNBC la cofundadora de Anthropic, Daniela Amodei, en una entrevista. Para la última versión del modelo de IA, un equipo de 30 a 35 personas trabajó directamente en él, con alrededor de 150 personas en total apoyándolo, dijo Amodei a CNBC en julio.

Anthropic dijo que Claude 3 puede resumir hasta unas 150.000 palabras, o un libro de tamaño considerable (piense: alrededor del rango de extensión de “Moby Dick” o “Harry Potter y las Reliquias de la Muerte”). Su versión anterior sólo podía resumir 75.000 palabras. Los usuarios pueden ingresar grandes conjuntos de datos y solicitar resúmenes en forma de memorando, carta o historia. ChatGPT, por el contrario, puede manejar alrededor de 3000 palabras.

Amodei también dijo que Claude 3 comprende mejor el riesgo en las respuestas que su versión anterior.

“En nuestra búsqueda por tener un modelo altamente inofensivo, Claude 2 a veces se negaba demasiado”, dijo Amodei a CNBC. “Cuando alguien se topaba con algunos de los temas más picantes o las barreras de confianza y seguridad, a veces Claude 2 tendía a ser un poco conservador al responder esas preguntas”.

Claude 3 tiene una comprensión más matizada de las indicaciones, según Anthropic.

La multimodalidad, o agregar opciones como capacidades de fotografía y video a la IA generativa, ya sea cargándolas usted mismo o creándolas usando un modelo de IA, se ha convertido rápidamente en uno de los casos de uso más populares de la industria.

“El mundo es multimodal”, dijo a CNBC el director de operaciones de OpenAI, Brad Lightcap, en noviembre. “Si piensas en la forma en que nosotros, como seres humanos, procesamos el mundo y nos relacionamos con él, vemos cosas, oímos cosas, decimos cosas: el mundo es mucho más grande que el texto. Así que para nosotros, siempre nos pareció incompleto el texto y El código debe ser las modalidades únicas, las interfaces únicas que podríamos tener para determinar cuán poderosos son estos modelos y qué pueden hacer”.

Pero la multimodalidad y los modelos de IA cada vez más complejos también generan más riesgos potenciales. Google recientemente desconectó su generador de imágenes de IA, parte de su chatbot Gemini, después de que los usuarios descubrieron inexactitudes históricas y respuestas cuestionables, que han circulado ampliamente en las redes sociales.

Claude 3 de Anthropic no genera imágenes; en cambio, solo permite a los usuarios cargar imágenes y otros documentos para su análisis.

“Por supuesto, ningún modelo es perfecto, y creo que es muy importante decirlo desde el principio”, dijo Amodei a CNBC. “Hemos intentado con mucha diligencia hacer que estos modelos sean lo más capaces y seguros posible. Por supuesto, habrá lugares donde el modelo aún inventará algo de vez en cuando”.

Aclaración: Anthropic aclaró con CNBC que Claude 3 puede resumir unas 150.000 palabras, no 200.000.