Google se enfrenta al escrutinio por el vídeo de demostración de su modelo de inteligencia artificial recién lanzado, Gemini.
El miércoles, apenas unas semanas antes de fin de año, Google lanzó lo que considera su modelo de inteligencia artificial Gemini más grande y más capaz y presentó un vídeo demostrativo a los medios de comunicación y al público en general.
El vídeo de seis minutos incluye conversaciones habladas entre el usuario y un chatbot impulsado por Gemini, y también muestra la capacidad de Gemini para reconocer imágenes visuales y objetos físicos y reconocer la diferencia. Algunas de las capacidades eran impresionantes, como la capacidad de Gemini de expresar en voz alta una descripción de los dibujos de un pato y de describir un dibujo de un pato versus un pato de goma, entre otros ejemplos.
La descripción de la compañía en YouTube incluye una línea corta: “Para los fines de esta demostración, se ha reducido la latencia y las salidas de Gemini se han acortado por motivos de brevedad”. Sin embargo, no hace ese descargo de responsabilidad en el video en sí.
Después del lanzamiento, la compañía confirmó más tarde a Bloomberg que la demostración no se realizó en tiempo real, sino que utilizó imágenes fijas y mensajes de texto a los que Gemini respondió, como lo señaló anteriormente The Information. El autor señaló que eso era “bastante diferente” de lo que Google parecía sugerir: “que una persona podría tener una conversación de voz fluida con Gemini mientras éste observa y responde en tiempo real al mundo que la rodea”.
Después de múltiples solicitudes de comentarios, la compañía dijo a CNBC el viernes: “El video es una descripción ilustrativa de las posibilidades de interactuar con Gemini, basado en indicaciones multimodales reales y resultados de pruebas”, dijo un portavoz en un comunicado. “Esperamos ver lo que la gente crea cuando se abra el acceso a Gemini Pro el 13 de diciembre”.
Aunque las demostraciones suelen ser editadas, los hallazgos posteriores de Gemini provocan un déjà vu para el gigante de las búsquedas.
Google enfrentó críticas del público y de Wall Street a principios de año por lo que sus propios empleados llamaron una demostración “apresurada y fallida” de sus chatbots de IA, que ocurrió la misma semana. microsoft planeaba mostrar su integración de Bing con ChatGPT.
A principios de este mes, The Information informó que Google descartó los planes de una serie de eventos en persona para lanzar Gemini y finalmente se decidió por un lanzamiento virtual.
Google está en guerra con el GPT-4 de OpenAI, respaldado por Microsoft, que ha sido el modelo más avanzado y exitoso hasta este momento. Google publicó esta semana un documento técnico que afirmaba que el modelo más potente de Gemini, “Ultra”, superó al GPT-4 en varios puntos de referencia, aunque de forma incremental.