Durante el lanzamiento del teléfono Pixel de Google el martes, un director de producto llamado David Citron subió al escenario para mostrar las capacidades móviles del nuevo asistente de inteligencia artificial de la compañía, Gemini. Las cosas se pusieron incómodas justo después de que el presentador le dijera a la audiencia: “Por cierto, todas las demostraciones de hoy son en vivo”.
Frente a una gran multitud de medios y analistas en de google Con sede en Silicon Valley y cerca de 100.000 espectadores en YouTube, Citron tomó una foto de un cartel de concierto y pidió al asistente que revisara su calendario para ver si estaba libre la noche que la estrella del pop Sabrina Carpenter toca en San Francisco.
La demostración falló, se congeló y mostró un mensaje de error. Citron lo intentó de nuevo, con el mismo resultado. Después de una rápida apelación verbal a los “dioses de la demostración” y un intercambio telefónico, el tercer intento funcionó.
“Claro, descubrí que Sabrina Carpenter vendrá a San Francisco el 9 de noviembre de 2024”, escribió el asistente en un mensaje que apareció en la pantalla de Citron. “No veo ningún evento en tu calendario durante ese tiempo”.
Si bien el incidente fue breve y lleno de errores, la demostración destacó una de las ventajas de Google a medida que las funciones de inteligencia artificial se abren paso en el software de los teléfonos inteligentes. Los rivales están preparando a los consumidores para un futuro de IA, pero las funciones Gemini de Google son reales y están disponibles, al menos con fines de prueba, ahora.
En junio, Manzana presentó un vídeo pregrabado, en lugar de una demostración en vivo, para mostrar el próximo salto de su asistente Siri en la capacidad de tomar acciones y comprender el contexto bajo su nuevo sistema de inteligencia artificial llamado Apple Intelligence.
Apple Intelligence se encuentra actualmente en pruebas para desarrolladores, pero algunas de sus mejoras más críticas, incluida la generación de imágenes, la integración con ChatGPT y avances clave para su asistente Siri, aún no han salido oficialmente de los laboratorios de Apple.
OpenAI, que inició el auge de la IA generativa con ChatGPT, también suele revelar avances en la IA, pero limita estrictamente el número de personas que pueden probarlos.
“Creo que lo nuevo es que hemos pasado del modo de proyectar una visión de hacia dónde se dirigen las cosas al envío real del producto”, dijo Rick Osterloh, jefe de dispositivos de Google, a Deirdre Bosa de CNBC el martes.
Las demostraciones en vivo de Google marcan un cambio con respecto a finales del año pasado, cuando la compañía intentó mostrar Gemini en una demostración y terminó siendo duramente criticada por editar el video.
“Lo que mostramos hoy es el material que se enviará en los próximos días o semanas, y eso es realmente crítico”, dijo Osterloh. “Muchas de las cosas que otras compañías han anunciado, en realidad no están disponibles para mucha gente. Esto estará disponible para millones de personas muy pronto”.
Después del anuncio de Apple en junio, la compañía realizó algunas pruebas en vivo con medios y analistas de Apple Intelligence en los dispositivos actuales. En julio, Apple lanzó una vista previa de algunas funciones de Apple Intelligence para desarrolladores, incluida la capacidad de generar resúmenes, así como una nueva apariencia para Siri que hace que toda la pantalla del iPhone brille. Sin embargo, la vista previa no incluye funciones como generación de imágenes, integración ChatGPT y las mejoras más esperadas de Siri que le permitirán realizar tareas de forma natural.
El lanzamiento de Google el martes podría ejercer una nueva presión sobre Apple, mientras los dos líderes del mercado de teléfonos inteligentes compiten por integrar la IA en sus sistemas operativos. IDC estima que los teléfonos inteligentes con capacidad de “Gen AI” (teléfonos con los chips y la memoria necesarios para ejecutar AI) se cuadriplicarán en unidades vendidas en 2024 a aproximadamente 234 millones de dispositivos.
“Hoy tenemos una idea de con qué compite Apple”, dijo en una entrevista Grace Harmon, analista de eMarketer.
Con la llegada de la IA generativa a los teléfonos, el mercado también verá un cambio en el procesamiento de la IA. En lugar de modelos sofisticados que emulen la producción humana ejecutados en enormes NVIDIAEn los centros de datos basados en, las características de IA para dispositivos se basarán en funciones más simples como el resumen o la fluidez, que se ejecutan principalmente en los chips que ya están dentro de los dispositivos.
En la presentación de 100 minutos de Google del martes, la compañía mostró varias capacidades que aún no están disponibles en otros lugares.
El ejemplo de Citron (hacer preguntas sobre el contenido de un cartel en una foto) destaca un avance técnico llamado “IA multimodal”, que no es una capacidad planeada por Apple.
La compañía introdujo una función que permite a los usuarios tomar capturas de pantalla de lo que están viendo, y Google compilará esa información en notas que se podrán buscar rápidamente más adelante.
La presentación más importante de Google el martes fue Gemini Live, su asistente de próxima generación. En la demostración, la tecnología pudo chatear de forma natural, como una persona, agregando elementos a las listas de compras o consultando los calendarios de Google. Pronto podrá ayudar al usuario a realizar una investigación profunda, dijo Osterloh en el escenario. Los ejecutivos de Google atribuyeron las capacidades a “décadas de inversión” en IA y su “estrategia integrada de IA”.
En un momento, Google dijo que su IA era una “experiencia completa de extremo a extremo que sólo Google puede ofrecer”, una modificación de una frase que viene de Apple desde hace mucho tiempo. A Tim Cook, director general de Apple, le gusta decir que “sólo Apple” puede crear sus productos gracias a su experiencia en la integración de hardware y software.
En un comunicado de prensa, Google habló de la próxima integración de Apple con ChatGPT, que se espera para antes de fin de año. La compañía dijo que el enfoque de Apple es menos privado que el de Google, porque Gemini “no requiere traspaso a un proveedor externo de IA que quizás no conozcas o no confíes”.