Nvidia RTX 4060 Super, RTX 4070 Ti Super, RTX 4080 Super anunciadas

El fundador y director ejecutivo de Nvidia, Jensen Huang, habla durante la cumbre anual DealBook del New York Times en la ciudad de Nueva York el 29 de noviembre de 2023.

Miguel M. Santiago | imágenes falsas

NVIDIA se encontró en el centro del auge de la inteligencia artificial el año pasado cuando sus costosos procesadores gráficos de servidor, incluido el H100, se volvieron esenciales para entrenar e implementar IA generativa como ChatGPT de OpenAI. Ahora, Nvidia está aprovechando su fuerza en las GPU de consumo para la llamada IA ”local” que puede ejecutarse en una PC o computadora portátil desde casa o en la oficina.

Nvidia anunció tres nuevas tarjetas gráficas el lunes: RTX 4060 Super, RTX 4070 Ti Super y RTX 4080 Super, con precios que oscilan entre $ 599 y $ 999. Estas tarjetas tienen “núcleos tensores” adicionales que están diseñados para ejecutar aplicaciones de IA generativa. Nvidia también proporcionará tarjetas gráficas en portátiles de empresas como Acer, Dell y Lenovo.

La demanda de GPU empresariales de Nvidia, que cuestan decenas de miles de dólares cada una y a menudo vienen en un sistema con ocho GPU trabajando juntas, provocó un aumento en las ventas generales de Nvidia y un valor de mercado de más de 1 billón de dólares.

Las GPU para PC han sido durante mucho tiempo el pan de cada día de Nvidia, destinadas a ejecutar videojuegos, pero la compañía dice que las tarjetas gráficas de este año se han mejorado con miras a ejecutar modelos de IA sin enviar información a la nube.

Los nuevos chips gráficos de consumo se utilizarán principalmente para juegos, pero aún pueden atravesar aplicaciones de inteligencia artificial, afirma la compañía. Por ejemplo, Nvidia dice que la RTX 4080 Super puede generar vídeo con IA un 150% más rápido que el modelo de última generación. Otras mejoras de software que la compañía anunció recientemente harán que el procesamiento de modelos de lenguaje grandes sea cinco veces más rápido, dijo Nvidia.

“Con 100 millones de GPU RTX enviadas, proporcionan una base instalada masiva para PC potentes para aplicaciones de IA”, dijo a los periodistas Justin Walker, director senior de gestión de productos de Nvidia, en una conferencia de prensa.

Nvidia espera que surjan nuevas aplicaciones de inteligencia artificial durante el próximo año para aprovechar el aumento de potencia. Se espera que Microsoft lance una nueva versión de Windows a finales de este año, Windows 12, que puede aprovechar aún más los chips de IA.

El nuevo chip se puede utilizar para generar imágenes en el generador Firefly de Adobe Photoshop o para eliminar fondos en videollamadas, dijo Walker. Nvidia también está creando herramientas que permitirían a los desarrolladores de juegos integrar IA generativa en sus títulos, por ejemplo, para generar diálogos a partir de un personaje que no es jugador.

Borde frente a servidor

Tarjetas gráficas 4070 Ti Super de Nvidia.

NVIDIA

Los anuncios de chips de Nvidia esta semana muestran que, si bien ha sido la empresa más asociada con las GPU para servidores grandes, competirá con Intel, AMD y Qualcomm también en la IA local. Los tres han anunciado nuevos chips que alimentarán las llamadas “PC con IA” con piezas especializadas para el aprendizaje automático.

La medida de Nvidia se produce mientras la industria tecnológica está buscando la mejor manera de implementar IA generativa, que requiere una enorme cantidad de potencia informática y puede costar una cantidad increíble ejecutarla en servicios en la nube.

Una solución técnica, promovida por los rivales de Microsoft y Nvidia, es lo que se llama “PC AI” o, a veces, “computación de borde”. En lugar de utilizar potentes supercomputadoras a través de Internet, los dispositivos tendrán chips de IA más potentes en su interior y podrán ejecutar los llamados grandes modelos de lenguaje o generadores de imágenes, aunque con algunas compensaciones y deficiencias.

Nvidia propone aplicaciones que pueden utilizar un modelo de nube para preguntas difíciles y un modelo de IA local para tareas que deben realizarse rápidamente.

“Las GPU de Nvidia en la nube pueden ejecutar modelos de lenguaje realmente grandes y utilizar toda esa potencia de procesamiento para alimentar modelos de IA muy grandes, mientras que, al mismo tiempo, los núcleos tensores RTX de su PC ejecutarán aplicaciones de IA más sensibles a la latencia. ” dijo Walker de Nvidia.

Las nuevas tarjetas gráficas cumplirán con los controles de exportación y podrán enviarse a China, dijo la compañía, ofreciendo una alternativa para los investigadores y empresas chinos que no pueden obtener las GPU para servidores más potentes de Nvidia.