otra inteligencia artificial crea imágenes impresionantes

Google presentó esta semana su modelo de computadora de “texto a imagen” me fuique genera imágenes hiperrealistas mediante el estudio de decenas de billones de entradas.

Pathways Autoregressive Text-to-Image, o Parti, estudia conjuntos de imágenes, que Google llama “fichas de imagen”usándolos para crear nuevas imágenes, dijo el gigante de las búsquedas en un sitio web de investigación.

Las imágenes de Parti se vuelven más realistas cuando tiene más parámetros (tarjetas y otro material de capacitación) para revisar. Los estudios de modelo 20 mil millones de parámetros antes de generar una imagen final.

Parti difiere de Image, un generador de texto a imagen que Google diseñó para utilizar el aprendizaje por difusión. El proceso entrena modelos informáticos. agregando “ruido” a una imagen para oscurecerla, como si estuviera estática en una pantalla de televisión.

Luego, el modelo aprende a decodificar la estática para recrear la imagen original. A medida que el modelo mejora, puede convertir lo que parece una serie de puntos aleatorios en una imagen.

Parti, la IA de Google. foto de google

Google no está lanzando Parti o Image al público porque Los conjuntos de datos de IA conllevan el riesgo de sesgo. Debido a que los conjuntos de datos son creados por humanos, sin darse cuenta pueden respaldar estereotipos o tergiversar ciertos grupos. Google dice que tanto Parti como Google Image tienen un sesgo hacia los estereotipos occidentales.

El gigante de las búsquedas ha invertido mucho en inteligencia artificial como una forma de mejorar sus servicios y desarrollar la computación ambiental, una forma de tecnología tan intuitiva que se convierte en parte de un segundo plano.

En su conferencia de desarrolladores de E/S en mayo, el CEO Sundar Pichai dijo que la IA se está utilizando para ayudar a Google Translate a agregar idiomas, crear imágenes 3D en Maps y condensar documentos en resúmenes rápidos.

Parti e Image no son los únicos modelos de texto a imagen que existen. Los modelos Dall-E, VQ-GAN+CLIP y Latent Diffusion son otros modelos de texto a imagen que no pertenecen a Google y que han sido noticia recientemente. Dall-E Mini es una IA de texto a imagen código abierto que está disponible para el público, pero está entrenado en conjuntos de datos más pequeños.

Parti, la IA de Google. foto de google

Dall-E, la tecnología que se hizo viral

Desde la semana pasada, las redes sociales se han inundado de imágenes muy particulares. Generados por inteligencia artificial, algunos son muy fieles al título. Otros parecen deformados. Lo cierto es que Dall-E se convirtió en tendencia: es un sitio que genera una representación de lo que escribe el usuario. Incluso lo que preguntamos no existe en el mundo real.

Dall-E es una tecnología creada por una empresa de San Francisco, OpenAI. La empresa tiene como objetivo crear “una inteligencia general artificial segura y útil”, y es reconocida en el entorno informático por trabajar en GPT-3, una herramienta que genera imágenes a partir de indicaciones muy básicas como, por ejemplo, un texto. También usan Copilot, una herramienta que ayuda a automatizar la escritura de código para ingenieros de software.

Qué significa todo esto? Que Dall-E puede generar imágenes con palabras. A partir de un algoritmo que considera 12 mil millones de parámetrosel sistema crea imágenes con solo letras.

A partir de esto, las redes se inundaron con este tipo de imágenes: