Las incrustaciones de IA generativa de texto e imágenes llegan a Amazon Titan

Durante la conferencia magistral de IA generativa de AWS re:Invent, Amazon anunció el soporte de Bedrock para Claude 2.1 y Llama 2 70B y más.

Después de los anuncios de AWS de ayer sobre el chatbot Amazon Q para empresas y nuevos chips potentes para cargas de trabajo de IA, el vicepresidente de bases de datos, análisis y aprendizaje automático de AWS, Swami Sivasubramanian, subió al escenario en la conferencia AWS re:Invent en Las Vegas el 29 de noviembre. para profundizar en las ofertas de IA de AWS. Anunció nuevos modelos de IA generativa que llegarán a Amazon Bedrock, búsqueda multimodal disponible para Amazon Titan en Amazon Bedrock y muchas otras nuevas características y herramientas de software empresarial relacionadas con el uso de IA generativa para el trabajo.

Salta a:

Amazon Titan ahora puede realizar búsquedas basadas en texto e imágenes

Las incorporaciones de Amazon Titan Multimodal ahora están disponibles de forma general en Amazon Bedrock, la herramienta de AWS para crear y escalar aplicaciones de IA. Las incorporaciones multimodales permiten a las organizaciones crear aplicaciones que permiten a los usuarios buscar utilizando texto e imágenes para obtener opciones de búsqueda y recomendación más ricas, dijo Sivasubramanian.

“Ellos (los clientes de AWS) quieren permitir a sus clientes buscar muebles utilizando una frase, una imagen o incluso ambas”, dijo Sivasubramanian. “Les vendrían bien instrucciones como ‘muéstrame qué funciona bien con mi sofá'”.

VER: ¿AWS o Google Cloud son adecuados para su negocio? (República Tecnológica)

Titan Text Lite y Titan Text Express agregados a Amazon Bedrock

Titan Text Lite y Titan Text Express ahora están disponibles de forma generalizada en Amazon Bedrock para ayudar a optimizar la precisión, el rendimiento y el costo, según sus casos de uso. Titan Text Lite es un modelo muy pequeño para texto y se puede ajustar. Titan Text Express es un modelo que puede realizar una gama más amplia de tareas de IA generativa basadas en texto, como chat conversacional y preguntas abiertas.

Generador de imágenes Titan (Figura A) ahora está disponible en vista previa pública en los EE. UU. Se puede utilizar para crear imágenes utilizando indicaciones en lenguaje natural. Las organizaciones pueden personalizar imágenes con datos patentados para que coincidan con su industria y marca. Las imágenes tendrán una marca de agua invisible de forma predeterminada para ayudar a evitar la desinformación.

Figura A

Una imagen creada por Titan Image Generator. Imagen: AWS

Claude 2.1 y Llama 2 70B ahora alojados en Amazon Bedrock

Amazon Bedrock ahora admitirá Claude 2.1 de Anthropic para usuarios en los EE. UU. Esta versión de la IA generativa de Claude ofrece avances en una ventana de 20 000 contextos, precisión mejorada, un 50 % menos de alucinaciones incluso durante ataques rápidos de adversarios y una reducción dos veces en declaraciones falsas en abierto. conversaciones finalizadas en comparación con Claude 2. El uso de herramientas para la llamada de funciones y la orquestación del flujo de trabajo en Claude 2.1 están disponibles en versión beta para socios seleccionados de acceso temprano.

Llama 2 70B de Meta, un modelo de lenguaje público grande optimizado para casos de uso basados en chat y tareas a gran escala, está disponible hoy en Amazon Bedrock.

Asistencia de Claude disponible en el Centro de innovación de IA generativa de AWS

El Centro de innovación de IA generativa de AWS se expandirá a principios de 2024 con un programa de modelo personalizado para Anthropic Claude. El Centro de innovación de IA generativa de AWS está diseñado para ayudar a las personas a trabajar con el equipo de expertos de AWS para personalizar las necesidades de Claude para los datos comerciales propios.

Se anuncian casos de uso adicionales de Amazon Q

Sivasubramanian anunció una vista previa de Amazon Q, el chatbot de lenguaje natural de AWS, en Amazon Redshift, que puede brindar ayuda con la escritura de SQL. Amazon Redshift con Amazon Q permite a los desarrolladores hacer preguntas en lenguaje natural, que la IA traduce en una consulta SQL. Luego, pueden ejecutar esa consulta y ajustarla según sea necesario.

Además, Amazon Q para canalizaciones de integración de datos ahora está disponible en la plataforma informática sin servidor AWS Glue para crear trabajos de integración de datos en lenguaje natural.

Herramientas de capacitación y evaluación de modelos agregadas a Amazon SageMaker

Sivasubramanian anunció la disponibilidad general de SageMaker HyperPod, una nueva capacidad de entrenamiento de IA generativa distribuida para reducir el tiempo de entrenamiento del modelo hasta en un 40%. SageMaker HyperPod puede entrenar modelos generativos de IA por sí solo durante semanas o meses, automatizando las tareas de dividir datos en fragmentos y cargarlos en chips individuales en un grupo de entrenamiento. SageMaker HyperPod incluye módulos de capacitación distribuidos de SageMaker, puntos de control administrados para optimización y la capacidad de detectar y redireccionar fallas de hardware. Otras características nuevas de SageMaker incluyen la inferencia de SageMaker para una optimización más rápida y una nueva experiencia de usuario en SageMaker Studio.

Amazon SageMaker y Bedrock ahora tienen evaluación de modelos, que permite a los clientes evaluar diferentes modelos básicos para encontrar cuál es el mejor para su caso de uso. La evaluación del modelo está disponible en versión preliminar.

Capacidades vectoriales y herramientas de gestión de datos agregadas a muchos servicios de AWS

Sivasubramanian anunció más herramientas nuevas en torno a vectores y gestión de datos que son adecuadas para una variedad de casos de uso empresarial, incluida la IA generativa.

Vector Engine para OpenSearch Serverless ya está disponible de forma generalizada.
Las capacidades vectoriales llegarán a Amazon DocumentDB y Amazon DynamoDB (ahora disponibles en todas las regiones donde Amazon DocumentDB está disponible) y Amazon MemoryDB para Redis (ahora en versión preliminar).
Amazon Neptune Analytics, un motor de base de datos de análisis para Amazon Neptune o Amazon S3, está disponible hoy en determinadas regiones.
Integración de ETL cero del servicio Amazon OpenSearch con Amazon S3.
AWS Clean Rooms ML, que permite a las organizaciones compartir modelos de aprendizaje automático con socios sin compartir sus datos subyacentes.

“Si bien la IA de generación todavía necesita una base sólida, también podemos utilizar esta tecnología para abordar algunos de los grandes desafíos en la gestión de datos, como hacer que los datos sean más fáciles de usar, hacerlos más intuitivos y hacer que los datos sean más valiosos”, dijo Sivasubramanian.

Nota: TechRepublic cubre AWS re:Invent virtualmente.