Google compartió una actualización de las capacidades de generación de imágenes de Google Cloud con Imagen 2, su “tecnología de conversión de texto a imagen más avanzada”. Lee los detalles de esta herramienta que ofrece resultados fotorrealistas de alta calidad ¡acá!

Google sigue apostando por la Inteligencia Artificial y, por cómo viene la cosa, parece que se postula como gran competencia de OpenAI. Y no solo hablamos de Gemini vs. ChatGPT, sino también de Imagen 2 vs. DALL-E 3. Y, para no quedarse atrás en la carrera, los de Mountain View recientemente compartieron una actualización de su generador de imágenes para desarrolladores y miembros de la nube a través de la API de Imagen en Vertex AI.
Si bien no todo el mundo puede acceder todavía a esta tecnología, Google adelantó algunas características que ofrecerá Imagen 2 para ayudar a las organizaciones a crear imágenes que “coincidan con los requisitos específicos de su marca con la misma confiabilidad y gobernanza de nivel empresarial a la que los clientes están acostumbrados con Imagen”. ¿Cuáles son estas nuevas funciones para los desarrolladores?

- Imágenes de alta calidad: Imagen 2 puede lograr resultados fotorrealistas precisos y de alta calidad con una mejor comprensión de la imagen y el texto y una variedad de técnicas novedosas de entrenamiento y modelado.
- Soporte de representación de texto: las tecnologías de texto a imagen a menudo tienen dificultades para representar el texto correctamente. Si se le solicita a un modelo que genere una imagen de un objeto con una palabra o frase específica, por ejemplo, puede resultar complicado garantizar que la frase correcta forme parte de la imagen de salida. Imagen 2 ayuda a resolver este problema, lo que puede brindar a las organizaciones un nivel más profundo de control sobre la marca y los mensajes.
- Generación de logotipos: Imagen 2 puede crear una amplia variedad de logotipos creativos y realistas, incluidos emblemas, letras y logos abstractos, para empresas, marcas y productos. También tiene la capacidad de superponerlos en productos, ropa, tarjetas de presentación y otras superficies.

- Subtítulos y preguntas-respuestas: las capacidades mejoradas de comprensión de imágenes de esta herramienta permiten a los clientes crear subtítulos descriptivos y de formato largo y obtener respuestas detalladas a preguntas sobre elementos dentro de la imagen.
- Mensajes en varios idiomas: además del inglés, Imagen 2 se lanza con soporte para seis idiomas adicionales (chino, hindi, japonés, coreano, portugués y español) en versión preliminar, y se planea lanzar muchos otros a principios de 2024.
- Seguridad: incluye precauciones de seguridad integradas para ayudar a garantizar que las imágenes generadas se alineen con los principios de IA responsable de Google. Por ejemplo, Imagen 2 está integrado con un servicio experimental de marcas de agua digitales, impulsado por SynthID de Google DeepMind, que permite a los clientes generar marcas de agua invisibles y verificar imágenes generadas. Imagen 2 también incluye filtros de seguridad integrales para ayudar a prevenir la generación de contenido potencialmente dañino.

Desde Google también comunicaron que emplearon “un enfoque doble de indemnización de derechos de autor” para poder brindar a los clientes “tranquilidad” al utilizar sus productos de IA generativa.
Como les decíamos, Imagen 2 se ofrece por medio de Vertex AI, una plataforma que ofrece todo lo necesario para crear y usar IA generativa, desde soluciones de IA hasta búsqueda y conversación, y más de 100 modelos base y una plataforma de IA unificada. Todavía no se sabe cuándo tiene previsto Google lanzar la herramienta a todo el público.