Google sorprendió a muchos con la calidad de su modelo de generación de video más avanzado: Veo. Esta IA ya está disponible en Vertex AI para los usuarios que accedieron a la versión beta privada. Te contamos todos los detalles ¡acá!
En una actualidad donde abundan generadores de videos con IA, Google vino a sorprender y a ganarle la carrera a OpenAI y Sora con Veo, el modelo más avanzado de la compañía. Si bien lo habían anunciado en mayo, el gigante tecnológico recientemente anunció que ya está disponible para cualquier usuario de Vertex AI que haya accedido a la versión beta privada. Pero ¿de qué trata y qué diferencia a este generador de videos de los demás?
Al igual que los demás modelos de IA, Veo nos deja generar videos de alta calidad a partir de prompts o breves descripciones de texto e imágenes. Con esta herramienta, Google quiere ayudar a las empresas a “transformar sus activos creativos existentes en elementos visuales dinámicos” y “abrir nuevas posibilidades para la expresión creativa y agilizar los flujos de trabajo de producción de video”.
Desarrollado por Google DeepMind, Veo genera videos de 1080p basados en texto o imágenes en diferentes estilos cinematográficos y visuales. Según describió la compañía, esta tecnología tiene un conocimiento avanzado del lenguaje natural y la semántica visual que ayuda a generar videos que se alinean estrechamente con el prompt. De esta manera, el modelo de IA crea imágenes consistentes y coherentes de personas, animales y objetos que se mueven de manera realista a lo largo de las tomas.
Hasta el momento, no está claro cuánto pueden durar los videos creados a partir de la IA de Google. En el lanzamiento, la compañía había insinuado que durarían aproximadamente un minuto. Sin embargo, no mencionaron ningún límite de duración para esta versión preliminar de Vertex AI.
Para que se den una idea de la capacidad de este generador de video, Google está ofreciendo Veo a diferentes creadores y compañías como una forma de hacer anuncios más rápidos y más baratos. “Ya sea que sea un especialista en marketing que crea publicaciones atractivas para las redes sociales, un equipo de ventas que crea presentaciones atractivas o un equipo de producción que explora nuevos conceptos, Veo agiliza su flujo de trabajo y desbloquea nuevas posibilidades para la narración visual”, explicó Google.
Es más, empresas como Mondelez International (propietario de Chips Ahoy!, Cadbury, Oreo y Milka) o la agencia de viajes Agoda ya están utilizando Veo para acelerar y mejorar la creación de contenido de campañas. Google incluso compartió un ejemplo de cómo el equipo de Agoda utilizó la IA para hacer un video promocional:
Además de esto, Google también anunció que su modelo de generación de imágenes de mayor calidad, Imagen 3, estará disponible para todos los clientes de Vertex AI a partir de la próxima semana. Esta herramienta de texto a imagen es capaz de crear imágenes más precisas y realistas, con más luz y detalle, y según describió la empresa, son ideales para usar en campañas de marketing, publicidad o anuncios.
Ahora bien, con tanto generador de imagen y video con IA, muchos se preocuparán por la seguridad, la protección y problemas de desinformación y atribución errónea. Sobre esto, Google aseguró que tanto los vídeos con Veo como las imágenes con Imagen 3 cuentan con una marca de agua digital e invisible con SynthID de DeepMind, una herramienta para identificar contenido generado por IA.
Además de esto, el contenido generado por Veo e Imagen 3 también tendrá filtros de seguridad, protecciones integradas y procesos de verificación de memorización que ayudan a mitigar los riesgos de privacidad, derechos de autor y sesgo y protegen contra la creación de contenido dañino.