19.04.2024
136

La red neuronal VASA-1 convierte una foto en un vídeo

Yuliia Zablotska
Autora en ApiX-Drive
Tiempo de leer: ~2 min

Microsoft vuelve a estar a la vanguardia de la innovación en el campo de la inteligencia artificial. Recientemente, la empresa presentó su nueva red neuronal VASA-1, que puede transformar fotografías normales en vídeos realistas. ¿Recuerdas las fotos "en vivo" de Sirius Black de la película "Harry Potter y el prisionero de Azkaban" publicadas en el periódico? Lo que era una fantasía en 2004 se ha convertido en realidad 20 años después. Todo lo que se necesita es una imagen y una grabación de audio para que la IA reproduzca emociones y expresiones faciales en detalle y produzca un vídeo extremadamente realista. La página web oficial de Microsoft ya cuenta con una página dedicada a esta tecnología, donde podrás encontrar muchos ejemplos de su uso.

VASA-1 utiliza algoritmos avanzados para simular el movimiento de partes del rostro, asegurando la naturalidad y suavidad de las expresiones faciales. La IA divide la cara en segmentos similares a músculos, lo que permite reproducir incluso movimientos tan complejos como girar la cabeza. Las herramientas para editar el estado emocional y la dirección de la mirada de los personajes brindan a los usuarios la capacidad de adaptar el contenido a diferentes necesidades, desde blogs de entretenimiento hasta podcasts profesionales. El sistema funciona en potentes PC con procesadores gráficos NVIDIA RTX 4090 y admite la creación de vídeos con una frecuencia de hasta 45 fotogramas por segundo a partir de fotografías con una resolución de hasta 512x512 píxeles.

Debido a que las capacidades de VASA-1 son verdaderamente revolucionarias, a Microsoft le preocupa el uso potencial de la red neuronal para crear imágenes y videos falsos con fines de manipulación o fraude. Actualmente, la empresa se niega temporalmente a distribuir demostraciones en línea, API y otras herramientas relacionadas con VASA-1 hasta que se desarrollen mecanismos sólidos para garantizar el uso ético de esta tecnología.