in

Project VoCo: El «Photoshop» del audio de Adobe

«No pongas en mi boca palabras que yo no he dicho» es una frase que se repite en miles de discusiones, ¿pero y si fuera posible hacer exactamente eso? Vamos a pensarlo por un momento: Hoy el Photoshop nos enseña cosas que no existen. Hemos observado iniciativas con el potencial de digitalizar actores fallecidos y traerlos de regreso a la pantalla grande. Los asistentes en dispositivos móviles reconocen nuestra voz a la perfección. ¿Qué tan difícil sería imitarla entonces? El Project VoCo de Adobe está tratando de averiguarlo.

La conferencia MAX que la gente de Adobe organiza cada año permite a desarrolladores y consumidores por igual ver más de cerca algunas de las cosas en las que se encuentra trabajando la compañía, ya sean productos de salida directa al mercado, o prototipos relativamente oscuros. En esta segunda categoría encaja Project VoCo, algo que no nos dice mucho con su nombre, pero que arrastra un potencial escalofriante. ¿Qué clase de potencial es ese? Veamos: Todos sabemos lo que puede hacer Photoshop en manos de un experto. Las modelos no tienen ni una sola imperfección en su piel, coches que aún no fueron construidos realizan espectaculares maniobras en la playa, y los políticos pierden diez o quince años cuando se encuentran en campaña. Ahora, pensemos en esos recursos aplicados al audio. Tomar el discurso de alguien, editarlo, reemplazar y colocar palabras que no están allí.

Project VoCo
Demo en vivo de VoCo durante la conferencia MAX

De eso se trata Project VoCo. En las palabras del desarrollador de Adobe Zeyu Jin, VoCo hace para el audio lo que Photoshop para la fotografía. El software es algo así como un pre alfa en estos momentos, pero si obedecemos a las breves demostraciones, todo lo que tiene que hacer el usuario es ingresar texto en una pequeña caja de diálogo, y VoCo lo reproducirá usando exactamente la misma voz. Por supuesto, semejante función implica realizar un análisis muy amplio del audio, y varias fuentes indican que VoCo necesita al menos 20 minutos de contenido para hacer una reproducción fiel. Si calculamos lo que duran en promedio los discursos de algunos políticos, estoy convencido de que VoCo posee material de sobra.

Si bien Adobe cuenta con razones legítimas para avanzar en un proyecto con estas características, las alarmas éticas no han dejado de sonar. Como siempre, la culpa no es de la herramienta, sino de quien la usa. Si VoCo llega a manos sin escrúpulos, un discurso lógico y coherente podría ser transformado en agresivo o beligerante… y viceversa. Ya nos resulta muy difícil detectar imágenes editadas y vídeos falsos. Imaginen extender ese mismo conflicto a una pieza de audio que puede durar un par de horas. Aún así, seguiremos a VoCo de cerca.

Reportar

¿Qué te pareció?

Escrito por Lisandro Pardo

5 Comments

Leave a Reply

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

VoCore2: La nueva generación del microordenador Linux

Mass Effect: Andromeda – Trailer cinemático de revelación