in Software

MusicGen: Cómo generar música con inteligencia artificial y texto

Uno de los modelos ya está disponible en línea

La gente de Meta sigue compartiendo sus desarrollos de inteligencia artificial. A mediados de abril exploramos Animated Drawings para animar dibujos, su chatbot Llama 2 apareció en los últimos días de julio, y ahora es el turno de AudioCraft. Tal y como lo sugiere su nombre, AudioCraft se concentra en la generación de audio con inteligencia artificial, y consiste de tres modelos: AudioGen, MusicGen, y EnCodec. El código ya está disponible para todos, pero si quieres probar MusicGen en este instante, puedes hacerlo sin instalar nada.

Riffusion, MusicLM, Soundraw, SongR. La idea de generar música con inteligencia artificial está ganando tracción en la Web. Desde un punto de vista técnico, esas plataformas aún se encuentran lejos si las comparamos con la generación de imágenes, pero el tiempo está definitivamente a su favor, y con cada nuevo modelo, los parámetros de calidad seguirán mejorando.

Así llegamos al proyecto AudioCraft de Meta. Esta biblioteca fue especialmente diseñada para realizar investigaciones de aprendizaje profundo en generación de audio, y se divide en tres modelos avanzados: AudioGen para la creación de efectos de sonido, MusicGen para generar música, y EnCodec, un «códec de audio neural» de alta fidelidad. El perfil de AudioCraft en GitHub contiene todo el código y las instrucciones de instalación, pero puedes probar a MusicGen en este momento gracias a la presencia de Meta en HuggingFace.

Cómo generar música con prompts usando AudioCraft y MusicGen

La espera puede ser más larga de lo normal, dependiendo de la carga en el server, y el momento del día

Esta versión de MusicGen posee dos herramientas: Una caja para ingresar nuestro prompt, y otra que nos permite cargar una melodía o muestra de micrófono como referencia. Hacemos clic en Generate, y eso nos llevará a la cola de espera. En promedio, HuggingFace reporta una demora de 600-900 segundos, pero en algunas pruebas, el modelo tardó la mitad de ese tiempo (por supuesto, esto dependerá de la carga en los servidores). El resultado final es una muestra de quince segundos, en formato MP4.

«a lively bard playing the lute on a tavern»

«an ominous, foreboding church piano melody, anticipating the appearance of an enemy in a videogame»

«soundtrack of a ecstatic moment in a space battle of a sci fi movie»

¿Qué tan bien funciona? Bueno… no es terrible. El modelo no ofrece ningún control de seed o intensidad, pero parece seguir con cierta precisión a nuestro prompt. Obviamente, la descripción se escribe en inglés, y cualquier modificación mínima puede generar melodías muy diferentes. El límite de quince segundos es absoluto aquí, y tampoco debemos esperar un «bucle» para utilizarlo de fondo en algún proyecto, sin embargo, creo que MusicGen tiene el potencial para convertirse en una herramienta mucho más robusta.

Accede a MusicGen: Haz clic aquí

AudioCraft en Facebook: Haz clic aquí

Reportar

música

¿Qué te pareció?

3 Points

Voto Positivo Voto Negativo

Escrito por Lisandro Pardo

Deja una respuesta Cancelar la respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Cómo reparar errores de USB en Windows con USB Repair

StagingTool: El programa filtrado por Microsoft que desbloquea funciones en Windows 11

Populares

Trending Geeky

in Artilugios

¿Por qué este adaptador dejó de funcionar? En Microsoft lo saben

Tal vez seas demasiado joven para recordar esto, pero hubo un período de transición en el que ratones y teclados USB venían equipados con adaptadores PS/2 (o viceversa), que garantizaban su compatibilidad. Sin embargo, con el paso del tiempo esos adaptadores dejaron de funcionar en la gran mayoría de los casos, y la única opción […] More

por Lisandro Pardo hace un día
Geeky

in Entretenimiento

Watch the Skies: Una película con «doblaje visual» que usa inteligencia artificial

Nos guste o no… esto se viene

La inteligencia artificial y el mundo del cine mantienen una relación muy tensa… pero inevitable. Ya tenemos deepfakes, síntesis de voz, corrección de acentos, rejuvenecimiento digital, y ahora es el turno del «doblaje visual». ¿Qué significa eso? Que alguien puede filmar una película en un idioma específico, preparar el doblaje a otro, y después alterar/sincronizar […] More

por Lisandro Pardo hace 3 días
No me gusta ¡Pero qué c...!

in Artilugios

Tu lavavajillas nuevo requiere WiFi y una app. ¿Cuál es tu reacción?

Los «dispositivos inteligentes» son zombies de los que no hay escapatoria…

La situación no es muy difícil de imaginar: Un lavavajillas con varios años sobre los hombros tira la toalla. Obtener sus repuestos (que además no garantizan su funcionamiento) representa una buena parte del costo de una unidad nueva, y varias recomendaciones en línea apuntan a un modelo específico… pero después de su instalación, el manual […] More

por Lisandro Pardo hace 4 días
Thug life Geeky

in Hardware

¿Recuerdas a la Nintendo PlayStation? ¡Hay otra más!

Descansando en un armario durante décadas…

Julio de 2015: El descubrimiento de un prototipo de la Nintendo PlayStation, producto de la colaboración fallida entre Nintendo y Sony, tomó a la Web por asalto. Cinco años más tarde, terminó en manos de un coleccionista privado por casi 400 mil dólares, y desapareció de la faz de la tierra. Y ahora, casi diez […] More

por Lisandro Pardo hace 6 días
Thug life

in Juegos

Tráiler Flash: 20 años de God of War

Celebrando una de las franquicias más importantes

No, el calendario no te engaña: Ayer se cumplieron 20 años del lanzamiento de God of War para PlayStation 2. Así comenzó la historia del espartano Kratos, lleno de furia, sediento de sangre, y traicionado por los dioses. Más allá de lo que sucedió en Ragnarök, algo nos dice que la historia de Kratos está […] More

por Lisandro Pardo hace 6 días
in Entretenimiento

Tráiler Flash: Final Destination Bloodlines (nuevo tráiler)

La Muerte puede fracasar… pero lo intentará de nuevo

En febrero pasado, el teaser de Final Destination Bloodlines explotó en la Web. Tres días y 16 millones de reproducciones después, lo mismo se repite con su tráiler oficial. Sólo puedo decir que la Muerte demuestra un gran orgullo por su trabajo, y perseguirá a familias enteras durante generaciones para ordenar las cosas… pero no […] More

por Lisandro Pardo hace 10 horas

Tráiler Flash: Final Destination Bloodlines (nuevo tráiler)

Microsoft elimina el «BypassNRO» para instalar Windows 11 sin cuentas

¿Por qué este adaptador dejó de funcionar? En Microsoft lo saben

El repetidor WiFi más falso que hayas visto

Cómo encontrar el servidor DNS más rápido en tu ubicación

Jugando en hardware viejo: ¿60 FPS por 60 centavos?

MusicGen: Cómo generar música con inteligencia artificial y texto

Uno de los modelos ya está disponible en línea

Cómo generar música con prompts usando AudioCraft y MusicGen

¿Qué te pareció?

Escrito por Lisandro Pardo

Deja una respuesta Cancelar la respuesta

Tráiler Flash: Final Destination Bloodlines (nuevo tráiler)

Microsoft elimina el «BypassNRO» para instalar Windows 11 sin cuentas

¿Por qué este adaptador dejó de funcionar? En Microsoft lo saben

El repetidor WiFi más falso que hayas visto

Cómo encontrar el servidor DNS más rápido en tu ubicación

Jugando en hardware viejo: ¿60 FPS por 60 centavos?

Microsoft elimina el «BypassNRO» para instalar Windows 11 sin cuentas

Transfiere archivos entre equipos rápidamente con PairDrop

WACUP: Winamp, «rescatado» por la comunidad

Cómo aumentar el sonido de tu PC más allá del límite con Equalizer APO y Peace Equalizer

Jugando Doom en un teléfono de línea, «segunda edición»

Microsoft «lanza» un Office gratuito y con publicidad

Los mejores buscadores de la Deep Web

Cómo saber el nombre de una película

UBP-X700/K: Sony lanza un nuevo reproductor Blu-ray

Conoce al modelo original del Enterprise que estuvo desaparecido por décadas

Una válvula de 223 mil dólares apareció en una tienda de ahorro

«Traductor élfico» en línea: Tengwar y Sindarin a tu alcance

Cómo reparar errores de USB en Windows con USB Repair

StagingTool: El programa filtrado por Microsoft que desbloquea funciones en Windows 11

¿Por qué este adaptador dejó de funcionar? En Microsoft lo saben

Watch the Skies: Una película con «doblaje visual» que usa inteligencia artificial

Tu lavavajillas nuevo requiere WiFi y una app. ¿Cuál es tu reacción?

¿Recuerdas a la Nintendo PlayStation? ¡Hay otra más!

Tráiler Flash: 20 años de God of War

Tráiler Flash: Final Destination Bloodlines (nuevo tráiler)

Cómo generar música con prompts usando AudioCraft y MusicGen

¿Qué te pareció?

Deja una respuesta Cancelar la respuesta

Hemos detectado un bloqueador de publicidad.

Entrar

Sign In

¿Has olvidado la clave?

Your password reset link appears to be invalid or expired.

Entrar

Privacy Policy

Agregar a Colección

No Collections