in Software

Riffusion: Una variante de Stable Diffusion para crear música con inteligencia artificial

Y todo comienza con una poco de texto…

Los desarrolladores de plataformas generativas se adaptan a nuevas exigencias. Los entusiastas y los artistas «combaten» en redes sociales. Y entre todo ese caos surgen nuevos proyectos basados en inteligencia artificial. Uno de ellos es Riffusion, que utiliza una versión optimizada de Stable Diffusion para crear espectrogramas, representaciones visuales de sonido que podemos escuchar fácilmente.

Imágenes, vídeos, voces, música. Los proyectos de inteligencia artificial siguen evolucionando… con opiniones a favor y en contra. Recientemente hemos visto protestas, muchos «intercambios» que equivalen a ladrillazos digitales, y enormes dudas en materia de copyright y fair use. Tarde o temprano, los conflictos legales llegarán a instancias superiores, pero independientemente de lo que suceda, la inteligencia artificial continuará sorprendiéndonos.

Hoy es el turno de una nueva plataforma generativa llamada Riffusion, desarrollada por Seth Forsgren y Hayk Martiros. Tal y como lo sugiere su nombre, Riffusion tiene alma de Stable Diffusion, con una diferencia: El modelo fue especialmente optimizado para generar sonogramas/espectrogramas. En otras palabras, representaciones visuales de audio basadas en prompts de texto.

Riffusion: De texto a audio con inteligencia artificial

Ingresa un prompt, y deja que el modelo haga el resto

La página no requiere ninguna clase de cuenta, ni la compra de tokens para generar sonidos. De hecho, recomienda al usuario que experimente ingresando sus estilos e instrumentos favoritos. Las combinaciones son definitivamente bienvenidas, por ejemplo, «gospel tropical». También es posible crear prompts que indiquen la presencia de voces (uno de los más interesantes que encontré fue «post-teen pop talent show winner»), pero no debemos esperar ningún diálogo claro.

El sonograma/espectrograma es fácil de interpretar: El eje X representa el tiempo, el eje Y la frecuencia de los sonidos, y el color de cada píxel su amplitud. La última fase queda a cargo de Torchaudio, que toma la imagen generada por Stable Diffusion, y la convierte en audio. La sección About de Riffusion es excelente, y merece tu atención.

Al igual que en otros modelos, puedes alterar el seed y el nivel de denoising

La configuración avanzada nos permite cambiar la imagen que sirve como seed (cinco opciones diferentes), y el nivel de denoising. Cuanto más alto es, más «creativo» resulta su output… pero se alejará de lo que quieres. Este comportamiento es idéntico al de Stable Diffusion procesando imágenes. Otra cosa que toma prestada es el peso de los prompts. Por ejemplo, un énfasis en violines puede ser escrito como (violin:1.25) entre paréntesis, o corchetes para minimizar su impacto: [violin] equivale a una reducción de 1.1x.

Para finalizar, el servidor de Riffusion está siendo bombardeado con solicitudes, por lo tanto, hay que armarse de paciencia. También necesitarás buena aceleración de hardware en tu navegador, porque el sitio oficial es bastante exigente. ¡Haz la prueba!

Sitio oficial: Haz clic aquí

Reportar

Destacados inteligencia artificial

¿Qué te pareció?

8 Points

Voto Positivo Voto Negativo

Escrito por Lisandro Pardo

Deja una respuesta Cancelar la respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Enlaces Recomendados de la Semana (N°699)

Turtle.Audio: Cómo «dibujar música» imitando al Logo

Populares

Thug life Una monería

in Software

WACUP: Winamp, «rescatado» por la comunidad

Una versión actualizada y con nuevas funciones, que respeta su esencia

Los últimos movimientos oficiales de Winamp han sido como mínimo decepcionantes. Aún recordamos muy bien el escándalo que envolvió a su código, primero con restricciones absurdas, después con una sección de issues estallada, y finalmente, eliminando su presencia de GitHub. Sin embargo, nada de eso afectó al Winamp Community Update Project, que ofrece una versión […] More

por Lisandro Pardo hace 7 días
Trending Geeky

in Hardware

UBP-X700/K: Sony lanza un nuevo reproductor Blu-ray

Okay… no esperábamos esto

A mediados de diciembre reportamos que LG discontinuó sus reproductores Blu-ray. Un mes más tarde, Sony confirmó el cese en la producción de discos Blu-ray grabables. Y cuando todo el mundo esperaba más malas noticias para el formato… ¿surge una buena? Se trata del Sony UBP-X700/K, un nuevo reproductor del gigante japonés, y el primero […] More

por Lisandro Pardo hace 13 horas
in Hardware

Reconstruyendo la carcasa de un ordenador retro

Con tres décadas sobre los hombros, el plástico se deshace…

Trabajar sobre ordenadores retro es un proceso fascinante y frustrante al mismo tiempo. Fascinante porque podemos desafiar a la mismísima obsolescencia, y frustrante porque el tiempo siempre da su mordisco. En el caso del Toshiba Libretto 50CT que decidió restaurar Polymatt en YouTube, los problemas son dos: Una contraseña muy difícil de eliminar, y el […] More

por Lisandro Pardo hace 6 días
Una monería Thug life

in Entretenimiento

Imágenes del «detrás de escenas» de Solaris, el clásico soviético de 1972

Un poco más de material, después de medio siglo

Sí, George Clooney hizo una «Solaris» en 2002. No, no es tan terrible como dicen, pero tampoco es que la haya visto mucha gente. La versión definitiva es sin lugar a dudas la que dirigió Andrei Tarkovsky en 1972. Su «Solaris» fue una respuesta a la falta de profundidad emocional que estaba viendo en la […] More

por Lisandro Pardo hace 6 días
in Artilugios

¿Tienes un Echo? Amazon recibirá todo lo que le digas

¿Privacidad? Eso es ciencia ficción…

La historia comienza así: En febrero pasado, Amazon confirmó el lanzamiento de una nueva versión de Alexa (llamada Alexa+) para usuarios de Prime en los Estados Unidos, y para quienes paguen 20 dólares mensuales. ¿Cuál es el problema? Según la compañía, esto requiere el uso de funciones generativas, que sólo pueden ser procesadas online. Por […] More

por Lisandro Pardo hace 10 horas
in Entretenimiento

Tráiler Flash: Lilo & Stitch

Okay, la gente no lo está odiando…

… y eso es mucho, considerando las expresiones vitriólicas que han recibido otras adaptaciones live action de Disney. Lilo realmente suena como Lilo, Chris Sanders vuelve a hacer la voz de Stitch, su animación no lo hace parecer como extraído de un lavarropas, el caos es absoluto, y 23 años después, Ohana sigue significando familia. […] More

por Lisandro Pardo hace 5 días

¿Tienes un Echo? Amazon recibirá todo lo que le digas

UBP-X700/K: Sony lanza un nuevo reproductor Blu-ray

Tráiler Flash: Black Mirror, séptima temporada

El día que un grupo de legisladores trató de redondear Pi a 4 (vídeo)

Neptune: Fabricando la consola que Sega canceló

Probando la generación de imágenes en Google Gemini 2.0 Flash

Riffusion: Una variante de Stable Diffusion para crear música con inteligencia artificial

Y todo comienza con una poco de texto…

Riffusion: De texto a audio con inteligencia artificial

¿Qué te pareció?

Escrito por Lisandro Pardo

Deja una respuesta Cancelar la respuesta

Los mejores clientes de correo electrónico gratuitos

Google anuncia el retiro de su servicio Google Reader

Send to Kindle: envía artículos de la web a tu Kindle

Streamified: Un elegante RSS de social media

Los mejores lectores de Feeds RSS

¿Tienes un Echo? Amazon recibirá todo lo que le digas

Transfiere archivos entre equipos rápidamente con PairDrop

WACUP: Winamp, «rescatado» por la comunidad

Cómo aumentar el sonido de tu PC más allá del límite con Equalizer APO y Peace Equalizer

Jugando Doom en un teléfono de línea, «segunda edición»

Microsoft «lanza» un Office gratuito y con publicidad

Amazon recuerda a sus usuarios: No son dueños de los libros en sus Kindle

Cómo saber el nombre de una película

Los mejores buscadores de la Deep Web

Amazon recuerda a sus usuarios: No son dueños de los libros en sus Kindle

Conoce al modelo original del Enterprise que estuvo desaparecido por décadas

Enlaces Recomendados de la Semana (N°464)

Reparando el «síndrome vinagre» en pantallas LCD

Enlaces Recomendados de la Semana (N°699)

Turtle.Audio: Cómo «dibujar música» imitando al Logo

WACUP: Winamp, «rescatado» por la comunidad

UBP-X700/K: Sony lanza un nuevo reproductor Blu-ray

Reconstruyendo la carcasa de un ordenador retro

Imágenes del «detrás de escenas» de Solaris, el clásico soviético de 1972

¿Tienes un Echo? Amazon recibirá todo lo que le digas

Tráiler Flash: Lilo & Stitch

Riffusion: De texto a audio con inteligencia artificial

¿Qué te pareció?

Deja una respuesta Cancelar la respuesta

Hemos detectado un bloqueador de publicidad.

Entrar

Sign In

¿Has olvidado la clave?

Your password reset link appears to be invalid or expired.

Entrar

Privacy Policy

Agregar a Colección

No Collections