El problema que hoy enfrentan los diferentes tipos de servicios de música en línea no está en ofrecer al usuario el tema que quiere. Después de todo, sólo se debe limitar a buscar el contenido y reproducirlo. En realidad, el truco está en saber qué música es la que le gusta al usuario, y ofrecerle sugerencias para incrementar la experiencia. Los ordenadores pueden haber mejorado mucho a la hora de interpretar la semántica de un lenguaje, pero en el caso de la música, todavía tienen mucho para aprender. Allí es en donde entra esta gigantesca base de datos, liberada al público general.
La realización de sugerencias en el entorno comercial puede encontrarse en casi todas partes. “¿Te puedo ofrecer un postre para acompañar a tu combo?” es una pregunta relativamente común entre las casas de comida rápida más importantes del globo, y el ejemplo se repite de forma constante en muchos otros rubros. Los ordenadores no son la excepción, y los servicios en línea tampoco. La música a través de Internet se está convirtiendo en un negocio particularmente redituable. Los usuarios de Grooveshark siguen creciendo, Spotify llegó al millón de usuarios que pagan una suscripción mensual, y de ninguna forma podemos ignorar la masiva cantidad de canciones vendidas por iTunes. Entonces, ¿cómo seguir? La solución no es otra más que detectar y comprender los gustos del consumidor. El servicio Pandora recurre a musicólogos para expandir su base de datos y realizar sugerencias, pero ahora, surge otra opción.
Million Song Dataset es una gigantesca base de información que contiene datos sobre un millón de canciones, pero irónicamente, no hay audio en su interior. Dicha información puede ser utilizada por investigadores y desarrolladores para crear y mejorar algoritmos destinados a recomendar música, a realizar estudios culturales, y otros tantos proyectos. Su tamaño responde directamente a una necesidad comercial. Cualquier desarrollador puede tener un algoritmo eficiente, pero no sirve de nada si sólo logra sugerir veinte o treinta canciones por vez. Con la cantidad de usuarios conectados que puede tener un servicio de música en línea en un tiempo determinado, la necesidad de sugerencias se ve elevada a varios cientos de miles de canciones, como mínimo.
Lo más importante de todo esto es que Million Song Dataset está disponible para todos los interesados, sin costo alguno. Quienes deseen darle un vistazo pueden descargar una pequeña porción con algunos miles de temas, pero aquellos que se encuentren de lleno en el desarrollo de una aplicación para entregar y recomendar música en línea, tal vez deban realizar el titánico esfuerzo de bajar la base completa. Nada fácil a decir verdad, ya que el tamaño total del Million Song Dataset puede exceder los 280 GB. Por último, volvemos a repetir: Esto no tiene audio en su interior. No encontrarás mp3s ni discografías completas. El Million Song Dataset puede que tenga un rol crítico para las aplicaciones de música del futuro, pero en cuanto a acumular música se refiere, eso sigue siendo trabajo tuyo.