Menú

Aplicaciones informáticas para la música: Sistemas de recomendación musical y procesado de voz cantada

4 de marzo de 2009

Music Technology GroupMuy interesante conferencia la que tuvo lugar ayer en el edificio rojo de Biología y que dio el Music Technology Group, un grupo de desarrolladores de software de tecnología musical situado en Barcelona.
Con el título de Aplicaciones informáticas para la música: Sistemas de recomendación musical y procesado de voz cantada la conferencia estuvo dividida en dos charlas de dos de los miembros del grupo de investigación.

Sistemas de recomendación musical

Me gusta mucho la música y además soy usuario activo de comunidades como lastfm o Spotify, por lo que la charla que Emilia Gómez dio sobre técnicas para recomendar música a través del análisis y relación de canciones me pareció una gran ocasión de conocer el funcionamiento interno de los sistemas de recomendación de estos servicios web. No sabía que había grupos dedicados a este tipo de campos aquí en España, ni que la recomendación musical conllevaba tantos cálculos, aunque también he de reconocer que las recomendaciones que hace lastfm o Spotify o Pandora (cuando lo usaba) no me convencen, pues los gustos musicales de los usuarios en la mayoría de los casos no responden a relaciones de géneros y mucho menos de los instrumentos utilizados en las canciones.
Aun así merece mucho la pena hacer un repaso a los métodos de análisis de canciones presentados por Emilia Gómez, aunque primero sería necesario definir cuáles son los requerimientos de una buena recomendación musical. Éstos, aunque en principio evidentes, deben ser enumerados para tener siempre presente las metas que se quieren conseguir con el desarrollo de las aplicaciones. Se pueden resumir en:

  • Que la recomendación sea relevante, esto es, que reconozca música relacionada con la música que normalmente escuchas.
  • Que sea novedosa, es decir, que no siempre sea la misma música, pues esto puede llegar a aburrir al usuario
  • Que sea transparente y explique por qué se está recomendando esa canción, lo que viene a decir que el usuario debe saber cuál es la relación que existe entre esa canción y la que se está tomando como modelo.

Al ser una tarea muy complicada la de recomendar música de manera automática, el problema se ha abarcado desde varios frentes, usando varias técnicas y a menudo combinándolas entre ellas para conseguir una mejor eficiencia y exactitud.

Aproximaciones para la recomendación automática:

  • Filtraje cooperativo: Una comunidad de usuarios combinan las evaluaciones de la información. Esto tiene la ventaja de que es la comunidad la que hace el trabajo por ti, pero tiene el problema de la existencia de vandalismo (pueden ver las etiquetas asignadas a Paris Hilton en lastfm para comprenderlo)
  • Anotación manual: Si no quieres vandalismo siempre tienes la opción de ser tú mismo el que crea el contenido y las relaciones. Esto es lo que llevan haciendo muchos años la gente de allMusic, un sitio para información musical realmente bueno. El problema de este método es básicamente el coste, pues necesitas subcontratar a gente que etiquete el contenido.
  • Búsqueda en la web: Siempre se puede echar mano a la gran cantidad de información que ya hay en la web al respecto, sin embargo esto conlleva el construir analizadores semánticos que realmente comprendan las relaciones entre los artistas, que extraigan la información relevante para relacionarlos.
  • Descripción automática del contenido: Se basa en extraer parámetros a través de la señal de sonido, tales como el timbre (instrumentos), ritmo, estructura…

Esta última aproximación es la que este grupo de investigación ha intentado abordar con la aplicación Ella, un software que detecta los instrumentos en los temas por el análisis de frecuencias de la señal de sonido, aunque también puede detectar los ritmos de los temas (muy útil para los dj que podrían usar estas opciones para buscar mezclas de manera automática), su compás, incluso los acordes de las canciones.

Procesado de voz cantada

Blue SonicLa segunda charla de la conferencia la dio Jordi Bonada y en ella se nos mostró una serie de programas dedicados al procesamiento de la voz cantada. Después de una breve introducción de los aspetos básicos de producción de la voz (pulmones, cuerdas vocales, conducto vocal) Jordi estuvo enseñándonos algunos ejemplos de programas que había en el mercado y sus aplicaciones:

  • SingingTutor: Un tutor de canto para karaoke desarrollado para Yamaha (es como un singstar pero en plan profesional).
  • También Bluesonic, un programa diseñado para hacer los castings online de Operación Triunfo.
  • Muy interesante un Impersonador para karaoke, Elvis, un programa que convierte la voz de un usuario amateur de karaoke en la de un profesional. Básicamente consiste en una capa de audio que se superpone sobre la capa de la persona que canta.
  • También nos enseñó todo tipo de efectos, como crear coros a partir de una voz principal o transformar voces masculinas en femeninas en tiempo real.
  • Por último algunos ejemplos de software de síntesis de voz cantada, esto es, programas que cantan sin la necesidad de una grabación de entrada. En japón llevan algún tiempo ya y son toda una revolución. Nada más mirar los más de 1300 vídeos sobre Hatsune Miku, mi primera cantante, una de las cantantes virtuales de la serie Vocaloid, para darse cuenta del impacto que este tipo de programas está teniendo en Japón.

En resumen, una conferencia muy muy densa y con muchas muestras de lo que hace el Music Technology Group, aunque creo que queda mucho por investigar si quieren conseguir sistemas de recomendación que de verdad acierten con los gustos musicales de la gente y también mucho por hacer para conseguir voces que sean idénticas a la voz cantada natural.

1 Comentario en Aplicaciones informáticas para la música: Sistemas de recomendación musical y procesado de voz cantada

  1. Avatar de <a href='http://www.punksolid.com' rel='external nofollow' class='url'>Jose Manuel</a>

    Jose Manuel dice:

    5/3/2009, 04:55

    Buen post, hace tiempo habia leido de un motor de reconocimiento de musica que es similar al software de Ella, solo que es web y se accede a el a travez de una API.

Leave a comment