LA COMPOSICIÓN MUSICAL POR ORDENADOR: EL PROYECTO IAMUS

 Autor: Juan Ignacio Fernández Morales

 

«Daisy, Daisy / Give me your answer, do. / I’m half crazy / all for the love of you»

 

Canción tarareada por HAL, la computadora de la película 2001: Una odisea del espacio,

aterrada ante la perspectiva de ser desconectada

 

INTRODUCCIÓN

El presente trabajo tiene como objetivos analizar y valorar la composición musical realizada por un ordenador, en lugar de una persona. Esta aplicación informática, cuyos inicios se remontan algunas décadas en el pasado, se ha convertido en una realidad tangible en la actualidad, por lo que merece un estudio que nos permita valorar su posible impacto en las perspectivas presentes y futuras de la actividad creativa musical.

De hecho, algunos autores señalan la necesidad de una reflexión profunda sobre la cuestión, que incluya la influencia de la falta de un autor consciente en la dimensión estética de la música y su capacidad expresiva, así como la relación entre los algoritmos empleados y la inteligibilidad de la obra (cf. Coradini y Zampronha 2009).

No se pretende, por tanto, analizar el enorme potencial de la computación como herramienta al servicio de la creatividad humana, sino examinar los aspectos más relevantes de la “creación” musical elaborada íntegramente por programas informáticos y evaluar la posibilidad de que llegue a sustituir a la composición musical humana.

Para poder realizar las valoraciones planteadas en los objetivos propuestos, se analizarán los factores que se han considerado más relevantes, como el desarrollo de la inteligencia artificial y la comparación entre la creatividad humana genuina y la producción de obras musicales por software. Además, se describirán varios ejemplos de composición “automática”, prestando especial atención a IAMUS, proyecto actual de composición musical por ordenador desarrollado en la Universidad de Málaga, con repercusión mediática a escala internacional.

 

1. CONTEXTO

Desde la segunda mitad del S. XX hasta la actualidad, hemos asistido a la mejora continua de la tecnología informática, cuyo ritmo, además, parece acelerarse de forma exponencial, según la “Ley de Moore”, que afirma que la capacidad de procesamiento para un mismo coste se duplica cada dieciocho meses.

Este desarrollo, unido al de las tecnologías de la comunicación y la información, han transformado considerablemente muchos aspectos de la vida cotidiana, lo que se puede apreciar en particular en el teléfono móvil, que se ha erigido como el dispositivo personal de uso universal que permite realizar muchas de las interacciones sociales que necesitamos, desde las conversaciones de voz hasta las transacciones comerciales, pasando por la gestión del correo y por tareas de búsqueda y análisis de información.

No obstante, es evidente que todo este potencial está orientado como un conjunto de herramientas esencialmente pasivas al servicio del usuario, que es el sujeto activo que toma las iniciativas y decisiones en cada instante. De hecho, tendemos a reaccionar con incomodidad cuando alguna aplicación parece emprender de forma autónoma alguna acción.

Sin embargo, un campo de investigación en el que hay depositadas grandes esperanzas es el de la “Inteligencia Artificial”, que pretende simular mediante software todos los atributos propios de una inteligencia humana, desde la capacidad de razonamiento hasta la autoconsciencia, pasando por la expresión verbal y el reconocimiento de patrones perceptivos.

En este ámbito, se considera habitualmente que el criterio de éxito en la simulación de una inteligencia lo constituye la superación del “Test de Turing”, que consiste en una entrevista – actualmente se realiza a través de un “chat” – entre una persona y el programa candidato: la persona intenta averiguar si su interlocutor es una persona o un programa mediante la formulación de preguntas especialmente seleccionadas por su exigencia de comprensión, como las relacionadas con el sentido de la vida, con juicios éticos o estéticos, o las que contienen dobles sentidos semánticos. En general se acepta que, si después de una entrevista exhaustiva, el entrevistador humano considera que su interlocutor es un humano, entonces el programa candidato habrá superado el Test de Turing y se podrá afirmar que simula con éxito una consciencia 1

En la actualidad, la investigación en esta disciplina se lleva a cabo desde diferentes perspectivas complementarias: modelado anatómico del cerebro y sus estructuras y conexiones, desarrollo de algoritmos evolutivos, reconocimiento de patrones visuales y auditivos, traducción de idiomas, etc. Los avances de estas investigaciones se van reflejando en aplicaciones diversas, como los programas de traducción automática, los sistemas de ayuda a la conducción, los programas de diagnóstico médico y los recientes asistentes personales de los teléfonos móviles, controlados por la voz.

Entre los éxitos parciales más destacados en esta búsqueda de la inteligencia artificial, debemos destacar la victoria al ajedrez de “Deeper Blue”, en 1997, sobre Gary Kaspárov, que era el vigente campeón mundial. Desde entonces, otros programas se han enfrentado con jugadores de ajedrez de alto nivel, y los resultados, mayoritariamente a favor de los ordenadores, reflejan la tendencia futura de un dominio por parte de los ordenadores. Por otra parte, el programa “Watson”, capaz de responder preguntas formuladas en lenguaje natural, participó en el concurso americano “Jeopardy” en 2011, derrotando a los dos mejores jugadores de la historia.

No obstante, la superación clara del Test de Turing no se ha producido todavía, aunque el progreso en la consecución de este propósito es bastante claro. El “Premio Loebner” es un concurso anual en el que compiten los mejores programas candidatos a superar el Test de Turing, llamados “chatbots”. En la edición de 2010, el chatbot llamado “Suzette” llegó a confundir a uno de los cuatro jueces humanos, que pensó que se trataba de una persona.

 

2. LA COMPOSICIÓN MUSICAL POR ORDENADOR

En este contexto, con la tecnología informática altamente desarrollada, y con la disponibilidad de una ingente capacidad de memoria y procesamiento a costes muy reducidos, se hace muy atractiva la posibilidad de diseñar algoritmos de composición musical.

De hecho, el análisis del repertorio musical a lo largo de la historia nos permite descubrir una cantidad ingente de pautas y relaciones que determinan los rasgos característicos del lenguaje musical correspondiente a cada estilo, y que son relativamente fáciles de incorporar a un algoritmo de generación de obras musicales.

Además, si nuestro objetivo es que el algoritmo de creación musical genere composiciones originales, podemos colocar un filtro a la salida que compare la obra propuesta con bases de datos del repertorio existente, y descarte dicha propuesta en el caso de que se detecte un grado de similitud 2

superior a un cierto umbral con otra obra existente previamente.

Por tanto, es perfectamente posible diseñar un programa que genere una obra musical en el estilo que seleccionemos, y que además sea original.

Los primeros algoritmos de creación musical de la historia los encontramos en el “Musikalisches Würferspiel” (“Juego de dados musical”), del siglo XVIII, que fue usado por Mozart y Haydn, y que consiste en un conjunto de fragmentos musicales muy breves, concebidos para poder ser mezclados entre sí, siguiendo una matriz que se va recorriendo según los resultados de las tiradas sucesivas de dos dados. La dependencia exponencial de las combinaciones posibles proporciona un número astronómicamente grande de piezas diferentes basadas en un único “Juego de dados musical”.

En el pasado más reciente, podemos mencionar dos ejemplos:

 

2.1. EMI (“Experiments in Musical Intelligence”)

Programa desarrollado por David Cope a lo largo de varias décadas, que tiene como objetivo la creación de obras nuevas que sigan el estilo compositivo particular de algunos de los compositores más importantes de la historia: invenciones al estilo de J. S. Bach, mazurkas al estilo de Chopin o sonatas al estilo de Mozart.

En “Virtual Music” (2001), David Cope explica las estrategias de su algoritmo, que parte de la “recombinación” de fragmentos de las obras que se toman como modelo. La parte más difícil consiste en la identificación de los rasgos estilísticos de los modelos, y en su inserción en las nuevas obras de forma que sean reconocidos, pero sin sonar a copias. Para conseguirlo, un programa de análisis realiza una exploración completa de intervalos melódicos más frecuentes, enlaces armónicos predominantes, estrategias típicas de repetición, étc.

En Virtual Music también encontramos un minucioso análisis y valoración de los resultados de EMI realizado por Douglas Hofstadter[3], científico y filósofo especializado en la investigación de las ciencias cognitivas, cuya reconocida devoción por la música se ve acompañada por una sólida formación musical.

Hofstadter explica que, para él, la música ha sido siempre una de las influencias más poderosas, capaz de penetrar su sensibilidad como prácticamente ninguna otra experiencia. Su percepción de obras de Bach o Chopin siempre le ha sugerido una sensación de inmensa profundidad emocional, presuntamente correspondientes con el espectro emocional de sus autores. Siendo uno de los pensadores más importantes sobre la naturaleza de la consciencia, Hofstadter manifestó en su libro “Gödel, Escher, Bach” que la música producida por un ordenador sólo podría llegar a ser expresiva cuando el propio programa hubiera adquirido autoconsciencia.

Sin embargo, Hofstadter reconoce que las obras de EMI le han sorprendido (y perturbado) en varios sentidos: en primer lugar, expresa su asombro al comprobar que, de hecho,  “suenan” como obras recién descubiertas de los autores a los que emulan 3. Además, parecen alcanzar una capacidad expresiva genuina.

Estas impresiones cuestionan algunas convicciones de Hofstadter sólidamente asentadas a lo largo de décadas sobre la complejidad intrínseca del lenguaje musical y de sus rasgos estilíticos, así como sobre la necesidad de que la creación de música expresiva se base en una experiencia consciente.

En palabras de Hofstadter, “la música es mucho más superficial de lo que pensaba”. Las intensas emociones provocadas por las obras maestras de la historia de la música, que parecen reflejar las profundidades espirituales de sus creadores, parecen reducirse, por tanto, a la utilización de patrones sintácticos que ejercen una poderosa influencia sobre la sensibilidad auditiva humana.

 

2.2. Wolfram Tones

Se trata de una aplicación gratuita, diseñada por el físico y matemático Stephen Wolfram, que genera obras sencillas, permitiendo seleccionar el estilo, la instrumentación y otros parámetros, y garantizando siempre que serán obras únicas, por la forma en que son generadas 4.

Se basa en la transcripción a música de un patrón generado por un “autómata celular” en el universo computacional.

En este caso, el enfoque musical predominante es el utilitario, por lo que la música producida tiene un carácter reconociblemente mecánico, que delata su origen automático. Es decir, el objetivo estético es poco ambicioso, aspirando a resultar agradable, lo que no supone ninguna amenaza para el estatus profesional del compositor.

 

3. IAMUS

El proyecto “IAMUS”, promovido por Francisco Vico en la Universidad de Málaga, ha tenido una notable repercusión mediática, y ha contado con la participación activa del prestigioso pianista Gustavo Díaz-Jerez y con la participación de la London Symphony Orchestra en la grabación de su primer álbum, titulado “IAMUS”.

Consiste en un sistema de composición musical formado por un cluster de computación y sus algoritmos correspondientes.

En su campaña de difusión, se han enfatizado su “autonomía” e “inteligencia creativa” mediante diversos recursos:

  • La ubicación del sistema físico en una caja metálica con una decoración muy llamativa trata de establecer una sutil conexión con nuestras asociaciones antropomórficas inconscientes, que establecen la relación entre un “agente consciente” y un recinto físico distinguido (ver figura 1).
Figura 1

Figura 1: IAMUS en el escenario, junto a un piano

 

  • La continua alusión a que IAMUS supera el Test de Turing, ya que resulta difícil distinguir una de sus composiciones de otra parecida realizada por una persona.
  • La descripción de sus algoritmos según términos biológicos como “algoritmos evolutivos”, “ecosistemas” de fragmentos, selección y evolución de “genomas” 5.

En realidad, cualquier tarea bien definida algorítmicamente puede ser ejecutada de forma absolutamente equivalente en cualquier computadora de propósito general, o incluso mediante computación distribuida, por lo que el diseño de la carcasa no es más que un reclamo publicitario sin ninguna relevancia.

Por otra parte, la interesante prueba de tratar de distinguir una obra de IAMUS de otra obra análoga elaborada por un humano no debería, en mi opinión, designarse como un “Test de Turing”, ya que la idea original de Turing involucra una comunicación bidireccional que exige un alto nivel de comprensión semántica o, al menos, un alto nivel de simulación de comprensión semántica. En este caso, sin embargo, lo único que se evalúa es un producto acabado.

Finalmente, el uso de terminología procedente de la biología en los algoritmos denominados “evolutivos” está ampliamente aceptado y justificado en la informática por la imitación que se realiza del proceso de selección natural: partiendo de una población inicial de entidades (a menudo, generadas aleatoriamente), se combinan entre sí y se fuerzan variaciones (“mutaciones”) para aumentar la diversidad de las nuevas generaciones sucesivas, cuyos supervivientes se van seleccionando según su grado de adecuación respecto a unos criterios establecidos previamente.

Aunque hay un paralelismo evidente con la selección natural, no debemos olvidar que los criterios que dirigen el proceso de “evolución virtual” en un algoritmo evolutivo son establecidos de antemano por los programadores (aunque dichos criterios sean variables, también deberá establecerse de antemano su pauta de variación), a diferencia de lo que ocurre en la naturaleza, donde la adaptación de los organismos a su entorno depende de relaciones mucho más complejas de interdependencia, con numerosos factores impredecibles.

Para destacar la presunta autonomía creativa de una entidad, resulta particularmente conveniente apelar al carácter “biológico” de su funcionamiento. Pero deberíamos recordar las limitaciones de la analogía entre el funcionamiento de un algoritmo evolutivo y el desarrollo de un proceso biológico real.

Una objeción menor a la producción de IAMUS, que parece haber pasado desapercibida, es la asignación de títulos a sus obras. Parece obvio que los títulos son elegidos por los responsables humanos del proyecto, ya que el programa no tiene ninguna capacidad semántica que le permita discernir palabras 6. En este sentido, se puede argumentar que IAMUS, como compositor autónomo, debería limitar su producción a obras sin letra. Sin embargo, una de sus obras, “Mutability”, para soprano y piano, usa un poema de Percy Shelley. La ausencia de habilidades semánticas de IAMUS nos lleva a la conclusión de que la adecuación de la música al contenido verbal del poema debería ser aleatoria o nula, lo que parece confirmarse después de su audición (se puede ver y escuchar  en: https://www.youtube.com/watch?v=Wv35jZCGAEk)

No obstante, es suficiente escuchar cualquiera de las composiciones de IAMUS 7  para comprobar  que su nivel de calidad es elevado, y que, tal como afirman sus promotores, es difícil identificar su procedencia “no humana”, lo que es suficiente para que nos planteemos si esta actividad presuntamente creativa puede sustituir ya o en el futuro la actividad creadora convencional de los compositores humanos.

Las definiciones convencionales del arte, aunque diversas, comparten que se trata de una actividad del hombre. De hecho, la etimología de “artificial” (hecho por el hombre) incluye “artis” (arte). Como consecuencia, podemos sentirnos inclinados a descartar a priori la consideración como obra de arte de una obra compuesta por un ordenador.

Sin embargo, parece recomendable examinar el proceso completo, desde el diseño de los algoritmos por parte de los programadores hasta la reacción de los oyentes, pasando por la interpretación, para poder realizar una comparación significativa con el proceso convencional de la composición humana y sus resultados.

En primer lugar, la valoración de esta cuestión dependerá de los objetivos estéticos planteados.

Si consideramos que la música es un mero “ornamento” de la experiencia vital, es decir, que es suficiente con que la combinación de sonidos sea agradable y/o interesante para el oyente, entonces podemos concluir que la generación de música por ordenador puede cumplir esa función de forma competente, y por un coste prácticamente despreciable, por lo que la actividad creadora de un compositor humano se podría llegar a considerar un lujo innecesario.

Pero, si consideramos que la música como arte tiene el objetivo de comunicar un contenido sonoro concebido en la consciencia del compositor, mediante la intervención del intérprete, a las consciencias de los oyentes, entonces parece obvio que la consciencia del creador es un elemento imprescindible, que está ausente (al menos, en la actualidad) en los algoritmos que generan obras musicales.

Es decir, en estas obras falta la figura del “Autor”como agente consciente que promueve la creación de la obra y define su contenido sonoro.

Además, el compositor humano dispone de su propia sensibilidad musical y consciencia como criterios fiables que guían el proceso creativo desde el inicio. Estos criterios son, en principio, los mejores posibles, ya que la música irá dirigida a las sensibilidades musicales y consciencias de otras personas, que presumiblemente tienen un elevado grado de afinidad con el autor. En cambio, la composición por ordenador procede siempre según reglas – o meta-reglas, es decir, normas de alto nivel según las cuales las reglas podrían cambiar 8 – fijadas de antemano, por lo que la responsabilidad del éxito del proceso creativo recae fundamentalmente en la elección de esas reglas de forma adecuada para el objetivo propuesto.

En cuanto a la capacidad de expresión de las obras generadas por ordenador, los comentarios de Hofstadter sobre sus reacciones a la escucha de las obras de EMI pueden ser confirmados mediante la audición de cualquier obra de IAMUS: resulta difícil negar la capacidad expresiva real de esta música, lo que resulta sorprendente cuando recordamos que no hay una consciencia real en su génesis. Para tratar de explicar esta aparente contradicción, debemos considerar varios factores:

Por una parte, los sonidos tienen un potencial expresivo que radica en la especial sensibilidad auditiva del cerebro humano. Los sonidos de la naturaleza, por ejemplo (poco sospechosos de tener intenciones expresivas) pueden llegar a producir emociones: las tormentas, el canto de los pájaros,  las olas rompiendo en la playa o el silbido del viento constituyen ejemplos conocidos.

En realidad, habría que señalar que la sensibilidad auditiva es un caso particular de la sensibilidad estética general de la especie humana, característica transcultural que nos permite dirigir nuestra atención perceptiva consciente hacia cualquier fenómeno sensible, con el objetivo de aprehender su dimensión estética, es decir, valorar su grado de belleza o su capacidad expresiva, y reaccionar de forma correspondiente. La naturaleza de dicha reacción puede ser muy diversa, y suele consistir en una combinación de sensaciones, emociones y valoraciones, que pueden incluir el deleite o el desagrado, y necesita una actitud receptiva particular, en la que la atención se concentra en los estímulos sensoriales recibidos, y la consciencia se recrea en su propia reacción, estableciendo un diálogo emocional.

Por otra parte, en el caso de la música, disponemos de miles de obras que abarcan varios siglos de historia, que nos han permitido deducir, mediante análisis, qué tipo de pautas y relaciones melódicas, rítmicas y armónicas tienden a causar reacciones emocionales más intensas. Por tanto, la generación de este tipo de pautas mediante un algoritmo, provocará las reacciones emocionales correspondientes, aunque no tengan un autor humano directo.

De hecho, es posible concebir la composición musical por ordenador actual como una tarea realizada por los programadores humanos, ya que ellos son los que toman la iniciativa de comenzar el proceso creativo y definen, aunque de forma indirecta, las principales características de la obra mediante el establecimiento de las reglas que gobernarán el algoritmo.

Además, la intervención de los intérpretes humanos garantiza el establecimiento de una comunicación efectiva, ya que el intérprete, especialista en aprehender el contenido musical de las obras de otras personas, encontrará la forma de dotar de un sentido y contenido coherentes a la obra compuesta por el ordenador. En este sentido, la interpretación de una obra de IAMUS es equivalente al hallazgo de una partitura de una obra anónima de estilo contemporáneo: el intérprete se vería obligado a reconstruir el contenido sonoro basándose exclusivamente en la partitura, y no dispondría de otras referencias relacionadas con el autor.

Estas consideraciones permiten explicar que la intervención humana en el diseño de los algoritmos, unida al aporte del intérprete, pueden llegar a suplir la ausencia del autor consciente, hasta el punto de que el resultado final, es decir, la música interpretada, llega a ser muy difícil de distinguir de la compuesta por una persona.

 

4. CONCLUSIÓN

A lo largo de este trabajo, se han descrito algunos sistemas de composición musical por ordenador, y se han contextualizado en el ámbito del desarrollo de la Inteligencia Artificial, al que pertenecen. Se pretendía realizar una valoración crítica de sus obras, así como de su impacto potencial en  la actividad compositiva musical, en función de su capacidad expresiva y su recepción y aceptación por parte de los oyentes.

Tanto el sistema EMI, especializado en la imitación de estilos particulares, como IAMUS, más orientado a la producción de música de estilo contemporáneo, consiguen unos resultados de notable calidad artística, que resultan difíciles de distinguir de obras equivalentes elaboradas por compositores humanos.

Las principales objeciones derivadas de la ausencia de un autor humano, como son la falta de una intención comunicativa o de unos contenidos elegidos conscientemente, se ven subsanadas (al menos parcialmente) por la intervención de los programadores (que promueven el acto creativo y lo dotan indirectamente, mediante las reglas de programación, de preferencias por ciertos tipos de contenidos) y por la actuación del intérprete que, además de reconstruir un contenido potencialmente expresivo, se erige como factor humanizador visible.

Por tanto, llegamos a la conclusión de que la composición musical por ordenador, aunque no es una actividad creativa completamente genuina (por carecer de autor), puede cumplir el objetivo artístico de provocar una experiencia estética musical en el oyente.

No obstante, es previsible una actitud del público de cierto rechazo inicial a la idea de la música compuesta por ordenador, por lo que, al menos a corto plazo, no parece probable que los compositores humanos vean peligrar la seguridad de su ámbito profesional. Además, aunque el elevado nivel de calidad de las obras de IAMUS resulte sorprendente, queda todavía por debajo (en mi opinión) de la calidad artística de las obras de creadores humanos.

Por tanto, la actividad creativa musical más ambiciosa seguirá siendo por el momento patrimonio fundamentalmente de las personas. Para usos menos ambiciosos – música ambiental, por ejemplo -, la música compuesta por ordenador irá ganando terreno poco a poco – Wolfram Tones constituye una opción disponible gratuita, que puede ser adecuada para estas aplicaciones de “perfil bajo”. Además, el potencial de proyectos como IAMUS puede utilizarse como herramienta auxiliar al servicio del talento creativo genuino de los compositores, generando miles de propuestas de forma instantánea, que constituirían un material excelente de trabajo para los compositores.

A medio plazo – en unas décadas o un siglo, quizás algo más -, es posible que los programas superen el Test de Turing y simulen satisfactoriamente la autoconsciencia. En ese momento, la inteligencia humana tendría una compañera en el mundo, lo que exigiría un respeto mutuo, y las posibilidades de colaboración y enriquecimiento entre ambas resultan difíciles de imaginar. En particular, es posible que nazca un nuevo arte musical que no podemos ni empezar a vislumbrar.

 

BIBLIOGRAFÍA

COPE, David: “Virtual Music. Computer Synthesis of Musical Style”. MIT Press, 2004.

CORADINI, L. P. & ZAMPRONHA, E. (2009). “Um mapa das tendências de composição pós-1980 que utilizam recursos tecnológicos”. Música em Perspectiva, 2 (2), 64-77. Recuperado en 10 de enero de 2011, http://ojs.c3sl.ufpr.br/ojs2/index.php/musica

HOFSTADTER, Douglas: “Gödel, Escher, Bach: un Eterno y Grácil Bucle”. Ed. Tusquets, 1987.

ZAMPRONHA, Edson: “Música e Inteligibilidad”. Brocar, nº 37. 2013.

 

  1. El hecho de que dicha simulación implique necesariamente la existencia real de una consciencia o no es la principal diferencia entre las corrientes denominadas “Inteligencia Artificial Fuerte” (la simulación implica la consciencia) e “Inteligencia Artificial Débil” (la simulación no implica una consciencia real).  (volver arriba)
  2. La medida del grado de similitud debe considerar múltiples factores: diseños melódicos, giros armónicos, patrones rítmicos, etc.  (volver arriba)
  3. Hofstadter señala que no todas las obras de EMI alcanzan el mismo poder de convicción, pero recuerda que se trata de un programa que admite un importante grado de perfeccionamiento en el futuro.  (volver arriba)
  4. Se puede utiliizar en: http://tones.wolfram.com/generate/advanced.html?generator  (volver arriba)
  5. Por desgracia, los detalles concretos sobre los algoritmos evolutivos usados por IAMUS no son públicos, por lo que no es posible analizarlos.  (volver arriba)
  6. La otra alternativa es la elección aleatoria del título  (volver arriba)
  7. Como ejemplo, la obra “Colossus”, para piano solo, se puede escuchar en: https://www.youtube.com/watch?v=yGrzzZupYVI  (volver arriba)
  8. En el caso concreto de los algoritmos evolutivos, empleados por IAMUS, las meta-reglas estarían contenidas implícitamente en los criterios evolutivos de supervivencia de las generaciones sucesivas.  (volver arriba)