Nick Cave wyjaśnia, dlaczego sztuczna inteligencja nigdy nie napisze dobrej piosenki

Maciej Olanicki , 29.01.2019 r.

Na fali powszechnego nadużywania terminu sztuczna inteligencja nie brakuje chętnych, by w tonie eksperckim wypowiadać się o tym, w jaki sposób oprogramowanie tworzyć będzie sztukę lub chociaż utwory kultury dostarczające ludzkim odbiorcom rozrywki. Często mówi się o tym na wszelkich branżowych konferencjach, na których brylują szefowie korporacji IT, imprezach pokroju TED Talks. Nieczęsto jednak mamy okazję wysłuchać rozsądnej opinii na ten temat z drugiej strony – opinii artystów.

nick Nick Cave, fot. Julio Enriquez na CC BY 2.0.

Muzyka generowana maszynowo

Nick Cave to człowiek, o którym bez przesady można powiedzieć, że od ponad 40 lat nieprzerwanie znajduje swój niepowtarzalny sposób na wyrażanie się w muzyce. Kolejne płyty nagrane z Bad Seeds są każdorazowo ważnym artystycznym wydarzeniem, zaś nagraną wraz z Kylie Minoque mroczną balladę „Where the Wild Roses Grow” do dziś można usłyszeć także w polskich rozgłośniach. Nie każdy wie, że Nick Cave to także autor dwóch powieści – obie przetłumaczono na polski i są co najmniej godne polecenia. Zarówno twórczość muzyczna, jak i literacka Cave’a dowodzi, że jest nie tylko gwiazdą rocka, ale też pozbawionym kompleksów intelektualistą z unikatowym sposobem opisywania tego, co go otacza.

Tym więcej uwagi warto poświęcić spostrzeżeniom dotyczącym sztucznej inteligencji, jakimi Australijczyk podzielił się na łamach The Red Right Hand Files – strony, gdzie odpowiada na pytania swoich fanów. Jedno z nich zabrzmiało: „jeśli założymy, że ludzka wyobraźnia jest ostatnią z niezbadanych rzeczy, to czy uważasz, że SI będzie kiedykolwiek w stanie napisać dobrą piosenkę?”. Niektórzy zasugerowaliby nawet, że dzieje się to już teraz – osadzony poniżej utwór „Daddy’s Car” został co prawda odegrany i zaśpiewany przez ludzkich muzyków, ale skomponowany został maszynowo w oparciu o twórczość The Beatles. Również tekst został wygenerowany w ten sposób.


Nick Cave w kwestii muzyki tworzonej maszynowo porusza się początkowo w kontekście bestsellerowej książki „21 lekcji na XXI wiek”, w której Yuval Noah Harari nie ma wątpliwości, że oprogramowanie będzie w przyszłości najpopularniejszym producentem muzycznym. Na podstawie uczenia maszynowego możliwe będzie opracowanie wzorców (kompozycja, tempo, metrum, instrumentarium, artykulacja, itd.), które będą wywoływać w odbiorcach konkretne emocje z precyzyjnie określoną intensywnością. W miarę przetwarzania kolejnych próbek, maszyny będą w wywoływaniu emocji coraz skuteczniejsze.

Sztuczna sztuka (zbyt) doskonała

Trudno się z tym nie zgodzić, jednak frontman Bad Seeds zastanawia się, czy to na pewno wywoływania konkretnych emocji szukamy w muzyce. Pozwala sobie zadać pytania, jaką funkcję mają utwory muzyczne? Czego od nich oczekujemy? A w końcu – czego w mniejszym lub większym stopniu autonomiczne algorytmy mogą lub nie mogą nam dostarczać. I czy w ogóle jest takie coś? Słuchanie skrojonych na miarę nastroju wygenerowanych maszynowo utworów bardziej przypomina przecież konsumpcję czy inny rodzaj zaspokajania potrzeb:

Nie jestem przekonany, czy to wszystko, co robią piosenki. Oczywiście, słuchamy, by poczuć się w określony sposób – wesoło, smutno, seksownie, by poczuć tęsknotę za domem, podekscytowanie czy cokolwiek innego – ale to nie wszystko. To, co wywołuje świetna piosenka to uczucie podziwu. Nie bez powodu. Poczucie podziwu opiera się niemal wyłącznie na naszych ograniczeniach, ograniczeniach ludzkich. To rzecz wyłącznie i całkowicie ludzka – nasza zuchwałość, by wykraczać poza własne możliwości. (…) Sztuczna inteligencja, z całym swym nieograniczonym potencjałem, po prostu nie ma takiej możliwości.

Trzeba przyznać, że opinia Cave’a to na pewno nie puste frazesy, jakich posłuchać można na branżowych konferencjach. Spostrzeżenia Cave’a można podsumować jako stwierdzenie, że słuchamy muzyki po to, by słuchać, jak człowiek próbuje przekroczyć własne granice. Maszyna zaś nie będzie ich w ogóle posiadała, zaś brak jakichkolwiek ograniczeń w formie wyrażania się ma być przeciwieństwem „dobrej piosenki”, o którą muzyk został zapytany. Padło nawet obrazowe porównanie – maszyna nigdy nie będzie chciała wydobyć z instrumentu tego, co chciał wydobyć Jimi Hendrix łamiąc i podpalając własną gitarę.

dilbert Z elementem chaosu bywa różnie... © Scott Adams

Porównanie można odnieść w pewnym sensie do oprogramowania – weźmy na przykład maszynowe generatory liczb pseudolosowych. Mimo tego, że jesteśmy w stanie odtwarzać dziś z pomocą maszynowego uczenia całe procesy poznawcze, to wciąż nie potrafimy skłonić maszyny do tego, by podawała prawdziwie losową liczbę. Zawsze będzie to wartość wytypowana na podstawie jakiegoś algorytmu, w jakiś sposób, który – mimo ogromnej złożoności – istnieje. Dziecko znając pierwszych dziesięć liczb lepiej poradzi sobie z wygenerowaniem losowej niż superkomputer – wyłącznie dlatego, że nie będzie potrafiło odtworzyć własnego procesu decyzyjnego.

Według Cave’a, to właśnie ten pierwiastek prawdziwej losowości, na swój sposób pojmowanego chaosu, sprawia, że sztuczna inteligencja nigdy nie napisze tak dobrej piosenki, jak człowiek. Przez swoją doskonałość. Warto w tym kontekście zwrócić uwagę na pewien niuans – często stawiamy znak równości między muzyką komponowaną i graną maszynowo. A przecież, jak choćby w przypadku „Daddy’s Car”, maszyna mogła jedynie wygenerować nuty, resztę w niedoskonały sposób mógł odegrać człowiek. Kto wie, czy najlepsi producenci już dziś nie posiłkują się w ten sposób oprogramowaniem, komponując wpadające w ucho refreny warte miliony dolarów.

Najnowsze oferty pracy:

Polecane wpisy na blogu IT: