Kínai kutatók egy csoportja olyan mesterséges intelligenciát akart létrehozni, amely képes zenét szerezni a meglévő darabok alapján.
Bármennyire is úgy gondoljuk, hogy a legújabb popslágereket gépek alkotják, a mesterséges intelligenciát (MI) jelen pillanatban még könnyebb rávenni arra, hogy megértse a zene különböző aspektusait, mint arra, hogy megalkosson egy slágert.
Egy Kínából származó új tanulmány azt vizsgálta, hogy a mesterséges intelligenciát meg lehet-e tanítani arra, hogy felismerjen néhány zenei jellemzőt, majd maga is komponáljon egy működőképes dalt. Bár az eredmények nem elégségesek ahhoz, hogy a zeneszerzőket munkanélkülivé tegyék, mégis arra utalnak, hogy egyszer majd a számítógépek is rájönnek a zeneszerzés legfinomabb fortélyaira – írja a BigThink.
A kutatók azzal a felvetéssel kezdték a tanulmányukat, hogy egy olyan mesterséges intelligenciának, amely hatékonyan képes jól strukturált zenét létrehozni, alkalmasnak kell lennie arra, hogy megtanulja a zenei adatok elemzéséből a dal kontextuális mintázatát. Emellett ezeket az elemeket olyan egységekké kell átalakítania, amelyeket az MI manipulálni tud, és le kell tudnia másolni a zenei forma és textúra közötti kölcsönhatást.
Ehhez egy általuk készített, Harmony-Aware Hierarchical Music Transformer (HAT) nevű programmal kiegészített mesterséges intelligenciát használtak. Ez egy olyan rendszer, amely képes a zenei adatokat gépileg olvasható részekké alakítani, majd ezeket a részeket harmónia, textúra, forma és más zenei tulajdonságok szempontjából felülvizsgálni. A rendszerbe ezután több száz, ember által komponált zongoradarabot tápláltak bele, hogy megtanulja, hogyan kell hangzania egy popdalnak.
Annak érdekében, hogy lássák, hogyan teljesít a szoftver, a kutatók megkérték a mesterséges intelligenciát, hogy fejezzen be egy dalt. A MI-be egy valódi kínai popslágert, a Guang Yin De Gu Shinyitányát táplálták be, majd megmérték, hogy mennyire tudott megfelelni a dalnak a hasonló hosszúságú dallamrészletek generálása szempontjából. A biztonság kedvéért ugyanezt a feladatot két másik, a HAT-nál kevésbé fejlett, zenét generáló mesterséges intelligenciának is megadták. Míg a HAT felülmúlta számítógépes riválisait, az általa létrehozott szegmensek nem kapcsolódtak egymáshoz, és egyértelműen kihallatszott, hogy nem ember alkotta őket, bár nagyjából ugyanolyan hosszúak voltak, mint az eredeti dalban.
Az MI-t arra is rávették, hogy a semmiből generáljon tíz saját popdalt. Az új darabokat több objektív mérőszám alapján értékelték, mint például az akkordmenet racionalitása, a hatásosság és a textúra. Összehasonlításképpen ezeket a mérőszámokat alkalmazták az ember által komponált zenékre is. Az emberek minden alkalommal legyőzték a mesterséges intelligenciát.
Természetesen a zenehallgatás is egy szubjektív élmény, ezért tizenöt, zeneileg képzett önkéntesnek kellett rangsorolnia a dalokat többek között a dallam, a koherencia és az integritás szempontjából. Bár a mesterséges intelligencia által készített dalok nem voltak borzalmasak, mégis az emberek által készített daloknál rosszabb helyezést értek el. Úgy tűnik, a zeneszerzés nem olyan munka, amelyet hamarosan automatizálni lehet.
A szerzők arra a következtetésre jutottak, hogy "még mindig hatalmas szakadék tátong a HAT által generált darabok és a valódi művek között".
Ez okból azt javasolják, hogy egy jövőbeli tanulmány során meg kellene próbálni egy olyan mesterséges intelligenciát létrehozni, amely képes javítani a saját maga által létrehozott zenét, annak érdekében, hogy bezárja ezt a szakadékot.
Egy szó, mint száz Britney Spears és kollégái egy darabig fellélegezhetnek.