Tiede selittää miksi kappale onnistuu

Olet ehkä jo sanonut, että "kaikki nämä kappaleet näyttävät samalta". Vain uusi kappale on onnistunut ja saavuttaa toplistojen kärjessä, joka tulee automaattisesti esiin sanomalla, että näyttää siltä, ​​joka on ironista kyllä ​​myös menestys. Kaksi Kalifornian San Franciscon yliopiston opiskelijatutkijaa päättivät käyttää Spotify-tietoja tähän tehtävään saadakseen selville, onko yksi kappale todella ”sama” kuin toinen.

Tutkijat loivat Spotifyn julkisen sovellusohjelmointirajapinnan luomaan neljä koneoppimallia, jotka pystyvät ennustamaan, voiko kappaleesta tulla hitti. "Tavoitteenamme oli nähdä, onko osumakappaleilla samanlaisia ​​piirteitä ja jos on, voiko näitä ominaisuuksia käyttää ennustamaan, mitkä kappaleet menestyvät tulevaisuudessa", selitti yksi tutkijoista Kai Middlebrook.

Hän ja kollega Kian Sheik keskittyivät kappaleiden joihinkin näkökohtiin, kuten rytmiin, valenssiin, energiaakustiikkaan, ääniin ja tanssiin, ja tuloksena oli neljä mallia.

Kuva: Pixabay

Logistinen regressio: Tässä mallissa kappaleessa on merkintä 1, joka osoittaa, että kappale on osuma, ja 0, joka osoittaa, että kappale floppaa. Jokaisella kappaleen ominaisuudella on paino, joka auttaa ennustamaan sen menestyksen. Näitä ominaisuuksia pidetään nopeina ja helppokäyttöisinä, ja niiden avulla voidaan helpottaa ymmärrettävissä olevien riippuvaisten muuttujien (musiikkitoimintojen) ymmärtämistä.

Satunnainen metsäarkkitehtuuri: Tässä mallissa tutkijat käyttävät päätöksentekopuita tietojen jakamiseen objektiivisella kyllä ​​ja ei kysymyksillä. Harjoitteludata on kuitenkin mahdollista muistaa hyvin tarkasti, mikä tarkoittaa, että malli ei ehkä havaitse todellista suhdetta kappaleen ominaisuuksien ja suosion välillä, koska data sisältää yleensä tietoa merkityksetön. Siksi Middlebrook ja Sheik rakensivat tämän mallin yhdistääkseen satoja tuhansia päätöksentekopuita analysoimalla erilaisia ​​osajoukkoja, tekemällä ennuste keskiarvoistamalla kunkin puun ja yhdistämällä tulokset. Nämä mallit ovat joustavampia kuin lineaariset mallit, mikä on Middlebrookin mukaan tärkeä etu.

Support Vector Machine: Tämä malli etsii ”hyperkorttia”, joka erottaa tiedot parhaiten kahteen luokkaan.

Neuraaliverkko: Tässä mallissa musiikkitiedoista oppimiseksi käytetään piilotettua kerrosta, jossa on 10 suodatinta.

Tutkijat suunnittelevat tutkimuksen laajentamista

Nämä kaksi tutkijaa testasivat tuloksia, jotka on saatu Billboardin historiallisilla tiedoilla käyttämällä San Franciscon yliopiston tietokoneverkkoa numeroiden analysointiin. Koko prosessi kesti viikkoja.

Kuva: Pixabay

He havaitsivat, että ”tukivektorikoneella” oli suurin osumien tarkkuusaste, saavuttaen vaikuttavan 99, 53%. Alhaisin osuus oli ”satunnainen metsä” -mallissa, 88%. Jos levylaatikot käyttäisivät tätä analyysimenetelmää kappaleen julkaisemiseen, Middlebrookille olisi heillä vahvempi liiketoimintapäätös.

Saatuaan päätelmän, että kappaleen onnistuminen on mahdollista ennustaa heidän äänianalyysin perusteella, pari aikoo analysoida muita tekijöitä, jotka voivat vaikuttaa kappaleen onnistumiseen, kuten artistikokemus, sosiaalisen median läsnäolo ja etiketin vaikutus.