Videnskab forklarer, hvorfor en sang er succesrig

Du har måske allerede sagt, at "alle disse sange ser ens ud." Bare en ny sang er vellykket og ramt på toppen af ​​hitlisterne, der automatisk kommer op og siger, at det ligner den, der ironisk nok også var en succes. For at finde ud af, om en sang virkelig er "den samme" som en anden, besluttede to studerende forskere ved University of San Francisco, Californien, at bruge Spotify-data til denne mission.

Forskere brugte Spotifys offentlige applikationsprogrammeringsgrænseflade til at skabe fire maskinlæringsmodeller, der kan forudsige, om en sang kan blive et hit eller ej. "Vores mål var at se, om hit-sangene havde lignende karakteristika, og i bekræftende fald, om disse egenskaber kunne bruges til at forudsige, hvilke sange, der ville få succes i fremtiden, " forklarede Kai Middlebrook, en af ​​forskerne.

Han og kollega Kian Sheik fokuserede på nogle aspekter af sangene, såsom rytme, valence, energiokustik, lyd og dans, og resultatet blev fire modeller.

Foto: Pixabay

Logistisk regression: I denne model er en sang mærket 1, hvilket indikerer, at sangen vil være et hit, og 0, hvilket indikerer, at sangen vil floppe. Hver funktion i sangen har en vægt, der hjælper med at forudsige dens succes. Disse funktioner betragtes som hurtige og lette at tolke og kan gøre det lettere at forstå de afhængige variabler (musikfunktioner) af de afhængige (hit eller miss).

Tilfældig skovarkitektur: I denne model bruger forskere beslutningstræer til at nedbryde data med objektive ja og nej spørgsmål. Det er dog muligt at huske træningsdataene med meget tæt tuning, hvilket betyder, at modellen muligvis ikke registrerer et reelt forhold mellem funktionerne og populariteten af ​​sangen, fordi dataene normalt indeholder information irrelevant. Derfor konstruerede Middlebrook og Sheik denne model til at kombinere hundreder af tusinder af beslutningstræer ved at analysere forskellige undergrupper, foretage en forudsigelse ved gennemsnit af hvert træ og kombinere resultaterne. Disse modeller er mere fleksible end lineære modeller, hvilket ifølge Middlebrook er en vigtig fordel.

Support vektormaskine: Denne model ser efter det "hyperplan", der bedst opdeler data i to kategorier.

Neural Network: I denne model bruges et skjult lag med 10 filtre til at lære af musikdataene.

Forskere planlægger at udvide forskningen

De to forskere testede de opnåede resultater med historiske data fra Billboard ved hjælp af et computernetværk i San Francisco til at analysere numrene. Hele processen tog uger.

Foto: Pixabay

De fandt, at “supportvektormaskinen” havde den højeste hitnøjagtighed og nåede imponerende 99, 53%. Den laveste sats var med "tilfældig skov" -model med 88%. For Middlebrook, hvis pladeselskaber brugte denne analysemetode til at frigive en sang, ville de have en stærkere forretningsafgørelse.

Efter at have konkluderet, at det er muligt at forudsige, om en sang vil få succes baseret på analyse af deres lyd, har parret til hensigt at analysere andre faktorer, der kan bidrage til en sangs succes, såsom kunstneroplevelse, tilstedeværelse på sociale medier og labelindflydelse.