Iedereen kent ‘m wel – die ene oudoom of collega die bij de kerstquiz de volle punten scoort tijdens de muziekronde, alle nieuwe nummers kent en ook nog eens moeiteloos meezingt met alle golden oldies. Wil jij deze maand ook indruk maken met je muziekkennis? Wij helpen je! Hoe? It’s that time of the year again! Met het jaar 2023 bijna achter ons doet de kou weer zijn intrede, herrijzen oliebollenkramen overal in het land en… kan er weer gestemd worden voor de Top 2000 van Radio 2¹!
Wij verklappen alvast dat Maan, Goldband, Miley Cyrus en Nothing but Thieves dit jaar heel hoog binnenkomen in de Top 2000. Benieuwd met welke nummers? Lees dan snel verder. Doe er je voordeel mee en imponeer je vrienden, familie en collega’s met jouw nieuwe muziekkennis en win dit jaar ook eindelijk eens die kerstquiz!
Trends in de Top 2000
Maar hoe weten we dit? Iedereen is immers vrij om voor de Top 2000 te stemmen op zijn / haar eigen favoriete nummers. Hierbij zijn er vaak externe factoren die van invloed zijn op hoe mensen stemmen. Zo steeg het nummer A Whiter Shade of Pale van Procol Harum in 2021 in één keer van plek 153 (2020) naar plek 3. Dit nummer was het lievelingsnummer van Peter R. de Vries die dat jaar werd doodgeschoten². Ook artiesten die in een jaar veel in het nieuws zijn geweest zorgen vaak voor de nodige beweging binnen de hitlijst.
Met dit in gedachten hebben we een machine learning model gemaakt wat een voorspelling doet over de hoge binnenkomers in de komende Top 2000. Een model is een gestructureerde manier om naar je data te kijken om te zien of hier patronen in te herkennen zijn. Wij gebruikten hiervoor gegevens uit de Top-40, Spotify, informatie over of artiesten in het nieuws zijn geweest en nog veel meer.
Voor consultants bij Cmotions is het maken van zulke modellen bekende kost: met de inzet van Artificial Intelligence-technieken helpen we inzichten te geven en voorspellingen te maken op basis van diverse databronnen. Dat doen we dagelijks in onze opdrachten voor klanten, maar hebben we bijvoorbeeld ook gedaan om de inhaalhuwelijken na Corona te voorspellen en om de nieuwe restaurants met Michelinsterren aan te wijzen.
Voorspelde hoge nieuwe binnenkomers
De grote vraag is natuurlijk: welke nummers zijn volgens ons de hoge nieuwe binnenkomers? Op basis van historische patronen voorspellen we dat onderstaande nummers dit jaar hoge nieuwe binnenkomers zijn in de Top 2000! En Stiekem (pun intended) zijn we best tevreden met de voorspellingen van ons model. Flowers (wereldwijd) en Stiekem (in Nederland) waren in 2023 namelijk de meest gestreamde nummers op Spotify. Hopelijk laat de uitslag zien dat we gelijk hebben!
Voorspelde hoge nieuwe binnenkomers Top 2000
Artiest | Nummer |
Maan & Goldband | Stiekem |
Felix Jaehn & Ray Dalton | Call it Love |
Metejoor & Hannah Mae | Wat wil je van mij? |
Flemming | Paracetamollen |
Son Mieux | Tonight |
Nothing but Thieves | Overcome |
Miley Cyrus | Flowers |
Voorspellingen? Onze aanpak
Om een voorspelling te maken op basis van patronen heb je data nodig, het liefst veel en relevante data. We zijn daarom begonnen met data verzamelen. Allereerst hebben we de lijsten van de Top 2000 verzameld van de jaren 2013 t/m 2022. Per jaar hebben we gekeken naar de positie van alle nummers en bijbehorende artiest(en). Daarnaast hebben we voor dezelfde periode data verzameld van de wekelijkse Nederlandse Top 40, vanuit de gedachte dat nieuwe of populaire nummers eerst in de in de Top 40 komen en er vervolgens door mensen op gestemd wordt voor de Top 2000. Ook hebben we extra informatie over de verzamelde Top 2000 en Top 40 nummers van Spotify gehaald. Denk hierbij aan de stijl van een nummer, zoals ‘dansbaarheid’ en in welke mate een nummer instrumentaal is. Tenslotte hebben we data verzameld over overleden artiesten en over de hoeveelheid Google zoekopdrachten per jaar over de artiesten in onze dataset.
Uit eigen ervaring weten we dat de meeste tijd en waarde zit in het goed voorbereiden van de data voordat we een model kunnen maken. Een uitdaging in dit proces was bijvoorbeeld dat namen van nummers en artiesten vaak op verschillende manieren worden geschreven. Dit gebeurt wanneer gebruik wordt gemaakt van diverse bronnen, maar ook binnen de Top 2000 is de schrijfwijze niet consistent. Het nummer Knocking on Heaven’s Door van Guns N’ Roses werd bijvoorbeeld t/m 2020 nog geschreven als Knockin’ on Heaven’s Door. En ‘Under Pressure’, is dat nou van Queen & David Bowie of van David Bowie & Queen? We kwamen beiden tegen.
Met deze complete dataset hebben we een model gemaakt gebaseerd op de data van de jaren 2013 t/m 2021, en het model vervolgens voorspellingen laten doen over het jaar 2022 om te valideren of onze voorspellingen kloppen. Dat zag er al veelbelovend uit! Tenslotte hebben we op dezelfde manier de voorspellingen gedaan voor de editie van dit jaar.
Voorspellende waarde variabelen
In totaal hebben we maar liefst 171 variabelen gebruikt voor onze voorspellingen. Met inzet van de juiste AI-technieken zijn we tot onze voorspellingen gekomen voor dit jaar én hebben we inzicht opgedaan over wat bepaalt of een nummer een flinke klapper kan gaan maken in de Top 2000. Voor de geïnteresseerden: op een later moment delen we meer details over de technieken die we gebruikten in het voorbereiden van de data, welke machine learning technieken we overwogen hebben, en hoe we met SHAP tot inzichten zijn gekomen wat bepaalt of een nummer naar een hoge notering zal stijgen bij binnenkomst. In dit artikel houden we het bij een aantal interessante inzichten.
Wat opvalt in onderstaande grafiek is dat verschillende type kenmerken terugkomen in de lijst van beste voorspellers volgens het model. Spotify audiokenmerken, zoals Duration, Loudness, Energy, Acousticness en Tempo, beschrijven de nummers heel technisch en doen er dus wel degelijk toe om (hoog) in de Top 2000 te komen! Daarnaast is het aantal weken dat een nummer afgelopen maanden in de Top 40 stond zeer voorspellend voor de plek waarop het nummer de Top 2000 zal binnenkomen. Maar ook in welke mate er ‘buzz’ rond een artiest is – door ons gemeten met de Google Trends data – blijkt voorspellend voor de debuutnotering.
Met de technieken die we hebben gebruikt, ontdekten we niet alleen welke nummers hoge ogen zullen gooien en welke kenmerken het meest relevant zijn, maar ook hoe die kenmerken de voorspelling beïnvloeden. Zo geven onderstaande grafieken het verband weer tussen de stijging in notering van enerzijds het aantal weken in de Top 40 in het afgelopen jaar (links) en anderzijds de Loudness van een nummer (midden). Hieruit leren we dat als een nummer in het afgelopen jaar meer dan een half jaar in de Top 40 heeft gestaan, de kans op hoog binnenkomen in de Top 2000 flink wordt vergroot. En de Loudness en Acousticness laten zien dat rustigere nummers een grotere kans maken op hoge noteringen dan drukke, energieke nummers.
Vol verwachting klopt ons hart
Op het moment van schrijven kan er nog steeds gestemd worden voor de Top 2000 van 2023, dus of we daadwerkelijk gelijk gaan hebben moeten we nog even afwachten. Hopelijk heeft bovenstaande jou wel geïnspireerd, en mocht Stiekem van Maan en Goldband inderdaad hoog binnenkomen dan weet je ons volgend jaar alvast te vinden!
Ben je benieuwd naar meer details over hoe we dit precies hebben aangepakt en naar de achterliggende data en het voorspelmodel? Houd onze posts dan in de gaten!
¹ Vanwege het 25-jarig jubileum van deze lijst der lijsten, bestaat de Top 2000 dit jaar zelfs uit 2500 nummers