Skip to main content
search

Plan je agenda vrij en zorg voor genoeg feestkleding in je kast, want grote kans dat je dit jaar rond de zomer voor meerdere huwelijken wordt uitgenodigd. We hebben het dan over de bekende inhaalhuwelijken, huwelijken die vanwege de corona restricties zijn uitgesteld naar het volgende jaar.

Hoe wij dit weten? Door middel van een tijdreeksanalyse hebben we een voorspelling gemaakt van het verwachte aantal huwelijken in 2020 en begin 2021. Het werkelijke aantal huwelijken dat heeft plaatsgevonden is echter lager. We vermoeden dat deze huwelijken zijn uitgesteld vanwege de corona restricties, waardoor een groot feest de afgelopen 1,5 jaar niet mogelijk was.

 

Trends in huwelijken

Het CBS registreert al meer dan 25 jaar het dagelijkse aantal huwelijken en geregistreerd partnerschappen in Nederland. Er zijn duidelijk een aantal trends zichtbaar in deze data. Vrijdag is zoals verwacht de meest populaire dag om in het huwelijksbootje te stappen. Maandag wordt nog relatief vaak, gratis, getrouwd waardoor deze dag populairder is dan dinsdag en woensdag.

Aantal huwelijken per dag per jaar

Aantal huwelijken per dag per jaar

 

Daarnaast is er elk jaar een duidelijk trouwseizoen van mei t/m juni en eind augustus t/m september. In deze periode loopt het aantal huwelijken op tot wel 400 per dag. In het laagseizoen wordt er ‘slechts’ 100 à 150 keer per dag het Ja-woord gegeven.

Ook valt op dat trouwen in populariteit afneemt. Sinds het jaar 2010 is er een dalende lijn in het aantal huwelijken te zien. Vermoedelijk zullen steeds meer Nederlanders kiezen voor een geregistreerd partnerschap in plaats van een huwelijk. In het aantal geregistreerd partnerschappen is juist een stijgende trend te zien. Sinds 2010 is het aantal geregistreerd partnerschappen meer dan verdubbeld.

 

Aantal huwelijkssluitingen en geregistreerd partnerschappen vanaf 2010

Aantal huwelijkssluitingen en geregistreerd partnerschappen vanaf 2010

Populaire trouwdagen

We herinneren ons allemaal nog de traan van Maxima op 02-02-2002. Het koningspaar is niet de enige die een voorkeur heeft voor bijzondere trouwdata. ‘Mooie’ data die binnen het trouwseizoen en in het weekend vallen staan garant voor volle trouwlocaties. Zo was vrijdag 08-08-2008 de meest populaire trouwdag van de afgelopen 25 jaar met bijna 3.000 huwelijken. Ook donderdag 09-09-1999 ging de boeken in als populair met ruim 2.500 huwelijken. Met nog ruim 1.500 huwelijken op vrijdag 10-09-1999 is dit de meest populaire trouwweek van de afgelopen 25 jaar.

Aantal huwelijkssluitingen per week vanaf 1996

Aantal huwelijkssluitingen per week vanaf 1996

 

 

Impact van corona op aantal bruiloften

Voor veel mensen hoort bij een droombruiloft de aanwezigheid van familie en vrienden. Door de coronamaatregelen vanaf maart 2020 viel dit plaatje voor huwelijksparen in duigen. Zelf waren we nieuwsgierig hoeveel impact deze maatregelen op het aantal bruiloften zou hebben. De sterke trends die we in de data zagen, gaven ons het vertrouwen dat we door middel van een statistisch model een goede voorspelling konden maken voor het verwachte aantal huwelijken in 2020 en 2021. Door deze af te zetten tegen de werkelijke gesloten huwelijken hebben we een indicatie van het aantal bruiloften dat is uitgesteld en hopelijk wordt ingehaald in 2022.

 

Tijdreeksanalyse verwachte huwelijken

Om een voorspelling te maken van het aantal verwachte huwelijken, maken we gebruik van statistische modellen. Op basis van resultaten uit het verleden proberen we een uitspraak te doen voor de toekomst. Veel standaard statistische voorspelmethodes gaan ervan uit dat de datapunten (aantal huwelijken op een dag) onderling onafhankelijk zijn. In het geval van een tijdreeks bestaat er echter afhankelijkheid tussen de datapunten. Dit wordt ook wel autocorrelatie genoemd: een nieuw datapunt is vaak een vertraagde kopie van een eerder moment. Zo is het aandeel huwelijken op een maandag relatief laag en trouwen er meer mensen net voor of na de zomer. Doordat deze afhankelijkheid tussen datapunten bestaat in de data zijn er methoden nodig die hier rekening mee houden. In dit geval is een tijdreeksmodel een goede methode om te modelleren en voorspellingen te maken.

Voordat we kunnen beginnen met het maken van het model, moeten we zorgen dat er geen uitschieters meer in de data zitten. Uitschieters zijn bijvoorbeeld ‘mooie’ data zoals 20-05-2005 waarbij het aantal huwelijken ruim 3x zo hoog is als gebruikelijk in het seizoen. Een week ervoor of erna, verwachten we niet zoveel huwelijken en daarom zal 20-05-2005 onze voorspelling verstoren en is het beter deze uitschieter te verwijderen. Zoals eerder uitgelegd laat het aantal huwelijkssluitingen een trend door het jaar heen zien, maar ook binnen een week. Omdat dit erg complex wordt om te modelleren, hebben we besloten het totaal aantal huwelijkssluitingen per week te berekenen en hiermee een statistisch model te schatten.

 

Tijdsreeksmodel ARIMA

Er zijn verschillende soorten modellen voor de tijdreeksen, de meeste bekende is ARIMA. ARIMA staat voor AutoRegressive Integrated Moving Average. Dit model kijkt naar de waarde voorafgaand aan het huidige datapunt (vorige week, de week daarvoor, etc.) en de afwijking van het verwachtte aantal. Het kijkt ook of er een trend is, bijvoorbeeld dat over een lange periode steeds minder mensen trouwen.

Een tijdreeksmodel probeert het aantal huwelijken op te bouwen uit een trend en een eventuele ruis. De data analist heeft als taak om te bepalen hoeveel weken je terugkijkt om deze week te voorspellen.

De data moet aan een aantal voorwaarde voldoen om dit model te kunnen gebruiken. We splitsen het aantal huwelijken per week op naar een trend, seizoenseffect en eventuele ruis om deze voorwaarden te kunnen controleren.

 

Uitsplitsing huwelijken naar trend, seizoenseffect en residu

Uitsplitsing huwelijken naar trend, seizoenseffect en residu

 

Na de totale aantallen, laat de tweede grafiek een overwegend dalende trend zien in de afgelopen jaren. De volgende grafiek toont een duidelijk seizoen patroon met de lengte van 1 jaar en de laatste grafiek toont de ruis. Deze ruis lijkt geen patroon te bevatten en is gelijkmatig verdeeld, wat betekent dat de data stationair is. Dit is nodig om statistische modellen zoals ARIMA toe te kunnen passen. Naast het bekijken van deze grafieken voeren we twee testen uit om te bevestigen dat de data stationair is.

Nu bevestigd is dat de data stationair is, kunnen we een ARIMA model schatten op de data. Hiervoor wordt alleen de data tot en met 2018 gebruikt, zodat we met het model voor het jaar 2019 een voorspelling van het verwachte aantal huwelijken kunnen maken.

 

Werkelijke en voorspelde huwelijken met ARIMA

Voorspellingen en werkelijke huwelijkssluitingen 2019 - huwelijken

Voorspellingen en werkelijke huwelijkssluitingen 2019 – huwelijken

 

Bovenstaande grafiek toont deze werkelijke aantallen en onze voorspelling voor 2019 op basis van het ARIMA model. De procentuele afwijking tussen de voorspelling en werkelijke aantallen in 2019, de Mean Average Percentage Error (MAPE), is een maat voor de nauwkeurigheid van onze voorspelling. Met een MAPE van 12,4%, wijken de voorspelling gemiddeld 12,4% af van de werkelijke aantallen en daarom zijn we er nog niet van overtuigd dat ARIMA het meest geschikt is voor onze data.

 

Andere voorspellingstechnieken

Naast ARIMA zijn er verschillende andere technieken die we kunnen toepassen. Het algoritme waarvan de voorspellingen de kleinste afwijking (de laagste MAPE), is dan de beste keuze. Dit algoritme zullen we gebruiken om te voorspellen hoeveel huwelijken we hadden verwacht in 2020 en 2021 (als er geen corona was geweest). De algoritmes die we naast ARIMA proberen zijn; NBEATS, Prophet and Exponential Smoothing.

Prophet is een techniek die is ontwikkeld door Facebook en houdt rekening met een trend, seizoenseffect en eventueel ook feestdagen.
NBEATS, Neural Basis Expansion Analysis for Interpretable Time Series, is een deep learning model dat voorgaande en toekomstige punten meeneemt.
Exponential Smoothing is een techniek die goed kan omgaan met een trend en seizoenseffecten. Net als ARIMA kijkt Exponential Smoothing naar het aantal huwelijken in de voorgaande weken, waarbij datapunten die verder in het verleden liggen een lager gewicht meekrijgen en minder zwaar meetellen dan datapunten dichterbij.
Meer uitleg over de modellen is hier te vinden: NBEATS, Prophet en Exponential Smoothing.

Alle technieken hebben hun sterke en zwakkere kanten. Door ze allemaal toe te passen om de huwelijken mee te voorspellingen, zien we dat Exponential Smoothing het beste werkt voor onze data. Dit model heeft slechts een MAPE van 8,6% per week op het aantal voorspelde huwelijkssluitingen voor 2019. Waarbij de andere modellen een afwijking hebben tussen de 9,6 en 12,4%.

Onderstaande grafiek laat het werkelijke aantal huwelijkssluitingen zien met daarbij van de verschillende technieken de voorspellingen en de MAPE.

Voorspellingen en werkelijke huwelijkssluitingen 2019

Voorspellingen en werkelijke huwelijkssluitingen 2019

De 8,6% afwijking zit voornamelijk in de periode september waarbij het aantal huwelijkssluitingen hoger is dan alle verschillende modellen voorspelden op basis van het aantal huwelijkssluitingen in de afgelopen jaren. Dit hoge aantal wordt mede veroorzaakt door meerdere ‘mooie data’ in deze maand; maandag 9-9-2019 en donderdag 19-9-2019. Deze uitschieters hadden we niet kunnen voorspellen. Zoals hier te lezen betekent een MAPE onder de 10% dat het model zeer accuraat is.

Voorspelling verwachte huwelijken 2020 en 2021

We zijn tevreden met het Exponential Smoothing model en dit geeft genoeg vertrouwen om ook voor 2020 en 2021 een voorspelling van het verwachte aantal huwelijkssluitingen te maken. Laten we dit het aantal voorgenomen huwelijken noemen. Door het uitbreken van de pandemie en de bijbehorende maatregelen weten we echter dat het aantal huwelijken anders is geweest dan het aantal voorgenomen huwelijken.

Onderstaande grafieken geven een overzicht van onze voorspelling en het werkelijke aantal huwelijkssluitingen per maand tot en met september 2021.

 

Voorspellingen en werkelijke huwelijkssluitingen 2019

De grafieken laten zien dat het werkelijke aantal huwelijken in de periode maart tot en met augustus 2020 lager geweest is dan voorspeld, dit is een verschil van 28%. In deze periode waren er strenge beperkingen vanwege corona op groepsgroottes. Wij verwachten dan ook dat dit de verklaring is voor deze daling. Ook in 2021 zien we in een periode met strenge maatregelen minder huwelijken dan voorspeld. In de periode juli tot september waren er minder beperkingen op groepsgroottes en is het aantal huwelijken juist hoger dan voorspeld. Naar verwachting zijn er in deze periode al een aantal uitgestelde huwelijken ingehaald.

 

Vooruitzicht huwelijken 2022

Over de gehele periode van maart 2020 tot en met september 2021 zijn er bijna 7.000 minder huwelijken gesloten dan we hadden verwacht. Dit is 13% van het totaal verwachte aantal huwelijken. Daarbij vermoeden wij dat een deel van de 100.000 gesloten huwelijken in afgeslankte vorm zijn doorgegaan zonder groot feest. Wanneer alle personen, die hun huwelijk vanwege de coronamaatregelen hebben uitgesteld of in afgeslankte vorm hebben gevierd, deze nog gaan inhalen in 2022 gaan we een mooi feestjaar tegemoet! Zo kan 22-02-2022 best een knaldatum worden en ook vrijdag 9 en 16 september zullen garant staan voor veel huwelijken. Daarom ons advies: zorg voor genoeg feestoutfits in de kast!

Wil je deze analyse op dezelfde data uitvoeren?

Bekijk dan dit notebook

Close Menu