Tell me what you read: online leessegmentatie voor marketingpersonalisatie: 7 februari 2019

12 februari 2019

Op 7 februari tijdens het MIE event 2019 lichtten Margot Rozendaal (De Persgroep) en Jurriaan Nagelkerke (Cmotions) toe hoe De Persgroep met behulp van online leessegmentatie het aanbod voor haar online lezers heeft gepersonaliseerd. Ze lieten ons zien met welke segmentaties de Persgroep werkt om meer relevantie voor haar lezers te creëren. Verschillende typen segmentaties worden gebruikt. Uitgelegd wordt hoe gedragssegmentatie de online bezoeker dichter bij de business brengt. Topic modeling en segmentatietechnieken zijn ingezet om tot negen online leesprofielen te komen. Deze segmenten worden onder andere in de online kanalen gebruikt om mensen te benaderen met aanbiedingen die hun nieuwsinteresse weerspiegelen.

 

De aanleiding

De Persgroep (AD, De Volkskrant, Trouw, diverse regionale titels) zit middenin de transitie naar digitaal. Zo zag De Persgroep in 2018 t.o.v. een jaar eerder een stijging van 86% bij haar digitale abonnees. In rap tempo en met gemiddeld 28 miljoen gelezen artikelen per maand weet de consument inmiddels de nieuwsplatforms te vinden. Voor zo’n 1,3 miljoen abonnees staat er dagelijkse allerlei soorten nieuws op het menu: van recente ontwikkelingen in de internationale politiek tot het shownieuws heet van de naald. Er is veel data beschikbaar: miljoenen bezoekers per week en miljarden clicks op artikelen, informatie over leestijd en bijvoorbeeld type device. Alleen al per dag levert dit zo’n 70 GB aan relevante data op.

 

Optimalisatie van de Customer Life Cycle

Het Customer Intelligence team van De Persgroep zet een grote hoeveelheid aan databronnen in om verschillende interne klantgroepen te bedienen met inzichten en dataproducten. Hierbij wordt steeds meer online data gebruikt voor onder andere de optimalisatie van de Customer Life Cycle. De meeste bezoekers zijn anoniem. Data van niet-anonieme bezoekers kunnen worden gecombineerd met CRM-data, informatie over bijvoorbeeld de huidige abonnementen, op welke manier iemand is geworven en o.a. data over het huishouden. Al deze data wordt gebruikt in verschillende dataproducten als dashboards, rapportages en modellen. Dit zijn modellen die bijvoorbeeld het gedrag proberen te voorspellen, zoals het ideale moment voor cross-sell of verlenging.

Segmentaties binnen de Customer Life Cycle

De Persgroep maakt voor optimalisatie van de customer life cycle ook gebruik van segmentaties. De essentie: het creëren van homogene groepen van klanten, maar heterogeen ten opzichte van elkaar. Het is belangrijk van tevoren heel goed te bepalen welke inzichten je uit de segmentatie wil halen, zo benadrukt Margot. Dat bepaalt enerzijds de data die je erin wil stoppen en anderzijds wat je er uiteindelijk mee kan. Margot maakte het vergelijk het maken van pasta: zodra je uit meel spaghetti hebt gesneden kun je er nooit meer lasagne van maken. Om die reden heeft de Persgroep meerdere segmentaties.

 

Behoeftesegmentatie

De eerste segmentatie die Margot besprak, is een behoeftesegmentatie, gemaakt op basis van een vragenlijst die gestuurd is naar 5.000 consumenten. De vragenlijst bevatte vragen die betrekking hebben op hoe men tegen nieuws aankijkt, hoe men nieuws consumeert, hoe vaak per dag men het nieuws kijkt, het kijkgedrag op andere media etc.. Dit leverde vier segmenten op: experts, fans, addicts en passives.

De inzichten in de behoeftesegmenten wordt toegepast bij het ontwikkelen van ‘above the line’ communicatie om consumenten aan te spreken op hun intenties met betrekking tot nieuwsconsumptie. Tegelijkertijd ontstond bij de business de behoefte en vraag aan het Customer Intelligence team om deze segmenten in selecties aan te leveren. Denk daarbij aan een selectie van de “experts” voor De Volkskrant op huishoudniveau.

 

Intentie versus daadwerkelijk gedrag

De segmentatie op behoefte is alleen bekend onder de mensen die de vragenlijst hebben ingevuld. Daarom hebben Margot en Jurriaan op verschillende manieren geprobeerd de behoeftesegmenten te voorspellen. Op basis van sociodemografische data, abonnementsdata en online clickgedrag is gekeken of de segmenten verschillen vertoonden. Als dat zo zou zijn, zou voor consumenten die de vragenlijst niet ingevuld hebben, kunnen worden voorspeld of ze een “addict” of “expert” of “fan” of “passive” zijn. Helaas bleken de segmenten nauwelijks te verschillen op de onderzochte kenmerken. Er was eigenlijk maar één segment dat enigszins goed te onderscheiden was, de “passives”, maar dat is nu precies de groep waar de Persgroep het – omzet-technisch gezien – niet van moet hebben…
De conclusie was dat er een verschil zat tussen de intentie van de abonnees en het daadwerkelijke gedrag. Als je wordt gevraagd wat je over het Verenigd Koninkrijk wil lezen, dan zeg je misschien wel dat je het Brexit-nieuws wilt volgen. In de werkelijkheid blijkt dat je toch vooral het nieuws over prins Harry en prinses Meghan leest.

 

Voorkeuren online bezoekers

Om wel alle online bezoekers aan te kunnen spreken op hun voorkeuren is er gekozen voor een segmentatie puur op online gedrag. Dit leverde drie segmentatie-assen op:

  • ‘Hoe’ segmentatie: Hoe lees je nieuws? Via mobiel, tablet of computer?
  • ‘Wanneer’ segmentatie: Wanneer lees je het nieuws? Tijdens kantooruren of in de nacht?
  • ‘Wat’ segmentatie: Wat lees je nu eigenlijk? In welke onderwerpen ben je geïnteresseerd?

Op de ‘Wat’ segmentatie gaf Jurriaan een verdere toelichting. Met behulp van Python is middels tekstanalyse in twee stappen een segmentatie gemaakt op leesinteresses:

  1. Waarover gaan alle artikelen? (Topic modeling)
  2. Waarover lezen bezoekers? (Cluster analyse)

 

Topic modeling

Jurriaan zette tijdens de presentatie uiteen waarom reeds beschikbare indelingen van artikelen naar onderwerpen, zoals de indeling van artikelen op de site, niet bruikbaar bleken als basis voor een segmentatie van online bezoekers. Daarom is topic modeling gebruikt om de onderwerpen af te leiden en alle artikelen toe te wijzen aan deze onderwerpen. Topic modeling is een statistische techniek om uit een verzameling documenten – in dit geval nieuwsartikelen – onderwerpen af te leiden. Uit de analyse van 400.000 artikelen kwamen uiteindelijk 30 leesinteresses naar voren. Deze leesinteresses zijn onderling goed onderscheidend, op eenzelfde niveau en ook onafhankelijk van tijd. Dit laatste is belangrijk omdat De Persgroep voor de huidige toepassing – het indelen van online bezoekers naar leesinteresses op hun langere termijn leesgedrag – op zoek is naar een stabiele, langere tijd te gebruiken gedragssegmentatie.

 

Clusteranalyse

Nadat de artikelen voorzien zijn van de onderwerpen, kan per online bezoeker een profiel van zijn leesinteresses worden gemaakt. Op basis van deze leesprofielen heeft een clusteranalyse – kmeans – geresulteerd in 9 leesinteresse-segmenten. Hierbij zijn de leesinteresses binnen een segment zo homogeen mogelijk en zit er zo veel mogelijk verschil in leesinteresses tussen de segmenten. Het grootste segment is het Nieuws van Vandaag segment. Een groep die vaak terugkomt om met name de actualiteit te lezen. Dit is bij alle landelijke en regionale titels het grootste segment. Alle segmenten komen bij alle titels voor, maar er zijn uiteraard wel duidelijke verschillen in hoe vaak. Zo zijn er bij De Volkskrant en Trouw relatief veel lezers uit het segment Blik op de Wereld en bij AD en de regiotitels zijn er juist meer lezers van het segment Sport. Het segment Cultuur en Vermaak komt tot verbazing van sommigen ook bij de ‘serieuzere’ krant De Volkskrant vaak voor. Dankzij uitgebreide profilering worden de segmenten levend voor de gebruikers. Jurriaan gaf aan dat momenteel realtime online bezoekers worden ingedeeld op de segmenten, zodat de customer experience hierop kan worden aangepast. Door het gedrag van de segmenten met dashboards te monitoren, wordt inzichtelijk welke verschuivingen er zijn en of personalisatie op basis van de inzichten werkt.

Na een aantal interessante discussies over de verschillende segmentatievormen en de online gedragssegmentatie met de aanwezigen in de PIM zaal, eindigden Margot en Jurriaan de presentatie met drie tips:

Tip 1:
Denk aan de pasta! (laat type segmentatie goed passen bij wat je er mee wilt doen. Eenmaal spaghetti gekozen…)

Tip 2:
Segmentatie = More Art than Science. (Bij optimalisatie is er geen ‘beste oplossing’ obv alleen data. Wel obv toepassing. Be creative!)

Tip 3:
Testen, testen, testen (Segmenten bieden mogelijkheid relevantie te verhogen. Met juiste content nog wel ff doen.)

Laatste nieuws

Prinses Peach gered uit de klauwen van Bowser op de Super Mario Hackathon

4 mei 2023

Op 21 april 2023 hielden we een heroïsche hackathon waarbij 10 teams van KPN, Rabobank, DPG,... lees meer

Rondetafelsessie – donderdagochtend 25 mei

16 januari 2023

Culture eats data strategy for breakfast​ Bedrijven die erkennen dat ze met de inzet van data... lees meer

The Beatles zijn terug? Het bouwen van een Beatles lyrics generator

13 december 2022

In 1964 brachten de Beatles hun iconische nummer “I Want to Hold Your Hand” uit. Vanaf... lees meer

Schrijf je in voor onze nieuwsbrief

Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!