De belangrijkste trends in data & analytics, toepasbaar in jouw realiteit

27 januari 2022

Artikel geschreven door Jeanine Schoonemann en Kees Groenewoud

Net als vorig jaar hebben wij kritisch gekeken naar de belangrijkste trends op het gebied van data & analytics voor 2022 en verder. Daarbij beoordelen we vooral de praktische toepassing van deze ontwikkelingen, vanuit onze ervaringen bij de vele projecten die wij uitvoeren en met een horizon wat dichter huis.

Zoals je van ons gewend bent, kijken wij naar wat er op dit moment in de markt en (vooral) bij onze klanten speelt op het gebied van data & analytics. Dus, welke ambities zijn er voor dit nieuwe jaar geformuleerd, wat zijn daarin de uitdagingen, wat zijn de vooruitzichten en hoe stellen organisaties zich hierop in?

Geen utopische vergezichten, maar juist een realistisch toetsingskader vanuit jouw realiteit. Om te gebruiken als toetsing, of ter geruststelling, dat jouw organisatie de juiste thema’s op de roadmap heeft gezet om dit jaar maximaal te scoren met data & analytics.

 

Afbeelding realisatie van doelstellingen en ambities - artikel trends data 2022

 

De wereld van data & analytics in hapklare brokken

Als wij het hebben over de wereld van data & analytics, dan is het handig om dit af te bakenen en te verdelen in logische en samenhangende delen.
Binnen Cmotions hebben wij vijf aandachtsgebieden gedefinieerd waarmee we het hele speelveld afdekken en die houvast bieden voor het inzichtelijk maken van de daadwerkelijke impact van data gedreven werken.

  1. Strategie & executie – hoe kan data & analytics helpen bij het realiseren van de organisatiedoelen, hoe kunnen we deze strategie direct omzetten in uitvoering door het inzetten van mens, organisatie en proces voor het maken van betere beslissingen en het optimaliseren van processen en (klant)interacties.
  2. Data engineering – hoe zorgen we dat de juiste data, in de juiste vorm, voor de juiste personen beschikbaar is op een efficiënte en duidelijke wijze, met de optimale inzet van de benodigde techniek.
  3. Data science & analytics – welke methoden en technieken passen we toe om data om te zetten in bruikbare en ondersteunende inzichten en dataproducten, om de waarde van data te maximaliseren voor de organisatie.
  4. Business intelligence & data visualisatie – hoe zorgen we dat inzichten begrepen en duidelijk gecommuniceerd worden en kunnen worden omgezet naar actiegerichte stuurinformatie.
  5. Data management & governance – hoe richten we de datahuishouding in, zodat doelen en kaders (in het datafundament) in een consistente en toekomst vaste inrichting worden vertaald, het datagebruik transparant en compliant is en inzichten ook betrouwbaar en consistent zijn?

 

Wat wij in 2022 als de belangrijkste ontwikkelingen zien voor data & analytics

In eerste instantie delen we in dit artikel de belangrijkste trends die wij zien in de verschillende vakgebieden. En geven daarmee een overzicht van wat er in de breedte gebeurt. In een aantal volgende artikelen nemen onze professionals je verder mee in deze ontwikkelingen. In die artikelen gaan we ook dieper in op de inhoud en wat ze concreet voor jou gaan/moeten betekenen.

 

Strategie & Executie

1. De opmars van enterprise data platforms

Een van de meest gebruikte termen in marketing executie afgelopen jaar was toch wel ‘CDP’. Oftewel, een customer data platform. Hoewel er verschillende definities bestaan, is de belofte van een CDP dat je met zo’n platform al je (online & offline) klantbronnen bij elkaar brengt, uniformeert op basis van één unieke klantsleutel, de juiste klantdialogen serveert met deze 360 graden klantview én die interacties op performance kan meten.

Wij denken dat de ontwikkeling of aanschaf, implementatie en uitrol van dergelijke enterprise data platforms voor de nodige hoofdbrekens gaat zorgen in 2022 en verder. Want let op, ook deze technologie is niet DE pasklare oplossing voor al je uitdagingen om (klant)data bij elkaar te brengen. Het kan één van je enablers zijn om doelstellingen te bereiken.

Voordat jij meegaat in de data platform trend, is ons advies om eerst kritisch te kijken wat jouw organisatie nodig heeft. En vooral goed te inventariseren of er geen (andere) initiatieven intern ontwikkeld zijn of bestaan die min of meer op hetzelfde neerkomen. In een volgend artikel staan we hier uitgebreider bij stil.

2. De comeback van first party data

Vooral de advertising tak van marketing executie schrok afgelopen jaar wakker: de third party cookies gaan verdwijnen! Onder druk van wetgeving stoppen de meeste grote browsers met tracking van third party data. Wat daarvan de consequenties zijn, is inmiddels genoeg over gepubliceerd.

Wij zien de belangstelling voor first party data als trend voor 2022. Wat best opmerkelijk is. Want dit data gedreven vak is ooit ontstaan vanuit first party data: de gegevens die een organisatie zelf, vanuit haar eigen kanalen, van klanten verzamel(d)en. Alle technologische ontwikkelingen hebben het vervolgens mogelijk gemaakt om steeds meer data over ook andere, niet-eigen, kanalen – van prospects en klanten te verzamelen en hierop te acteren.

We hebben het hier dus eigenlijk over de comeback van first party data. Een ontwikkeling die wij van harte toejuichen. Immers, first party data betreft alle gegevens waarvoor jouw klanten ‘bewust’ toestemming hebben gegeven. Dit past in het tijdperk waarin privacy en ethiek veel belangrijker zijn geworden. Met first party data ben je in staat om transparant te zijn over je marketing beslissingen richting je klanten en stakeholders.

 

Data Engineering

1. ModelOps (Model Operations) wordt (nog) steeds relevanter

Deze trend zagen wij afgelopen jaar ook al op de kaart staan, maar blijkt nog onverminderd interessant. ModelOps heeft als doel om de automatisering van modellen naar een hoger niveau te brengen. Dat geldt zowel voor de kwaliteit van de modellen als voor de manier waarop deze naar productie kunnen worden gebracht. Dit is vooral relevant voor bedrijven die meerdere modellen in productie hebben staan, waardoor het steeds lastiger wordt om voor ieder model te bepalen of ze goed functioneren, fair zijn en of er geen bias insluipt. Het volledige spectrum van de lifecycle van een model komt in ModelOps dus aan bod: model creatie, continuous integration, continuous delivery, deployment, monitoring & beheer. Waar ModelOps is begonnen als een set van best practices, zien we dat dit steeds meer een onafhankelijke aanpak wordt voor model lifecycle management, zoals we dit ook kennen van DevOps en DataOps. Binnen Cmotions is het een aanpak die we hanteren voor onze DOTS Predictive Services.

2. Data Mesh, “de” manier om jouw datalandschap in te richten

Op het gebied waarop data opgeslagen en vooral (her)bruikbaar is, gaan de ontwikkelingen nog steeds onverminderd snel. Waar we de laatste jaren het vooral veel over Data Lakes hebben gehad, horen we nu meer en meer de term Data Mesh voorbijkomen. Een Data Mesh is geen technologie, maar meer een aanpak die een organisatie in staat stelt om flexibel te zijn in de data architectuur, zowel als het aankomt op technologie, maar ook op organisatie. Zo is het eenvoudig om meer rekenkracht toe te voegen, maar kan er ook snel gereageerd worden als een bedrijf verandert en groeit.

 

Data Science & Analytics

1. AutoML vs CustomML – kunnen we onze analist vervangen door een computer?

Met de ontwikkelingen op het vlak van AutoML rijst ook steeds meer de vraag of wij, als data analisten/scientists, niet in de nabije toekomst compleet vervangen zullen worden door computers. Een vraag die wij, uiteraard, met nee beantwoorden en we zullen in een volgend artikel ook zeker gaan uitleggen waarom. Maar feit is dat er absoluut een trend gaande is die de balans tussen wat “vanzelf” gaat en waar mensenhanden (en intelligentie) aan te pas komt aan het veranderen is. De vraag die wij voor, en met jou willen beantwoorden: Wat is hier nou de optimale balans? Wat kunnen we toevertrouwen aan AutoML oplossingen en wanneer is meer menselijke inbreng van belang in het ontwikkelen van Machine Learning toepassingen?

2. Bias en ethiek in (voorspel)modellen

Al sinds de introductie van de nieuwe privacywetgeving is er meer focus komen te liggen op de uitlegbaarheid van modellen. Wat we echter, gelukkig, tegenwoordig ook meer en meer zien is focus op bias en ethiek. Uiteraard mede dankzij maatschappelijke discussies en bewegingen zoals Black Lives Matter. Maar hoe test je nou of een algoritme “eerlijk” is en wat kan je eraan doen om dit eventueel te verbeteren? Met privacywetgeving zijn er kaders gekomen, maar waar de grenzen precies liggen, is vaak nog niet duidelijk. Hierin zal de komende jaren, maar zeker ook al in 2022, nog een hoop uitgekristalliseerd worden, wat wel en wat niet kan. Samen met juristen kruisen wij hier de komende tijd regelmatig de degens over – de lessen hieruit gaan we met jou delen.

3. Concept drift, data drift en de invloed op (voorspel)modellen

Nu het steeds makkelijker wordt om een (voorspel)model in productie te brengen, wordt een andere vraag steeds belangrijker: hoe weten we nu zeker dat het model nog doet wat het moet doen en wat wij denken dat het doet? Sluiten de beslisregels die het model heeft geleerd nog wel voldoende aan bij de beslisregels die gelden in de praktijk? Of is er mogelijk sprake van Data Drift: hoe zag onze originele trainingsdata eruit en hoe is deze data veranderd door de tijd heen. Modellen worden steeds vaker ingezet en langdurig gebruikt. Het is daarom van toenemend belang te beoordelen of een model nog steeds doet wat het zou moeten doen. Maar hoe bepaal, en vooral hoe beoordeel, je de veranderingen in data en de werking van een model eigenlijk? Dat is een vraag waarvan wij verwachten dat in 2022 veel organisaties voor het eerst echt tegen aan gaan lopen.

 

Data Visualisatie & Business Intelligence

1. Heimwee naar het klassieke DWH

Bij steeds meer klanten ervaren we dat er geen klassiek datawarehouse meer aanwezig is en daarmee ook de afwezigheid van BI engineers die datastromen in goede banen leiden. Het is waar dat steeds meer applicaties connectoren bieden waarmee je extractie van front-end gegevens snel kunt uitvoeren naar een applicatie van jouw keuze. Op korte termijn biedt dit snelle inzichten, op langere termijn is data consistentie en betrouwbaarheid van gegevens een probleem. Zo zien we vaak dat meerdere stakeholders binnen één organisatie dezelfde KPI’s berekenen met verschillende uitkomsten. Hoe ga je als data professional om met deze situatie? En wat kunnen organisaties doen om snel inzichten te verzamelen en tegelijkertijd consistentie in hun datahuishouding te bewaren?

2. Op zoek naar antwoorden? Vraag het je dashboard!

Hoe vaak gebeurt het jou dat je zoekt in een dashboard naar die ene grafiek of tabel waarin het overzicht staat dat je zoekt? Soms is het even klikken en bladeren, en als je geluk hebt en een dashboard is goed ontworpen, vind je wat je zoekt. Maar hoe prettig zou het zijn als je gewoon een vraag zou kunnen stellen aan je dashboard? En als het overzicht dat je zoekt gegenereerd kan worden op basis van je vraag. Deze functionaliteit is beschikbaar in de grotere dashboarding pakketten maar wordt niet veel gebruikt naar ons idee. Dit terwijl het je tijd kan schelen, maar ook zorgt voor een bredere beschikbaarheid van gegevens. In 2022 zoeken we uit hoe je als organisatie optimaal gebruik maakt van geschreven en gesproken interactie met je dashboard en hoe waardevol dit voor organisaties is.

 

Data Governance

1. Van Big Data naar Right Data

“Data is de toekomst”, maar organisaties dreigen overspoeld te raken door een aanzwellende data-tsunami en dan met name de exponentiele groei van ongestructureerde data (nu al 90% van het datavolume). Dat maakt het steeds moeilijker om te weten wat de meest betrouwbare data is. Tegelijk blijkt volgens Gartner, al in 2020 de (data) sciencefiction droom van de automatisch patronen herkennende AI, nog niet zo veel te kunnen als werd verwacht. Mede hierdoor zien we een ontwikkeling van onbeperkt data grazen (data obesitas), naar focus op het verzamelen van relevante en bruikbare data, ofwel fit for purpose.

Dit alles dwingt organisaties om strategisch te gaan kijken naar hun datagebruik, verwerving, verwerking en beheer (o.a. lifecycle management). Data governance helpt hierbij. Gartner gaf voor 2021 aan dat er een aantal verschillende ontwikkelingen aan komen, die daarbij gaan helpen: trust based governance en governance op analytics, AI en Machine Learning om er een paar te noemen.

2. Opkomst van ‘Werken onder governance’

Wij zien meer organisaties die de ‘datatechniek’ (steeds beter) op orde hebben, maar de organisatie eromheen nog niet, dan andersom. Er is dan ook groeiende aandacht voor het inrichten van een goed gestroomlijnde organisatie met heldere rollen en verantwoordelijkheden, waarop verantwoorde, voorspelbare en efficiënte wijze, kwalitatieve data kan worden geleverd.

Dit vereist dat de ‘business’ beter wordt in het formuleren van hun databehoeften (vraagarticulatie). En dat de dataorganisatie aantoonbaar de benodigde kwaliteit data (fit for purpose) data kan leveren. Natuurlijk binnen de kaders van het datafundament en met solide governance op de data en het gebruik daarvan.

In analogie met werken onder architectuur, spreken we daarbij over werken onder governance, met vergelijkbare drivers en voordelen, maar de laatste jaren met één extra driver: wetgeving omtrent verantwoord datagebruik waaraan voldaan moet worden, zoals de AVG (Eng: GDPR), ook wel bekend als compliance. Hierbij spelen ook veel ethische vraagstukken een rol. Veel organisaties zien data governance als randvoorwaarde om te kunnen voldoen aan privacywetgeving.

Data governance biedt mogelijkheden om met behoud van effectiviteit en efficiency, je dataprocessen compliant by design in te richten, bijvoorbeeld met betrekking tot privacy, transparantie van datagebruik en (ethische) kaders voor AI en algoritmegebruik.

3. Outsourcing datamanagement … of niet?

Datamanagement wordt steeds vaker gezien als een strategisch aandachtsgebied, maar ook wel als specialisme. Veel Nederlandse directiekamers maken op dit moment de ontwikkeling door van onbewust onbekwaam naar bewust (on)bekwaam: weet vaak al wel dat er iets moet gebeuren, maar weet niet precies wat of hoe. Daardoor zien we in dit kader ook een algehele ambitie om meer datageletterd te worden. Maar organisaties hebben vaak te maken met achterstallig onderhoud op hun datahuishouding, hebben koudwatervrees of zien data gedreven werken als een rijstebrijberg: het ontwikkelen van een volwassen, effectieve data-organisatie vergt namelijk een lange adem en structurele investeringen. En dan hebben we het nog niet over het opschonen en consistent krijgen van je historische (master) data.

In plaats van alles zelf in huis willen houden, zien we dan ook een trend naar meer oplossingen om (een deel van) dataprocessen en tooling uit te besteden aan andere publieke en private partijen, bijvoorbeeld in de vorm van data(management) in the cloud of as a service (DAAS), of centralisatie van data in de keten of het ecosysteem. Welke data kan en wil je zelf opslaan, welke data haal je liever uit een centrale bron en mag dat? Op het vlak van data governance betekent dat nieuwe uitdagingen, bijvoorbeeld op het vlak van decentraal of federated data governance, data-eigenaarschap en standaardisatie van metadata en datadefinities.

Er zijn ook organisaties die het DAAS model juist zelf, intern toepassen, om de dataleverprocessen steeds meer geformaliseerd, service-oriented en fabrieksmatig in te richten, wat flexibiliteit, voorspelbaarheid en consistentie helpt borgen. Maar wat betekent dat voor je bestaande data- en informatieprocessen en de kennis en vaardigheden die je daarvoor in huis moet opbouwen? Hoe zorg je dat je vanaf het begin al de vruchten gaat plukken?

 

Reality check?

Met dit artikel hebben wij onze visie gegeven op wat we zien gebeuren in het vak en de markt voor 2022. We hopen dat het je inspireert en helpt met het krijgen van overzicht in dit snel veranderende vakgebied.

Gebruik het als een reality check wat er wel en niet toe doet en om te toetsen of jouw organisatie ook de goede onderwerpen op de agenda heeft. Op sommige onderdelen gaan we, zoals gezegd, in vervolg artikelen dieper in.

Ben je geïnspireerd en roept het vragen op hoe met deze ontwikkelingen om te gaan, neem dan contact met ons op. We sparren hier graag over, online of wie weet binnenkort weer veilig met een fysiek contact.

Contact

Wil je meer weten over dit onderwerp? Neem dan contact op met Jeanine Schoonemann of Kees Groenewoud via onderstaande contactgegevens.

Jeanine Schoonemann, Principal Consultant

+31 6 55 89 75 12

j.schoonemann@cmotions.nl

Laatste nieuws

Amref versterkt met Power BI: het benutten van datapotentieel

18 juli 2023

Om blijvende veranderingen in de gezondheidszorg in heel Afrika te stimuleren heeft Amref Health Africa, de... lees meer

De leukste kennismaking met data

5 juli 2023

Wil jij jouw collega’s op ludieke wijze laten kennismaken met datagedreven werken? Geef ze op voor... lees meer

Vind jouw risicovolle bestanden volgens AVG met onze DriveScanner

17 april 2023

In elk bedrijf is het een uitdaging om ervoor te zorgen dat we alleen de documenten... lees meer

Schrijf je in voor onze nieuwsbrief

Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!