Data science & data engineering

“Hoe vertaal ik complexe business vraagstukken naar data science vraagstukken?”
“Hoe zorg ik ervoor om geautomatiseerd en daardoor kostenefficiënt waarde uit mijn data te halen?”
“Hoe richt ik mijn IT infrastructuur in om data science mogelijk te maken, en welke rol speelt data engineering hierbij?”

Wat is data science & data engineering?

Voor ons betekent data science het slim en efficiënt inzetten van data om complexe business vraagstukken op te lossen, bijvoorbeeld:

  • Welke klanten gaan hun contract opzeggen?
  • Wat is per klant het beste kanaal en tijdstip om te communiceren?
  • Wat is de optimale productmix om de marges te maximaliseren?

Door de complexiteit is het niet mogelijk om deze vragen 100% correct te beantwoorden, maar met de hulp van grote hoeveelheden data, beproefde algoritmes en domeinkennis is het wel mogelijk om goede schattingen te maken. Deze schattingen zijn vaak veel beter dan een willekeurige gok, waardoor zij toegevoegde waarde leveren.

Ons uitgangspunt is om het gehele proces rondom het maken van deze schattingen zoveel mogelijk te automatiseren, zodat er structureel en kostenefficiënt waarde kan worden toegevoegd. Technisch gezien wordt dit proces ook wel een ‘data pipeline’ genoemd, en daar komt data engineering bij kijken.

Data engineering betekent voor ons het ophalen, valideren en verwerken van datastromen, vaak ten behoeve van data science oplossingen. Hierbij hoort ook de infrastructuur waarop de tools draaien die deze datastromen mogelijk maken.

Een sprekend voorbeeld waar data science & data engineering samenkomen is DOTS predictive services. Dit is een product dat we intern ontwikkelen en beheren en waarin alle bovengenoemde facetten terugkomen. Meer informatie is hier te vinden.

Werkwijze en visie

Kennisdeling, snelheid, en reproduceerbaarheid zijn voor ons belangrijke waarden. Als data science consultant balanceer je enerzijds tussen de snelheid en resultaatgerichtheid die wordt gevraagd in een business omgeving, en anderzijds aan het experimentele en complexe karakter van data science. Hoe gaan wij daarmee om?

  • We delen onderling veel kennis die we centraal opslaan. Dit stelt ons in staat om de gedeelde kennis en kunde makkelijk toe te passen bij andere projecten.
  • We houden er niet van om het wiel opnieuw uit te vinden waardoor voor diverse onderdelen van het data science proces best practices zijn geformuleerd.
  • Naast klantopdrachten werken we samen aan interne projecten waar we nieuwe technieken uitproberen en van elkaar leren.
  • We zijn pragmatisch: als we een vergelijkbare impact kunnen maken met een simpele oplossing heeft dat de voorkeur boven een complexe oplossing.

Het laatste punt heeft alles te maken met vertrouwen. Als we iets geleerd hebben de afgelopen 2 decennia is dat vertrouwen de grootste rol speelt in de adoptie van data science. Vertrouwen in de onderliggende technieken, vertrouwen in de interpretatie en vertrouwen in de reproduceerbaarheid. Ook hier speelt data engineering een belangrijke rol, aangezien iedere oplossing staat of valt bij de betrouwbaarheid van de onderliggende data. Door ook in dat stuk betrokken te zijn, kunnen we garanderen dat de output betrouwbaar is.

 

Toepassingen

Het leuke van het werken met data is dat het nagenoeg overal op kan worden toegepast, hieronder enkele voorbeelden waar we aan hebben gewerkt:

  • Next best action model
  • Churn reductie
  • Opzetten van raamwerk zodat de klant zelfstandig modellen kan maken
  • Het programmeren van zelfrijdende auto’s
  • Het publiceren van een Python package

De laatste toepassing hebben we intern ontwikkeld met een groep betrokken collega’s, maar de eerste 4 toepassingen hebben we meermaals opgezet en uitgevoerd bij diverse klanten. Mocht je meer willen weten over deze projecten of ben je benieuwd wat wij voor jou kunnen betekenen schroom dan niet om contact op te nemen.

 

Meer lezen over data science & data engineering

Speciaal voor de meer technisch geinteresseerde lezer hebben we in 2016 vanuit Cmotions `The Analaytics Lab` opgericht. Daar zoeken we samen met onze opdrachtgevers de grenzen op van de mogelijkheden van data science & AI. Enkele van de bovenstaande toepassingen zijn ook te vinden op deze website. Klik hier voor meer informatie.

Andere artikelen:

 

Hoe wij helpen

E-learning professionaliseert data analyses in alle lagen van de NVWA

naar de case

Betere gebruikerservaring op farmacommunity CPhI met datagebaseerde verbeteringen

naar de case

CarNext zet data science in voor optimaliseren resultaten Google Ads

naar de case

Neem contact met mij op

    Schrijf je in voor onze nieuwsbrief

    Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!