Weet jij nog een geschikte dataset voor mij?

21 april 2022

Bij Cmotions helpen we bedrijven om beslissingen te nemen op basis van data. Soms nemen we alle werkzaamheden uit handen, een andere keer werken we intensief samen met medewerkers in projecten of leiden we medewerkers op zodat zij zelf in staat zijn waarde uit data te halen voor hun organisatie. Met de Cmotions Academy leiden we al meer dan 15 jaar medewerkers en aanstormend talent op het gebied van data en analytics. Opleiden en jezelf blijven ontwikkelen is belangrijk, steeds meer bedrijven zetten in op de toepassing van data voor het onderbouwen van beslissingen. De medewerker van morgen heeft dus een stevig fundament nodig om data gedreven werken in de praktijk te realiseren.

Bij de opzet van een dergelijke opleiding starten wij dan ook met de vraag welke vaardigheden nodig zijn en hoe deze het beste kunnen worden ingezet. Ligt de nadruk op onderzoeksmethoden, analysevaardigheden, de omgang met gegevensbronnen of eerder bij de intakevaardigheden of presentatietechniek? Wat de kern van een opleidingsvraagstuk ook is, data speelt bij ons altijd een grote rol.

Wij constateren dat er maar weinig vrij beschikbare datasets zijn die goed aansluiten bij vaardigheden die je binnen een opleiding of training wilt aanleren. Zoek maar eens op een dataset die geschikt is voor een regressieanalyse, dashboarding vraagstuk of outlier detectie. Deze sets zijn er niet, of ze passen niet goed genoeg bij de training die we ontwikkelen.
Daarom ontwikkelen wij onze eigen datasets die helemaal passen bij het opleidingsvraagstuk. We gebruiken hiervoor een zelf ontwikkelde tool, de DOTS Datasampler, om realistische datasets te creëren. Om (toekomstige) medewerkers voor te bereiden op hun taak is realistische data wat ons betreft een uitkomst. Een dataset die tot de verbeelding spreekt en goed aansluit op de praktijk zorgt ervoor dat kennis die wordt opgedaan duurzaam is.

dataset

Data op maat: Hogeschool Utrecht

Recent hebben we samen met de Hogeschool Utrecht een B2B dataset ontwikkeld voor gebruik in het curriculum voor 2e-jaars studenten. Hierin wordt aan studenten gevraagd om exploratieve data analyse toe te passen, de belangrijkste bevindingen te visualiseren in dashboarding software en een coherente presentatie te verzorgen over de bevindingen.

Voor deze leerdoelen hebben we een dataset op maat gemaakt van een fictieve Nederlandse bierbrouwerij, De Clerck. Dit bedrijf levert bier van de eigen brouwerij, in flessen per krat of fusten van 10 of 50 liter aan horeca in Nederland. Frisfrank, verschillende soorten wijn, snacks en producten van andere fabrikanten behoren ook tot het assortiment. Daarbij leveren we een gedetailleerd overzicht van de tabellen die beschikbaar zijn voor De Clerck:

  1. Company: een tabel waarin de contactgegevens staan van het bedrijf waaraan geleverd wordt, enkele bedrijfskenmerken en de klanttevredenheid.
  2. Account details: deze tabel bevat kenmerken van het bedrijf die van belang zijn voor  marketing. Heeft een bedrijf zich ingeschreven voor de nieuwsbrief van De Clerck, heeft het bedrijf een opt-in afgegeven voor marketing doeleinden, heeft een accountmanager van De Clerck dit bedrijf de afgelopen 3 maanden bezocht en is er een kwantum korting bedongen door dit bedrijf (en hoe hoog is deze korting).
  3. Orders: dit zijn 4 afzonderlijke tabellen voor de jaren 2018 tot en met 2021. Hierin staat de datum waarop een bestelling is geplaatst, en welke goederen zijn besteld.
  4. Referentietabel: dit bevat een overzicht van de producten en hun kenmerken die De Clerck levert, inclusief de prijs ex btw.

Deze dataset wordt geleverd met een beschrijving van elk veld, een zogenaamd data dictionary. Er zijn kleine, middelgrote en grote ondernemingen beschikbaar in de data en de orders bevatten duidelijke trends en seizoenspatronen die realistisch zijn. Zo wordt alcoholvrij bier over de jaren heen steeds vaker besteld en uiten ondernemingen die minder aandacht krijgen van hun accountmanager hun onvrede door een lagere klanttevredenheid. Daarnaast bevatten enkele variabelen in de dataset missende waarden, om de studenten te leren de data eerst gronding te exploreren voordat er visualisaties of berekeningen worden gemaakt.

Special beers orders

Dataset bierbrouwerij De Clerck

Wil je voor jouw opleidingsvraagstuk ook gebruikmaken van de dataset van bierbrouwerij De Clerck? Dat kan! Vul hieronder je gegevens in en je ontvangt van ons een e-mail met de link naar de dataset, documentatie en uitleg voor gebruik.

 

Ja, ik wil ook de dataset van De Clerck!

Met dit formulier vraag je vrijblijvend de dataset aan met bijbehorende documentatie en uitleg voor gebruik.

Laatste nieuws

De leukste kennismaking met data

5 juli 2023

Wil jij jouw collega’s op ludieke wijze laten kennismaken met datagedreven werken? Geef ze op voor... lees meer

Vind jouw risicovolle bestanden volgens AVG met onze DriveScanner

17 april 2023

In elk bedrijf is het een uitdaging om ervoor te zorgen dat we alleen de documenten... lees meer

De vijf belangrijkste inzichten uit het datascan onderzoek

10 maart 2023

Scan voor datagedrevenheid – hoe volwassen zijn we en waar moeten we mee aan de slag?... lees meer

Schrijf je in voor onze nieuwsbrief

Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!