21 februari 2018
Cognitieve biases: We hebben ze allemaal en we komen ze regelmatig tegen in het dagelijks leven. Maar hoe heb je eigenlijk als data analist te maken met deze biases? En hoe kun je ze herkennen? In deze reeks bespreken we cognitieve biases bij analisten. Iedere blog worden er 3 biases uit 20 categorieën gekozen.
Met in deze blog twee biases uit het “Too Much Information” Spectrum: Availability heuristic en het Contrast effect en een bias uit het “Not Enough Meaning” Spectrum: Clustering illusion.
Een heuristiek is een snelle route die je hersenen nemen als je een beslissing moet nemen. De availability heuristic zegt dat gedachten die recent beschikbaar voor je waren, sneller opnieuw geselecteerd zullen worden. Voorbeeld: Je ben in je kantoortuin aan het werk en moet gaan beslissen welke analyse je gaat toepassen op de data. Daarvoor heb je een email ontvangen over een seminar “Nieuwe technieken in random forest modeling”. Ergens in de kantoortuin zijn twee collega’s aan het praten over het snoeien van de bomen in de tuin. De kans is nu groter dat je decision trees als techniek kiest. Niet omdat deze techniek voor je data zo geschikt is, maar puur omdat deze techniek ‘available’ voor je is. Je neemt hierdoor aan dat er vast wel een reden is dat je aan deze techniek moest denken (want je was natuurlijk hard aan het werk en niet stiekem aan het meeluisteren met je collega’s of je mail aan het lezen).
Het contrast effect zegt dat je twee elementen die je tegelijk of kort na elkaar gepresenteerd krijgt automatisch met elkaar gaat vergelijken. Ook als deze twee elementen helemaal niets met elkaar te maken hebben. Voorbeeld: Je bent hard aan het werken en hebt een model gebouwd dat slechts een hitrate heeft van 47% — je model doet het dus slechter dan wanneer je uitgaat van random keuzes. Het tweede model dat je maakt heeft een hitrate van 61% en dus voel je je een stuk beter! Je gaat de 61% vergelijken met de 47% hitrate en daardoor vind je je model beter dan wanneer je deze vergelijkende informatie niet had gehad. Dus de volgende keer dat je tevreden bent met jouw remake van een 3d-piechart: Vraag jezelf af of het echt een goede grafiek is of dat het contrast ervoor zorgt dat je tevreden bent.
De clustering illusion is voor analisten niet alleen relevant voor clusteranalyse (what’s in a name), maar ook voor onder andere factoranalyse, correlaties, en regressieanalyses. Deze illusie houdt in dat je clusters of samenhang ziet in kleine random samples oftewel: Je denkt dat de data niet random verdeeld is, terwijl dat wel zo is. Deze bias komt voor uit het feit dat mensen graag samenhang en voorspelbaarheid willen en dat dus overal in terug gaan zoeken. Dus de volgende keer dat je zeker weet dat je een patroon observeert tussen het aantal telefoontjes per dag bij de helpdesk en het dagnummer in de Chinese jaarkalender; Think again 🙂
Lees ook deel 1, 3 en 4:
Deel 1: Self-relevance effect, Confirmation bias en de Bias blind spot.
Deel 3: Essentialism, het Positivity effect en de Appeal to probability fallacy.
Deel 4: Curse of Knowledge, Hindsight Bias en Hard-Easy Effect.
Wil je meer weten over dit onderwerp? Neem dan contact met ons op via +31 (0)33 258 28 30 of info@cmotions.nl.
13 december 2022
In 1964 brachten de Beatles hun iconische nummer “I Want to Hold Your Hand” uit. Vanaf... lees meer
21 februari 2022
Plan je agenda vrij en zorg voor genoeg feestkleding in je kast, want grote kans dat... lees meer
27 januari 2022
Net als vorig jaar hebben wij kritisch gekeken naar de belangrijkste trends op het gebied van... lees meer