Hoe je als data analist met cognitieve biases te maken hebt en hoe je ze kunt herkennen: Deel 1

29 januari 2018

Cognitieve biases: We hebben ze allemaal en we komen ze regelmatig tegen in het dagelijks leven. Maar hoe heb je eigenlijk als data analist te maken met deze biases? En hoe kun je ze herkennen? In deze reeks bespreken we cognitieve biases bij analisten. Iedere blog worden er 3 biases uit 20 categorieën gekozen.

Met in deze blog 3 biases uit het “Too Much Information” Spectrum: Self-relevance effect, Confirmation bias, en de Bias blind spot.

 

Self-Relevance effect

Kort gezegd betekent deze bias dat als je iets meer kunt relateren aan jezelf, dat het dan meer opvalt bij je. Stel, je bent een enorme kattenliefhebber en je hebt een abonnement op allerlei dierentijdschriften. Als je dan een churn model moet maken voor bijvoorbeeld een uitgeverij, dan valt de variabele ‘Is in bezit van een kat’ sneller bij je op. Immers, je hebt zelf een kat en ook een abonnement op tijdschriften. De kans dat je deze variabele ziet als een belangrijke variabele is dan ook groter, terwijl andere variabelen (“is in bezit van een hond”) misschien een even groot effect hebben op de churnkans. Echter, deze variabelen zijn minder relevant voor jezelf en dus vallen deze variabelen minder op.

 

Confirmation bias

Als jij gelooft dat het imputeren van missende waarden door middel van het gemiddelde beter is dan het imputeren van missende waarden door de mediaan, dan ga je eerder naar informatie op zoek die dit bevestigt dan naar informatie die deze stelling onderuit haalt. Of als je vindt dat Access een beter programma is dan SQL Server, dan ga je op zoek naar informatie om deze stelling te bevestigen. Als je dan informatie krijgt die jouw idee niet bevestigd of als je informatie krijgt die tegengesteld is aan wat je al weet, accepteer je deze minder snel en ben je geneigd deze informatie af te wijzen.

 

Bias blind spot

Deze bias zegt eigenlijk dat je geen biases kunt herkennen bij jezelf. Bij anderen herken je sneller dat ze last hebben van een bias dan bij jezelf. Als je bij een collega-analist ziet dat hij altijd kiest voor Access of voor het imputeren van missende waarden met het gemiddelde, dan wijs je dit toe aan de confirmation bias. Of als je ziet dat je katten-liefhebbende collega de variabele ‘in bezit van een kat’ in zijn analyse heeft gedaan, dan zou je dat toewijzen aan het self-relevance effect. Echter, het feit dat jij altijd alleen maar decision trees doet “omdat dat gewoon beter is” of dat jij de variabele “woon-werk verkeer afstand” in je model stopt gegeven dat je iedere dag 2 uur moet reizen naar je werk is natuurlijk geen bias. Nee, dat zijn weloverwegen keuzes.

 

 

Lees ook deel 2, 3 en 4:

Deel 2: Availability heuristic, Contrast effect en Clustering illusion.

Deel 3: Essentialism, het Positivity effect en de Appeal to probability fallacy.

Deel 4: Curse of Knowledge, Hindsight Bias en Hard-Easy Effect.

 

Contact

Wil je meer weten over dit onderwerp? Neem dan contact met ons op via +31 (0)33 258 28 30 of info@cmotions.nl.

Laatste nieuws

The Beatles zijn terug? Het bouwen van een Beatles lyrics generator

13 december 2022

In 1964 brachten de Beatles hun iconische nummer “I Want to Hold Your Hand” uit. Vanaf... lees meer

In 2022 gaan we een mooi feestjaar tegemoet! Veel huwelijken verwacht

21 februari 2022

Plan je agenda vrij en zorg voor genoeg feestkleding in je kast, want grote kans dat... lees meer

De belangrijkste trends in data & analytics, toepasbaar in jouw realiteit

27 januari 2022

Net als vorig jaar hebben wij kritisch gekeken naar de belangrijkste trends op het gebied van... lees meer

Schrijf je in voor onze nieuwsbrief

Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!