Boek review: Data Scientist

29 maart 2017

Artikel geschreven door Jurriaan Nagelkerke, Principal Consultant

The Definitive Guide to Becoming a Data Scientist door dr. Zacharias Voulgaris

De wondere wereld van Data Science, het buzzzzt nogal rond dezer dagen. Maar wat is een Data Scientist nou precies en hoe wordt je er één? Dat is een vraag die veel starters maar ook professionals in het data domein bezig houdt. Er is online een overvloed aan blogs en artikelen te vinden over dit topic, maar er zijn ook goede boeken met soms net wat meer diepgang op dit onderwerp. In deze blog neem ik je graag mee door de inhoud van het boek “Data Scientist – The Definitive Guide to Becoming a Data Scientist” van Zacharias Voulgaris. Ik vond het de moeite van het lezen waard, daarom neem ik je graag mee in een korte intro in het boek en sta ik stil bij wat volgens mij de sterke punten zijn van dit boek.

 

De definitie van Data Science

Een eerste mooie winst van het boek is een heldere definitie van Data Science en een duidelijk onderscheid dat Voulgaris maakt tussen een Data Scientist en een Data Analist. Data Science beschrijft Voulgaris vrij vertaald als volgt: Data Science betreft alle verschillende aspecten van omgaan met data, in het bijzonder Big Data, op een intelligente en methodologische wijze, met als doel bruikbare data producten te creëren. Deze definitie bevat een aantal waardevolle invalshoeken: Big Data, intelligente én methodologische wijze, creëren van data producten. Hiermee geeft Voulgaris duidelijk aan dat Data Science niet zomaar een rebranding is van Data Analyse of Data Engineering maar wel degelijk een vakgebied op zich is op het snijvlak van data analyse en meer IT-achige rollen zoals die van een data engineer. In de rest van het boek werkt hij deze unieke rol nader uit.

 

De Data Scientist vs de Data Analist

Dat wordt nog eens benadrukt door het expliciete verschil dat Voulgaris maakt tussen een Data Scientist en Data Analist, iets waar velen nu juist grote moeite mee hebben: om de verschillen tussen deze rollen te duiden. Een Data Analist gebruikt technieken die goed werken op data die grenst aan de definitie van big data, echter vele van deze technieken zijn inefficiënt en ontbreekt het aan de flexibiliteit welke de technieken die door Data Scientist worden gebruikt, juist zo kenmerken. De Data Analist vertrouwt op een reeks beschikbare modellen om bruikbare informatie uit de data af te leiden en ontwikkelt rapportages om aan de collega’s aan de business zijde van het bedrijf te laten zien. De Data Scientist ontwikkelt vaak eigen modellen of gebruikt een volledig data gedreven aanpak in zijn analyse. Dit leidt meestal tot iets dat vele anderen, niet enkel de business personen in zijn eigen bedrijf, kunnen gebruiken. De Data Scientist ontwikkelt een interactief dashboard dat alle essentiële informatie real time toont. In de niet-zwart-witte wereld waarin we leven werkt het verhelderend als iemand af en toe wel een duidelijke streep durft te trekken en Voulgaris doet dat. Daar kan je het mee eens of oneens zijn, maar er ligt wel een heldere scheidslijn. Een Data Analist levert geen data producten, maar levert inzicht. Hij is meer adviseur. Een Data Scientist heeft zijn werk niet goed gedaan als zijn antwoord niet schaalbaar geborgd is in het IT landschap. Hij is meer bouwer. Dat haal ik uit de vergelijking van Voulgaris en ik kan me daar wel in vinden als uitgangspunt, alle shades of grey even negerend.

 

Dr. Zacharias Voulgaris

Maar het boek is meer dan enkel deze definitie van Data Science en de vergelijking tussen een Data Analist en een Data Scientist. Eerst iets meer over de schrijver, want wie is die Dr. Zacharias Voulgaris? Hij is opgeleid als Ingenieur, heeft een PhD in Machine Learning afgerond en heeft gewerkt als universitair onderzoeker. Voulgaris is zelf ‘pas’ sinds 2013 Data Scientist, hij heeft het boek geschreven nadat hij zelf net de verkenningstocht omtrent ‘Wat is dat nou, Data Science??’ had afgelegd. In zijn boek neemt hij de lezer mee in een stukje historie van Data Science, beschrijft de verschillende typen Data Scientist die hij onderkent, geeft aan wat een Data Scientist nou zo uniek maakt en heeft vele tips en interviews die heel waardevol zijn voor hen die zelf het domein van Data Science willen gaan betreden. De structuur is prettig met aan het begin van ieder hoofdstuk een korte intro en een recap aan het eind van elk hoofdstuk. Ook waardevol zijn de interviews met ‘echte’ Data Scientists in de latere hoofdstukken en een uitgebreide woordenlijst met Big Data krachttermen die Voulgaris achterin het boek heeft opgenomen. Ga vooral zelf lezen dus, zou ik zeggen! Maar wil je alvast wat meer inzicht in de inhoud voordat je zelf los gaat of wil je gewoon de short cut naar de belangrijkste inzichten uit het boek, lees dan nog even hier door :).

 

De Data Scientist Demystified

Met veel plezier en interesse heb ik het boek van Voulgaris gelezen. Zijn duidelijke taal, afbakeningen en legio tips en verwijzingen naar andere interessante bronnen hebben mijn beeld van het Data Science veld aangescherpt, bevestigd en verbreed. Voor potentiele toetreders tot het domein van Data Science heeft Voulgaris de mythische status van de Data Scientist concreet en bereikbaar gemaakt. Graag sluit ik me aan bij zijn laatste zinnen uit de laatste alinea in het boek: …And as big data technology continues to evolve, more and more interesting ways of making use of existing data will become available.The Data Scientist will continue to be an ever-fascinating role that will rely as much on creativity as it does on technical skills. By then, there will probably be university departments specializing in this field, and future Data Scientists will look back on the Data Scientist of this decade, the pioneers of the field, with great admiration.

Mooie, inspirerende slotwoorden! Dat de universiteiten, ook de Nederlandse, inderdaad met meer en meer specialisaties op het gebied van Data Science komen, kunnen we bevestigen. Lees voor meer info hierover onze post over opleidingen tot Data Scientist aan Nederlandse onderwijsinstellingen. En wil je meer inzicht in de Nederlandse Data Scientist? Lees dan vooral ook onze posts naar aanleiding van ons eigen onderzoek naar de Data Scientist in de Polder, waarbij we op basis van meer dan 1.000 profielen van Data Scientists de Nederlandse Data scientist verkennen. Ook hebben we een aantal vooraanstaande Data Scientists uit Nederland geinterviewd en kan je hier binnenkort meer over verwachten, dus hopelijk zien we je snel terug!

Contact

Wil je meer weten over dit onderwerp? Neem dan contact op met Jurriaan Nagelkerke via onderstaande contactgegevens.

Jurriaan Nagelkerke, Principal Consultant

+31 6 29 62 00 11

j.nagelkerke@cmotions.nl

Laatste nieuws

Vind jouw risicovolle bestanden volgens AVG met onze DriveScanner

17 april 2023

In elk bedrijf is het een uitdaging om ervoor te zorgen dat we alleen de documenten... lees meer

Rondetafelsessie – donderdagochtend 25 mei

16 januari 2023

Culture eats data strategy for breakfast​ Bedrijven die erkennen dat ze met de inzet van data... lees meer

Van het voorspellen van de frietverkoop tot het creëren van een betere toekomst met data

20 december 2022

20 jaar Cmotions is ook 20 jaar vakgeschiedenis en -ontwikkeling. Dit geeft waardevolle inzichten voor de... lees meer

Schrijf je in voor onze nieuwsbrief

Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!