Data Visualisatie en Predictive Modeling in SAS Visual Analytics vs. IBM Watson Analytics

22 januari 2018

Artikel geschreven door Luc Claassens, Managing Consultant

Nu data steeds belangrijker wordt en meer beschikbaar komt, kan het soms lastig zijn om hier snel de juiste informatie uit te halen en deze op de juiste manier te presenteren. Gelukkig komen er steeds meer tools op de markt die dit vergemakkelijken, waardoor het leven van de analist nóg leuker wordt en data-analyse tevens voor een breder publiek toegankelijker wordt. In dit artikel zoomen we in op twee tools, te weten SAS Visual Analytics (SAS VA) en IBM Watson Analytics (IBM WA).

Nieuwe tools zorgen ervoor dat data-analyse niet meer alleen is weggelegd voor analisten met technische skills in diverse programmeertalen, zoals SAS, SPSS, SQL, R en Python. De afgelopen jaren is het scala aan software voor data-analyse onder andere uitgebreid met pakketten die data op een eenvoudige click & play-achtige manier omzetten in visualisatie. SAS VA en IBM WA zijn daar grote voorbeelden van, die niet alleen data snel en eenvoudig weten te visualiseren, maar met hetzelfde gemak verbanden kunnen ontdekken en zelfs (beperkte) mogelijkheden bieden tot predictive modeling.

 

Belangrijkste voor- en nadelen van beide tools

Voor- en nadelen SAS VA en IBW WA_datavisualisatie

SAS Visual Analytics/Statistics

SAS VA is het antwoord van SAS op de toenemende vraag naar analyse tooling waarvoor kennis van SAS code niet vereist is en die data op een krachtige en goede manier weet te visualiseren. SAS lijkt hierin aardig geslaagd, met een tool die vooral lijkt in te zetten op veelzijdigheid in plaats van focus op enkel data visualisatie. Deze veelzijdigheid houdt in dat de tool tevens mogelijkheden biedt om dashboards te ontwikkelen en simpele process mining analyses uit te voeren (Sankey diagram). Daarnaast biedt de extra module Visual Statistics de mogelijkheid om predictive modeling toe te voegen aan het pakket. Dit beperkt zich echter wel tot regressie en decision trees.

De tool biedt feitelijk twee structuren om data te visualiseren, namelijk in de vorm van Data Explorer en Rapporten Ontwerpen (ja inderdaad, in de benaming van deze structuren wordt een combinatie van Engels en Nederlands gehanteerd…). Eerstgenoemde is zoals de naam al aangeeft vooral gericht op exploratie, zonder dat de gebruiker al direct naar een structurele toepassing van de visualisatie toewerkt. Erg handig om op deze manier de data te verkennen en te visualiseren. Extra handig is de functie Automatisch Diagram, waarmee SAS op basis van de geselecteerde data zelf een voorstel doet voor het diagramtype om deze data weer te geven. Ook het Sankey diagram is een mooi voorbeeld van hoe SAS met deze tool data krachtig weet te visualiseren.
Indien je van plan bent om een dashboard te ontwikkelen, dan kun je kiezen voor Rapporten Ontwerpen. Zodra je je dashboard gemaakt hebt kun je het via Report Viewer inzien en delen met anderen. Dit kan via leesrechten zodat diegenen die het dashboard gaan gebruiken zelf kunnen inloggen en het dashboard kunnen zien zoals het ontworpen is. Andere manieren om het dashboard te exporteren zijn pdf, csv of Microsoft (Sharepoint, PowerPoint, Excel en Word).

Naast data exploratie en visualisatie biedt SAS VA (in combinatie met SAS Visual Statistics) ook de mogelijkheid om meer geavanceerde analyses uit te voeren, zoals het maken van een beslisboom of het uitvoeren van een regressieanalyse. Het voordeel hiervan is dat de tool drempels kan wegnemen als het gaat om predictive modeling. Voor analisten die nog nooit iets met predictive modeling hebben gedaan is het namelijk een mooie introductie in de wereld van de voorspellende statistiek. Nadeel is dat het vooral exploratief blijft, omdat datapreparatie en implementatie van het model (uitscoring) geen onderdeel zijn van de tool. Een belangrijke voorwaarde om deze methodieken te gebruiken is dan ook dat de dataset reeds geprepareerd is en dus gereed is voor predictive modeling, zodat je als gebruiker ook de juiste informatie uit de data haalt.

Al met al is SAS Visual Analytics een mooie tool die veel mogelijkheden biedt, maar die door de veelzijdigheid wel moet inleveren op diepgang. Ook is het jammer dat de visualisatie van sommige diagrammen beperkt is wanneer deze worden uitgezoomd om alles in één oogopslag te kunnen zien (bijvoorbeeld een beslisboom die niet meer leesbaar en te begrijpen is wanneer deze volledig wordt uitgezoomd doordat de namen van variabelen en de waarden wegvallen).

 

IBM Watson Analytics

Watson is de supercomputer van IBM die wordt aangestuurd op basis van Artificial Intelligence die antwoord geeft op vragen die de gebruiker stelt. IBM Watson Analytics (WA) is een cloudtoepassing op basis van dezelfde basisprincipes. In plaats van zelf de analyse uit te voeren, kun je in dit geval alles aan de tool overlaten door je analysevraag in te voeren en de analyse aan IBM WA over te laten. Erg vernieuwend vergeleken met andere data visualisatie tools! Een groot voordeel van IBM WA is bovendien dat de basisversie gratis is, waardoor het erg aantrekkelijk is om de tool gewoon eens te proberen.

Net als SAS VA biedt IBM WA mogelijkheden om data te exploreren, te voorspellen en te rapporteren aan de hand van een dashboard. Deze toepassingen zijn overigens niet alleen te gebruiken aan de hand van het innovatieve vraagprincipe. Je kunt ook net zoals in andere tools zelf aan de slag gaan door bijvoorbeeld een visualisatie te selecteren en aan te geven welke data je daarin wilt weergeven.

Een voordeel van IBM WA is dat de tool zelf al een hoop zaken analyseert op de achtergrond via Discoveries. Erg handig als analist, want zo navigeer je vanzelf al door belangrijke inzichten vanuit de data, zonder dat je daar telkens zelf een visualisatie van hoeft te maken. Bovendien word je zo continu getriggerd en kom je wellicht tot inzichten die je er zelf niet had uitgehaald. Zo wordt er bijvoorbeeld direct al gekeken naar verbanden met andere variabelen, waardoor je snel al meer inzichten genereert dan bij andere tools, waar je telkens elk inzicht zelf dient te creëren.De intuïtieve algoritmes waarop IBM WA gebouwd is maakt de tool toegankelijk voor een breed publiek en dat is een van de grote krachten van de tool. Zonder al teveel kennis van analysetools kun je al een aardig eind komen door de juiste vragen te stellen en het analysewerk aan IBM WA over te laten. Voor de echte analist kan dit weer een nadeel zijn, omdat deze misschien liever zelf op onderzoek uitgaat. Gelukkig biedt IBM WA dan ook de mogelijkheid om zelf de data te analyseren.

De Predictive Modeling mogelijkheden binnen IBM WA zijn net als in SAS VA beperkt. De kracht zit daarbij vooral in snel inzicht krijgen in de belangrijkste drivers die de targetvariabele verklaren. SAS VA biedt daarbij overigens meer metrics en modelinformatie dan IBM WA, waarbij laatstgenoemde zich vooral beperkt tot een overzicht van de belangrijkste inputvariabelen.
IBM WA biedt vervolgens weer net iets meer mogelijkheden op het gebied van visualisatie in dashboarding, waarbij je als gebruiker bijvoorbeeld afbeeldingen en figuren kunt toevoegen om je visualisatie net even iets krachtiger neer te zetten.

 

Conclusie

Net als bij SAS VA is IBM WA bedoeld voor geprepareerde datasets om zo snel de juiste informatie uit de data te halen. Voordat je aan de slag gaat met IBM WA, dien je dus net als bij SAS VA de data te prepareren in een andere tool om zo tot de juiste inzichten te komen. Jammer dat beide tools geen oplossing bieden voor een goede en eenvoudige datapreparatie, want zo blijft de tijdwinst om te komen tot de juiste inzichten beperkt. Bovendien brengt een aparte tool voor deze werkzaamheden ook weer extra kosten met zich mee. Hierdoor bieden beide tools nog geen totaaloplossing voor analysedoeleinden en dat is jammer, want daardoor blijven beide tools add-ons voor de bestaande tooling en mogelijk daarom minder interessant.

Contact

Wil je meer weten over dit onderwerp? Neem dan contact op met Luc Claassens via onderstaande contactgegevens.

Luc Claassens, Managing Consultant

+31 6 46 22 67 24

l.claassens@cmotions.nl

Laatste nieuws

Modelplot[R/py]: grafieken om de business waarde van voorspelmodellen bloot te leggen

8 oktober 2018

Het is voor veel data scientists en data analisten een herkenbare uitdaging: je hebt een –... lees meer

Power BI vs. Qlikview vs. Tableau: welke datavisualisatietool moet ik kiezen (deel 2/2)

7 februari 2018

In deel 1 startten we met de vergelijking tussen de softwarepakketten Power BI, Qlikview en Tableau. We... lees meer

Power BI vs. Qlikview vs. Tableau: welke datavisualisatietool moet ik kiezen (deel 1/2)

31 januari 2018

We krijgen van opdrachtgevers regelmatig de vraag welke datavisualisatietool (dashboardingtool) nu eigenlijk ‘de beste’ is. In... lees meer

Schrijf je in voor onze nieuwsbrief

Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!