Verkenning data science en machine learning bij Open Raadsinformatie

19 maart 2018

Artikel geschreven door Jeroen Kromme en Marjolein Geesing

VNG Realisatie (Vereniging Nederlandse Gemeenten) had Cmotions uitgenodigd voor een oriëntatiedag bij de Data Science Hub in Den Bosch. In een mooi oud klooster aan de gracht werden we verwelkomt door Pim Bliek, projectleider Open Verantwoording binnen VNG Realisatie. De insteek van de dag was om te kijken in hoeverre data science een toegevoegde waarde kan leveren bij het versterken van de controlerende rol van de gemeenteraad.

 

Raadsinformatie

Dagelijks werken ambtenaren hard om hun gemeente te ondersteunen en te verbeteren. Deze ambtenaren worden aangestuurd door de gemeentesecretaris, die vervolgens rapporteert aan het college van Burgemeester en Wethouders. Het is de taak van de gemeenteraad om te controleren of zij hun werk wel goed doen. Zij doen dit onder andere door het doornemen van een grote hoeveelheid informatie: raadsinformatie. Voor de uitvoer van wetten worden indicatoren opgesteld, waar de raadsleden in het bijzonder naar kijken om de prestaties te beoordelen. Zo zijn er bijvoorbeeld voor de Archiefwet en de Kinderwet een aantal indicatoren opgesteld door de overheid waaraan gemeentes moeten voldoen.

 

Data science als toegevoegde waarde

Tijdens de oriëntatiedag was de vraag of we data science en machine learning konden inzetten om geautomatiseerd door alle verslagen (raadsinformatie) heen te gaan om vervolgens de indicatoren automatisch in te vullen. We kwamen vrij snel tot de conclusie dat machine learning en deep learning specifiek, tegenwoordig grote stappen maken op het gebied van tekstanalyse, maar dat dit voor nu een brug te ver zou zijn. De rest van dag hebben wij de focus gelegd op het ontwikkelen van een conceptueel model waar data science op korte termijn wel toegevoegde waarde kan bieden en die makkelijker realiseerbaar is.

In gezamenlijk overleg kwamen we op het idee om eerst te kijken of we de context kunnen bepalen voordat we de indicatoren in kunnen vullen. Het doel is dus niet het automatisch invullen van indicatoren, maar de raadsleden en andere afnemers de mogelijkheid te geven dit efficiënt en effectief te doen.

De conclusie was dat we eerst het beste kunnen focussen op het reduceren van irrelevante informatie en het vinden van extra relevante informatie. Dit met als doel dat raadsleden niet bijvoorbeeld 60 artikelen met 60 pagina’s moeten doorlezen, maar vijf artikelen met vijf pagina’s.

 

Zoekmachine als kanaal inzetten

De zoekmachine zagen we hier als het uitgelezen kanaal, aangezien dit het eerste kanaal is waar raadsleden hun informatie kunnen ophalen. Een drietal stappen hebben wij hiervoor opgezet:

  1. Tekst analyse inzetten ter verbetering van de zoekmachine:
    a. Waarschijnlijk is er sprake van een pareto effect. 20% van de vragen omvat 80% van de zoekqueries. Maar synoniemen maken het lastig om te zoeken, bv: kinderwet, kinderopvang, peuterwet, naschoolseopvang, etc. zijn allemaal verwant. Begin met het handmatig maken van dictionairies, op basis van jargon-kennis en veel voorkomende woord-combinaties.
    b. Dit proces kan vervolgens verbeterd worden door topic modelling.
    c. Toevoegen van meta data aan artikelen, zoals entity recognition en het topic model.
  2. Het vinden van andere relevante artikelen door het ontwikkelen van aanbevelingssystemen:
    a. content based recommenders: “de volgende artikelen gaan over hetzelfde onderwerp:”
    b. user based recommenders: “anderen lazen ook”
  3. Het reduceren van content binnen artikelen:
    a. samenvatten van tekst
    b. “op pagina 56 staat de indicator”

Met de input van deze interessante dag gaat VNG Realisatie aan de slag om te kijken naar verdere mogelijkheden. Het was erg leuk om een bijdrage te kunnen leveren aan deze oriëntatiedag Data Science!

Contact

Wil je meer weten over dit onderwerp? Neem dan contact op met Jeroen Kromme of Marjolein Geesing via onderstaande contactgegevens.

Jeroen Kromme, Principal Consultant

+31 6 43 58 59 92

j.kromme@cmotions.nl

Marjolein Geesing, Accountmanager

+31 6 52 48 39 97

m.geesing@cmotions.nl

Laatste nieuws

Meetup – conversational analytics: 12 februari

14 januari 2020

Op woensdag 12 februari is het tijd voor een nieuwe editie van onze Meetup. Deze keer... lees meer

Wie krijgt een Michelinster? Wij weten het al!

3 januari 2020

Met de feestdagen net achter de rug heb je wellicht je buik vol van het lekkere... lees meer

Verslag meetup – A.I. & media: 16 oktober

29 oktober 2019

De nieuwste editie van onze Meetup sessies, op woensdag 16 oktober 2019, vond deze keer plaats... lees meer

Schrijf je in voor onze nieuwsbrief

Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!