Verkenning data science en machine learning bij Open Raadsinformatie

19 maart 2018

VNG Realisatie (Vereniging Nederlandse Gemeenten) had Cmotions uitgenodigd voor een oriëntatiedag bij de Data Science Hub in Den Bosch. In een mooi oud klooster aan de gracht werden we verwelkomt door Pim Bliek, projectleider Open Verantwoording binnen VNG Realisatie. De insteek van de dag was om te kijken in hoeverre data science een toegevoegde waarde kan leveren bij het versterken van de controlerende rol van de gemeenteraad.

 

Raadsinformatie

Dagelijks werken ambtenaren hard om hun gemeente te ondersteunen en te verbeteren. Deze ambtenaren worden aangestuurd door de gemeentesecretaris, die vervolgens rapporteert aan het college van Burgemeester en Wethouders. Het is de taak van de gemeenteraad om te controleren of zij hun werk wel goed doen. Zij doen dit onder andere door het doornemen van een grote hoeveelheid informatie: raadsinformatie. Voor de uitvoer van wetten worden indicatoren opgesteld, waar de raadsleden in het bijzonder naar kijken om de prestaties te beoordelen. Zo zijn er bijvoorbeeld voor de Archiefwet en de Kinderwet een aantal indicatoren opgesteld door de overheid waaraan gemeentes moeten voldoen.

 

Data science als toegevoegde waarde

Tijdens de oriëntatiedag was de vraag of we data science en machine learning konden inzetten om geautomatiseerd door alle verslagen (raadsinformatie) heen te gaan om vervolgens de indicatoren automatisch in te vullen. We kwamen vrij snel tot de conclusie dat machine learning en deep learning specifiek, tegenwoordig grote stappen maken op het gebied van tekstanalyse, maar dat dit voor nu een brug te ver zou zijn. De rest van dag hebben wij de focus gelegd op het ontwikkelen van een conceptueel model waar data science op korte termijn wel toegevoegde waarde kan bieden en die makkelijker realiseerbaar is.

In gezamenlijk overleg kwamen we op het idee om eerst te kijken of we de context kunnen bepalen voordat we de indicatoren in kunnen vullen. Het doel is dus niet het automatisch invullen van indicatoren, maar de raadsleden en andere afnemers de mogelijkheid te geven dit efficiënt en effectief te doen.

De conclusie was dat we eerst het beste kunnen focussen op het reduceren van irrelevante informatie en het vinden van extra relevante informatie. Dit met als doel dat raadsleden niet bijvoorbeeld 60 artikelen met 60 pagina’s moeten doorlezen, maar vijf artikelen met vijf pagina’s.

 

Zoekmachine als kanaal inzetten

De zoekmachine zagen we hier als het uitgelezen kanaal, aangezien dit het eerste kanaal is waar raadsleden hun informatie kunnen ophalen. Een drietal stappen hebben wij hiervoor opgezet:

  1. Tekst analyse inzetten ter verbetering van de zoekmachine:
    a. Waarschijnlijk is er sprake van een pareto effect. 20% van de vragen omvat 80% van de zoekqueries. Maar synoniemen maken het lastig om te zoeken, bv: kinderwet, kinderopvang, peuterwet, naschoolseopvang, etc. zijn allemaal verwant. Begin met het handmatig maken van dictionairies, op basis van jargon-kennis en veel voorkomende woord-combinaties.
    b. Dit proces kan vervolgens verbeterd worden door topic modelling.
    c. Toevoegen van meta data aan artikelen, zoals entity recognition en het topic model.
  2. Het vinden van andere relevante artikelen door het ontwikkelen van aanbevelingssystemen:
    a. content based recommenders: “de volgende artikelen gaan over hetzelfde onderwerp:”
    b. user based recommenders: “anderen lazen ook”
  3. Het reduceren van content binnen artikelen:
    a. samenvatten van tekst
    b. “op pagina 56 staat de indicator”

Met de input van deze interessante dag gaat VNG Realisatie aan de slag om te kijken naar verdere mogelijkheden. Het was erg leuk om een bijdrage te kunnen leveren aan deze oriëntatiedag Data Science!

Laatste nieuws

Vind jouw risicovolle bestanden volgens AVG met onze DriveScanner

17 april 2023

In elk bedrijf is het een uitdaging om ervoor te zorgen dat we alleen de documenten... lees meer

Rondetafelsessie – donderdagochtend 25 mei

16 januari 2023

Culture eats data strategy for breakfast​ Bedrijven die erkennen dat ze met de inzet van data... lees meer

Van het voorspellen van de frietverkoop tot het creëren van een betere toekomst met data

20 december 2022

20 jaar Cmotions is ook 20 jaar vakgeschiedenis en -ontwikkeling. Dit geeft waardevolle inzichten voor de... lees meer

Schrijf je in voor onze nieuwsbrief

Mis nooit meer iets op het gebied van advanced analytics, data science en de toepassing daarvan binnen organisaties!