Op de laatste dag van het academische jaar organiseert Woogle weer de Woorkshop met presentaties van scripties die gaan over de Woo en AI. Iedereen is welkom. Er zijn hapjes en drankjes en er is genoeg gelegenheid met de afstudeerders te spreken.
UvA opengov ICAI lab Woorkshop
28 juni 2024, 15:00, Lab 42, Zaal L.101, Science Park Amsterdam.
Woorkshop
Elk jaar hebben Jaap Kamps en Maarten Marx wel zo’n 20 afstudeerders die “wat spannends doen met de Woo”. Die komen uit de bachelors en masters AI, Informatica en Informatiekunde van de UvA. In deze Woorkshop laten 9 daarvan kort hun werk zien. De rode draad die in alle projecten zit is:
- alles moet zo veel mogelijk automatisch en schalen (géén handwerk);
- het onderwerp ligt op het snijvlak van openbaarmaking en informatiehuishouding;
- AI en zoek- of taal-technologie speelt een grote rol.
- als het even kan integreren we de resultaten in ons living lab Woogle;
Het achterliggende doel van al die projecten is om de geest van de Woo, overheid, deel je informatie met je burgers, te bevorderen. Maar goed, het blijft wetenschap, dus soms is dat wat zichtbaarder dan anders.
Programma
- 15:00 Korte introductie Woogle, opengov lab, Woorkshop opzet
- We mikken op zo’n 8 minuten per praatje, en daarna vragen en discussie, dus rond de 15 minuten per onderwerp.
| Onderwerp | Spreker | Link Presentatie | Link scriptie |
|---|---|---|---|
| Videotulen | Pepijn van Wijk | Slides | Scriptie |
| Handelingen | Pascal Venema | Slides | Scriptie |
| ORI en raadsverslagen | Thom van der Ent | Slides | Scriptie |
| Woo-index | Jasper Hoogenhout | Slides | Scriptie |
| Pauze | |||
| Beschikkingen | Harry Nan | Slides | Scriptie |
| Convenanten | Sander Oud | Slides | Scriptie |
| Zoeksysteem kopen? | Wim Pilkes | Slides | Scriptie |
| Adviezen | Martijn Bakker | Slides | Scriptie |
| Borrel |
Samenvattingen
Blok 1. Zoom in op aparte Woo informatie categorieën
- We kijken naar Adviezen, Beschikkingen, Convenanten, Handelingen, en Vergaderstukken decentrale overheden
- Voor elke soort doen we:
- Hoe staat het het de openbaarmaking ervan?
- Kunnen we alle stukken van alle bestuursorganen automatisch ophalen en verwerken?
- Kunnen we automatisch sleutelinformatie uit die stukken halen?
Adviezen
Er zijn meer dan 100 advies-colleges en -raden. De uitgebrachte adviezen zijn zeer waardevol. Onze vraag: kunnen we die allemaal verzamelen, netjes ordenen en uniformeren, en zo beschikbaar maken voor onderzoek en ander hergebruik?
Heel specifiek: kunnen we –automatisch– basis-metadata over het advies bemachtigen: wanneer is het advies gegeven, door wie, aan wie, was het gevraagd of ongevraagd, en aan welke andere Woo-stukken is dat advies verbonden (bijv, de reactie van de minister)?
Vergaderstukken lokale overheden
Die stukken worden voor 275 gemeentes en provincies vanaf één plek aangeboden op openraadsinformatie.nl van de VNG. Woogle wilde die integreren in haar systeem, maar kwam erachter dat het niet compleet leek. Onze vraag: hoe volledig en actueel is openraadsinformatie.nl in vergelijking met de vergaderstukken die bestuursorganen zelf op hun websites hebben staan?
Meer specifiek: komen de vergaderdatums en agendas overeen, komen de bijbehorende stukken overeen, komt de bijbehorende metadata overeen? En zo nee, kunnen we systematische fouten ontdekken?
Handelingen
De Handelingen der Staten Generaal behoren tot de mooist en best geopenbaarde stukken binnen de Woo. Toch kan het beter. Onze vraag: kunnen we de kamerstukken waaraan in een debat gerefereerd wordt (zoals “de Motie Sneller”) detecteren in de tekst en vervolgens verbinden aan het juiste stuk?
Deze vraag lijkt best op het werk dat gedaan wordt met de Legal Link eXtractor van KOOP op wetsteksten. Als stage bij KOOP wordt dit project opgepakt. Dit is weer een stap om van een verzameling losse documenten naar een netwerk van expliciet (via URLs) met elkaar verbonden documenten te gaan.
Beschikkingen
Beschikkingen vormen een groot deel van de Woo-documenten, en komen vanuit allerlei bestuursorganen. Onze vraag:kunnen we automatisch de in Woo artikel 3.3.a lid 1 en 2 genoemde metadata (o.a., de grondslag, duur en rechtsgevolg van de beschikking) uit gepubliceerde beschikkingen halen?
Dit werk wordt gedaan als stage bij het CITaDOG project over beschikkingen van Prof. Johan Wolswinkel. In dat project wordt er op een data science manier naar beslissingen van de overheid gekeken. Vandaar dat men gegevens in tekst vorm wil omzetten naar spreadsheet formaat. En liefst met zo min mogelijk handwerk.
Convenanten
Vrijwel elk bestuursorgaan kan afspraken met niet-overheid partijen maken en die vastleggen in een convenant. Onze vraag:deze is vrijwel identiek aan die bij de adviezen: kunnen we alle convenanten verzamelen en op basis daarvan automatisch een netwerk maken, vergelijkbaar met het netwerk tussen overheid en bedrijfsleven opgesteld in de jaren 70 in Graven naar Machtn.a.v. de beroemde 200 van Mertens.
Blok 2. Woo en Woogle potpourri: openbaarmaking
- We kijken hier naar het openbaarmaken van stukken die onder de Woo vallen, en hoe AI en informatie technologie daarbij kan helpen.
Videotulen
Het is toegestaan om het verslag van een raadsvergadering als een video te publiceren. Het is natuurlijk erg lastig zoeken of terugvinden in zulke, vaak best lange, videotulen. Onze vraag: kunnen we dit makkelijker maken met behulp van AI?
Meer specifiek: kunnen we met automatische spraak-, spreker- en agendapunt-herkenning de videotulen omzetten naar een gestructureerde tekst versie vergelijkbaar met de Handelingen? En kunnen we daar dan niet ook met AI-LLMs (bekend van ChatGPT) gewoon vragen aan stellen? Vragen zoals: “Wat was gisteravond het standpunt van GroenLinks over de aanleg van de nieuwe rotonde?”. En als antwoord wil je dan een samenvatting daarvan plus links naar de stukjes in de video waarop GroenLinks haar standpunt hierover uiteenzet.
Hoe staat het met de Woo-index na een jaar?
De Woo-index werd samen met de zoekfunctie gepresenteerd als een meer haalbare opvolger van het platform PLOOI. De Woo index kan sinds juni 2023 ingevuld worden. Onze vraag: hoe goed is die nu, na 1 jaar, ingevuld? En zijn de ingevulde links naar paginas met stukken bruikbaar om automatisch die stukken op te halen (om die vervolgens te indexeren voor een zoekmachine)?
Dit is een herhaling van een eerdere meting gedaan eind 2023 uitgebreid met een analyse van de kwaliteit van de verwijzingen, en interviews met Woo-contactpersonen en de mensen achter de Woo-index.
Een op maat gesneden Woogle
Sommige bestuursorganen verwijzen in de Woo-index naar de pagina met hun stukken op Woogle, want daar staan de stukken keurig bij elkaar, netjes met metadata, etc. Maar het wordt visueel saai gevonden, en gemeentes willen dit ook graag integreren in hun eigen website. Onze vraag: is dat niet heel eenvoduig en tegen minimale kosten voor elkaar te krijgen? Kunnen we software maken waar we de huisstijl van een bestuursorgaan instoppen en die dan een volledig gepersonaliseerde versie van Woogle voor alleen dat bestuursorgaan, en in haar eigen stijl, oplevert? Het instellen ervan moet vergelijkbaar zijn (in tijd en in moeilijkheid) met het opzetten van een profiel op LinkedIn of vergelijkbare sociale media.
Een eigen zoekmachine opzetten….
Een middelgrote gemeente pakt de Woo aan om hun openbaarmakingsbeleid nu eens echt goed te gaan doen, en daarbij een eigen zoekmachine, open voor publiek, op te zetten. Maar bij wie koop je die dan? En welke is de beste? En vooral, hoe meet je dat laatste nou op? Evaluatie van information retrieval systemen is de specialiteit van het IRLab van de UvA. Dus wij hebben hierbij geholpen en vertellen erover.

Een gedachte over “UvA Woogle Woorkshop 28 juni”