Automatisch gegevens halen uit Woo besluiten

De brief met het besluit over een Woo of Wob verzoek bevat veel informatie die handig is om ook gestructureerd te hebben. Dan kunnen we dat gebruiken op de pagina met de gepubliceerde verzoeken, en ook voor overzichten en allicht zelfs in een zoeksysteem.

In de scriptie van Julián Venhuizen probeert hij volledig automatisch een aantal van de meeste basale gegevens over een Woo verzoek uit het besluit te “vissen”. Dat zijn:

  • de datum van het verzoek, en van het besluit
  • het verzoek zelf
  • het genomen besluit
  • de artikelen
  • de pagina waar de inventarislijst staat of begint.

In dit voorbeeld besluit zijn deze eigenschappen in kleur aangegeven.

De taak blijkt nog helemaal niet zo makkelijk, hoe uniform de besluitbrieven er voor het menselijke oog ook uitzien. De resultaten van de gemaakte algorithmes zijn vergeleken met wat menselijke codeurs eruit hebben gehaald op, varierend per eigenschap, tussen de 44 en 110 besluitbrieven.

De datums gingen nog het beste, waarbij de datum van het besluit wat makkelijker was dan de datum van het verzoek. Afhankelijk van de “netheid van het besluit”, ging dat in tweederde tot 95% van de gevallen goed.

Ook bij het automatisch “markeren” (inderdaad eigenlijk precies vergelijkbaar met hoe een mens zoiets doet met een gele pen) van het verzoek en het besluit was het besluit wat makkelijker. Voor het verzoek varieerde de overlap tussen de door de mens en de computer gemarkeerde tekst tussen de 37 en 44%. Voor het besluit was dat tussen de 51 en 66%.

Het vinden van de juiste pagina met de inventarislijst lukte met zowel een pakkans als een precisie van rond de 50%. Dat betekent dat we de helft van de paginas vonden, maar ook dat rond de helft van de paginas die we als inventarislijst pagina aanmerkten, dat niet waren.

Conclusie

Zelfs met moderne AI technieken is het nog erg lastig om de sleutel eigenschappen van een Woo dossier correct uit de besluitbrief te halen. Voor al gepubliceerde Woo dossiers kunnen we vaak niet anders. Maar voor toekomstige dossiers is het natuurlijk veel makkelijker als de Woo jurist deze metadata van een dossier, naast netjes in de brief, ook gestructureerd opslaat. Als dat tegelijk gebeurt met het maken van de brief is dit vrijwel geen extra werk. Dat kan bijvoorbeeld heel makkelijk met de WooFairify tool.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

Blog at WordPress.com.

%d bloggers like this: