Ook nog handschriftherkenning

Om stukken vrijgegeven onder de Woo echt goed doorzoekbaar en ook (voor)leesbaar te maken op Woogle, doen we veel aan optische karakter herkenning (OCR). Met de verbreding naar raadstukken zijn we ook gestuit op documenten waarbij we zelfs handschriftherkenning moeten gaan toepassen, zoals deze Motie van Treurnis uit de Provincie Flevoland.

DANS Dutch Data Prize

Tien jaar geleden won een deel van het het huidige Woogle team (Jaap Kamps en Maarten Marx) de Dutch Date Prize, met hun FAIR en open publicatie van 200 jaar Handelingen der Staten Generaal. Een interview met Maarten daarover staat in het laatste nummer van laatste ResearchData.

Twee TPDL publicaties over ons Woo onderzoek

Uit 4 scripties zijn twee publicaties op de komende Theory and Practice of Digital Libraries conferentie gerold. Eentje over zwartlakdetectie en één over het opsporen en verbeteren van OCR fouten. TPDL (2023) Detection of Redacted Text in Legal Documents, Ruben van Heusden, Aron de Ruijter, Roderick Majoor, en Maarten Marx. TPDL (2023) Making PDFs Accessible … Lees verder Twee TPDL publicaties over ons Woo onderzoek