Twee TPDL publicaties over ons Woo onderzoek

Uit 4 scripties zijn twee publicaties op de komende Theory and Practice of Digital Libraries conferentie gerold. Eentje over zwartlakdetectie en één over het opsporen en verbeteren van OCR fouten. TPDL (2023) Detection of Redacted Text in Legal Documents, Ruben van Heusden, Aron de Ruijter, Roderick Majoor, en Maarten Marx. TPDL (2023) Making PDFs Accessible … Lees verder Twee TPDL publicaties over ons Woo onderzoek

Struinen door Woo-dossiers

Artikel door Erica Renckens, overgenomen uit E-DATA & Research, Juni 2023 Overheidsdocumenten die zijn geopenbaard via een Woo-verzoek zijn vaak slecht doorzoekbaar. Informaticus Maarten Marx brengt daar verandering in.  Eén pdf van honderden pagina’s, waarin tientallen documenten lukraak achter elkaar zijn geplakt, met teksten die onleesbaar zijn voor een computer. Zo ontvangen onderzoeksjournalisten meestal de … Lees verder Struinen door Woo-dossiers