Zwartlak detector

Roderick Majoor heeft zijn Bachelorscriptie Informatica aan de UvA geschreven over een algoritme dat heel nauwkeurig de weggelakte stukken tekst in overheidsdocumenten kan bepalen. Zijn systeem is voor iedereen te proberen op Woogle’s lakdetector. Hij heeft zowel een aanpak geleerd uit voorbeelden als een regel gebaseerde aanpak gemaakt en getest. De regel gebaseerde aanpak op basis van OCR werkte het best, en eigenlijk heel erg nauwkeurig. Het systeem kan zowel PDFs gelakt door “laksoftware” als Zylab aan, als handgelakte stukken en zelfs oude documenten met weggekraste handtekeningen worden nog aardig goed herkend.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

Blog at WordPress.com.

%d bloggers like this: