Roderick Majoor heeft zijn Bachelorscriptie Informatica aan de UvA geschreven over een algoritme dat heel nauwkeurig de weggelakte stukken tekst in overheidsdocumenten kan bepalen. Zijn systeem is voor iedereen te proberen op Woogle’s lakdetector. Hij heeft zowel een aanpak geleerd uit voorbeelden als een regel gebaseerde aanpak gemaakt en getest. De regel gebaseerde aanpak op basis van OCR werkte het best, en eigenlijk heel erg nauwkeurig. Het systeem kan zowel PDFs gelakt door “laksoftware” als Zylab aan, als handgelakte stukken en zelfs oude documenten met weggekraste handtekeningen worden nog aardig goed herkend.
- De presentatie op Rodericks verdediging.
- Rodericks scriptie.
- Probeer zelf de lakdetector.
Leave a Reply