Lars Nelissen heeft zijn scriptie geschreven over de toegankelijkheid van PDFs gepubliceerd op open.overheid.nl. Om die toegankelijkheid te testen heeft hij de code die achter de PDFchecker van Forum Standardisatie zit geschikt gemaakt voor grootschalig gebruik (zowel heel veel als enorm grote PDFs). In de table hieronder zien we de resultaten voor documenten vrijgegeven na een Woo-verzoek (Dataset 1) en de besluiten op een Woo-verzoek (Dataset 2). Samen gaat het om bijna een miljoen paginas. Vrijwel geen een document voldoet aan de PDF toegankelijkheids eisen; de meeste hebben “Serious” tekortkomingen (95 en 79%, respectivelijk).
Daarnaast heeft hij laten zien dat de gepubliceerde PDFs eigenlijk veel te groot zijn voor hun informatie inhoud. Dat komt omdat het eigenlijk fotos van teksten zijn, en vreemde en best ongebruikelijke manier om een tekst te publiceren. Breng je die teksten terug tot hun kern: de leesbare tekst en de basale opmaak (koppen, paragrafen, lijsten, dik/schuin gedrukt, hyperlinks, etc) dan heb je gemiddeld nog maar zo’n 1.5% van de oorspronkelijke bestandsgrootte nodig.

