Overheidsinformatie voor visueel gehandicapten vaak niet goed toegankelijk

Informatie geplaatst op open.overheid.nl is voor visueel gehandicapten vaak niet goed toegankelijk. Wij denken dat dit komt door het verkeerde (en vaak onnodige) gebruik van zwartlaksoftware. Deze software doet veel meer dan zwartlakken, het haalt vaak alle tekst weg en vervangt het document dan door een foto van het document. Of het behandelt een net op een computer geschreven brief als een archiefstuk uit de 19de eeuw en gaat de brief dan inscannen en daar optische karakterherkenning (OCR) op toepassen. Dat laatste gaat vaak heel goed, maar ook best vaak flink fout. Wij illusteren dit aan de hand van een brief geschreven op 1 Maart 2021 uit naam van de Minister van Binnenlandse Zaken.

Hier is de eerste alinea uit dit besluit zoals de computer het leest en zoals de computer het voorleest. We hebben dit stukje tekst met Control C, Control V uit de bron gehaald.

Geachte hear
In uw brief van 22 november 2019, gericht aan hat minlstaria van Landbouw, Natuur an Voadsaikwalitait (hiarna: LNV) haaft u met aan baroap op da Wat opanbaarhaid van bastuur (hiarna: Wob) informatia varzocht omdat u inzicht wil krijgan in da totstandkoming van hat maatragalanpakkat voor da stikstof- PFASproblamatiak van 13 novambar 2019,

Ter referentie, in de oorspronkelijke brief staat natuurlijk dit (wat lezende mensen ook zelf kunnen lezen in de PDF):

Geachte heer,

In uw brief van 22 november 2019, gericht aan het ministerie van Landbouw, Natuur en Voedselkwaliteit (hierna: LNV) heeft u met een beroep op de Wet openbaarheid van bestuur (hierna: Wob) informatie verzocht omdat u inzicht wilt krijgen in de totstandkoming van het maatregelenpakket voor de stikstof- en PFAS-problematiek van 13 november 2019.

PDFChecker.nl

We hebben het document laten testen op toegankelijkheid via pdfchecker.nl, een site, mede gefinancierd door het Ministerie van BZK uit  het Innovatiebudget Digitale Overheid, waarmee men kan nagaan of een PDF bestand toegankelijk is voor visueel gehandicapten. Het antwoord was Het document bevat kritieke toegankelijkheidsproblemen die hieronder worden toegelicht. Los deze eerst op en check het document dan nogmaals. Hieronder een screenshot van de gehele uitkomst.

De PDF is gemaakt door ScandAll PRO V2.1.5 en de PFU PDF Library 1.2.1.

Erg groot bestand

Door het inscannen wordt de oorspronkelijke tekst in de brief verwijderd. Eigenlijk wordt de hele oorspronkelijke brief vervangen door 2 dingen:

  • een foto van elke bladzijde
  • met daaronder, precies op de juiste plek, de woorden en letters zoals die door de OCR scan software zijn herkend. Inclusief alle fouten die daarbij optreden.

Fotos maken van tekst en vervolgens de computer vragen te lezen wat er op die foto staat is natuurlijk raar. Het blaast het bestand waar de informatie instaat ook enorm op. Het oorspronkelijke bestand is 3.9Mb. Als we daar de tekst uithalen, krijgen we een bestand van slecht 25Kb. Dat is 156 keer zo klein! We kunnen beide bestanden nog verkleinen door compressie toe te passen. Bij foto’s werkt dat vaak niet goed, en inderdaad het neemt af naar 3.2Mb, terwijl van het tekst bestand nog maar 7Kb overblijft. Dit is nu zelfs 460 keer kleiner!

Onverklaarbare fouten

Het briefhoofd rechts op de eerste bladzijde wordt vrijwel goed ingescand, maar we zien toch een malle fout:

Ministerie van Binnenlandse Zaken en Koninkrijksrelaties Turfmarkt 147 Den Maag Postbus 20011 2500 EA Den Haag Nederland

Als je de PDF erbij pakt en dit stukje uitvergroot zie je geen verschil tussen die twee “Den Haag”s, maar toch wordt de eerste “Den Maag”. De rest van de eerste bladzijde van deze brief gaat ook flink de mist in. Zie hieronder. Gek genoeg zitten er in de volgende bladzijden een stuk minder fouten. Waarom?

De eerste bladzijde zoals de computer hem leest:

Datum          1 MRT2021
Betreft        Besluit op uw Wob-verzoek



Geachte hear


In uw brief van 22 november 2019, gericht aan hat minlstaria van Landbouw,
Natuur an Voadsaikwalitait (hiarna: LNV) haaft u met aan baroap op da Wat
opanbaarhaid van bastuur (hiarna: Wob) informatia varzocht omdat u inzicht wil
krijgan in da totstandkoming van hat maatragalanpakkat voor da stikstof- PFAS-
problamatiak van 13 novambar 2019,

U vraagt naar alia adviazan, memo's an andara documantan die in 2019 tot aan
da datum van uw varzoak (ongavraagd) verkragan, uitgadaan en/of opgavraagd
zijn in hat kadar van aan zoaktocht naar da opiossingan voor da stikstof- an
PFAS-problamatiak. Tavans vraagt u om alia communicatie daaromtrant.

Uw varzoak is door hat ministerie van LNV doorgastuurd naar hat ministerie van
Binnenlandse Zakan an Koninkrijksralatias (hiarna: BZK). Da ontvangst van uw
varzoak door hat ministerie van BZK is bavastigd bij brief van 20 dacambar 2019,
kanmark 2019-000069030830909.


Bij brief van ISjanuari 2020, kenmerk 2020-0000018522, is da baslistermijn
verdaagd mat viar waken.

Aangazian uw varzoak ook naar hat ministerie van Infrastructuur an Watarstaat
an hat ministerie van Algamana Zaken is doorgazondan, is door hat ministerie van
LNV namens alia batrokkan ministarias contact mat u opganomen over da
spacificaring an voortgang van uw varzoak. Met u is afgasprokan dat u aarst aan
basluit zult ontvangan over da documantatia die ondar uw varzoak valt. Da
communicatie die ondar uw varzoak valt, wordt daarom in dit basluit buitan
baschouwing galatan. Daarnaast is u madagadaald dat gezian da omvang van uw
varzoak niat aan da wattalijka tarmijnan uit da Wob voldaan kon wordan.

Wettelijk kader
Uw varzoak valt ondar da raikwijdta van da Wob. Voor da ralavanta Wob-artikalan
varwijs ik u naar bijiaga 1.




                                                                                   Paglna 1 van 8

Conclusie

Vaar niet blind op zwartlaksoftware. Het maakt veel meer kapot dan je lief is, heel vaak zonder dat je het doorhebt, want je ziet het niet. De fouten die onherroepelijk ontstaan door het inscannen leiden tot:

  • slechte toegankelijkheid voor visueel gehandicapten
  • slechte (terug)vindbaarheid (want als je zoekt op een woord dat er wel stond maar verminkt is door de OCR, wordt het stuk niet teruggevonden, ook niet door Google of Woogle).
  • enorm groot opgeblazen PDF bestanden, die dus (onnodig) duur zijn om op te slaan, duur zijn om te downloaden, duur om te lezen. Dit kost allemaal onnodige energie en CO2 uitstoot.

Natuurlijk moeten er wel eens stukken worden ingescand. Dat is geen probleem. Maar probeer het te vermijden voor een brief waarin alleen 1 naam van een ambtenaar en 1 naam van de geadresseerde moet worden weggelakt. Naast de problemen die we net schetsten is het toch ook erg zonde van zo’n mooi gecomponeerd stuk, en misschien ook wel iets om je voor te schamen.

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s