Bij het maken van Woogle merkten we dat erg veel onder de Woo vrijgegeven documenten "verminkt" waren. Daar bedoelen we mee dat de tekst die een computer in dat document leest niet hetzelfde is als de tekst die een mens ziet staan. Dat is vervelend voor een zoekmachine, en ook voor het zoeken met Control … Lees verder Direct in PDF documenten lakken
Auteur: maartenmarx
PDFs repareren
UIt onderzoek van Woogle bleek dat vrijwel geen enkel PDF document op open.overheid.nl door de pdfchecker.nl toegankelijkheidscheck komt. Verschillende studenten Informatica aan de UvA hebben geprobeerd die PDFs automatisch te repareren. Omdat het om miljoenen paginas gaat, en handmatige reparatie tot wel 7 Euro per pagina kost, is volgens ons alleen zo'n aanpak haalbaar. De … Lees verder PDFs repareren
ACOI rapport uit
Het Woogle team heeft een onderzoek, in opdracht van het ACOI, uitgevoerd naar de digitale toegankelijkheid van gepubliceerde overheidsdocumenten. Het eindrapport is te vinden bij het nieuwsbericht hierover op de site van het ACOI.
Woogle 5 miljoen paginas
Maik en Ramon gaan gewoon lekker door deze maand, en liggen nog prima op schema voor de jaarlijkse Kerst doelstelling van weer een jaar exponentiële groei.
Woogle 1 miljoen documenten
Vandaag op 5 december heeft Woogle de grens van 1 miljoen documenten doorbroken. Wat een heerlijk Sinterklaaskado! Met grote dank aan Ramon Duursma en Maik Larooij, en de eindeloze stroom beschikkingen van de gemeentes. We verwachten deze week ook de 4 miljoen paginas en 1 miljoen dossiers grenzen te slechten. De vertienvoudiging van Woogle in … Lees verder Woogle 1 miljoen documenten
