Acht miljoen krantenpagina’s in één website
Koninklijke Bibliotheek digitaliseert 1.500 dagbladen
De Koninklijke Bibliotheek KB bouwt een website, waarin zo’n 1.500 Nederlandse dagbladen zijn te doorzoeken. Het gaat om 8 miljoen krantenpagina’s, ofwel 25 miljard (!) woorden. De eerste miljoen worden in het voorjaar van 2010 toegankelijk gemaakt. Voor de KB is dit het grootste digitaliseringsproject ooit.
In rap tempo worden krantenbestanden tegenwoordig digitaal toegankelijk gemaakt. Meest opvallende project tot nu toe is het Archief Leeuwarder Courant, waarbij 256 jaar aan artikelen gratis doorzoekbaar zijn. Het is een onwaarschijnlijk rijke bron, en is al vanaf het begin een enorm succes.
De KB werkt aan een overkoepelend project, waar de Leeuwarder Courant ook toe behoort. Het instituut digitaliseert zo’n 1500 verschillende lokale, regionale, landelijke en koloniale dagbladen uit de periode 1618-1995. Een eerste versie draait al overigens enkele jaren, waarbij 350.000 pagina’s zijn terug te vinden.
Volgens de KB scant een team van tien medewerkers elke week 50.000 krantenpagina’s. Dit levert wekelijks zo’n 610.000 digitale bestanden op. Het project is in 2006 begonnen.
Reacties