Follow That Page stuurt u een email wanneer deze pagina wordt gewijzigd.
|
Wikipedia download-edities
Het afgelopen jaar heb ik dikwijls in de trein gewerkt op mijn laptop. Dat beviel erg goed, alleen was het soms lastig dat ik geen internetverbinding had. Dat was redelijk op te vangen door me goed voor te bereiden, bijvoorbeeld door handleidingen en webpagina's van tevoren te downloaden.
Ik vroeg mij toen af of dat met Wikipedia ook niet kon. Losse pagina's zijn makkelijk te downloaden als je precies weet welke je nodig hebt; als je dat niet weet, is het nuttiger om de hele Wikipedia te downloaden. Ook stel ik mij voor dat in ontwikkelingslanden een download-editie van Wikipedia van onschatbare waarde kan zijn.
Ik vond op Wikipedia zelf diverse chaotische pagina's over de verschillende mogelijkheden en problemen van een offline editie.
Wikipedia:Snapshots
Wikipedia:Database_download
Wikipedia_talk:Database_download
Mogelijkheden genoeg, maar soms met grote praktische problemen. Zo is de Engelse versie met afbeeldingen 75GB groot. Voor veel laptops is dat ondoenlijk. Handiger is het om de afbeeldingen weg te laten. Inhoudelijk is dat acceptabel en de overgebleven tekst is veel beter te comprimeren.
Een ander probleem is dat veel downloadbare versies een bepaald bestandformaat hebben. Zo heb je de originele wiki-bestanden, die niet zonder meer door een browser zijn te openen. Daar is een vertaalslag voor nodig. Deze wordt gedaan door een webserver met wiki-software: ook Wikipedia doet dat, namelijk met MediaWiki. Als je offline op je eigen laptop de wiki-bestanden wilt lezen, dien je dus een webserver op je laptop te installeren met MediaWiki erop. Er zijn ook database downloads beschikbaar. Dit zijn XML- of SQL-bestanden en ook deze zijn niet zonder nabewerking te bekijken. Dat betekent programmeren, of een bestaand programma zoeken om deze bestanden om te zetten naar hapklare HTML-bestanden.
Gelukkig heeft Wikipedia dat al gedaan.
static.wikipedia.org
Deze downloads zijn ongeveer 10 GB, opgedeeld in bestanden van circa 1 GB. Ze zijn gecomprimeerd met 7Zip, een soort Winzip maar dan efficiënter en met een vrije licentie. Downloaden, uitpakken met 7Zip en klaar. Deze versie bevat wel extra's zoals geschiedenis van en discussies over de artikelen.
Er zijn ook projecten die Wikipedia offline beschikbaar willen maken voor derde wereldlanden; een mooi streven, vindt Onnoot. MoulinWiki is een van die projecten. Ze bieden een Franstalige versie van 554 MB ter download aan: die past netjes op een cdrom.
Een soortgelijk project is Wikipedia for Schools van SOS Children. Hun Engelstalige selectie bevat 24.000 afbeeldingen, 14 miljoen woorden en 4625 onderwerpen, vergelijkbaar met een 15-delige encyclopedie, en past op een DVD.
Onno -
26 juni 2007, 21:44 -
1 reactie
|