Mezi snem a realitou: Otevřená data českého webového archivu.
Rudolf Kreibich (Webový archiv Národní Knihovny ČR) | westfoodhttp://itchy.cz |
---|
Knihovní a autorský zákon omezuje volné zpřístupnění celého českého webového archivu. Jednou ze strategií jak v takovém legislativním rámci poskytovat služby veřejnosti, je zpřístupňovat metadata k jednotlivým archivním exemplářům. Český webový archiv zatím žádnou Open Data službu neposkytuje, ale postupně se konceptuálně připravuje na její spuštění. Touto přednáškou chceme navázat kontakt s komunitou mimo paměťové instituce a nejlépe získat zpětnou vazbu o tom, jak by taková služba měla vypadat.
Přednáška nejdříve stručně představí proč jsou webové archivy důležité a čemu zajímavému se nyní věnuje mezinárodní komunita webových archivů. Představíme např. Common Crawl, kontejner WARC a popíšeme zavedené metadatové formáty a jaká data obsahují. Řekneme si, které data můžeme někdy zpřístupnit a které do změny legislativní rámce určitě ne. Nakonec se zasníme, jaké algoritmy bychom rádi pustili vůči našemu archivu a jaká data bychom o našem archivu získali.