segunda-feira, maio 29, 2006

Capturar para preservar

A Biblioteca do Congresso dos Estados Unidos da América acrescentou às suas funções tradicionais de biblioteca Nacional a preservação dos materiais digitais, incluindo aqui as páginas web.
Um sistema bastante interessante de arquivo e captura de sites permite à Biblioteca do Congresso arquivar terabytes e terabytes de informação, preservando assim as páginas web que digam respeito às áreas temáticas previamente organizadas em colecções – ex: 11 de Setembro, Katrina, Eleições, etc.
A
web capture da Biblioteca do Congresso assume como ponto de partida o significativo volume de informação nas áreas cultural e educativa que é criada em suporte digital não existindo qualquer suporte físico.
É interessante observar o imenso volume de informação que já se perdeu por ter apenas sido produzido para a web e do qual não ficou registo. Quantos e quantos sites já foram actualizados, modificados e dos quais não ficaram preservadas as versões anteriores. Muitas vezes reformulamos conteúdos, mudamos layouts de sites mas não percebemos o interesse que teria em guardarmos esses ficheiros "para mais tarde recordar".

2 comentários:

Anónimo disse...

Pareceme unha iniciativa estupenda, pero non consigo ver cal é a diferencia co respecto o que xa fai o internet archive, ¿podes comentala?

Paulo Jorge Izidoro disse...

Só para deixar o link do Way Back Machine http://web.archive.org/collections/web/advanced.html que arquiva sites (embora de uma forma não universal) e já me serviu para recuperar um documento que eu tinha colocado num site que tinha deixado de existir.
Contudo este serviço já teve problemas por os seus recursos terem sido utilizados em tribunal para provar que um determinado site tinha publicado algo. A questão que se pode colocar é: podemos impedir que os autores tentem apagar o passado?