Um sistema bastante interessante de arquivo e captura de sites permite à Biblioteca do Congresso arquivar terabytes e terabytes de informação, preservando assim as páginas web que digam respeito às áreas temáticas previamente organizadas em colecções – ex: 11 de Setembro, Katrina, Eleições, etc.
A web capture da Biblioteca do Congresso assume como ponto de partida o significativo volume de informação nas áreas cultural e educativa que é criada em suporte digital não existindo qualquer suporte físico.
É interessante observar o imenso volume de informação que já se perdeu por ter apenas sido produzido para a web e do qual não ficou registo. Quantos e quantos sites já foram actualizados, modificados e dos quais não ficaram preservadas as versões anteriores. Muitas vezes reformulamos conteúdos, mudamos layouts de sites mas não percebemos o interesse que teria em guardarmos esses ficheiros "para mais tarde recordar".