sábado, julho 05, 2008

Bom e barato, IV.

A propósito da providência cautelar que mandou fechar o Povoaonline (1), recomendo o HTTracker, um programa gratuito para fazer cópias locais de sites na Web.

Para quem tem um blog no blogspot fica uma sugestão para as scan rules. Sem estas vão descarregar muita informação duplicada nos arquivos e ligações com pesquisas:

-*/*search*
-*/*archive*
-*.tmp
-*?showComment?*
+*.css
-*[vosso blog].blogspot.com/feeds*

Basta substituir [vosso blog] pelo nome do vosso blog e ficarão com uma cópia local de todos os posts e comentários. Infelizmente, muitas das ligações para os arquivos e posts são feitas dinamicamente, por isso se o blog for apagado será necessário criar um índice. E este arquivo é estático, não permitindo adicionar posts ou comentários. Mas sempre evita que algum disparate judicial ou percalço faça desaparecer tudo.

1- Imprensa da Póvoa, e também Póvoa Offline, macedo vieira é o nosso homem

8 comentários:

  1. Excelente informação.

    O Firefox 2 tem um add on que usa esse programa, o Spiderzilla.

    Infelizmente ainda não saiu a versão actualizada para o Firefox 3.

    http://spiderzilla.mozdev.org/

    ResponderEliminar
  2. tudo junto? -*/*search*
    -*/*archive*
    -*.tmp
    -*?showComment?*
    +*.css
    -*[vosso blog].blogspot.com/feeds*

    ResponderEliminar
  3. Anónimo,

    Quando se usa o HTTracker, o programa pede um nome para o projecto, uma pasta onde gravar os ficheiros e, quando carregamos em next, pede o(s) endereço(s) a copiar. Por baixo dessa caixa tem um botão "set options". Esse faz abrir uma janela com uma página "scan rules".

    Nessa tem uma caixa onde pode copiar estas linhas, apagando ou não a linha que lá está (eu apago porque não quero guardar as imagens como cópias locais).

    ResponderEliminar
  4. Hã?

    Desculpa?

    OK vou mostrar ao miguel ou ao teu irmão porque não sei do que estás a falar :)
    Nestes assuntos sou mesmo, mas mesmo loira ;)

    ResponderEliminar
  5. Obrigado!!!

    Anónimo das 05-07-2008 19:27

    ResponderEliminar
  6. Ludwig

    Tenho a informar que depois de horas a fazer uma cópia do meu blogue, a cópia abre e depois dá-lhe um ataque cardíaco, com o site a dizer que não sei o quê e que não encontra uns robots. Não sabia que tinha robots no meu site. Só fotos de fufas.

    E logo quando eu pensava que não era loura!

    ResponderEliminar
  7. Abobrinha,

    As horas deve ter sido porque deixaste as regras que lá estavam de origem. Essas gravam as imagens todas, o que pode ser boa ideia se tens muitas mas demora um bocado.

    O índice não fica 100% porque tem ligações para o search do google. Mas nota que o indice do teu blog na pasta chamada aboborapequenina.blogspot.com. O index.html na pasta acima dessa é informação para o httracker, para quando quiseres actualizar o backup.

    Nessa pasta com o nome do teu blog, além do index deves ter pastas com os anos, os meses e dentro de cada uma os posts todos completos com os comentários.

    Se não tiveres diz que é sinal que ficou alguma coisa engatada :)

    ResponderEliminar
  8. Ludwig

    Eu tenho montes de imagens! A maioria são porcaria, claro! (Isso admitindo que por "imagens" não estás a querer dizer uma coisa qualquer em computês)

    Eu acho que tenho essa divisão toda em pastinhas, mas houve qualquer coisa que correu mal e vai tudo abaixo. Vou tentar ver o que é com calma e depois digo-te.

    Claro que eu deixei as definições originais. A minha política é "failing everything else, read the instructions". Até aí, é carregar em qualquer coisa e se estiver a funcionar ou parecer que está a funcionar, tá-se!

    ResponderEliminar

Se quiser filtrar algum ou alguns comentadores consulte este post.