Scaricare un intero sito per una eventuale consultazione off-line.
wget è uno strumento a linea di comando utilissimo (e funziona bene, che non è poco) per scaricare interi siti internet, in modo che possono essere consultati off-line all’occorrenza. L’utilizzo è molto semplice, si utilizza wget da prompt, aprendo il terminale nella directory dove si vuole eseguire il download e si imposta il comando, che può essere semplicissimo, come ad esempio: $ wget http://www.nomedominio
oppure accompagnato da una serie di opzioni che ne agevolano l’utilizzo del risultato finale. Sotto ho riportato le opzioni più comuni e più utili. Il risultato finale sarà quello di trovare una nuova directory nel punto dove abbiamo voluto scaricare cha ha il mome del sito, esempio: www.sopravvivere.org
Questa è la linea di comando che utilizzo quasi sempre:
$ wget --mirror --convert-links --html-extension --show-progress -p -k https://www.sopravvivere.org
Opzioni e spiegazione:
-b esegue wget in background-l 5 specifica il livello di profondità (default 5)-c, --continue Riprende a scaricare un file parzialmente scaricato fa il resume del download-convert-link converte il link da assoluti a relativi per visualizzare la pagina offline-mirror solo un aggiornamento-nq evita di scaricare link che fanno riferimento ad altri siti-E oppure --html-extension: Aggiungi .html al nome del file se è un file HTML ma non termina in .html o simili-H: Scarica file anche da altri host-k: Dopo il download, converti tutti i link in modo che puntino ai file scaricati-p: Scarica tutto ciò di cui la pagina ha bisogno per una corretta visualizzazione offline-r abilita il recupero ricorsivo. Per ulteriori informazioni, consultare Download ricorsivo.-P imposta il prefisso della directory in cui vengono salvati tutti i file e le directory.-A imposta una whitelist per il recupero di soli determinati tipi di file. Sono accettati stringhe e pattern, ed entrambi possono essere utilizzati in un elenco separato da virgole (come illustrato sopra). Per ulteriori informazioni, consultare Tipi di file.-q: Disattiva l’output di wget--show-progress: Forza wget a visualizzare la barra di avanzamento indipendentemente dal livello di verbosità impostato
