wget: scaricare interi siti con GNU/Linux

Scaricare un intero sito per una eventuale consultazione off-line.

wget è uno strumento a linea di comando utilissimo (e funziona bene, che non è poco) per scaricare interi siti internet, in modo che possono essere consultati off-line all’occorrenza. L’utilizzo è molto semplice, si utilizza wget da prompt, aprendo il terminale nella directory dove si vuole eseguire il download e si imposta il comando, che può essere semplicissimo, come ad esempio: $ wget http://www.nomedominio
oppure accompagnato da una serie di opzioni che ne agevolano l’utilizzo del risultato finale. Sotto ho riportato le opzioni più comuni e più utili. Il risultato finale sarà quello di trovare una nuova directory nel punto dove abbiamo voluto scaricare cha ha il mome del sito, esempio: www.sopravvivere.org

Questa è la linea di comando che utilizzo quasi sempre:
$ wget --mirror --convert-links --html-extension --show-progress -p -k https://www.sopravvivere.org

Opzioni e spiegazione:

-b esegue wget in background
-l 5 specifica il livello di profondità (default 5)
-c, --continue Riprende a scaricare un file parzialmente scaricato fa il resume del download
-convert-link converte il link da assoluti a relativi per visualizzare la pagina offline
-mirror solo un aggiornamento
-nq evita di scaricare link che fanno riferimento ad altri siti
-E oppure --html-extension: Aggiungi .html al nome del file se è un file HTML ma non termina in .html o simili
-H: Scarica file anche da altri host
-k: Dopo il download, converti tutti i link in modo che puntino ai file scaricati
-p: Scarica tutto ciò di cui la pagina ha bisogno per una corretta visualizzazione offline
-r abilita il recupero ricorsivo. Per ulteriori informazioni, consultare Download ricorsivo.
-P imposta il prefisso della directory in cui vengono salvati tutti i file e le directory.
-A imposta una whitelist per il recupero di soli determinati tipi di file. Sono accettati stringhe e pattern, ed entrambi possono essere utilizzati in un elenco separato da virgole (come illustrato sopra). Per ulteriori informazioni, consultare Tipi di file.
-q: Disattiva l’output di wget
--show-progress: Forza wget a visualizzare la barra di avanzamento indipendentemente dal livello di verbosità impostato

Articoli vari