Usando wget y Linux para bajar sitios web completos

06/06/2007
By

wget: Bajando sitios enteros facilmente

Unos trucos para lograr bajar automaticamente los sitios que necesites desde el internet a tu pc.

Wget es una herramienta que viene en cualquier linux, es usada para bajar archivos desde internet. Su forma basica de uso es: wget http://www.guatewireless.org/crack.exe

Esta es la manera en la cual wget se utiliza normalmente, pero tambien puede ser utilizado recursivamente, esto es su poder escondido. wget puede conectarse a los sitios y recursivamente bajar todas las paginas (imagenes y otro tipo de datos) que esten linkeadas en la pagina principal:

wget -r http://www.guatewireless.org/

Sin embargo, existen muchos sitios los cuales nos deniegan poder bajar el sitio completo. Para prevenir esto, los sitios verifican la identificacion de los navegadores. Para evitar estas molestias wget tiene la opcion -U.

wget  -r -p -U Mozilla http://www.guatewireless.org/

Seria bueno que agregaran las opciones –limit-rate= y –wait=. Lo anterior es para hacer pausa entre cada pagina, ya que de lo contrario el dueno del sitio puede darse cuenta que con un simple comando wget le estamos bajando el sitio completamente. Sin embargo, nadie se dara cuenta si limitan la velocidad de descarga y hacen pausa entre archivos.

wget --wait=20 --limit-rate=20K -r -p -U Mozilla http://www.guatewireless.org/

Use –no-parent

–no-parent esta opcion garantiza de que wget no descargara archivos por debajo del directorio que deseamos descargar.

Popularity: 10% [?]


Otros articulos de interes:

  1. La portatil del proyecto One Laptop per Child podria bajar a 50 dolares
  2. Usando SMBCLIENT para Transferir archivos entre Solaris 10 y Windows
  3. AcetoneISO: El manipulador de imagenes de CD/DVD para Linux
  4. Configurar rssh Chroot Jail en Linux para bloquear a los usuarios en su directorio home
  5. Usando Ethtool para cambiar la velocidad y el duplex de la tarjeta Ethernet

Tags: muchos sitios, opcion, pausa, wget r

20 Responses to Usando wget y Linux para bajar sitios web completos

  1. Hosting on 24/01/2012 at 20:16

    Saludos,

    Los archivos los guarda en el directorio que te escuentres en el SSH, para cambiar cd NombreCarpeta

  2. martin on 18/03/2011 at 06:46

    Muy bueno, funciona perfecto.

  3. miguel on 24/12/2010 at 17:51

    gracias por el dato pero una duda como hago para que descarga hasta las paginas que estan en los link por ejemplo que me descarge la pagina que tiene un link en una imagen

  4. parrjos504 on 09/11/2010 at 19:10

    Gracias amigo, pero perdon la ignorancia, en donde guarda los archivos que se van descargando?

  5. Anibal on 29/07/2010 at 22:04

    que bueno que estas cosas sirvan!
    que bueno compartir nuestros los conocimientos!
    que bueno seguir conectados!

    @Narsil: saludos desde Argentina a nuestrxs hermanxs, al pueblo Cubano!

Leave a Reply

Your email address will not be published. Required fields are marked *

*