Usando wget y Linux para bajar sitios web completos

wget: Bajando sitios enteros facilmente

Unos trucos para lograr bajar automaticamente los sitios que necesites desde el internet a tu pc.

Wget es una herramienta que viene en cualquier linux, es usada para bajar archivos desde internet. Su forma basica de uso es: wget http://www.guatewireless.org/crack.exe

Esta es la manera en la cual wget se utiliza normalmente, pero tambien puede ser utilizado recursivamente, esto es su poder escondido. wget puede conectarse a los sitios y recursivamente bajar todas las paginas (imagenes y otro tipo de datos) que esten linkeadas en la pagina principal:

wget -r http://www.guatewireless.org/

Sin embargo, existen muchos sitios los cuales nos deniegan poder bajar el sitio completo. Para prevenir esto, los sitios verifican la identificacion de los navegadores. Para evitar estas molestias wget tiene la opcion -U.

wget  -r -p -U Mozilla http://www.guatewireless.org/

Seria bueno que agregaran las opciones –limit-rate= y –wait=. Lo anterior es para hacer pausa entre cada pagina, ya que de lo contrario el dueno del sitio puede darse cuenta que con un simple comando wget le estamos bajando el sitio completamente. Sin embargo, nadie se dara cuenta si limitan la velocidad de descarga y hacen pausa entre archivos.

wget --wait=20 --limit-rate=20K -r -p -U Mozilla http://www.guatewireless.org/

Use –no-parent

–no-parent esta opcion garantiza de que wget no descargara archivos por debajo del directorio que deseamos descargar.

Popularity: 11% [?]


Ningun articulo relacionado.

Etiquetado como: , , , ,

17 Comentarios

  1. esta bueno el tutorial

  2. Muchas gracias amigo, me ha servido mucho este post…

  3. Y que pasa con las paginas php, ¿ las baja igual?

    Saludos

  4. funciona bien, pero veo que no descarga ni enlaza bien los css ni los js.
    ¿Hay alguna manera de que los descargue y enlace también?

  5. Pedro O no seas webon …

    el codigo en el explorador es html capa 7 de aplicacion del modelo OSI

    claro que no te baja el php, aprende a programar ……..webon

    • fercho no seas gilipollas…
      no a todo el mundo lo pare su madre siendo ingeniero informático
      el chaval sólo preguntaba, aprende educación, no hace falta insultar… gilipollas.

      Por si a alguien le interesa, wget está tambien para windows
      http://pages.interlog.com/~tcharron/wgetwin.html

      • gran respuesta carnal si hubieses omitido el gilipollas tu comentario no aplicaria ati jeje….. Pedro O mis disculpas

        • La verdad que yo tambien redacté mal mi pregunta. porque la idea era saber si bajaba las “paginas generadas por php”. Ya que he conocido otras herramientas que cuando ven una pagina php, se cuelgan.. Obviamente sé los de las capas de red, ya que soy un programador.
          Acepto tus disculpas fercho

    • y para colmo, capa 7 es hardware jajajajajaja

  6. Muchas gracias por la informacion dada, fue de mucha utilidad

  7. Y como paras la descarga ?
    Yo cierro la terminal, me indica que esto matará el proceso, pero mirando sigue aun en memoria, tengo que matarlo a mano desde el monitor del sistema.
    Perdonad si parece tonta la pregunta, pero uno no es muy diestro en estos temas.
    Gracias

  8. Rovix, creo que la opciones es:
    (1)debes apretar jutamente las teclas: “Ctrl” + “c”.

    Cuando cierras una terminal los procesos siguen en segundo plano

  9. Me sirvió de mucho la información, que bueno que exista personas que compartan el conocimiento de esta forma, Saludos desde la UCLV, Cuba !!!!!!!!!

  10. Muchas gracias. Estaba buscando esto hace tiempo.

  11. que bueno que estas cosas sirvan!
    que bueno compartir nuestros los conocimientos!
    que bueno seguir conectados!

    @Narsil: saludos desde Argentina a nuestrxs hermanxs, al pueblo Cubano!

Trackbacks

  1. Usar wget para descargar sitios y archivos de internet | Paraiso Linux

Por favor, escriba un comentario

Por favor tome en cuenta lo siguiente:
Los comentarios son moderados, por lo cual puede tardar en ser publicados. No hay necesidad de repetir su comentario.
Su correo electronico nunca sera revelado.

Terminos de busqueda


  • wget linux
  • linux wget
  • wget descargar sitio completo
  • descargar web linux
  • descargar web wget
  • wget en linux
  • wget descargar web
  • descargar web con wget
  • descargar sitio web completo wget
  • descargar sitio completo con wget
  • comando wget linux
  • descargar sitio completo wget
  • descargar sitio wget
  • descargar sitio web linux
  • descargar sitio con wget
  • uso de wget
  • descargar un sitio con wget
  • bajar sitio con wget
  • wget descargar sitio
  • wget sitio completo
  • descargar sitio web wget
  • descargar una web con wget
  • wget web
  • descargar página web completa linux
  • dESCARGAR PAGINA WEB WGET
  • bajar sitio wget
  • bajar web linux
  • descargar web completa linux
  • wget
  • descargar un sitio completo con wget
  • bajar una web con wget
  • descargar sitio web completo linux
  • wget descargar pagina completa
  • descargar todas las imagenes con wget
  • Linux descargar sitio web
  • descargar sitios con wget
  • usar wget
  • wget bajar web
  • bajar pagina php con wget
  • programa que baja imagenes de web o bajan sitios web completos
  • como descargar una web con wget
  • descarga completa de un sitio con wget
  • pagina web wget como
  • como descargar toda página web linux
  • bajar un sitio completo con wget
  • wget bajar un sitio completo
  • bajar sitios web
  • utilizar wget linux
  • herramienta para descargar un sitio completo ubuntu
  • como guardar una pajina web en linux tutorial
  • descargar con wget
  • descargar linuz web
  • descargar paginas web con linux
  • ubuntu como bajar imágenes de un sitio web
  • wget --serverip
  • weg bajar linux
  • wget sitio web entero
  • wget --no-check-certificate
  • wget para ubuntu
  • wget --passive-ftp