Usando wget y Linux para bajar sitios web completos
wget: Bajando sitios enteros facilmente
Unos trucos para lograr bajar automaticamente los sitios que necesites desde el internet a tu pc.
Wget es una herramienta que viene en cualquier linux, es usada para bajar archivos desde internet. Su forma basica de uso es: wget http://www.guatewireless.org/crack.exe
Esta es la manera en la cual wget se utiliza normalmente, pero tambien puede ser utilizado recursivamente, esto es su poder escondido. wget puede conectarse a los sitios y recursivamente bajar todas las paginas (imagenes y otro tipo de datos) que esten linkeadas en la pagina principal:
wget -r http://www.guatewireless.org/
Sin embargo, existen muchos sitios los cuales nos deniegan poder bajar el sitio completo. Para prevenir esto, los sitios verifican la identificacion de los navegadores. Para evitar estas molestias wget tiene la opcion -U.
wget -r -p -U Mozilla http://www.guatewireless.org/
Seria bueno que agregaran las opciones –limit-rate= y –wait=. Lo anterior es para hacer pausa entre cada pagina, ya que de lo contrario el dueno del sitio puede darse cuenta que con un simple comando wget le estamos bajando el sitio completamente. Sin embargo, nadie se dara cuenta si limitan la velocidad de descarga y hacen pausa entre archivos.
wget --wait=20 --limit-rate=20K -r -p -U Mozilla http://www.guatewireless.org/
Use –no-parent
–no-parent esta opcion garantiza de que wget no descargara archivos por debajo del directorio que deseamos descargar.
Ningun articulo relacionado.
Terminos de busqueda
descargar todos los archivos de una pagina de internet linux, descargar site web linux, wget en linux, como se usa el wget en linux, descargar website con wget, linux wget how to, como se utiliza wget red hat 9, bajar sitios enteros con wget, copiar una web completa con wget, bajar sitio php, descargat sitio completo wget, wget for linux, descarga de flv pagina web linux, descargar sitio web php, descargar automaticamente wget, wget bajar toda una web, wget descargar un site, wget para linux, descargar sitios enteros linux, descargar una web con wget, wget descargar pagina, como bajar una pagina web linux, linux descargar correos, wget como descargar imagenes de una web, wget descargar web completa, mget linux, bajar todas las imagenes de un sitio linux, descargar sitio web wget css, wget internet, descargar sitio web wget










on 23 May 2008 at 16:27 # roy
esta bueno el tutorial
on 23 Aug 2008 at 16:57 # gurzaf
Muchas gracias amigo, me ha servido mucho este post…
on 27 Sep 2008 at 09:11 # Pedro O.
Y que pasa con las paginas php, ¿ las baja igual?
Saludos
on 29 Sep 2008 at 09:32 # fher98
Baja las paginas generadas, pero no te baja el codigo fuente en php.
on 10 Nov 2008 at 08:43 # Miguel Carmona
funciona bien, pero veo que no descarga ni enlaza bien los css ni los js.
¿Hay alguna manera de que los descargue y enlace también?
on 19 Dec 2008 at 16:08 # fercho
Pedro O no seas webon …
el codigo en el explorador es html capa 7 de aplicacion del modelo OSI
claro que no te baja el php, aprende a programar ……..webon
on 09 Jan 2009 at 08:53 # ladilla
fercho no seas gilipollas…
no a todo el mundo lo pare su madre siendo ingeniero informático
el chaval sólo preguntaba, aprende educación, no hace falta insultar… gilipollas.
Por si a alguien le interesa, wget está tambien para windows
http://pages.interlog.com/~tcharron/wgetwin.html
on 12 Jan 2009 at 09:05 # fercho
gran respuesta carnal si hubieses omitido el gilipollas tu comentario no aplicaria ati jeje….. Pedro O mis disculpas
on 12 Jan 2009 at 09:48 # Pedro O.
La verdad que yo tambien redacté mal mi pregunta. porque la idea era saber si bajaba las “paginas generadas por php”. Ya que he conocido otras herramientas que cuando ven una pagina php, se cuelgan.. Obviamente sé los de las capas de red, ya que soy un programador.
Acepto tus disculpas fercho