HTTrack: web spider

Reading time: 2 – 2 minutes

La Daphne em va demanar si li podia fer la còpia en local d’una pàgina web d’acpuntura, ja que aquesta pertany a un portal generalista i té por de que un dia deixi d’exisitir. Així que m’ha vingut al cap provar el Pavuk un webspider que vaig veure a gentoo packages fa uns dies. No us faré perdre massa el temps, la meva valoració és: eggs!

Així que m’he dirigit al goolge i he buscat un webspider GPL i que si pogués ser tingués versió per win, per si la Daphne volia fer una altre còpia d’alguna altre pàgina. El primer de la llista he trobat el HTTrack, i d’aquí ja no he passat. Després d’usar-lo us puc assegurar que és una passada lluny de les complexitats del pavuk i el wget. No has de ser un gurú del HTTP per poder fer un mirroring sense suar.

httrack.jpg

Obviament també teniu versió per linux i per: Windows 9x/NT/2000/XP o Linux/Unix/BSD. Ho podeu comprobar a la pàgina de descàrregues. Per cert, en linux només he trobat una interficie per KDE a la Gentoo si algú en sap alguna per GNOME que m’avisi, malgrat això la interficie esta molt bé.