Přihlásit
: [1]
   |   
: wget nestahuje nektere soubory  ( 6183 )
Ged
Full Member
***

Karma: 3
: 215


17002977
« : December 10, 2008, 13:11:24 »

Chtel jsem si udelat jednoduchy script na provereni zda webove stranky neobsahuji viry:
:
#!/bin/bash
wget -R jpg,gif -r --directory-prefix=/home/ged/prechodne/virusscan http://sikovnerucicky.wz.cz
wget -R jpg,gif,zip,wmv -r --directory-prefix=/home/ged/prechodne/virusscan http://uranit.wz.cz
clamscan --recursive --infected /home/ged/prechodne/virusscan/
rm -rf /home/ged/prechodne/virusscan
Problem je v tom, ze wget nestahuje vsechny soubory. Napr. soubory "http://uranit.wz.cz/preview.php", "http://uranit.wz.cz/file/error1.png" to uplne ignoruje a podobne je to u dalsich souboru.

Nemuze to byt tim, ze na nej z index.php v / nevede zadny odkaz?

Cele jsem to podstupoval, protoze nejaky z.... pako mi na stranky umistilo Trojskeho kone a jelikoz pouzivam LINUX tak me na to upozornili az lidi s windows a google.

Jako alternativu jsem take hledal nejaky online scanner, ale vse co jsem nasel tak bylo bud na scannovani souboru vna lokalnim pocitaci, pro windows nebo neumelo rekurzivne prohledat web.

Dekujiza rady.

Jednou jsem ho videl na vanoce

Gold "3-Ethyl-1,2,2-trimethyl-bicyclo[2.1.0]pentane"

jabber: uranit@jabbim.cz
Ged
Full Member
***

Karma: 3
: 215


17002977
« #1 : December 10, 2008, 15:11:56 »

Tak jsem na zkousku zkusil do home.php, ktery se includuje do index.php vlozit odkaz na preview.php a wget to tentokrat stahnul.

Takze otazka proc to nestahuje je doufam vyresena.

Jen zbyva vyresit jak donutit wget aby stahoval i soubory na ktere nevede nejaky odkaz z index.php.......

man wget se miji ucinkem.

Jednou jsem ho videl na vanoce

Gold "3-Ethyl-1,2,2-trimethyl-bicyclo[2.1.0]pentane"

jabber: uranit@jabbim.cz
Luděk Sladký
Hero Member
*****

Karma: 4
: 1 358


« #2 : December 10, 2008, 16:08:07 »


Cele jsem to podstupoval, protoze nejaky z.... pako mi na stranky umistilo Trojskeho kone a jelikoz pouzivam LINUX tak me na to upozornili az lidi s windows a google.

A mohu zeptat jak? Prolomil heslo? Nebo vložil nějaký odkaz do komentáře?
Ged
Full Member
***

Karma: 3
: 215


17002977
« #3 : December 10, 2008, 16:46:55 »

No tak priznam se zas tak dobre s php si nerozumim. Muj web pouziva z php jen fce include a require a nejake css na formatovani.

Navstevni knihu mam resenou externe tak tam by snad byt problem nemel. Jinak komentare krome navstevni knihy zadavat nejdou tak tudy asi k pruniku trojanu nedoslo.

Napada me ze jedine co na strankach mam a cemu nerozumim je pomerne obsahly js na zobrazovani fotek (tal jestli to nebude pres nej).

Bohuzel zkoumat jakym zpusobem doslo k pruniku je nad me sily.



Tedka me vsak napadlo proc to resim pres wget, kdyz bych mohl pouzit nejakeho radkoveho ftp klienta. Vyzkousim a poreferuji.

Jednou jsem ho videl na vanoce

Gold "3-Ethyl-1,2,2-trimethyl-bicyclo[2.1.0]pentane"

jabber: uranit@jabbim.cz
Luděk Sladký
Hero Member
*****

Karma: 4
: 1 358


« #4 : December 10, 2008, 20:57:04 »

Aha, tak v tom pripade si myslim, ze nez kontrolovat a stahovat cely web, kvuli av kontrole (to zkontroluje pouze na viry, nebude kontrolovat naruseni samotneho redakcniho systemu ci celeho systemu) je najit bezpecnostni mezeru a tu zalatat.
Hobil
Hero Member
*****

Karma: 58
: 4 006


« #5 : December 10, 2008, 22:55:35 »

Osobne si myslim, ze neni od veci mit na svem kompu kopii takoveho webu a moznost jeho preklopeni na server je v pripade potizi nejjednodussi momentalni reseni.
Stejne tak hledani chyb a testovani je doma snazsi a neni potreba omezovat/rusit provoz stranek.
wget ma i parametr pro zrcadleni (--mirror), takze neni problem naslednym pouzitim diff zjistit co se zmenilo a hledani problemu se zjednodusuje.

Stazeni vsech pozadovanych souboru, viz man wget (ve 2009 je cesky):
:
  -p
       --page-requisites
           Tato volba způsobí, že Wget stáhne všechny soubory nezbytné pro
           správné zobrazení dané HTML stránky. To zahrnuje věci jako obrázky,
           zvuky a odkazované stylesheety.

           Normálně nejsou při stahování jediné HTML stránky dokumenty nezbytné
           pro její správné zobrazení stahovány.  Volba -r spolu s -l může
           pomoci, ale protože Wget nerozlišuje mezi externími a inline doku‐
           menty, obvykle zůstanou tzv. ‘‘leaf documents'', kterým potřebné
           soubory chybí.

           Například dokument 1.html obsahuje tag "<IMG>", který odkazuje na
           1.gif a tag "<A>" odkazující na externí dokument 2.html. Řekněme že
           2.html je podobný, ale jeho obrázek je 2.gif aa odkazuje na 3.html. A
           tak to může jít dál a dál.

           Pokud je spuštěn příkaz:

                   wget -r -l 2 http://<site>/1.html

           budou staženy soubory 1.html, 1.gif, 2.html, 2.gif a 3.html. Jak
           vidíte souboru 3.html chybí pro správné zobrazení obrázek 3.gif,
           protože Wget, aby zjistil konec rekurze, jednoduše počítá počet skoků
           (nejvýše 2) od 1.html.  Nicméně příkaz:

                   wget -r -l 2 -p http://<site>/1.html

           způsobí stažení všech uvedených souborů a soubor 3.gif, který 3.html
           vyžaduje.
Prostudujte si chovani wgetu v pripade, ze narazi na zmeneny soubor pri snaze "dokoncit stahovani" - parametr -c.
H.

Benzínem se nemá hasit ohniště
teď už je to jedno, ale pro příště... (K.P.)
: [1]
   |   
 
: