View previous topic :: View next topic |
Author |
Message |
DonCallisto n00b
Joined: 13 May 2011 Posts: 2
|
Posted: Fri May 13, 2011 2:05 pm Post subject: Problema wget |
|
|
Buongiorno a tutti.
Ho un piccolo problema con il comando wget di unix. Mi spiego meglio.
Avrei bisogno di recuperare una pagina (non solo il suo html) risolvendo gli indirizzi che sono presenti nell'HTML: in parole povere, mi servirebbe reperire anche tutte le immagini ed il resto in maniera da poter consultare anche la pagina offline. Faccio questo, per misurare le prestazioni di una pagina che utilizziamo in ambiente lavorativo senza doverlo fare a mano, volta per volta, tramite il browser (dovendo fare un numero di test che si aggiri tra i 6 ed i 10.000).
Il problema è sostanzialmente questo:
Abbiamo delle macchine desktop che montano linux Ubuntu ed un server che monta linux Gentoo; ho fatto un piccolo script del genere:
Code: |
#!/bin/bash
if [ $# -ne 1 ]
then
echo $0 "usage:" $0 "number"
else
primo=$1
wget --save-cookies cookie.txt --keep-session-cookies --delete-after -q --post-data "__ac_name=[i]USERNAME[/i]&__ac_password=[i]PASSWORD[/i]" https://[i]MIOSITO[/i]/login_form
START=$(date +%s)
while [ $primo -ne 0 ]
do
wget --load-cookies cookie.txt -E -H -k -p https://[i]MIOSITO[/i]/login_form
let primo-=1
done
END=$(date +%s)
DIFF=$(( $END - $START ))
result=$(( $DIFF/$1 ))
echo $DIFF
echo $result
fi
|
Il problema, sostanzialmente, risiede nel fatto che se lancio lo script dalla mia macchina (ubuntu) riesco a reperire tutte le informazioni in maniera corretta (sono 62 kb e riesco a scaricare tutti e 62 i kb) mentre se lancio lo stesso identico script però sul server (gentoo) questo non mi reperisce alcune parti (nella fattispecie, alcune immagini) e non riesco a capire il perché.
Ho consultato il man per vedere se, magari, gentoo utilizzasse un formato diverso di passaggi parametri ecc, ma il man (e la versione del comando) sono identiche...
Ora non sò come fare (non vorrei farlo girare sul mio pc in quanto introdurremmo dei ritardi in trasmissione di rete che, per motivi interni non vogliamo calcolare e considerare).
Attendo qualcuno con più dimestichezza di gentoo che io, per altro, non ho mai preso in mano
Saluti,
S. |
|
Back to top |
|
|
ago Developer
Joined: 01 Mar 2008 Posts: 1527 Location: Milan, Italy
|
Posted: Fri May 13, 2011 2:46 pm Post subject: |
|
|
Il binario wget è sostanzialmente uguale ovunque, la differenza potrebbe essere qualche patch applicata dal team gentoo/ubuntu. Quindi provali tutti e 2 in versione vanilla e/o con le stesse patch applicate |
|
Back to top |
|
|
DonCallisto n00b
Joined: 13 May 2011 Posts: 2
|
Posted: Fri May 13, 2011 2:57 pm Post subject: |
|
|
Scusa l'ignoranza ma, come faccio a provarle in versione vanilla o senza patch ?
E, in caso, come faccio ad applicare o togliere una patch da una piuttosto che dall'altra ?
Grazie per la risposta.
S.[/quote] |
|
Back to top |
|
|
Onip Advocate
Joined: 02 Sep 2004 Posts: 2912 Location: Parma (Italy)
|
Posted: Fri May 13, 2011 2:59 pm Post subject: |
|
|
potrebbe essere un problema di configurazione di apache\firewall che non ti permette il download in locale dei file? sinceramente fatico a credere che wget centri qualcosa...
se queste immagini le scarichi direttamente da una console del server funziona?
hai provato, che so, con curl? _________________ Linux Registered User n. 373835
Titus Lucretius Carus, De Rerum Natura - Tantum religio potuit suadere malorum |
|
Back to top |
|
|
Kernel78 Moderator
Joined: 24 Jun 2005 Posts: 3654
|
Posted: Fri May 13, 2011 3:00 pm Post subject: |
|
|
Moved from Forum italiano (Italian) to Forum di discussione italiano. _________________ Le tre grandi virtù di un programmatore: pigrizia, impazienza e arroganza. (Larry Wall).
Prima di postare un file togli i commenti con Code: | grep -vE '(^[[:space:]]*($|(#|!|;|//)))' |
|
|
Back to top |
|
|
|