View previous topic :: View next topic |
Author |
Message |
funkoolow Guru
Joined: 21 Sep 2004 Posts: 545 Location: er paese delle anguille
|
Posted: Tue Dec 19, 2006 12:14 pm Post subject: Strano spegnimento improvviso |
|
|
Salve a tutti,
da qualche tempo quando torno a casa trovo occasionalmente il mio serverino domestico d'epoca spento. Escluderei lo sbalzo per via di un gruppo di continuità che fa il suo lavoro credo piuttosto egregiamente e cmq, ogni volta che trovo il server spento, trovo sempre un altra macchina (il desktop) sulla stessa rete elettrica perfettamente up and running.
Altra cosa strana, quando riavvio la macchina in questione dopo averla trovata spenta, la sequenza di avvio fallisce nell'avviare la scheda di rete eth0 e a cascata tutti i servizi ad essa collegati (apache, mysql, sshd...), ma se a quel punto arresto la macchina e faccio ripartire, tutto procede per bene e come da copione fino in fondo.
sospettando una qualche attività remota non autorizzata l'altro giorno ho cambiato le passw di accesso di root e dell'unico utente del gruppo wheel, ma ieri sera ho ritrovato la macchina off.
ad intuito ho fatto un tail dell'authlog ma non ci ho rilevato niente di anomalo a parte la solita massa di tentativi di accesso con username classici tipo user, test, etc. ma nessuno andato a buon fine..
Cosa può essere? come posso intervenire per capire meglio? cosa posso postare?
per il momento grazie a tutti!
edit titolo: scusate, la fretta di postare pre-pranzo mi ha fatto perdere di vista il campo titolo! _________________ SabaziaLUG: il LUG a nord di Roma
Last edited by funkoolow on Tue Dec 19, 2006 6:21 pm; edited 1 time in total |
|
Back to top |
|
|
Elbryan Guru
Joined: 13 Nov 2006 Posts: 523 Location: Rovereto (TN)
|
Posted: Tue Dec 19, 2006 12:24 pm Post subject: |
|
|
Cambia scheda di rete |
|
Back to top |
|
|
fikiz Apprentice
Joined: 07 Mar 2005 Posts: 282 Location: Italy
|
Posted: Tue Dec 19, 2006 1:19 pm Post subject: |
|
|
ma e' stato uno shutdown regolare oppure uno spegnimento improvviso? nel secondo caso, e visto che dici essere una macchina "d'epoca", verifica che le ventole funzionino e siano libere da polvere. In caso di surriscaldamento molte schede madri fanno scattare uno spegnimento immediato.
ciao! |
|
Back to top |
|
|
funkoolow Guru
Joined: 21 Sep 2004 Posts: 545 Location: er paese delle anguille
|
Posted: Tue Dec 19, 2006 1:27 pm Post subject: |
|
|
non so come succede, in tutti i casi in cui si è verificato il problema ho trovato la macchina già spenta. Immagino cmq che si spenga malamente... _________________ SabaziaLUG: il LUG a nord di Roma |
|
Back to top |
|
|
randomaze Bodhisattva
Joined: 21 Oct 2003 Posts: 9985
|
Posted: Tue Dec 19, 2006 1:35 pm Post subject: |
|
|
Puoi cambiare il subject con qualcosa di più significativo?
Cosa dicono i log?
Sei sicuro che l'hardware (es. l'alimentatore) sia a posto?
Moved from Forum italiano (Italian) to Forum di discussione italiano. _________________ Ciao da me! |
|
Back to top |
|
|
fikiz Apprentice
Joined: 07 Mar 2005 Posts: 282 Location: Italy
|
Posted: Tue Dec 19, 2006 1:48 pm Post subject: |
|
|
funkoolow wrote: | Immagino cmq che si spenga malamente... |
puoi controllare dentro /var/log/messages . in caso di shutdown regolare trovi i messaggi relativi allo spegnimento, cose del tipo:
Code: | ...
Dec 19 00:16:13 bart shutdown[28013]: shutting down for system halt
Dec 19 00:16:14 bart init: Switching to runlevel: 0
...
Dec 19 00:17:19 bart syslog-ng[3529]: syslog-ng version 1.6.9 going down
... |
che chiaramente troverai (se presenti) appena prima dei messaggi che riguardano il boot successivo allo spegnimento. Se vedi uno shutdown regolare, allora e' legittimo supporre che il tuo hardware funzioni correttamente. |
|
Back to top |
|
|
Kernel78 Moderator
Joined: 24 Jun 2005 Posts: 3654
|
Posted: Tue Dec 19, 2006 2:34 pm Post subject: Re: Strano |
|
|
funkoolow wrote: | ad intuito ho fatto un tail dell'authlog ma non ci ho rilevato niente di anomalo |
Io ad intuito avrei controllato anche altri log in cerca di qualche traccia dello shutdown ... _________________ Le tre grandi virtù di un programmatore: pigrizia, impazienza e arroganza. (Larry Wall).
Prima di postare un file togli i commenti con Code: | grep -vE '(^[[:space:]]*($|(#|!|;|//)))' |
|
|
Back to top |
|
|
funkoolow Guru
Joined: 21 Sep 2004 Posts: 545 Location: er paese delle anguille
|
Posted: Tue Dec 19, 2006 6:27 pm Post subject: |
|
|
dando un occhiata a messages, sono riuscito a risalire all'ora dello spegnimento, tracciabile per il caso di ieri, fra le 19:20 e le 19:25 (ho uno script che pinga il router ogni 5min e l'ultimo di ieri è quello delle 19:20). Dopo quel ping, nessun messaggio di shutdown o altro, come se fosse saltata la corrente (cosa impossibile per i motivi spiegati sopra).
un amico mi ha suggerito di provare a disattivare l'ACPI, dato che sembra il tipico caso di spegnimento da surriscaldamento. Al momento l'ho disabilitato dal runlevel di default, per vedere se la situazione si ripresenta. Riposterò appena ho novità, intanto grazie a tutti per l'interessamento _________________ SabaziaLUG: il LUG a nord di Roma |
|
Back to top |
|
|
Ic3M4n Advocate
Joined: 02 Nov 2004 Posts: 3489 Location: Bergamo.
|
Posted: Tue Dec 19, 2006 11:13 pm Post subject: |
|
|
se è un'errore tipico da surriscaldamento io non toglierei l'acpi come dice il tuo amico, ci tengo al mio computer. in ogni caso non credo che tolgiendo l'acpi tu possa risolvere qualcosa. da quanto ne so l'acpi funziona a livello bios e tutto quello che puoi ottenere è a livello di controllo o di segnali emessi dall'acpi ed intercettati dal kernel. quindi l'acpi dovresti disabilitarlo nel bios. cosa che comunque non farei per quanto ho detto sopra. se effettivamente si tratta di surriscaldamento come detto da fikiz controlla le ventole ed il dissipatore del procio. |
|
Back to top |
|
|
Kernel78 Moderator
Joined: 24 Jun 2005 Posts: 3654
|
Posted: Wed Dec 20, 2006 7:49 am Post subject: |
|
|
funkoolow wrote: | un amico mi ha suggerito di provare a disattivare l'ACPI, dato che sembra il tipico caso di spegnimento da surriscaldamento. |
Bell'amico ... se si tratta di un problema di riscaldamento e tu lavori affinché non si spenga secondo te cosa succede una volta che la temperatura aumenta ? metti una braciola al posto della cpu ? _________________ Le tre grandi virtù di un programmatore: pigrizia, impazienza e arroganza. (Larry Wall).
Prima di postare un file togli i commenti con Code: | grep -vE '(^[[:space:]]*($|(#|!|;|//)))' |
|
|
Back to top |
|
|
codadilupo Advocate
Joined: 05 Aug 2003 Posts: 3135
|
Posted: Wed Dec 20, 2006 8:31 am Post subject: |
|
|
oddio, bisogna vedere se davvero l'acpi riporta una temperatura corretta
Avevo un pc asus per cui nemmeno acpi4asus funzionava, e mi mandava le ventole a manetta anche con temperature bassissime, per il semplice motivo che credeva di raggiungere i 100° !
Ora, con i nuovi kernel il problema sembra risolto, per fortuna
Coda |
|
Back to top |
|
|
Kernel78 Moderator
Joined: 24 Jun 2005 Posts: 3654
|
Posted: Wed Dec 20, 2006 8:46 am Post subject: |
|
|
codadilupo wrote: | oddio, bisogna vedere se davvero l'acpi riporta una temperatura corretta
Avevo un pc asus per cui nemmeno acpi4asus funzionava, e mi mandava le ventole a manetta anche con temperature bassissime, per il semplice motivo che credeva di raggiungere i 100° !
Ora, con i nuovi kernel il problema sembra risolto, per fortuna
|
Ok, ma tu rischieresti di disabilitare lo spegnimento automatico ? soprattutto tenendo conto che la macchina si spegne quando lui non è in casa ... se si trattasse di un problema ai sensori non ci sono grosse ricadute ma se effettivamente la temperatura sale ... ciao ciao pc e rischi anche un incendio ... personalmente non mi sentirei tranquillo .... _________________ Le tre grandi virtù di un programmatore: pigrizia, impazienza e arroganza. (Larry Wall).
Prima di postare un file togli i commenti con Code: | grep -vE '(^[[:space:]]*($|(#|!|;|//)))' |
|
|
Back to top |
|
|
funkoolow Guru
Joined: 21 Sep 2004 Posts: 545 Location: er paese delle anguille
|
Posted: Wed Dec 20, 2006 7:32 pm Post subject: |
|
|
Continuando ad indagare (e tenuto spento l'acpi) noto che la memoria a disposizione cala drasticamente durante l'arco della giornata lavorativa del server (qui c'è una paginetta che riassume i dati della macchinetta in questione): appena acceso (stamattina alle era occupato un 45-47%, ora (circa 12 ore dopo, ore 20) siamo al 99%.
potrebbe essere un buon indizio? una cosa del genere potrebbe provocare uno spegnimento improvviso? _________________ SabaziaLUG: il LUG a nord di Roma |
|
Back to top |
|
|
Ic3M4n Advocate
Joined: 02 Nov 2004 Posts: 3489 Location: Bergamo.
|
Posted: Wed Dec 20, 2006 8:31 pm Post subject: |
|
|
se la memoria è sana no.
calcola che l'utilizzo della ram in linux è differente rispetto a quanto avviene in windows, per porti un esempio: linux mantiene occupata la ram con i dati precedentemente inseriti fino a quando non serve. quindi è normale che tu veda la ram completamente piena.
se il memtest non trova nulla di strano non è quella. |
|
Back to top |
|
|
GiRa l33t
Joined: 07 Apr 2005 Posts: 717
|
Posted: Thu Dec 21, 2006 8:22 am Post subject: |
|
|
Puoi passare a syslog il parametro -m $intervalloditempo senza per forza pingare il router ogni 5 minuti.
Prova a stressare la macchina: se fai andare cpuburn si spegne?
Se fai andare tanti test pesanti con hdparm?
Se glxgears gira per mezz'ora? |
|
Back to top |
|
|
randomaze Bodhisattva
Joined: 21 Oct 2003 Posts: 9985
|
Posted: Thu Dec 21, 2006 9:24 am Post subject: |
|
|
funkoolow wrote: | appena acceso (stamattina alle era occupato un 45-47%, ora (circa 12 ore dopo, ore 20) siamo al 99%. |
Suggerirei intando di cercare il colpevole.
Se la memoria libera é diminuita c'é un processo che se la é presa (oppure si tratta di illusione ottica dovuta alla gestione a buffer del kernel).
Se poi si arriva in una situazione in cui tutta la memoria (fisica+swap) viene occupata non so se può esserci lo spegnimento forzato del server... ma non mi sento di escluderlo. _________________ Ciao da me! |
|
Back to top |
|
|
|