View previous topic :: View next topic |
Author |
Message |
amaury.dg n00b
Joined: 05 Feb 2006 Posts: 38 Location: Montigny-Le-Tileul / Belgique
|
Posted: Wed Apr 11, 2007 4:50 pm Post subject: [hardware] hdd mort ? |
|
|
Salut,
Voilà il y a qq temps j'ai eut une partition xfs qui a été corrompue, plus moyen de rien faire avec. Je me suis dit c'est le hdd...mais l'autre partition (même hdd, était bonne). J'ai quand même réinstallé un système dessus en reiserfs (au cas où ça serait la faute à xfs...) et aucun prob (tj pas de problème pour le moment) mais j'ai une sortie de smartctl qui me fait peur:
Raw_Read_Error_Rate et Seek_Error_Rate ne sont pas à zéro ! (cf. plus bas)
Chose encore plus bizarre: en utilisant le CD bootable de diagnostique de seagate...il ne veut pas lire, ni me donner aucune info sur le disque dur (pourtant un seagate)...(erreur de smart...).
Merci de m'éclairer sur ce sujet.
Note: (si ça peut vous aider, problèmes connus sur ce type de hdd ?)
Model Family: Seagate Barracuda 7200.7 and 7200.7 Plus family
Device Model: ST3200822AS
Serial Number: 3LJ3KT0V
Code: |
smartctl version 5.36 [x86_64-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 058 050 006 Pre-fail Always - 12693517
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 797
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 2
7 Seek_Error_Rate 0x000f 083 060 030 Pre-fail Always - 209192229
9 Power_On_Hours 0x0032 094 094 000 Old_age Always - 5541
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 841
194 Temperature_Celsius 0x0022 026 059 000 Old_age Always - 26
195 Hardware_ECC_Recovered 0x001a 058 049 000 Old_age Always - 12693517
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
|
|
|
Back to top |
|
|
Magic Banana Veteran
Joined: 13 Dec 2005 Posts: 1912 Location: Belo Horizonte, Minas Gerais, Brasil
|
Posted: Wed Apr 11, 2007 4:52 pm Post subject: |
|
|
J'attends la confirmation d'Anigel (spécialiste en la matière) mais on dirait bien que ton disque dur va te lâcher sous peu... Il est temps de faire une sauvegarde ! |
|
Back to top |
|
|
amaury.dg n00b
Joined: 05 Feb 2006 Posts: 38 Location: Montigny-Le-Tileul / Belgique
|
Posted: Wed Apr 11, 2007 5:03 pm Post subject: |
|
|
Ok merci j'attend la réponse avec impatience |
|
Back to top |
|
|
anigel Bodhisattva
Joined: 14 Apr 2003 Posts: 1894 Location: Un petit bled pas loin de Limoges ;-)
|
Posted: Wed Apr 11, 2007 5:58 pm Post subject: |
|
|
Spécialiste, non. Mais j'en ai vu cramer assez pour les reconnaître sans trop me tromper.
Et dans ton cas, j'en suis certain : je n'ai jamais vu ce problème précis. Sur cette série, rien de particulier à signaler, j'en ai une petite centaine en production, sans aucun souci dont je puisse me rappeler. Par contre la sortie de smartctl ne ressemble pas vraiment à ce que j'ai l'habitude de voir. Que te répond la commande smartctl --all /dev/hdd (remplace hdd par le device concerné) ? _________________ Il y a 10 sortes d'individus en ce bas-monde : ceux qui causent binaire, et les autres. |
|
Back to top |
|
|
widan Veteran
Joined: 07 Jun 2005 Posts: 1512 Location: Paris, France
|
Posted: Wed Apr 11, 2007 6:09 pm Post subject: Re: [hardware] hdd mort ? |
|
|
amaury.dg wrote: | Raw_Read_Error_Rate et Seek_Error_Rate ne sont pas à zéro ! |
Il semble que ça ne soit pas signe de problèmes sur un Seagate (regarde ici et là). |
|
Back to top |
|
|
amaury.dg n00b
Joined: 05 Feb 2006 Posts: 38 Location: Montigny-Le-Tileul / Belgique
|
Posted: Wed Apr 11, 2007 6:39 pm Post subject: |
|
|
Voici ce que tu m'as demandé anigel.
Vu le post précédant je me dis que ce n'est peut être pas si grave que ça.....mais je n'ai vrmt pas envie de perdre mes données
Code: |
localhost atomik # smartctl -d ata --all /dev/sda
smartctl version 5.36 [x86_64-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.7 and 7200.7 Plus family
Device Model: ST3200822AS
Serial Number: 3LJ3KT0V
Firmware Version: 3.01
User Capacity: 200.049.647.616 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: ATA/ATAPI-6 T13 1410D revision 2
Local Time is: Wed Apr 11 20:38:35 2007 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 430) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 111) minutes.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 057 050 006 Pre-fail Always - 18666698
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 797
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 2
7 Seek_Error_Rate 0x000f 083 060 030 Pre-fail Always - 209213030
9 Power_On_Hours 0x0032 094 094 000 Old_age Always - 5544
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 841
194 Temperature_Celsius 0x0022 037 059 000 Old_age Always - 37
195 Hardware_ECC_Recovered 0x001a 057 049 000 Old_age Always - 18666698
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 4278 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
|
|
|
Back to top |
|
|
anigel Bodhisattva
Joined: 14 Apr 2003 Posts: 1894 Location: Un petit bled pas loin de Limoges ;-)
|
Posted: Wed Apr 11, 2007 7:11 pm Post subject: |
|
|
Code: | SMART Error Log Version: 1
No Errors Logged |
Voilà ce que je voulais voir. A priori pas de souci à avoir donc. Ca ne te dispense pas de faire des backups réguliers toutefois ! _________________ Il y a 10 sortes d'individus en ce bas-monde : ceux qui causent binaire, et les autres. |
|
Back to top |
|
|
amaury.dg n00b
Joined: 05 Feb 2006 Posts: 38 Location: Montigny-Le-Tileul / Belgique
|
Posted: Wed Apr 11, 2007 7:30 pm Post subject: |
|
|
Je viens de remarquer que l'ID 1 et 195 ont les mêmes valeurs.....
Comme mit sur le lien précédants, il s'agirait donc du total des erreurs survenues et de celles corrigées, donc si il s'agit des même nombres...je ne dois pas m'inquiéter |
|
Back to top |
|
|
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Wed Apr 11, 2007 9:01 pm Post subject: |
|
|
J'ai déjà eu ma poussée d'adrénaline avec ce même paramètre sur mes DD, et tiens, comme par hasard, j'ai 2-3 exemplaires des 7200.7. Mais nada à signaler de leur côté, les tests ne reportent jamais d'erreur, et les check healths toujours OK. _________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
pathfinder l33t
Joined: 19 Jan 2006 Posts: 731 Location: Barcelona, Spain
|
Posted: Fri Apr 13, 2007 9:00 am Post subject: |
|
|
tente ceci pour pousser le test:
Code: | smartctl -d ata -t long /dev/sda |
et Code: |
smartctl -d ata -l selftest /dev/sda |
ou
Code: | smartctl -d ata -l error /dev/sda |
pour avoir le rapport. _________________ Cuando un tonto coge un camino, el camino se acaba, pero el tonto sigue |
|
Back to top |
|
|
|