View previous topic :: View next topic |
Author |
Message |
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Mon Aug 30, 2010 11:40 am Post subject: [OFF] Linux et les disques WD Green Caviar: warning!! |
|
|
Bon, ce WE j'ai installé un NAS (Synology, système sur base linux), et découvert avec horreur que les disques Western Digital Caviar Green ont un ENORME problème avec les OS linux: ils s'usent prématurément à cause de leur zèle à entrer et sortir d'un mode d'économie d'énergie (toutes les 8 secondes...).
C'est visible par une montée en flèche du compteur SMART LCC (193) Load Cycle Count quand le disque est idle.
Bref, c'est la fête, pour corriger çà il faut passer par un utilitaire DOS pour modifier un timer interne sur chaque disque.
Joie.
Perso, ça impacte mes disque "EARS" donc GP dernière génération, même fabriqués en juin de cette année...
Donc pas de disque Caviar Green dans des NAS, les gens, sauf si vous aimez vous habiller en cuir et qu'on vous surnomme "La Crampe"....
Quelques pointeurs:
http://forum.synology.com/enu/viewforum.php?f=124
http://community.wdc.com/t5/Desktop/Green-Caviar-High-Load-Cycle-Cout-after-short-operation-time/td-p/15731/highlight/true
http://www.naschenweng.info/2008/12/04/western-digital-you-and-your-green-drive _________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
boozo Advocate
Joined: 01 Jul 2004 Posts: 3193
|
|
Back to top |
|
|
Poussin l33t
Joined: 08 Jun 2007 Posts: 659 Location: Liège
|
Posted: Mon Aug 30, 2010 1:58 pm Post subject: |
|
|
Malheur! J'en ai 3 en RAID5 chez moi :s
Je mate ça en rentrant. Merci pour l'info
Edit: je devrais réinstaller un CACTI pour monitorer tout ça tiens... |
|
Back to top |
|
|
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Mon Aug 30, 2010 2:49 pm Post subject: |
|
|
boozo wrote: | 'alute
cela ne se tweake pas bien sur ces disques avec les commandes classiques ? (genre #hdparm -B "value" <device> ou un truc dans ce goût-là)
Edit: "value" equal "255" en fait :$ |
'lute!
Ben je ne connais pas tous les mécanismes introduits par WD pour diminuer la conso, mais si je comprends bien, passer par hdparm pour modifier APM vire tous ces mécanismes, pas uniquement celui responsable de la montée du LCC.
Modifier uniquement la valeur de Idle3 est alors moins bourrin, mais largement moins facile. Ceci dit, il semble y avoir une iso bootable faite par un utilisateur contenant un DOS de base (sans keyb, attention ) et avec l'utilitaire WD. Juste booté dessus pour voir, pas pu l'utiliser en vrai. _________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
guilc Bodhisattva
Joined: 15 Nov 2003 Posts: 3326 Location: Paris - France
|
Posted: Mon Aug 30, 2010 3:32 pm Post subject: |
|
|
Les caviar green ne sont pas les seuls affectés !
J'ai un WD Scorpio Blue dans mon laptop, même problème.
Perso, je le règle à coup de hdparm -B254, comme ça, il ne part plus en veille. Il faut juste penser à faire un "/etc/init.d/hdparm restart" au pm resume et à blacklister le module pm "harddrive" (sinon dès qu'on débranche/rebranche le secteur, rebelote, pm-utils change la valeur de hdparm -B...), mais sinon, ça marche bien _________________ Merci de respecter les règles du forum.
Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing |
|
Back to top |
|
|
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Mon Aug 30, 2010 4:07 pm Post subject: |
|
|
Hé bien mon serveur "maison" a un scorpio blue et un caviar green première génération, vous ne pouvez pas savoir dans quel état de béatitude je suis
Le caviar green (EACS) est dans un état "avancé":
Code: | ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 166 104 021 Pre-fail Always - 8666
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 551
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000e 200 200 051 Old_age Always - 0
9 Power_On_Hours 0x0032 072 072 000 Old_age Always - 20852 <<<<<<<
10 Spin_Retry_Count 0x0012 100 100 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 185
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 29
193 Load_Cycle_Count 0x0032 062 062 000 Old_age Always - 415774 <<<<<<<
194 Temperature_Celsius 0x0022 121 098 000 Old_age Always - 31
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 175
200 Multi_Zone_Error_Rate 0x0008 200 200 051 Old_age Offline - 0
|
Soit 20 LCC par heure.
Donc trop!
Et il ne supporte pas hdparm -Bxxx, non non, trop facile monsieur...
Mon scorpio blue plus récent (qq mois) est à 6 LCC/heures.
Logiquement trop aussi, mais moins, youpi...
Code: | ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 2
3 Spin_Up_Time 0x0027 185 184 021 Pre-fail Always - 1708
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 32
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 088 088 000 Old_age Always - 8798 <<<<<<<<<<<<<<<
10 Spin_Retry_Count 0x0033 100 253 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 31
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 13
193 Load_Cycle_Count 0x0032 183 183 000 Old_age Always - 52006 <<<<<<<<<<<<<<
194 Temperature_Celsius 0x0022 113 098 000 Old_age Always - 34
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 178
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 0
|
_________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
barul Guru
Joined: 28 May 2010 Posts: 434
|
Posted: Mon Aug 30, 2010 4:53 pm Post subject: |
|
|
Quelqu'un peut dire si les Caviar Blue sont touchés aussi? Je me suis pris ça pour mon desktop, et j'aimerais bien ne pas avoir de problèmes…
C'est inquiétant :/ |
|
Back to top |
|
|
Poussin l33t
Joined: 08 Jun 2007 Posts: 659 Location: Liège
|
Posted: Mon Aug 30, 2010 7:11 pm Post subject: |
|
|
Tiens, j'ai des valeurs bien plus basses:
Code: |
=== START OF INFORMATION SECTION ===
Device Model: WDC WD10EARS-22Y5B1
Serial Number: WD-WCAV5D282299
Firmware Version: 80.00A80
User Capacity: 1,000,204,886,016 bytes
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Mon Aug 30 21:07:41 2010 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 124 124 021 Pre-fail Always - 6766
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 28
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 855
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 27
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 4
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 2936
194 Temperature_Celsius 0x0022 120 111 000 Old_age Always - 27
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
|
|
|
Back to top |
|
|
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Mon Aug 30, 2010 7:17 pm Post subject: |
|
|
Le phénomène se produit quand les disques sont "idle", dans le cas contraire le timeout avant mise en veille ne se déclenche pas.
Tout dépend de la charge de ta machine, s'il s'agit d'un disque système, j'imagine que ça doit aider à la garder actif... _________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
guilc Bodhisattva
Joined: 15 Nov 2003 Posts: 3326 Location: Paris - France
|
Posted: Mon Aug 30, 2010 8:04 pm Post subject: |
|
|
El_Goretto wrote: | Le phénomène se produit quand les disques sont "idle", dans le cas contraire le timeout avant mise en veille ne se déclenche pas.
Tout dépend de la charge de ta machine, s'il s'agit d'un disque système, j'imagine que ça doit aider à la garder actif... |
Le problème c'est qu'un idle de 8s, c'est fréquent, mais passé ces 8 secondes, il y a très peu avant le reveil...
J'ai d'ailleurs constaté que ces parquage très rapides qu'imposent les firmwares des disques "verts" et "écologiques" ont un impact très négatif sur la réactivité du desktop : le disque passe son temps à déparquer, ce qui plombe sérieusement la réactivité de l'interface... _________________ Merci de respecter les règles du forum.
Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing |
|
Back to top |
|
|
Poussin l33t
Joined: 08 Jun 2007 Posts: 659 Location: Liège
|
Posted: Mon Aug 30, 2010 8:13 pm Post subject: |
|
|
boh... c'est juste un disque de données (enfin 1 des 3 disques du raid). Ce n'est pas du tout un disque système. |
|
Back to top |
|
|
Chr0nos Apprentice
Joined: 26 Feb 2010 Posts: 205
|
Posted: Tue Aug 31, 2010 5:00 pm Post subject: |
|
|
hum j'ai:
Quote: | BlackPearl htdocs # hdparm -B 255 /dev/sda
/dev/sda:
setting Advanced Power Management level to disabled
HDIO_DRIVE_CMD failed: Input/output error
APM_level = not supported
|
c'est bon signe ou pas ?
car en disques j'ai:
Quote: | BlackPearl htdocs # fdisk -l
Disque /dev/hda: 82.0 Go, 81964302336 octets
255 têtes, 63 secteurs/piste, 9964 cylindres, total 160086528 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0xf239f239
Périphérique Amorce Début Fin Blocs Id Système
/dev/hda1 63 158143859 79071898+ 83 Linux
/dev/hda2 158143860 160071659 963900 82 Linux swap / Solaris
Disque /dev/sda: 2000.4 Go, 2000398934016 octets
255 têtes, 63 secteurs/piste, 243201 cylindres, total 3907029168 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x00039a68
Périphérique Amorce Début Fin Blocs Id Système
/dev/sda1 63 3907024064 1953512001 83 Linux
Disque /dev/sdb: 1000.2 Go, 1000204886016 octets
255 têtes, 63 secteurs/piste, 121601 cylindres, total 1953525168 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x00067d46
Périphérique Amorce Début Fin Blocs Id Système
/dev/sdb1 63 1953520064 976760001 83 Linux
Disque /dev/sdc: 1000.2 Go, 1000204886016 octets
255 têtes, 63 secteurs/piste, 121601 cylindres, total 1953525168 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x000df9ae
Périphérique Amorce Début Fin Blocs Id Système
/dev/sdc1 63 1953520064 976760001 83 Linux
Disque /dev/sdd: 1500.3 Go, 1500301910016 octets
255 têtes, 63 secteurs/piste, 182401 cylindres, total 2930277168 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x00012cd1
Périphérique Amorce Début Fin Blocs Id Système
/dev/sdd1 63 2930272064 1465136001 83 Linux
Disque /dev/sde: 320.1 Go, 320072933376 octets
255 têtes, 63 secteurs/piste, 38913 cylindres, total 625142448 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x755eec05
Périphérique Amorce Début Fin Blocs Id Système
/dev/sde1 63 625040954 312520446 83 Linux
/dev/sde2 * 625040955 625137344 48195 83 Linux
|
|
|
Back to top |
|
|
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Tue Aug 31, 2010 5:42 pm Post subject: |
|
|
@Chr0nos: à part la taille de tes disques, on ne voit pas grand chose...
Install smarttools (ou un truc du genre) et affiche toutes les valeurs.
Et fait ton calcul LCC/Heure. _________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
guilc Bodhisattva
Joined: 15 Nov 2003 Posts: 3326 Location: Paris - France
|
Posted: Tue Aug 31, 2010 6:52 pm Post subject: |
|
|
Chr0nos wrote: | hum j'ai:
Quote: | BlackPearl htdocs # hdparm -B 255 /dev/sda
/dev/sda:
setting Advanced Power Management level to disabled
HDIO_DRIVE_CMD failed: Input/output error
APM_level = not supported
|
c'est bon signe ou pas ? |
Ca veut dire que le disque ne supporte pas la gestion d'econnomie d'énergie. Donc à priori, il ne devrait pas être affecté par ce souci (qui est présent pour les modèles concernés quand le paramètre est < 254) _________________ Merci de respecter les règles du forum.
Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing |
|
Back to top |
|
|
Chr0nos Apprentice
Joined: 26 Feb 2010 Posts: 205
|
Posted: Tue Aug 31, 2010 10:42 pm Post subject: |
|
|
ben deja pour le premier disque:
Quote: | BlackPearl htdocs # smartctl --all /dev/sda
smartctl 5.39.1 2010-01-28 r3054 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Device Model: WDC WD20EARS-00S8B1
Serial Number: WD-WCAVY3672528
Firmware Version: 80.00A80
User Capacity: 2 000 398 934 016 bytes
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Wed Sep 1 00:42:23 2010 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (39960) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 255) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x3031) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 244 192 021 Pre-fail Always - 4783
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 53
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 2282
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 52
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 46
193 Load_Cycle_Count 0x0032 199 199 000 Old_age Always - 5987
194 Temperature_Celsius 0x0022 117 100 000 Old_age Always - 35
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
|
|
|
Back to top |
|
|
geforce l33t
Joined: 29 Dec 2003 Posts: 654 Location: Canada
|
Posted: Mon Oct 04, 2010 1:23 pm Post subject: |
|
|
Exactement le même problème ici.
J'ai monté un serveur Linux avec ZFS-Fuse et un DAS SansDigital TRM-8B avec 3 WD20EADS. Avoir su...
Code: | root@fishtank:/# smartctl -d ata -a /dev/sda | grep 193
193 Load_Cycle_Count 0x0032 185 185 000 Old_age Always - 47659
root@fishtank:/# smartctl -d ata -a /dev/sdc | grep 193
193 Load_Cycle_Count 0x0032 180 180 000 Old_age Always - 62706
root@fishtank:/# smartctl -d ata -a /dev/sdd | grep 193
193 Load_Cycle_Count 0x0032 181 181 000 Old_age Always - 59379
root@fishtank:/# smartctl -d ata -a /dev/sde | grep 193
193 Load_Cycle_Count 0x0032 181 181 000 Old_age Always - 59662 |
Les disques ont moins de 3 mois d'utilisation.
J'ai rien vu venir avant que zfs pool status me rapporte des problèmes de checksum:
Code: |
root@fishtank:/# zpool status BigPool
pool: BigPool
state: ONLINE
status: One or more devices has experienced an unrecoverable error. An
attempt was made to correct the error. Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
using 'zpool clear' or replace the device with 'zpool replace'.
see: http://www.sun.com/msg/ZFS-8000-9P
scrub: scrub completed after 4h16m with 0 errors on Sun Oct 3 20:27:23 2010
config:
NAME STATE READ WRITE CKSUM
BigPool ONLINE 0 0 0
raidz1-0 ONLINE 0 0 0
sdc ONLINE 0 0 9
sde ONLINE 0 0 3
sdd ONLINE 0 0 7
errors: No known data errors
|
Et ça continue à monter...
J'hésite à considérer ça comme quoi les disques meurent tranquillement et que je devrais tous les retourner à WD sous la garantie.
Sinon j'applique le fix tout de suite, mais j'ai cru lire quelque part que ça annulait la garantie ?? (à vérifier)
L'utilitaire de WD est ici: http://support.wdc.com/product/download.asp?groupid=609&sid=113&lang=en |
|
Back to top |
|
|
guilc Bodhisattva
Joined: 15 Nov 2003 Posts: 3326 Location: Paris - France
|
Posted: Mon Oct 04, 2010 3:11 pm Post subject: |
|
|
geforce wrote: | Les disques ont moins de 3 mois d'utilisation.
J'ai rien vu venir avant que zfs pool status me rapporte des problèmes de checksum: |
Aucun rapport, même si ces valeurs de LCC sont élevées, et indiquent effectivement que ça parque/déparque beaucoup trop souvent pour 3 mois d'utilisation, c'est des valeurs qui sont de toute manière très inférieures aux valeurs maximales "prévues" par les constructeurs.
De mémoire, on parle de 300 000 parquages prévus pour un disque.
Tes erreurs de checksum viennent d'ailleurs
Quote: | J'hésite à considérer ça comme quoi les disques meurent tranquillement et que je devrais tous les retourner à WD sous la garantie. |
Un LLC qui monte ne sera pas pris en garantie... Et pour avoir eu affaire à eux, il faut un peu plus que ça dans le rapport smart pour qu'ils acceptent le disque en garantie.
Il vaut mieux leur montrer des trucs du genre :
- Current_Pending_Sector > 0
- test extended en KO
Quote: | Sinon j'applique le fix tout de suite, mais j'ai cru lire quelque part que ça annulait la garantie ?? (à vérifier) |
Quel fix ? changer la valeur du paramètre d'APM (hdparm -B) ? Et depuis quand ça ferait sauter la garantie ??? C'est un paramètre fait pour être modifié... _________________ Merci de respecter les règles du forum.
Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing |
|
Back to top |
|
|
geforce l33t
Joined: 29 Dec 2003 Posts: 654 Location: Canada
|
Posted: Mon Oct 04, 2010 3:34 pm Post subject: |
|
|
guilc wrote: | geforce wrote: | Les disques ont moins de 3 mois d'utilisation.
J'ai rien vu venir avant que zfs pool status me rapporte des problèmes de checksum: |
Aucun rapport, même si ces valeurs de LCC sont élevées, et indiquent effectivement que ça parque/déparque beaucoup trop souvent pour 3 mois d'utilisation, c'est des valeurs qui sont de toute manière très inférieures aux valeurs maximales "prévues" par les constructeurs.
De mémoire, on parle de 300 000 parquages prévus pour un disque.
Tes erreurs de checksum viennent d'ailleurs
|
Peut être très inférieures aux valeurs maximales prévues, mais > 50 000 en 3 mois c'est beaucoup et j'ai pas envie de laisser ça aller à ce train.
Et j'ai jamais dit que les erreurs de checksum venaient des LCC, mais que j'ai remarqué les LCC à cause des checksum.
guilc wrote: |
Quote: | J'hésite à considérer ça comme quoi les disques meurent tranquillement et que je devrais tous les retourner à WD sous la garantie. |
Un LLC qui monte ne sera pas pris en garantie... Et pour avoir eu affaire à eux, il faut un peu plus que ça dans le rapport smart pour qu'ils acceptent le disque en garantie.
Il vaut mieux leur montrer des trucs du genre :
- Current_Pending_Sector > 0
- test extended en KO
Quote: | Sinon j'applique le fix tout de suite, mais j'ai cru lire quelque part que ça annulait la garantie ?? (à vérifier) |
Quel fix ? changer la valeur du paramètre d'APM (hdparm -B) ? Et depuis quand ça ferait sauter la garantie ??? C'est un paramètre fait pour être modifié... |
Non, hdparm -B est inutile. Le disque ne supporte pas APM.
Code: | root@fishtank:~# hdparm -B 255 /dev/sdc
/dev/sdc:
setting Advanced Power Management level to disabled
HDIO_DRIVE_CMD failed: Input/output error
APM_level = not supported
|
Je parlais du soft que WD fourni (j'ai mis le lien dans mon précédent post). Mais de toute façon j'ai lu trop vite il s'agissait d'un post de 2002, et non l'outil ne va pas annuler la garantie. |
|
Back to top |
|
|
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Mon Oct 04, 2010 5:11 pm Post subject: |
|
|
Perso, j'ai utilisé ce misérable utilitaire fourni très aimablement par WD sur 2 disques tous neufs, en prenant l'ISO dont j'ai déjà donné le lien.
Cela a au moins résolu ce problème de LCC surexité.
Plus jamais de green caviar pour bibi. Ni de scorpio non plus alors. _________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Thu Oct 07, 2010 12:54 pm Post subject: |
|
|
guilc wrote: | Les caviar green ne sont pas les seuls affectés !
J'ai un WD Scorpio Blue dans mon laptop, même problème.
Perso, je le règle à coup de hdparm -B254, comme ça, il ne part plus en veille. |
Confirmé par les 900 dernières heures de fonctionnement de mon scorpio blue (WD5000BEVT), pas d'augmentation du LCC avec cette astuce.
Par contre, le Green Caviar première génération (WD10EACS) refusant ce type de commande est toujours à 5,7 LCC par heure sur les 900 dernières heures. _________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
Kernald n00b
Joined: 03 Jan 2010 Posts: 18
|
Posted: Sun Oct 10, 2010 12:27 pm Post subject: |
|
|
Salut,
J'ai commencé à avoir peur en lisant ça, ayant un raid5 de 3 WD Blue…
Code: | Naiade ~ # smartctl -d ata -a /dev/sda | grep 193
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 15
Naiade ~ # ^sda^sdb^
smartctl -d ata -a /dev/sdb | grep 193
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 15
Naiade ~ # ^sdb^sdc^
smartctl -d ata -a /dev/sdc | grep 193
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 15 |
Les trois disques sont identiques :
Code: | === START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar Blue Serial ATA family
Device Model: WDC WD5000AAKS-007AA0
Serial Number: WD-WCATR2261045
Firmware Version: 05.01D05 |
Et ils en sont à un poil moins de 400h de fonctionnement, soit, si je lis bien la sortie de hdparm, bien moins d'un LCC par heure ?
De même, j'ai un Caviar Green pour du stockage, qui lui a plus de 8700h derrière lui :
Code: | Model Family: Western Digital Caviar Green family
Device Model: WDC WD10EADS-65L5B1
Serial Number: WD-WCAU4C119127
Firmware Version: 01.01A01
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 608 |
Soit là non plus rien de bien inquiétant… J'en ai un autre, en externe, le SMART ne passe pas dessus, je peux donc pas vérifier.
Par contre, sur mon netbook, là, c'est bien plus violent…
Code: | Model Family: Western Digital Scorpio Blue Serial ATA family
Device Model: WDC WD2500BEVT-75A23T0
Serial Number: WD-WX91A5086781
Firmware Version: 01.01A01
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 311
193 Load_Cycle_Count 0x0032 192 192 000 Old_age Always - 24193 |
Les Caviar Blue n'ont donc pas l'air touchés, de même que les anciens Caviar Green… Je testerais l'utilitaire de WD, voir si ça change quelque chose sur le Scorpio Blue. |
|
Back to top |
|
|
NEOxAKIRA Guru
Joined: 20 May 2007 Posts: 302 Location: France
|
Posted: Fri Oct 15, 2010 7:42 am Post subject: |
|
|
Code: | # smartctl -d ata -a /dev/sdd | grep 193
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 760
# smartctl -d ata -a /dev/sde | grep 193
193 Load_Cycle_Count 0x0032 170 170 000 Old_age Always - 90118 |
le 1er je l'ai installé hier, le 2ieme ca doit faire un an que je l'ai, que faire ? |
|
Back to top |
|
|
El_Goretto Moderator
Joined: 29 May 2004 Posts: 3174 Location: Paris
|
Posted: Fri Oct 15, 2010 7:56 am Post subject: |
|
|
Lire les posts précédents? _________________ -TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT) |
|
Back to top |
|
|
NEOxAKIRA Guru
Joined: 20 May 2007 Posts: 302 Location: France
|
Posted: Fri Oct 15, 2010 8:16 am Post subject: |
|
|
mais
empêche les disques de se mettre en veille ? |
|
Back to top |
|
|
guilc Bodhisattva
Joined: 15 Nov 2003 Posts: 3326 Location: Paris - France
|
Posted: Fri Oct 15, 2010 3:08 pm Post subject: |
|
|
On va être gentil mais, heu, c'est quand même écrit dans la page man hein :
- 254 = laisse APM activé mais interdit le spin-down
- 255 = désactive APM (et conséquence, interdit le spin-down aussi), sachant que la page man indique aussi que tous les disques ne supportent pas 255 (alors que 254 visiblement oui) _________________ Merci de respecter les règles du forum.
Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing |
|
Back to top |
|
|
|