Gentoo Forums
Gentoo Forums
Gentoo Forums
Quick Search: in
[OFF] Linux et les disques WD Green Caviar: warning!!
View unanswered posts
View posts from last 24 hours

Goto page 1, 2  Next  
Reply to topic    Gentoo Forums Forum Index French
View previous topic :: View next topic  
Author Message
El_Goretto
Moderator
Moderator


Joined: 29 May 2004
Posts: 3174
Location: Paris

PostPosted: Mon Aug 30, 2010 11:40 am    Post subject: [OFF] Linux et les disques WD Green Caviar: warning!! Reply with quote

Bon, ce WE j'ai installé un NAS (Synology, système sur base linux), et découvert avec horreur que les disques Western Digital Caviar Green ont un ENORME problème avec les OS linux: ils s'usent prématurément à cause de leur zèle à entrer et sortir d'un mode d'économie d'énergie (toutes les 8 secondes...).
C'est visible par une montée en flèche du compteur SMART LCC (193) Load Cycle Count quand le disque est idle.

Bref, c'est la fête, pour corriger çà il faut passer par un utilitaire DOS pour modifier un timer interne sur chaque disque.

Joie.

Perso, ça impacte mes disque "EARS" donc GP dernière génération, même fabriqués en juin de cette année...
Donc pas de disque Caviar Green dans des NAS, les gens, sauf si vous aimez vous habiller en cuir et qu'on vous surnomme "La Crampe".... :)

Quelques pointeurs:
http://forum.synology.com/enu/viewforum.php?f=124
http://community.wdc.com/t5/Desktop/Green-Caviar-High-Load-Cycle-Cout-after-short-operation-time/td-p/15731/highlight/true
http://www.naschenweng.info/2008/12/04/western-digital-you-and-your-green-drive
_________________
-TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT)
Back to top
View user's profile Send private message
boozo
Advocate
Advocate


Joined: 01 Jul 2004
Posts: 3193

PostPosted: Mon Aug 30, 2010 12:22 pm    Post subject: Reply with quote

'alute

cela ne se tweake pas bien sur ces disques avec les commandes classiques ? (genre #hdparm -B "value" <device> ou un truc dans ce goût-là)

Edit: "value" equal "255" en fait :$
_________________
" Un psychotique, c'est quelqu'un qui croit dur comme fer que 2 et 2 font 5, et qui en est pleinement satisfait.
Un névrosé, c'est quelqu'un qui sait pertinemment que 2 et 2 font 4, et ça le rend malade ! "
Back to top
View user's profile Send private message
Poussin
l33t
l33t


Joined: 08 Jun 2007
Posts: 659
Location: Liège

PostPosted: Mon Aug 30, 2010 1:58 pm    Post subject: Reply with quote

Malheur! J'en ai 3 en RAID5 chez moi :s

Je mate ça en rentrant. Merci pour l'info

Edit: je devrais réinstaller un CACTI pour monitorer tout ça tiens...
Back to top
View user's profile Send private message
El_Goretto
Moderator
Moderator


Joined: 29 May 2004
Posts: 3174
Location: Paris

PostPosted: Mon Aug 30, 2010 2:49 pm    Post subject: Reply with quote

boozo wrote:
'alute

cela ne se tweake pas bien sur ces disques avec les commandes classiques ? (genre #hdparm -B "value" <device> ou un truc dans ce goût-là)

Edit: "value" equal "255" en fait :$

'lute!

Ben je ne connais pas tous les mécanismes introduits par WD pour diminuer la conso, mais si je comprends bien, passer par hdparm pour modifier APM vire tous ces mécanismes, pas uniquement celui responsable de la montée du LCC.
Modifier uniquement la valeur de Idle3 est alors moins bourrin, mais largement moins facile. Ceci dit, il semble y avoir une iso bootable faite par un utilisateur contenant un DOS de base (sans keyb, attention :)) et avec l'utilitaire WD. Juste booté dessus pour voir, pas pu l'utiliser en vrai.
_________________
-TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT)
Back to top
View user's profile Send private message
guilc
Bodhisattva
Bodhisattva


Joined: 15 Nov 2003
Posts: 3326
Location: Paris - France

PostPosted: Mon Aug 30, 2010 3:32 pm    Post subject: Reply with quote

Les caviar green ne sont pas les seuls affectés !
J'ai un WD Scorpio Blue dans mon laptop, même problème.

Perso, je le règle à coup de hdparm -B254, comme ça, il ne part plus en veille. Il faut juste penser à faire un "/etc/init.d/hdparm restart" au pm resume et à blacklister le module pm "harddrive" (sinon dès qu'on débranche/rebranche le secteur, rebelote, pm-utils change la valeur de hdparm -B...), mais sinon, ça marche bien :)
_________________
Merci de respecter les règles du forum.

Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing
Back to top
View user's profile Send private message
El_Goretto
Moderator
Moderator


Joined: 29 May 2004
Posts: 3174
Location: Paris

PostPosted: Mon Aug 30, 2010 4:07 pm    Post subject: Reply with quote

Hé bien mon serveur "maison" a un scorpio blue et un caviar green première génération, vous ne pouvez pas savoir dans quel état de béatitude je suis :evil:

Le caviar green (EACS) est dans un état "avancé":
Code:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0003   166   104   021    Pre-fail  Always       -       8666
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       551
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000e   200   200   051    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       20852   <<<<<<<
 10 Spin_Retry_Count        0x0012   100   100   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   051    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       185
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       29
193 Load_Cycle_Count        0x0032   062   062   000    Old_age   Always       -       415774   <<<<<<<
194 Temperature_Celsius     0x0022   121   098   000    Old_age   Always       -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       175
200 Multi_Zone_Error_Rate   0x0008   200   200   051    Old_age   Offline      -       0

Soit 20 LCC par heure.
Donc trop!
Et il ne supporte pas hdparm -Bxxx, non non, trop facile monsieur...

Mon scorpio blue plus récent (qq mois) est à 6 LCC/heures.
Logiquement trop aussi, mais moins, youpi...
Code:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       2
  3 Spin_Up_Time            0x0027   185   184   021    Pre-fail  Always       -       1708
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       32
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   088   088   000    Old_age   Always       -       8798     <<<<<<<<<<<<<<<
 10 Spin_Retry_Count        0x0033   100   253   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       31
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       13
193 Load_Cycle_Count        0x0032   183   183   000    Old_age   Always       -       52006   <<<<<<<<<<<<<<
194 Temperature_Celsius     0x0022   113   098   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       178
200 Multi_Zone_Error_Rate   0x0009   200   200   051    Pre-fail  Offline      -       0

_________________
-TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT)
Back to top
View user's profile Send private message
barul
Guru
Guru


Joined: 28 May 2010
Posts: 434

PostPosted: Mon Aug 30, 2010 4:53 pm    Post subject: Reply with quote

Quelqu'un peut dire si les Caviar Blue sont touchés aussi? Je me suis pris ça pour mon desktop, et j'aimerais bien ne pas avoir de problèmes…

C'est inquiétant :/
Back to top
View user's profile Send private message
Poussin
l33t
l33t


Joined: 08 Jun 2007
Posts: 659
Location: Liège

PostPosted: Mon Aug 30, 2010 7:11 pm    Post subject: Reply with quote

Tiens, j'ai des valeurs bien plus basses:

Code:

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD10EARS-22Y5B1
Serial Number:    WD-WCAV5D282299
Firmware Version: 80.00A80
User Capacity:    1,000,204,886,016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Mon Aug 30 21:07:41 2010 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   124   124   021    Pre-fail  Always       -       6766
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       28
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       855
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       27
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       4
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       2936
194 Temperature_Celsius     0x0022   120   111   000    Old_age   Always       -       27
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0




Back to top
View user's profile Send private message
El_Goretto
Moderator
Moderator


Joined: 29 May 2004
Posts: 3174
Location: Paris

PostPosted: Mon Aug 30, 2010 7:17 pm    Post subject: Reply with quote

Le phénomène se produit quand les disques sont "idle", dans le cas contraire le timeout avant mise en veille ne se déclenche pas.
Tout dépend de la charge de ta machine, s'il s'agit d'un disque système, j'imagine que ça doit aider à la garder actif...
_________________
-TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT)
Back to top
View user's profile Send private message
guilc
Bodhisattva
Bodhisattva


Joined: 15 Nov 2003
Posts: 3326
Location: Paris - France

PostPosted: Mon Aug 30, 2010 8:04 pm    Post subject: Reply with quote

El_Goretto wrote:
Le phénomène se produit quand les disques sont "idle", dans le cas contraire le timeout avant mise en veille ne se déclenche pas.
Tout dépend de la charge de ta machine, s'il s'agit d'un disque système, j'imagine que ça doit aider à la garder actif...

Le problème c'est qu'un idle de 8s, c'est fréquent, mais passé ces 8 secondes, il y a très peu avant le reveil...
J'ai d'ailleurs constaté que ces parquage très rapides qu'imposent les firmwares des disques "verts" et "écologiques" ont un impact très négatif sur la réactivité du desktop : le disque passe son temps à déparquer, ce qui plombe sérieusement la réactivité de l'interface...
_________________
Merci de respecter les règles du forum.

Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing
Back to top
View user's profile Send private message
Poussin
l33t
l33t


Joined: 08 Jun 2007
Posts: 659
Location: Liège

PostPosted: Mon Aug 30, 2010 8:13 pm    Post subject: Reply with quote

boh... c'est juste un disque de données (enfin 1 des 3 disques du raid). Ce n'est pas du tout un disque système.
Back to top
View user's profile Send private message
Chr0nos
Apprentice
Apprentice


Joined: 26 Feb 2010
Posts: 205

PostPosted: Tue Aug 31, 2010 5:00 pm    Post subject: Reply with quote

hum j'ai:
Quote:
BlackPearl htdocs # hdparm -B 255 /dev/sda

/dev/sda:
setting Advanced Power Management level to disabled
HDIO_DRIVE_CMD failed: Input/output error
APM_level = not supported


c'est bon signe ou pas ?

car en disques j'ai:

Quote:
BlackPearl htdocs # fdisk -l

Disque /dev/hda: 82.0 Go, 81964302336 octets
255 têtes, 63 secteurs/piste, 9964 cylindres, total 160086528 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0xf239f239

Périphérique Amorce Début Fin Blocs Id Système
/dev/hda1 63 158143859 79071898+ 83 Linux
/dev/hda2 158143860 160071659 963900 82 Linux swap / Solaris

Disque /dev/sda: 2000.4 Go, 2000398934016 octets
255 têtes, 63 secteurs/piste, 243201 cylindres, total 3907029168 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x00039a68

Périphérique Amorce Début Fin Blocs Id Système
/dev/sda1 63 3907024064 1953512001 83 Linux

Disque /dev/sdb: 1000.2 Go, 1000204886016 octets
255 têtes, 63 secteurs/piste, 121601 cylindres, total 1953525168 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x00067d46

Périphérique Amorce Début Fin Blocs Id Système
/dev/sdb1 63 1953520064 976760001 83 Linux

Disque /dev/sdc: 1000.2 Go, 1000204886016 octets
255 têtes, 63 secteurs/piste, 121601 cylindres, total 1953525168 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x000df9ae

Périphérique Amorce Début Fin Blocs Id Système
/dev/sdc1 63 1953520064 976760001 83 Linux

Disque /dev/sdd: 1500.3 Go, 1500301910016 octets
255 têtes, 63 secteurs/piste, 182401 cylindres, total 2930277168 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x00012cd1

Périphérique Amorce Début Fin Blocs Id Système
/dev/sdd1 63 2930272064 1465136001 83 Linux

Disque /dev/sde: 320.1 Go, 320072933376 octets
255 têtes, 63 secteurs/piste, 38913 cylindres, total 625142448 secteurs
Unités = secteurs de 1 * 512 = 512 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x755eec05

Périphérique Amorce Début Fin Blocs Id Système
/dev/sde1 63 625040954 312520446 83 Linux
/dev/sde2 * 625040955 625137344 48195 83 Linux
Back to top
View user's profile Send private message
El_Goretto
Moderator
Moderator


Joined: 29 May 2004
Posts: 3174
Location: Paris

PostPosted: Tue Aug 31, 2010 5:42 pm    Post subject: Reply with quote

@Chr0nos: à part la taille de tes disques, on ne voit pas grand chose...
Install smarttools (ou un truc du genre) et affiche toutes les valeurs.
Et fait ton calcul LCC/Heure.
_________________
-TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT)
Back to top
View user's profile Send private message
guilc
Bodhisattva
Bodhisattva


Joined: 15 Nov 2003
Posts: 3326
Location: Paris - France

PostPosted: Tue Aug 31, 2010 6:52 pm    Post subject: Reply with quote

Chr0nos wrote:
hum j'ai:
Quote:
BlackPearl htdocs # hdparm -B 255 /dev/sda

/dev/sda:
setting Advanced Power Management level to disabled
HDIO_DRIVE_CMD failed: Input/output error
APM_level = not supported


c'est bon signe ou pas ?

Ca veut dire que le disque ne supporte pas la gestion d'econnomie d'énergie. Donc à priori, il ne devrait pas être affecté par ce souci (qui est présent pour les modèles concernés quand le paramètre est < 254)
_________________
Merci de respecter les règles du forum.

Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing
Back to top
View user's profile Send private message
Chr0nos
Apprentice
Apprentice


Joined: 26 Feb 2010
Posts: 205

PostPosted: Tue Aug 31, 2010 10:42 pm    Post subject: Reply with quote

ben deja pour le premier disque:
Quote:
BlackPearl htdocs # smartctl --all /dev/sda
smartctl 5.39.1 2010-01-28 r3054 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model: WDC WD20EARS-00S8B1
Serial Number: WD-WCAVY3672528
Firmware Version: 80.00A80
User Capacity: 2 000 398 934 016 bytes
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Wed Sep 1 00:42:23 2010 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (39960) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 255) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x3031) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 244 192 021 Pre-fail Always - 4783
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 53
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 2282
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 52
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 46
193 Load_Cycle_Count 0x0032 199 199 000 Old_age Always - 5987
194 Temperature_Celsius 0x0022 117 100 000 Old_age Always - 35
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Back to top
View user's profile Send private message
geforce
l33t
l33t


Joined: 29 Dec 2003
Posts: 654
Location: Canada

PostPosted: Mon Oct 04, 2010 1:23 pm    Post subject: Reply with quote

Exactement le même problème ici.
J'ai monté un serveur Linux avec ZFS-Fuse et un DAS SansDigital TRM-8B avec 3 WD20EADS. Avoir su...

Code:
root@fishtank:/# smartctl -d ata -a /dev/sda | grep 193
193 Load_Cycle_Count        0x0032   185   185   000    Old_age   Always       -       47659
root@fishtank:/# smartctl -d ata -a /dev/sdc | grep 193
193 Load_Cycle_Count        0x0032   180   180   000    Old_age   Always       -       62706
root@fishtank:/# smartctl -d ata -a /dev/sdd | grep 193
193 Load_Cycle_Count        0x0032   181   181   000    Old_age   Always       -       59379
root@fishtank:/# smartctl -d ata -a /dev/sde | grep 193
193 Load_Cycle_Count        0x0032   181   181   000    Old_age   Always       -       59662


Les disques ont moins de 3 mois d'utilisation.
J'ai rien vu venir avant que zfs pool status me rapporte des problèmes de checksum:

Code:

root@fishtank:/# zpool status BigPool
  pool: BigPool
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://www.sun.com/msg/ZFS-8000-9P
 scrub: scrub completed after 4h16m with 0 errors on Sun Oct  3 20:27:23 2010
config:

        NAME                STATE     READ WRITE CKSUM
        BigPool              ONLINE       0     0     0
          raidz1-0           ONLINE       0     0     0
            sdc                ONLINE       0     0     9
            sde                ONLINE       0     0     3
            sdd                ONLINE       0     0     7

errors: No known data errors

Et ça continue à monter...
J'hésite à considérer ça comme quoi les disques meurent tranquillement et que je devrais tous les retourner à WD sous la garantie.
Sinon j'applique le fix tout de suite, mais j'ai cru lire quelque part que ça annulait la garantie ?? (à vérifier)


L'utilitaire de WD est ici: http://support.wdc.com/product/download.asp?groupid=609&sid=113&lang=en
Back to top
View user's profile Send private message
guilc
Bodhisattva
Bodhisattva


Joined: 15 Nov 2003
Posts: 3326
Location: Paris - France

PostPosted: Mon Oct 04, 2010 3:11 pm    Post subject: Reply with quote

geforce wrote:
Les disques ont moins de 3 mois d'utilisation.
J'ai rien vu venir avant que zfs pool status me rapporte des problèmes de checksum:

Aucun rapport, même si ces valeurs de LCC sont élevées, et indiquent effectivement que ça parque/déparque beaucoup trop souvent pour 3 mois d'utilisation, c'est des valeurs qui sont de toute manière très inférieures aux valeurs maximales "prévues" par les constructeurs.
De mémoire, on parle de 300 000 parquages prévus pour un disque.
Tes erreurs de checksum viennent d'ailleurs

Quote:
J'hésite à considérer ça comme quoi les disques meurent tranquillement et que je devrais tous les retourner à WD sous la garantie.

Un LLC qui monte ne sera pas pris en garantie... Et pour avoir eu affaire à eux, il faut un peu plus que ça dans le rapport smart pour qu'ils acceptent le disque en garantie.
Il vaut mieux leur montrer des trucs du genre :
- Current_Pending_Sector > 0
- test extended en KO

Quote:
Sinon j'applique le fix tout de suite, mais j'ai cru lire quelque part que ça annulait la garantie ?? (à vérifier)

Quel fix ? changer la valeur du paramètre d'APM (hdparm -B) ? Et depuis quand ça ferait sauter la garantie ??? C'est un paramètre fait pour être modifié...
_________________
Merci de respecter les règles du forum.

Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing
Back to top
View user's profile Send private message
geforce
l33t
l33t


Joined: 29 Dec 2003
Posts: 654
Location: Canada

PostPosted: Mon Oct 04, 2010 3:34 pm    Post subject: Reply with quote

guilc wrote:
geforce wrote:
Les disques ont moins de 3 mois d'utilisation.
J'ai rien vu venir avant que zfs pool status me rapporte des problèmes de checksum:

Aucun rapport, même si ces valeurs de LCC sont élevées, et indiquent effectivement que ça parque/déparque beaucoup trop souvent pour 3 mois d'utilisation, c'est des valeurs qui sont de toute manière très inférieures aux valeurs maximales "prévues" par les constructeurs.
De mémoire, on parle de 300 000 parquages prévus pour un disque.
Tes erreurs de checksum viennent d'ailleurs

Peut être très inférieures aux valeurs maximales prévues, mais > 50 000 en 3 mois c'est beaucoup et j'ai pas envie de laisser ça aller à ce train.
Et j'ai jamais dit que les erreurs de checksum venaient des LCC, mais que j'ai remarqué les LCC à cause des checksum.

guilc wrote:

Quote:
J'hésite à considérer ça comme quoi les disques meurent tranquillement et que je devrais tous les retourner à WD sous la garantie.

Un LLC qui monte ne sera pas pris en garantie... Et pour avoir eu affaire à eux, il faut un peu plus que ça dans le rapport smart pour qu'ils acceptent le disque en garantie.
Il vaut mieux leur montrer des trucs du genre :
- Current_Pending_Sector > 0
- test extended en KO

Quote:
Sinon j'applique le fix tout de suite, mais j'ai cru lire quelque part que ça annulait la garantie ?? (à vérifier)

Quel fix ? changer la valeur du paramètre d'APM (hdparm -B) ? Et depuis quand ça ferait sauter la garantie ??? C'est un paramètre fait pour être modifié...

Non, hdparm -B est inutile. Le disque ne supporte pas APM.
Code:
root@fishtank:~# hdparm -B 255 /dev/sdc

/dev/sdc:
 setting Advanced Power Management level to disabled
 HDIO_DRIVE_CMD failed: Input/output error
 APM_level    = not supported

Je parlais du soft que WD fourni (j'ai mis le lien dans mon précédent post). Mais de toute façon j'ai lu trop vite il s'agissait d'un post de 2002, et non l'outil ne va pas annuler la garantie.
Back to top
View user's profile Send private message
El_Goretto
Moderator
Moderator


Joined: 29 May 2004
Posts: 3174
Location: Paris

PostPosted: Mon Oct 04, 2010 5:11 pm    Post subject: Reply with quote

Perso, j'ai utilisé ce misérable utilitaire fourni très aimablement par WD sur 2 disques tous neufs, en prenant l'ISO dont j'ai déjà donné le lien.
Cela a au moins résolu ce problème de LCC surexité.

Plus jamais de green caviar pour bibi. Ni de scorpio non plus alors.
_________________
-TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT)
Back to top
View user's profile Send private message
El_Goretto
Moderator
Moderator


Joined: 29 May 2004
Posts: 3174
Location: Paris

PostPosted: Thu Oct 07, 2010 12:54 pm    Post subject: Reply with quote

guilc wrote:
Les caviar green ne sont pas les seuls affectés !
J'ai un WD Scorpio Blue dans mon laptop, même problème.

Perso, je le règle à coup de hdparm -B254, comme ça, il ne part plus en veille.

Confirmé par les 900 dernières heures de fonctionnement de mon scorpio blue (WD5000BEVT), pas d'augmentation du LCC avec cette astuce.
Par contre, le Green Caviar première génération (WD10EACS) refusant ce type de commande est toujours à 5,7 LCC par heure sur les 900 dernières heures.
_________________
-TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT)
Back to top
View user's profile Send private message
Kernald
n00b
n00b


Joined: 03 Jan 2010
Posts: 18

PostPosted: Sun Oct 10, 2010 12:27 pm    Post subject: Reply with quote

Salut,
J'ai commencé à avoir peur en lisant ça, ayant un raid5 de 3 WD Blue…
Code:
Naiade ~ # smartctl -d ata -a /dev/sda | grep 193
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       15
Naiade ~ # ^sda^sdb^
smartctl -d ata -a /dev/sdb | grep 193
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       15
Naiade ~ # ^sdb^sdc^
smartctl -d ata -a /dev/sdc | grep 193
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       15

Les trois disques sont identiques :
Code:
=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Blue Serial ATA family
Device Model:     WDC WD5000AAKS-007AA0
Serial Number:    WD-WCATR2261045
Firmware Version: 05.01D05


Et ils en sont à un poil moins de 400h de fonctionnement, soit, si je lis bien la sortie de hdparm, bien moins d'un LCC par heure ?

De même, j'ai un Caviar Green pour du stockage, qui lui a plus de 8700h derrière lui :
Code:
Model Family:     Western Digital Caviar Green family
Device Model:     WDC WD10EADS-65L5B1
Serial Number:    WD-WCAU4C119127
Firmware Version: 01.01A01

193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       608

Soit là non plus rien de bien inquiétant… J'en ai un autre, en externe, le SMART ne passe pas dessus, je peux donc pas vérifier.

Par contre, sur mon netbook, là, c'est bien plus violent…
Code:
Model Family:     Western Digital Scorpio Blue Serial ATA family
Device Model:     WDC WD2500BEVT-75A23T0
Serial Number:    WD-WX91A5086781
Firmware Version: 01.01A01
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       311
193 Load_Cycle_Count        0x0032   192   192   000    Old_age   Always       -       24193


Les Caviar Blue n'ont donc pas l'air touchés, de même que les anciens Caviar Green… Je testerais l'utilitaire de WD, voir si ça change quelque chose sur le Scorpio Blue.
Back to top
View user's profile Send private message
NEOxAKIRA
Guru
Guru


Joined: 20 May 2007
Posts: 302
Location: France

PostPosted: Fri Oct 15, 2010 7:42 am    Post subject: Reply with quote

Code:
# smartctl -d ata -a /dev/sdd | grep 193
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       760
# smartctl -d ata -a /dev/sde | grep 193
193 Load_Cycle_Count        0x0032   170   170   000    Old_age   Always       -       90118

le 1er je l'ai installé hier, le 2ieme ca doit faire un an que je l'ai, que faire ?
Back to top
View user's profile Send private message
El_Goretto
Moderator
Moderator


Joined: 29 May 2004
Posts: 3174
Location: Paris

PostPosted: Fri Oct 15, 2010 7:56 am    Post subject: Reply with quote

Lire les posts précédents? :)
_________________
-TrueNAS & jails: µ-serv Gen8 E3-1260L, 16Go ECC + µ-serv N40L, 10Go ECC
-Réseau: APU2C4 (OpenWRT) + GS726Tv3 + 2x GS108Tv2 + Archer C5v1 (OpenWRT)
Back to top
View user's profile Send private message
NEOxAKIRA
Guru
Guru


Joined: 20 May 2007
Posts: 302
Location: France

PostPosted: Fri Oct 15, 2010 8:16 am    Post subject: Reply with quote

mais
Code:
hdparm -B 255

empêche les disques de se mettre en veille ?
Back to top
View user's profile Send private message
guilc
Bodhisattva
Bodhisattva


Joined: 15 Nov 2003
Posts: 3326
Location: Paris - France

PostPosted: Fri Oct 15, 2010 3:08 pm    Post subject: Reply with quote

On va être gentil mais, heu, c'est quand même écrit dans la page man hein :

- 254 = laisse APM activé mais interdit le spin-down
- 255 = désactive APM (et conséquence, interdit le spin-down aussi), sachant que la page man indique aussi que tous les disques ne supportent pas 255 (alors que 254 visiblement oui)
_________________
Merci de respecter les règles du forum.

Mon site perso : https://www.xwing.info
Mon PORTDIR_OVERLAY : https://gentoo.xwing.info ou layman -a xwing
Back to top
View user's profile Send private message
Display posts from previous:   
Reply to topic    Gentoo Forums Forum Index French All times are GMT
Goto page 1, 2  Next
Page 1 of 2

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum