PDA

Afficher la version complète : Usage de smartd avec 2 HDD en RAID 1



MD25
06/03/2009, 18h09
Bonjour,

J'ai deux disques durs en RAID 1 (système vieux de 3 mois) et depuis peu, j'ai autorisé SMART dans le BIOS pour les HDDs.
Alors que je regardais les /var/log/messages pour autre chose, je me suis aperçu que j'avais des messages du type
<div class='quotetop'>Citation </div>
Mar 6 12:59:01 x smartd[6250]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 76 to 79
Mar 6 12:59:01 x smartd[6250]: Device: /dev/sda [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 49 to 50
Mar 6 12:59:01 x smartd[6250]: Device: /dev/sdb [SAT], FAILED SMART self-check. BACK UP DATA NOW!
Mar 6 12:59:01 x smartd[6250]: Device: /dev/sdb [SAT], 158 Currently unreadable (pending) sectors
Mar 6 12:59:01 x smartd[6250]: Device: /dev/sdb [SAT], 158 Offline uncorrectable sectors
Mar 6 12:59:01 x smartd[6250]: Device: /dev/sdb [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 71 to 70
Mar 6 12:59:01 x smartd[6250]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 29 to 30
Mar 6 13:19:01 x -- MARK --
Mar 6 13:29:01 x smartd[6250]: Device: /dev/sdb [SAT], FAILED SMART self-check. BACK UP DATA NOW!
Mar 6 13:29:01 x smartd[6250]: Device: /dev/sdb [SAT], 158 Currently unreadable (pending) sectors
Mar 6 13:29:01 x smartd[6250]: Device: /dev/sdb [SAT], 158 Offline uncorrectable sectors
Mar 6 13:29:01 x smartd[6250]: Device: /dev/sdb [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 70 to 71
Mar 6 13:29:01 x smartd[6250]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 30 to 29[/b]
C'est grave docteur ? :huh:
(lors d'un boot mon array RAID passe le sanity check)
SMART sait-il se débrouiller avec des disques en RAID ?

thveillon
09/03/2009, 23h20
Salut,

<div class='quotetop'>Citation </div>
Même avec le disque dur et l'interface supportant S.M.A.R.T., les données peuvent ne pas être transmises correctement au système d'exploitation de l'ordinateur. Certains contrôleurs de disques peuvent dupliquer toutes les opérations d'écriture sur un deuxième disque de sauvegarde en temps réel. Cette technique est connue sous le nom de RAID 1 (http://fr.wikipedia.org/wiki/RAID_%28informatique%29#RAID_1_:_miroitage_de_disq ues) ou RAID mirroring car le second disque est une image miroir du premier. Cependant, de nombreux programmes conçus pour analyser les changements de comportement du disque et pour transmettre les alertes S.M.A.R.T. à l'utilisateur ne fonctionnent pas quand le système est configuré en RAID (http://fr.wikipedia.org/wiki/RAID_%28informatique%29), parce que, dans les conditions normales de fonctionnement de l'architecture RAID, l'ordinateur n'est pas autorisé à "voir" (ou à accéder directement) les différents disques physiques, il est seulement autorisé à "voir" les volumes logiques (http://fr.wikipedia.org/w/index.php?title=Volume_logique&action=edit&redlink=1) à travers le sous-système RAID.[/b]

Source: Wikipedia: Smart (http://fr.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology)

Mon expérience me dit la même chose, donc pas de conflit d'édition avec Wikipedia sur ce coup là...

Tu peux utiliser un live-cd, ne pas monter ton groupe raid, et scanner chacun des disques avec "smartctl" et les partitions avec "fsck" . "Raw errors" à 79, 150 secteurs morts, 71°C , je pense que le disque serait déjà mort et enterré !

MD25
09/03/2009, 23h44
Salut,
Source: Wikipedia: Smart (http://fr.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology)

Mon expérience me dit la même chose, donc pas de conflit d'édition avec Wikipedia sur ce coup là...

Tu peux utiliser un live-cd, ne pas monter ton groupe raid, et scanner chacun des disques avec "smartctl" et les partitions avec "fsck" . "Raw errors" à 79, 150 secteurs morts, 71°C , je pense que le disque serait déjà mort et enterré ![/b]

Si je comprends bien (?) c'était donc bien au mieux inutile, au pire source de Pb que d'activer le SMART sur un RAID.

Bon dans la pratique, /dev/sdb me cause des GROS soucis et j'ai dû faire plusieurs fsck de suite pour retrouver quelque chose d'utilisable (cf. mon autre post plus récent)...

Merci pour la réponse en tout cas (même si je n'ai pas tout compris dans la dernière phrase : serait => est ???) !