Aller au contenu principal
Sujet: SSD en fin de vie ? (Lu 3859 fois) sujet précédent - sujet suivant

SSD en fin de vie ?

Bonjour toutes et tous,

À chaque démarrage du PC portable (un Thinkpad x240) j'ai une jolie pop-up avec ce message :
Le périphérique de stockage TOSHIBA THNSNJ128GCSU (/dev/sda) affiche des signes d'instabilité.

Avec la commande smartctl -a /dev/sda, j'ai deux erreurs :

Error 2 occurred at disk power-on lifetime: 6938 hours (289 days + 2 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 00 00 e0 42 40  Error: ICRC, ABRT at LBA = 0x0042e000 = 4382720

et (presque pareille) :

Error 1 occurred at disk power-on lifetime: 6918 hours (288 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 28 00 34 6d 40  Error: ICRC, ABRT at LBA = 0x006d3400 = 7156736

Dois-je commencer à économiser pour faire changer le disque dur ?


à plus,
oh!rocks

Re : SSD en fin de vie ?

Répondre #1
Il n'a que 288 jours? Le modèle x 240 a plus de bouteille. Pas garanti le SSD?

Re : SSD en fin de vie ?

Répondre #2
Hello,

Je suis assez d'accord avec jtro, regarde si c'est toujours sous garantie .... normalement deux ans

Que donne un TestDisk au boot ?

Re : SSD en fin de vie ?

Répondre #3
Bonjour,

J'ai trouvé cette documentation sur Debian-Facile qui doit peut-être permettre de savoir si une panne est imminente ou si le disque est à surveiller de près.

Voir la section Analyse des valeurs et les indications du champs d'alerte WHEN_FAILED. Le SSD de ma tour serait ainsi à surveiller de près car il est indiqué une fois In_the_past dans ce champs  :(

En parcourant vite fait cette discussion sur le forum de DF, je note qu'il n'est peut-être pas vain de vérifier aussi la connectique du DD ou du SSD quand un message d'erreur apparaît (sauf je pense si le champs WHEN_FAILED nous indique que c'est presque mort avec l'indication FAILING_NOW).

Re : SSD en fin de vie ?

Répondre #4
Bonjour.
J'ai ce message pour 2 de mes 3 DD, les 2 que j'utilise le moins ! J'ai un peu l'impression que c'est encore un des nombreux bugs des mises à jour en ce moment !
C'est infernal depuis quelques semaines :
- Yast et Dolphin qui ne se lancent plus en mode graphique pour cause de mot de passe erroné
- PulseAudio qui ne se lance plus au démarrage et qui ne trouve plus une de mes cartes son
- logiciel de l'onduleur Eaton qui a son icône dans la barre des taches mais qui ne s'ouvre pas
- Et sûrement d'autres qui passent inaperçus !

Si c'était pas que j'ai pas de temps à y consacrer, je crois que Opensuse, va finir à la poubelle !

 

Re : SSD en fin de vie ?

Répondre #5
Bonjour pmichel,

Heu ... je vois pas très bien ce que votre message viens faire ici ...  O:) :D

Avez-vous fait un test pour voir si votre DD n'aurai pas un problème de clusters  (si DD mécanique bien entendu) ?

Re : SSD en fin de vie ?

Répondre #6
Bonjour.
J'ai ce message pour 2 de mes 3 DD, les 2 que j'utilise le moins ! J'ai un peu l'impression que c'est encore un des nombreux bugs des mises à jour en ce moment !
C'est infernal depuis quelques semaines :
- Yast et Dolphin qui ne se lancent plus en mode graphique pour cause de mot de passe erroné
- PulseAudio qui ne se lance plus au démarrage et qui ne trouve plus une de mes cartes son
- logiciel de l'onduleur Eaton qui a son icône dans la barre des taches mais qui ne s'ouvre pas
- Et sûrement d'autres qui passent inaperçus !

Si c'était pas que j'ai pas de temps à y consacrer, je crois que Opensuse, va finir à la poubelle !
Si les disques ne vont pas bien, ça pourrait participer à l'explication de ces bugs bizarres sur YaST, sur dolphin...etc que vous semblez le seul à avoir.

Re : SSD en fin de vie ?

Répondre #7
Parted Magic a un utilitaire qui permet de tester les dd ou ssd , et vous signale s'ils sont subclaquants ou pas.

Re : SSD en fin de vie ?

Répondre #8
Merci pour vos réponses. :)

Pas de garantie. Portable acheté "en l'état" à moins de 200€ il y a un an et demi. Tourne toujours comme une horloge malgré ce message inquiétant.

La connectique à vérifier peut-être une piste vu qu'il est souvent "en balade" dans le sac.

Le champ WHEN_FAILED de smartcl est vide.

Je vais donc tenter un coup de Parted Magic. ;)

Encore merci, je vous tiendrais au courant pour la suite !


à plus,
oh!rocks

Re : SSD en fin de vie ?

Répondre #9
C'est le début de la sortie de la commande smartctl qui est intéressant pour savoir l'état du SSD, notamment l'attribut 231.

Re : SSD en fin de vie ?

Répondre #10
Salut @Pascal

Je n'ai pas d'attribut 231...

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000a   100   100   000    Old_age   Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   100   100   050    Pre-fail  Always       -       0
  5 Reallocated_Sector_Ct   0x0013   100   100   050    Pre-fail  Always       -       0
  7 Unknown_SSD_Attribute   0x000b   100   100   050    Pre-fail  Always       -       0
  8 Unknown_SSD_Attribute   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       12552
 10 Unknown_SSD_Attribute   0x0013   100   100   050    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0012   100   100   000    Old_age   Always       -       6298
167 SSD_Protect_Mode        0x0022   100   100   000    Old_age   Always       -       0
168 SATA_PHY_Error_Count    0x0012   100   100   000    Old_age   Always       -       2
169 Bad_Block_Count         0x0013   100   100   010    Pre-fail  Always       -       100
170 Unknown_Attribute       0x0013   100   100   010    Pre-fail  Always       -       0
173 Erase_Count             0x0012   176   176   000    Old_age   Always       -       0
175 Program_Fail_Count_Chip 0x0013   100   100   010    Pre-fail  Always       -       0
192 Power-Off_Retract_Count 0x0012   100   100   000    Old_age   Always       -       69
194 Temperature_Celsius     0x0022   071   049   000    Old_age   Always       -       29 (Min/Max 1/51)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
240 Unknown_SSD_Attribute   0x0013   100   100   050    Pre-fail  Always       -       0


à plus,
oh!rocks

Re : SSD en fin de vie ?

Répondre #11
12552h ça commence à faire. :D
Sinon l'attribut 169 semble confirmer qu'il y a des secteurs hs, à mon avis il semble fatigué.
Tu peux lancer un test smart dessus via :

sudo smartctl -t long  /dev/sdX (remplacer sdx par le volume correspondant au ssd)

Re : SSD en fin de vie ?

Répondre #12
Bonjour,

Pas d'attribut 231 non plus, ni sur ma tour ni sur mon ThinkPad X240. Les retours de la commande smartctl ne sont pas simples à décrypter.

J'ai fait un peu de lecture hier soir. Mouai  :-\ En synthétisant, il en ressort que lorsqu'une valeur inscrite dans le champs VALUE est inférieure à une valeur inscrite dans le champs TRESH, ce n'est pas bon du tout et c'est presque cuit si le champs TYPE est Pre-Fail, le disque est en fin de vie si le champs TYPE est Old-age  (ce qui doit se traduire par une indication dans le champs WHEN_FAILED dans tous les cas). Le champs WORST?

WORST représente la valeur VALUE la plus basse que l'attribut à pu atteindre

En gros WORST indique qu'au moins une fois l'état du "disque" a été très critique et il indique la pire valeur que le champs VALUE a atteint à l'une ou l'autre occasion (le service smartd, actif et lancé au démarrage, teste les "disques" régulièrement).

Quel est l'état de mon "disque" et est-ce que quelque chose cloche? La commande suivante devrait le signaler (remplacer sda par l'unité que vous voulez vérifier, sdb, sdc, ect) :

smartctl -H /dev/sda

Sur ma tour, ça donne ça :

smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.3.18-57-default] (SUSE RPM)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Please note the following marginal Attributes:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   001   010    Pre-fail  Always   In_the_past 0


Ah oui mais c'est quoi cet attribut 179? un attribut "Pre-Fail" utilisé au moins dans les appareils Samsung si je me réfère à cet article de Wikipédia : https://en.wikipedia.org/wiki/S.M.A.R.T.

Ah bon  :o ?! Certains attributs seraient spécifiques à certains fabricants? Je cite (extrait traduit) :

Les attributs SMART n'étant pas standardisés, chaque fabricant peut choisir les attributs SMART qu'il définit pour chaque modèle de disque dur ou SSD.

Comme si ce n'était pas déjà assez compliqué  ::) 

Lectures :
https://en.wikipedia.org/wiki/S.M.A.R.T.
https://wiki.csnu.org/index.php/Diagnostic_smart_d%27un_disque
https://www.thomas-krenn.com/en/wiki/SMART_Attributes_documentation
https://wiki.archlinux.org/title/S.M.A.R.T._(Fran%C3%A7ais)

Re : SSD en fin de vie ?

Répondre #13
12552h ça commence à faire. :D
Sinon l'attribut 169 semble confirmer qu'il y a des secteurs hs, à mon avis il semble fatigué.

Un peu moins d'un an et demi d'utilisation, ça ne me semble pas extraordinaire. Quant à l'attribut 169 qui pourrait bien être un attribut spécifique à Toshiba, il faudrait pouvoir interpréter le champs RAW_VALUE... et ce n'est pas simple (dans certains cas une valeur haute est meilleure, dans d'autres c'est l'inverse).

Je crois qu'il faut revenir à la base et essayer d'interpréter les codes de l'erreur : ICRC, ABRT at LBA

Une piste ici? Extrait traduit :

Une erreur importante est l'ICRC (interface CRC error). Cela signifie que des erreurs sont détectées sur le bus IDE/SATA ou PCIe auquel le disque dur est connecté. Bien que cette erreur soit rare et qu'elle puisse être causée par le disque dur lui-même, elle peut signifier que votre chipset (le matériel qui contrôle le SATA, par exemple) est endommagé - dans ce cas, le remplacement du disque dur ne résoudra pas le problème. Il est également possible que la connexion du câble soit intermittente
.

Re : SSD en fin de vie ?

Répondre #14
Ce n'est pas énorme en durée brute, sauf qu'ici c'est pour un pc portable, donc je suppose que la fréquence d'utilisation est bien moindre, on peut exclure le 24h/24 donc le ssd doit avoir plusieurs années je suppose.

cela dit je n'avais pas fait gaffe, mais l'erreur smart remonte à environ 6000h.
Ce n'est pas une erreur récente, il n'est pas impossible qu'il y ait eu des incompatibilités dans sa précédente vie.
Citer
power-on lifetime: 6938 hours

Or le power-on lifetime actuel c'est:
Citer
12552


Dans tous les cas lancer le test smart qui donnera une indication actuelle mais pour moi l'erreur remontée n'est pas récente..