Alionet - Communauté openSUSE francophone

openSUSE => Matériel => Discussion initiée par: oh!rocks le 13 Juin, 2021, 08:32:12

Titre: SSD en fin de vie ?
Publié par: oh!rocks le 13 Juin, 2021, 08:32:12
Bonjour toutes et tous,

À chaque démarrage du PC portable (un Thinkpad x240) j'ai une jolie pop-up avec ce message :
Le périphérique de stockage TOSHIBA THNSNJ128GCSU (/dev/sda) affiche des signes d'instabilité.

Avec la commande smartctl -a /dev/sda, j'ai deux erreurs :

Error 2 occurred at disk power-on lifetime: 6938 hours (289 days + 2 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 00 00 e0 42 40  Error: ICRC, ABRT at LBA = 0x0042e000 = 4382720

et (presque pareille) :

Error 1 occurred at disk power-on lifetime: 6918 hours (288 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 28 00 34 6d 40  Error: ICRC, ABRT at LBA = 0x006d3400 = 7156736

Dois-je commencer à économiser pour faire changer le disque dur ?


à plus,
oh!rocks
Titre: Re : SSD en fin de vie ?
Publié par: jtro le 13 Juin, 2021, 09:50:54
Il n'a que 288 jours? Le modèle x 240 a plus de bouteille. Pas garanti le SSD?
Titre: Re : SSD en fin de vie ?
Publié par: Gerinald le 13 Juin, 2021, 12:23:21
Hello,

Je suis assez d'accord avec jtro, regarde si c'est toujours sous garantie .... normalement deux ans

Que donne un TestDisk au boot ?
Titre: Re : SSD en fin de vie ?
Publié par: Chumi le 13 Juin, 2021, 16:42:00
Bonjour,

J'ai trouvé cette documentation sur Debian-Facile (https://debian-facile.org/doc:systeme:smartmontools) qui doit peut-être permettre de savoir si une panne est imminente ou si le disque est à surveiller de près.

Voir la section Analyse des valeurs et les indications du champs d'alerte WHEN_FAILED. Le SSD de ma tour serait ainsi à surveiller de près car il est indiqué une fois In_the_past dans ce champs  :(

En parcourant vite fait cette discussion sur le forum de DF (https://debian-facile.org/viewtopic.php?id=20105), je note qu'il n'est peut-être pas vain de vérifier aussi la connectique du DD ou du SSD quand un message d'erreur apparaît (sauf je pense si le champs WHEN_FAILED nous indique que c'est presque mort avec l'indication FAILING_NOW).
Titre: Re : SSD en fin de vie ?
Publié par: pmichel le 13 Juin, 2021, 17:13:25
Bonjour.
J'ai ce message pour 2 de mes 3 DD, les 2 que j'utilise le moins ! J'ai un peu l'impression que c'est encore un des nombreux bugs des mises à jour en ce moment !
C'est infernal depuis quelques semaines :
- Yast et Dolphin qui ne se lancent plus en mode graphique pour cause de mot de passe erroné
- PulseAudio qui ne se lance plus au démarrage et qui ne trouve plus une de mes cartes son
- logiciel de l'onduleur Eaton qui a son icône dans la barre des taches mais qui ne s'ouvre pas
- Et sûrement d'autres qui passent inaperçus !

Si c'était pas que j'ai pas de temps à y consacrer, je crois que Opensuse, va finir à la poubelle !
Titre: Re : SSD en fin de vie ?
Publié par: Gerinald le 13 Juin, 2021, 17:18:52
Bonjour pmichel,

Heu ... je vois pas très bien ce que votre message viens faire ici ...  O:) :D

Avez-vous fait un test pour voir si votre DD n'aurai pas un problème de clusters  (si DD mécanique bien entendu) ?
Titre: Re : SSD en fin de vie ?
Publié par: chalu le 13 Juin, 2021, 17:44:31
Bonjour.
J'ai ce message pour 2 de mes 3 DD, les 2 que j'utilise le moins ! J'ai un peu l'impression que c'est encore un des nombreux bugs des mises à jour en ce moment !
C'est infernal depuis quelques semaines :
- Yast et Dolphin qui ne se lancent plus en mode graphique pour cause de mot de passe erroné
- PulseAudio qui ne se lance plus au démarrage et qui ne trouve plus une de mes cartes son
- logiciel de l'onduleur Eaton qui a son icône dans la barre des taches mais qui ne s'ouvre pas
- Et sûrement d'autres qui passent inaperçus !

Si c'était pas que j'ai pas de temps à y consacrer, je crois que Opensuse, va finir à la poubelle !
Si les disques ne vont pas bien, ça pourrait participer à l'explication de ces bugs bizarres sur YaST, sur dolphin...etc que vous semblez le seul à avoir. (https://www.alionet.org/index.php?topic=943.msg7763#msg7763)
Titre: Re : SSD en fin de vie ?
Publié par: sobkowiak le 13 Juin, 2021, 19:42:52
Parted Magic a un utilitaire qui permet de tester les dd ou ssd , et vous signale s'ils sont subclaquants ou pas.
Titre: Re : SSD en fin de vie ?
Publié par: oh!rocks le 13 Juin, 2021, 21:03:02
Merci pour vos réponses. :)

Pas de garantie. Portable acheté "en l'état" à moins de 200€ il y a un an et demi. Tourne toujours comme une horloge malgré ce message inquiétant.

La connectique à vérifier peut-être une piste vu qu'il est souvent "en balade" dans le sac.

Le champ WHEN_FAILED de smartcl est vide.

Je vais donc tenter un coup de Parted Magic. ;)

Encore merci, je vous tiendrais au courant pour la suite !


à plus,
oh!rocks
Titre: Re : SSD en fin de vie ?
Publié par: Pascal le 14 Juin, 2021, 09:04:48
C'est le début de la sortie de la commande smartctl qui est intéressant pour savoir l'état du SSD, notamment l'attribut 231.
Titre: Re : SSD en fin de vie ?
Publié par: oh!rocks le 14 Juin, 2021, 09:54:38
Salut @Pascal

Je n'ai pas d'attribut 231...

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000a   100   100   000    Old_age   Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   100   100   050    Pre-fail  Always       -       0
  5 Reallocated_Sector_Ct   0x0013   100   100   050    Pre-fail  Always       -       0
  7 Unknown_SSD_Attribute   0x000b   100   100   050    Pre-fail  Always       -       0
  8 Unknown_SSD_Attribute   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       12552
 10 Unknown_SSD_Attribute   0x0013   100   100   050    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0012   100   100   000    Old_age   Always       -       6298
167 SSD_Protect_Mode        0x0022   100   100   000    Old_age   Always       -       0
168 SATA_PHY_Error_Count    0x0012   100   100   000    Old_age   Always       -       2
169 Bad_Block_Count         0x0013   100   100   010    Pre-fail  Always       -       100
170 Unknown_Attribute       0x0013   100   100   010    Pre-fail  Always       -       0
173 Erase_Count             0x0012   176   176   000    Old_age   Always       -       0
175 Program_Fail_Count_Chip 0x0013   100   100   010    Pre-fail  Always       -       0
192 Power-Off_Retract_Count 0x0012   100   100   000    Old_age   Always       -       69
194 Temperature_Celsius     0x0022   071   049   000    Old_age   Always       -       29 (Min/Max 1/51)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
240 Unknown_SSD_Attribute   0x0013   100   100   050    Pre-fail  Always       -       0


à plus,
oh!rocks
Titre: Re : SSD en fin de vie ?
Publié par: burn2 le 15 Juin, 2021, 10:04:42
12552h ça commence à faire. :D
Sinon l'attribut 169 semble confirmer qu'il y a des secteurs hs, à mon avis il semble fatigué.
Tu peux lancer un test smart dessus via :

sudo smartctl -t long  /dev/sdX (remplacer sdx par le volume correspondant au ssd)
Titre: Re : SSD en fin de vie ?
Publié par: Chumi le 15 Juin, 2021, 10:16:00
Bonjour,

Pas d'attribut 231 non plus, ni sur ma tour ni sur mon ThinkPad X240. Les retours de la commande smartctl ne sont pas simples à décrypter.

J'ai fait un peu de lecture hier soir. Mouai  :-\ En synthétisant, il en ressort que lorsqu'une valeur inscrite dans le champs VALUE est inférieure à une valeur inscrite dans le champs TRESH, ce n'est pas bon du tout et c'est presque cuit si le champs TYPE est Pre-Fail, le disque est en fin de vie si le champs TYPE est Old-age  (ce qui doit se traduire par une indication dans le champs WHEN_FAILED dans tous les cas). Le champs WORST?

Citation de:  https://wiki.csnu.org/index.php/Diagnostic_smart_d%27un_disque
WORST représente la valeur VALUE la plus basse que l'attribut à pu atteindre

En gros WORST indique qu'au moins une fois l'état du "disque" a été très critique et il indique la pire valeur que le champs VALUE a atteint à l'une ou l'autre occasion (le service smartd, actif et lancé au démarrage, teste les "disques" régulièrement).

Quel est l'état de mon "disque" et est-ce que quelque chose cloche? La commande suivante devrait le signaler (remplacer sda par l'unité que vous voulez vérifier, sdb, sdc, ect) :

smartctl -H /dev/sda

Sur ma tour, ça donne ça :

smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.3.18-57-default] (SUSE RPM)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Please note the following marginal Attributes:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   001   010    Pre-fail  Always   In_the_past 0


Ah oui mais c'est quoi cet attribut 179? un attribut "Pre-Fail" utilisé au moins dans les appareils Samsung si je me réfère à cet article de Wikipédia : https://en.wikipedia.org/wiki/S.M.A.R.T.

Ah bon  :o ?! Certains attributs seraient spécifiques à certains fabricants? Je cite (extrait traduit) :

Citation de:  https://www.thomas-krenn.com/en/wiki/SMART_Attributes_documentation
Les attributs SMART n'étant pas standardisés, chaque fabricant peut choisir les attributs SMART qu'il définit pour chaque modèle de disque dur ou SSD.

Comme si ce n'était pas déjà assez compliqué  ::) 

Lectures :
https://en.wikipedia.org/wiki/S.M.A.R.T.
https://wiki.csnu.org/index.php/Diagnostic_smart_d%27un_disque
https://www.thomas-krenn.com/en/wiki/SMART_Attributes_documentation
https://wiki.archlinux.org/title/S.M.A.R.T._(Fran%C3%A7ais)
Titre: Re : SSD en fin de vie ?
Publié par: Chumi le 15 Juin, 2021, 11:18:12
12552h ça commence à faire. :D
Sinon l'attribut 169 semble confirmer qu'il y a des secteurs hs, à mon avis il semble fatigué.

Un peu moins d'un an et demi d'utilisation, ça ne me semble pas extraordinaire. Quant à l'attribut 169 qui pourrait bien être un attribut spécifique à Toshiba, il faudrait pouvoir interpréter le champs RAW_VALUE... et ce n'est pas simple (dans certains cas une valeur haute est meilleure, dans d'autres c'est l'inverse).

Je crois qu'il faut revenir à la base et essayer d'interpréter les codes de l'erreur : ICRC, ABRT at LBA

Une piste ici? Extrait traduit :

Citation de: https://techoverflow.net/2016/07/25/how-to-interpret-smartctl-messages-like-error-unc-at-lba/
Une erreur importante est l'ICRC (interface CRC error). Cela signifie que des erreurs sont détectées sur le bus IDE/SATA ou PCIe auquel le disque dur est connecté. Bien que cette erreur soit rare et qu'elle puisse être causée par le disque dur lui-même, elle peut signifier que votre chipset (le matériel qui contrôle le SATA, par exemple) est endommagé - dans ce cas, le remplacement du disque dur ne résoudra pas le problème. Il est également possible que la connexion du câble soit intermittente
.
Titre: Re : SSD en fin de vie ?
Publié par: burn2 le 15 Juin, 2021, 11:36:27
Ce n'est pas énorme en durée brute, sauf qu'ici c'est pour un pc portable, donc je suppose que la fréquence d'utilisation est bien moindre, on peut exclure le 24h/24 donc le ssd doit avoir plusieurs années je suppose.

cela dit je n'avais pas fait gaffe, mais l'erreur smart remonte à environ 6000h.
Ce n'est pas une erreur récente, il n'est pas impossible qu'il y ait eu des incompatibilités dans sa précédente vie.
Citer
power-on lifetime: 6938 hours

Or le power-on lifetime actuel c'est:
Citer
12552


Dans tous les cas lancer le test smart qui donnera une indication actuelle mais pour moi l'erreur remontée n'est pas récente..
Titre: Re : SSD en fin de vie ?
Publié par: Chumi le 15 Juin, 2021, 11:55:18
Oui, les deux erreurs sont relativement anciennes, je l'avais noté. Ce qui m'étonne, c'est que la pop-up signalant des signes d'instabilité et qui est, elle, bien actuelle, ne se traduise pas par des informations avec smartctl.
Titre: Re : SSD en fin de vie ?
Publié par: oh!rocks le 15 Juin, 2021, 12:11:03
Les gars, vous êtes hyper pointus, bravo ! :)

À mon niveau, changer de SSD semble la solution la plus envisageable à moyen terme...


à plus,
oh!rocks
Titre: Re : SSD en fin de vie ?
Publié par: Chumi le 15 Juin, 2021, 12:53:21
À mon niveau, changer de SSD semble la solution la plus envisageable à moyen terme...

Vérifie la connectique avant de changer le SSD... et si tu pouvais tester le nouveau au cas, ou un autre de prêt par exemple, des fois que ce ne soit pas le SSD qui soit en cause (je ne te le souhaite pas).


Titre: Re : SSD en fin de vie ?
Publié par: burn2 le 15 Juin, 2021, 14:11:45
Oui, les deux erreurs sont relativement anciennes, je l'avais noté. Ce qui m'étonne, c'est que la pop-up signalant des signes d'instabilité et qui est, elle, bien actuelle, ne se traduise pas par des informations avec smartctl.
S'il y a eu une mise à jour du bios, ou une réinitialisation des réglages du bios, il se peut que l'option warning sur alerte smart soit maintenant activée ce qui peut expliquer l'alerte présente maintenant alors qu'avant non.
Titre: Re : SSD en fin de vie ?
Publié par: Pascal le 16 Juin, 2021, 14:25:32
Bon il est pas jeune mais il est en très bon état ce disque !!!
Tu devrais vérifier le branchement et sa fixation ou son calage. Dans certain portable le disque est juste coincé mais les SSD faisant 7mm d'épais et les logements de disque peuvent faire 9.5mm.
Il se balade peut être un peu.