Bonjour toutes et tous,
À chaque démarrage du PC portable (un Thinkpad x240) j'ai une jolie pop-up avec ce message :
Le périphérique de stockage TOSHIBA THNSNJ128GCSU (/dev/sda) affiche des signes d'instabilité. Avec la commande
smartctl -a /dev/sda, j'ai deux erreurs :
Error 2 occurred at disk power-on lifetime: 6938 hours (289 days + 2 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 00 00 e0 42 40 Error: ICRC, ABRT at LBA = 0x0042e000 = 4382720
et (presque pareille) :
Error 1 occurred at disk power-on lifetime: 6918 hours (288 days + 6 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 28 00 34 6d 40 Error: ICRC, ABRT at LBA = 0x006d3400 = 7156736
Dois-je commencer à économiser pour faire changer le disque dur ?
à plus,
oh!rocks
Il n'a que 288 jours? Le modèle x 240 a plus de bouteille. Pas garanti le SSD?
Hello,
Je suis assez d'accord avec jtro, regarde si c'est toujours sous garantie .... normalement deux ans
Que donne un TestDisk au boot ?
Bonjour,
J'ai trouvé cette documentation sur Debian-Facile (https://debian-facile.org/doc:systeme:smartmontools) qui doit peut-être permettre de savoir si une panne est imminente ou si le disque est à surveiller de près.
Voir la section Analyse des valeurs et les indications du champs d'alerte WHEN_FAILED. Le SSD de ma tour serait ainsi à surveiller de près car il est indiqué une fois In_the_past dans ce champs :(
En parcourant vite fait cette discussion sur le forum de DF (https://debian-facile.org/viewtopic.php?id=20105), je note qu'il n'est peut-être pas vain de vérifier aussi la connectique du DD ou du SSD quand un message d'erreur apparaît (sauf je pense si le champs WHEN_FAILED nous indique que c'est presque mort avec l'indication FAILING_NOW).
Bonjour.
J'ai ce message pour 2 de mes 3 DD, les 2 que j'utilise le moins ! J'ai un peu l'impression que c'est encore un des nombreux bugs des mises à jour en ce moment !
C'est infernal depuis quelques semaines :
- Yast et Dolphin qui ne se lancent plus en mode graphique pour cause de mot de passe erroné
- PulseAudio qui ne se lance plus au démarrage et qui ne trouve plus une de mes cartes son
- logiciel de l'onduleur Eaton qui a son icône dans la barre des taches mais qui ne s'ouvre pas
- Et sûrement d'autres qui passent inaperçus !
Si c'était pas que j'ai pas de temps à y consacrer, je crois que Opensuse, va finir à la poubelle !
Bonjour pmichel,
Heu ... je vois pas très bien ce que votre message viens faire ici ... O:) :D
Avez-vous fait un test pour voir si votre DD n'aurai pas un problème de clusters (si DD mécanique bien entendu) ?
Si les disques ne vont pas bien, ça pourrait participer à l'explication de ces bugs bizarres sur YaST, sur dolphin...etc que vous semblez le seul à avoir. (https://www.alionet.org/index.php?topic=943.msg7763#msg7763)
Parted Magic a un utilitaire qui permet de tester les dd ou ssd , et vous signale s'ils sont subclaquants ou pas.
Merci pour vos réponses. :)
Pas de garantie. Portable acheté "en l'état" à moins de 200€ il y a un an et demi. Tourne toujours comme une horloge malgré ce message inquiétant.
La connectique à vérifier peut-être une piste vu qu'il est souvent "en balade" dans le sac.
Le champ WHEN_FAILED de smartcl est vide.
Je vais donc tenter un coup de Parted Magic. ;)
Encore merci, je vous tiendrais au courant pour la suite !
à plus,
oh!rocks
C'est le début de la sortie de la commande smartctl qui est intéressant pour savoir l'état du SSD, notamment l'attribut 231.
Salut
@Pascal Je n'ai pas d'attribut 231...
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000a 100 100 000 Old_age Always - 0
2 Throughput_Performance 0x0005 100 100 050 Pre-fail Offline - 0
3 Spin_Up_Time 0x0007 100 100 050 Pre-fail Always - 0
5 Reallocated_Sector_Ct 0x0013 100 100 050 Pre-fail Always - 0
7 Unknown_SSD_Attribute 0x000b 100 100 050 Pre-fail Always - 0
8 Unknown_SSD_Attribute 0x0005 100 100 050 Pre-fail Offline - 0
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 12552
10 Unknown_SSD_Attribute 0x0013 100 100 050 Pre-fail Always - 0
12 Power_Cycle_Count 0x0012 100 100 000 Old_age Always - 6298
167 SSD_Protect_Mode 0x0022 100 100 000 Old_age Always - 0
168 SATA_PHY_Error_Count 0x0012 100 100 000 Old_age Always - 2
169 Bad_Block_Count 0x0013 100 100 010 Pre-fail Always - 100
170 Unknown_Attribute 0x0013 100 100 010 Pre-fail Always - 0
173 Erase_Count 0x0012 176 176 000 Old_age Always - 0
175 Program_Fail_Count_Chip 0x0013 100 100 010 Pre-fail Always - 0
192 Power-Off_Retract_Count 0x0012 100 100 000 Old_age Always - 69
194 Temperature_Celsius 0x0022 071 049 000 Old_age Always - 29 (Min/Max 1/51)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
240 Unknown_SSD_Attribute 0x0013 100 100 050 Pre-fail Always - 0
à plus,
oh!rocks
12552h ça commence à faire. :D
Sinon l'attribut 169 semble confirmer qu'il y a des secteurs hs, à mon avis il semble fatigué.
Tu peux lancer un test smart dessus via :
sudo smartctl -t long /dev/sdX (remplacer sdx par le volume correspondant au ssd)
Bonjour,
Pas d'attribut 231 non plus, ni sur ma tour ni sur mon ThinkPad X240. Les retours de la commande
smartctl ne sont pas simples à décrypter.
J'ai fait un peu de lecture hier soir. Mouai :-\ En synthétisant, il en ressort que lorsqu'une valeur inscrite dans le champs VALUE est inférieure à une valeur inscrite dans le champs TRESH, ce n'est pas bon du tout et c'est presque cuit si le champs TYPE est Pre-Fail, le disque est en fin de vie si le champs TYPE est Old-age (ce qui doit se traduire par une indication dans le champs WHEN_FAILED dans tous les cas). Le champs WORST?
En gros WORST indique qu'au moins une fois l'état du "disque" a été très critique et il indique la pire valeur que le champs VALUE a atteint à l'une ou l'autre occasion (le service
smartd, actif et lancé au démarrage, teste les "disques" régulièrement).
Quel est l'état de mon "disque" et est-ce que quelque chose cloche? La commande suivante devrait le signaler (remplacer sda par l'unité que vous voulez vérifier, sdb, sdc, ect) :
smartctl -H /dev/sda
Sur ma tour, ça donne ça :
smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.3.18-57-default] (SUSE RPM)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Please note the following marginal Attributes:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 001 010 Pre-fail Always In_the_past 0
Ah oui mais c'est quoi cet attribut 179? un attribut "Pre-Fail" utilisé au moins dans les appareils Samsung si je me réfère à cet article de Wikipédia : https://en.wikipedia.org/wiki/S.M.A.R.T.
Ah bon :o ?! Certains attributs seraient spécifiques à certains fabricants? Je cite (extrait traduit) :
Comme si ce n'était pas déjà assez compliqué ::)
Lectures :
https://en.wikipedia.org/wiki/S.M.A.R.T.
https://wiki.csnu.org/index.php/Diagnostic_smart_d%27un_disque
https://www.thomas-krenn.com/en/wiki/SMART_Attributes_documentation
https://wiki.archlinux.org/title/S.M.A.R.T._(Fran%C3%A7ais)
Un peu moins d'un an et demi d'utilisation, ça ne me semble pas extraordinaire. Quant à l'attribut 169 qui pourrait bien être un attribut spécifique à Toshiba, il faudrait pouvoir interpréter le champs RAW_VALUE... et ce n'est pas simple (dans certains cas une valeur haute est meilleure, dans d'autres c'est l'inverse).
Je crois qu'il faut revenir à la base et essayer d'interpréter les codes de l'erreur : ICRC, ABRT at LBA
Une piste ici? Extrait traduit :
.
Ce n'est pas énorme en durée brute, sauf qu'ici c'est pour un pc portable, donc je suppose que la fréquence d'utilisation est bien moindre, on peut exclure le 24h/24 donc le ssd doit avoir plusieurs années je suppose.
cela dit je n'avais pas fait gaffe, mais l'erreur smart remonte à environ 6000h.
Ce n'est pas une erreur récente, il n'est pas impossible qu'il y ait eu des incompatibilités dans sa précédente vie.
Or le power-on lifetime actuel c'est:
Dans tous les cas lancer le test smart qui donnera une indication actuelle mais pour moi l'erreur remontée n'est pas récente..
Oui, les deux erreurs sont relativement anciennes, je l'avais noté. Ce qui m'étonne, c'est que la pop-up signalant des signes d'instabilité et qui est, elle, bien actuelle, ne se traduise pas par des informations avec smartctl.
Les gars, vous êtes hyper pointus, bravo ! :)
À mon niveau, changer de SSD semble la solution la plus envisageable à moyen terme...
à plus,
oh!rocks
Vérifie la connectique avant de changer le SSD... et si tu pouvais tester le nouveau au cas, ou un autre de prêt par exemple, des fois que ce ne soit pas le SSD qui soit en cause (je ne te le souhaite pas).
S'il y a eu une mise à jour du bios, ou une réinitialisation des réglages du bios, il se peut que l'option warning sur alerte smart soit maintenant activée ce qui peut expliquer l'alerte présente maintenant alors qu'avant non.
Bon il est pas jeune mais il est en très bon état ce disque !!!
Tu devrais vérifier le branchement et sa fixation ou son calage. Dans certain portable le disque est juste coincé mais les SSD faisant 7mm d'épais et les logements de disque peuvent faire 9.5mm.
Il se balade peut être un peu.