doc:techref:smart

SMART: Monitoritzar discos

Per consultar dades del disc i saber si té SMART habilitat:

# smartctl -i /dev/hda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.7 and 7200.7 Plus family
Device Model:     ST340014A
Serial Number:    5JX9N28Q
Firmware Version: 3.06
User Capacity:    40,020,664,320 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   6
ATA Standard is:  ATA/ATAPI-6 T13 1410D revision 2
Local Time is:    Thu Nov 18 18:47:42 2010 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Amb -H podrem veure un estat ràpid del disc:

# smartctl -H /dev/sda
smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Amb -A ens mostrarà els valors dels atributs SMART suportats per el disc:

# smartctl -A /dev/sda
smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   069   064   006    Pre-fail  Always       -       239951478
  3 Spin_Up_Time            0x0003   098   098   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       8
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   088   060   030    Pre-fail  Always       -       676399120
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       8850
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       652
194 Temperature_Celsius     0x0022   029   048   000    Old_age   Always       -       29
195 Hardware_ECC_Recovered  0x001a   069   063   000    Old_age   Always       -       239951478
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 Data_Address_Mark_Errs  0x0032   100   253   000    Old_age   Always       -       0

La interpretació RAW_VALUE pot variar molt d'un fabricant/model a un altre i per tant el firmware normalitza el valor a un byte representat a VALUE (que tampoc significa res). Tot i així la interpretació és que si VALUE ≤ THRESHOLD aleshores tenim un problema.

La gravetat del problema bé determinada pel tipus d'atribut indicat en la columna TYPE:

TYPE Descripció
Pre-fail Fallada del disc inminent (24h)
Old_age Excedit el temps de funcionament (massa ús)

Amb -a obtenim tant informació del disc, com els atributs i capacitats SMART i el registre d'errors que s'han pogut produïr.

En alguna sortida de comanda veurem que parla de testos, i és que el mateix firmware del disc porta incorporat una bateria de testos a fer el disc. És posible configurar el disc per què faci els testos de forma automàtica cada cert temps.

Per executar els testos:

# smartctl -t offline /dev/sdb
smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART off-line routine immediately in off-line mode".
Drive command "Execute SMART off-line routine immediately in off-line mode" successful.
Testing has begun.
Please wait 430 seconds for test to complete.
Test will complete after Thu Mar  3 16:09:06 2011

Use smartctl -X to abort test.

No veurem res, i com indica el missatge, ens demana que li donem temps per fer els testo. L'únic que farà això és actualitzar els atributs SMART i, en cas d'algun error, registrar-ho al log.

  • doc/techref/smart.txt
  • Last modified: 2021/06/10 21:45
  • by 127.0.0.1