SMART: Monitoritzar discos
Capacitat SMART
Per consultar dades del disc i saber si té SMART habilitat:
# smartctl -i /dev/hda smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF INFORMATION SECTION === Model Family: Seagate Barracuda 7200.7 and 7200.7 Plus family Device Model: ST340014A Serial Number: 5JX9N28Q Firmware Version: 3.06 User Capacity: 40,020,664,320 bytes Device is: In smartctl database [for details use: -P show] ATA Version is: 6 ATA Standard is: ATA/ATAPI-6 T13 1410D revision 2 Local Time is: Thu Nov 18 18:47:42 2010 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled
Verificacions
Check General
Amb -H
podrem veure un estat ràpid del disc:
# smartctl -H /dev/sda smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build) Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED
Consultar atributs d'estat
Amb -A
ens mostrarà els valors dels atributs SMART suportats per el disc:
# smartctl -A /dev/sda smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build) Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 069 064 006 Pre-fail Always - 239951478 3 Spin_Up_Time 0x0003 098 098 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 8 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 088 060 030 Pre-fail Always - 676399120 9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 8850 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 652 194 Temperature_Celsius 0x0022 029 048 000 Old_age Always - 29 195 Hardware_ECC_Recovered 0x001a 069 063 000 Old_age Always - 239951478 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0 202 Data_Address_Mark_Errs 0x0032 100 253 000 Old_age Always - 0
La interpretació RAW_VALUE
pot variar molt d'un fabricant/model a un altre i per tant el firmware normalitza el valor a un byte representat a VALUE
(que tampoc significa res). Tot i així la interpretació és que si VALUE ≤ THRESHOLD
aleshores tenim un problema.
La gravetat del problema bé determinada pel tipus d'atribut indicat en la columna TYPE
:
TYPE | Descripció |
---|---|
Pre-fail | Fallada del disc inminent (24h) |
Old_age | Excedit el temps de funcionament (massa ús) |
Estat global -a
Amb -a
obtenim tant informació del disc, com els atributs i capacitats SMART i el registre d'errors que s'han pogut produïr.
Test SMART
En alguna sortida de comanda veurem que parla de testos, i és que el mateix firmware del disc porta incorporat una bateria de testos a fer el disc. És posible configurar el disc per què faci els testos de forma automàtica cada cert temps.
Per executar els testos:
# smartctl -t offline /dev/sdb smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build) Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net === START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART off-line routine immediately in off-line mode". Drive command "Execute SMART off-line routine immediately in off-line mode" successful. Testing has begun. Please wait 430 seconds for test to complete. Test will complete after Thu Mar 3 16:09:06 2011 Use smartctl -X to abort test.
No veurem res, i com indica el missatge, ens demana que li donem temps per fer els testo. L'únic que farà això és actualitzar els atributs SMART i, en cas d'algun error, registrar-ho al log.