S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) - технология оценки состояния
винчестера встроенной подпрограммой самодиагностики, а также механизм
предсказания времени выхода его из строя.
S.M.A.R.T. представляет
собой набор мини-подпрограмм, которые являются частью микрокода накопителя и
определяют поддерживаемые диагностические функции. В современных накопителях
используется технология S.M.A.R.T. III, в которой
реализована не только функция обнаружения дефектов поверхности, но и
возможность их восстановления "прозрачно" для пользователя и многие
другие новшества. В скором будушем производители жестких дисков готовятся
принять к использованию новый вариант технологии S.M.A.R.T. - "1024 S.M.A.R.T.",
характерной особенностью которого будет заметно больший размер журналов,
повсеместное использование мультисекторных журналов, более точные алгоритмы
анализа показаний встроенных в накопитель сенсоров (термодатчики, сенсоры
ударов, и т.п.) и многое другое.
SMART производит мониторинг основных характеристик
накопителя, каждая из которых получает свою оценку. Характеристики можно
условно разбить на две группы:
• параметры, отражающие процесс
естественного старения жёсткого диска (число оборотов шпинделя, число
перемещений головок, количество циклов включения-выключения).
• текущие параметры накопителя (высота
головок над поверхностью диска, число переназначенных секторов, время поиска
дорожки и количество ошибок поиска).
Данные
хранятся в шестнадцатеричном виде, называемом «raw value», а потом пересчитываются в «value» — значение,
символизирующее надёжность относительно некоторого эталонного значения. Обычно
«value»
располагается в диапазоне от 0 до 100 (некоторые атрибуты имеют значения от 0
до 200 и от 0 до 253).
Высокая оценка «value» говорит об
отсутствии изменений данного параметра или медленном его ухудшении. Низкая
оценка говорит о возможном скором сбое накопителя.
Значение, меньшее, чем минимальное, при
котором производителем гарантируется безотказная работа накопителя, означает
выход узла из строя.
Технология
SMART
позволяет осуществлять:
• мониторинг параметров состояния.
• сканирование поверхности.
• сканирование поверхности с
автоматической заменой сомнительных секторов на надёжные из резервной зоны
накопителя.
Следует заметить,
что технология SMART
позволяет предсказывать выход устройства из строя в результате механических
неисправностей, что составляет около 60 % причин, по которым жесткие диски
выходят из строя.
Параметры SMART можно
просмотреть с помощью специального программного обеспечения (например:
бесплатная утилитой “HDD S.M.A.R.T. Viewer”).
В
следующей таблице приведены известные атрибуты SMART. (Красным цветом выделены критические
параметры).
ID
|
Атрибут
|
Описание
|
01
|
Raw Read
Error Rate
|
Частота
ошибок при чтении данных с диска, происхождение которых обусловлено
аппаратной частью диска.
|
02
|
Throughput Performance
|
Общая
производительность диска. Если значение атрибута уменьшается, то велика
вероятность, что с диском есть проблемы.
|
03
|
Spin-Up Time
|
Время
раскрутки пакета дисков из состояния покоя до рабочей скорости.
|
04
|
Start/Stop Count
|
Полное
число запусков/остановок шпинделя. У дисков некоторых производителей
(например, Seagate) — счётчик включения режима
энергосбережения. В поле raw value хранится общее количество запусков/остановок диска.
|
05
|
Reallocated Sectors Count
|
Число
операций переназначения секторов. Когда диск обнаруживает ошибку
чтения/записи, он помечает сектор «переназначенным» и переносит данные в
специально отведённую область. Вот почему на современных жёстких дисках
нельзя увидеть bad-блоки — все они спрятаны в
переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор — remap. Чем больше значение, тем хуже состояние поверхности
дисков. Поле raw value содержит общее количество переназначенных секторов.
|
06
|
Read Channel Margin
|
Запас
канала чтения. Назначение этого атрибута не документировано. В современных
накопителях не используется.
|
07
|
Seek Error Rate
|
Частота
ошибок при позиционировании блока головок. Чем их больше, тем хуже состояние
механики и/или поверхности жёсткого диска.
|
08
|
Seek Time Performance
|
Средняя
производительность операции позиционирования магнитными головками. Если значение
атрибута уменьшается, то велика вероятность проблем с механической частью.
|
09
|
Power-On Hours (POH)
|
Число
часов (минут, секунд - в зависимости от производителя), проведённых во
включенном состоянии. В качестве порогового значения для него выбирается
паспортное время наработки на отказ (MTBF — mean time between failure).
|
0A
|
Spin-Up Retry Count
|
Число
повторных попыток раскрутки дисков до рабочей скорости в случае, если первая
попытка была неудачной. Если значение атрибута увеличивается, то велика
вероятность неполадок с механической частью.
|
0B
|
Recalibration Retries
|
Количество
повторов запросов рекалибровки в случае, если первая попытка была неудачной.
Если значение атрибута увеличивается, то велика вероятность проблем с
механической частью.
|
0C
|
Device Power Cycle Count
|
Количество
полных циклов включения-выключения диска.
|
0D
|
Soft Read Error Rate
|
Число
ошибок при чтении по вине программного обеспечения.
|
B8
|
End-to-End
error
|
This attribute is a part of HP's SMART
IV technology and it means that after transferring through the cache RAM data
buffer the parity data between the host and the hard drive did not match
|
BE
|
Airflow
Temperature (WDC)
|
Температура
воздуха внутри корпуса жёсткого диска для дисков Western Digital. Для дисков Seagate рассчитывается по формуле (100 — HDA temperature).
|
BF
|
G-sense error rate
|
Количество
ошибок, возникающих в результате ударных нагрузок.
|
C0
|
Power-off
retract count
|
Number of power-off or emergency
retract cycles.
|
C1
|
Load/Unload Cycle
|
Количество
циклов перемещения блока магнитных головок в парковочную зону / в рабочее
положение.
|
C2
|
HDA temperature
|
Здесь
хранятся показания встроенного термодатчика.
|
C3
|
Hardware ECC Recovered
|
Число
коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования,
ошибок передачи по внешнему интерфейсу).
|
C4
|
Reallocation Event Count
|
Число
операций переназначения. В поле «raw value» атрибута хранится общее число попыток переноса информации с
переназначенных секторов в резервную область. Учитываются как успешные, так и
неуспешные попытки.
|
C5
|
Current Pending Sector Count
|
В поле
хранится число секторов, являющихся кандидатами на замену. Они не были ещё
определены как плохие, но считывание с них отличается от чтения стабильного
сектора, это так называемые подозрительные или нестабильные сектора. В случае
успешного последующего прочтения сектора он исключается из числа кандидатов.
В случае повторных ошибочных чтений накопитель пытается восстановить его и
выполняет операцию переназначения.
|
C6
|
Uncorrectable Sector Count
|
Число
неисправимых ошибок при обращении к сектору. {Возможно, имелось в виду «число
некорректируемых секторов», но никак не число самих ошибок!} В случае
увеличения числа ошибок велика вероятность критических дефектов поверхности
и/или механики накопителя.
|
C7
|
UltraDMA CRC Error Count
|
Число
ошибок, возникающих при передаче данных по внешнему интерфейсу.
|
C8
|
Write
Error Rate /
Multi-Zone
Error Rate
|
Показывает
общее количество ошибок, происходящих при записи сектора. Может служить
показателем качества поверхности и механики накопителя.
|
C9
|
Soft
read error rate
|
Soft read error ra
|
Ca
|
Data
Address Mark errors
|
Number of Data Address Mark (DAM)
errors (or) vendor-specific.
|
CB
|
Run out
cancel
|
Количество ошибок ECC.
|
CC
|
Soft ECC correction
|
Количество
ошибок ECC, скорректированных программным
способом.
|
CD
|
Thermal
asperity rate (TAR)
|
Number of thermal asperity errors.
|
CE
|
Flying height
|
Высота
между головкой и поверхностью диска.
|
CF
|
Spin
high current
|
Amount of high current used to spin up
the drive.
|
D0
|
Spin
buzz
|
Number of buzz routines to spin up the
drive.
|
D1
|
Offline
seek performance
|
Drive’s seek performance during
offline operations.
|
DC
|
Disk Shift
|
Дистанция
смещения блока дисков относительно шпинделя. В основном возникает из-за удара
или падения. Единица измерения неизвестна.
|
DD
|
G-Sense Error Rate
|
Число
ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания
встроенного датчика удара.
|
DE
|
Loaded Hours
|
Время,
проведённое блоком магнитных головок между выгрузкой из парковочной области в
рабочую область диска и загрузкой блока обратно в парковочную область.
|
DF
|
Load/Unload Retry Count
|
Количество
новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной
области после неудачной попытки.
|
E0
|
Load Friction
|
Величина
силы трения блока магнитных головок при его выгрузке из парковочной области.
|
E2
|
Load 'In'-time
|
Время, за
которое привод выгружает магнитные головки из парковочной области на рабочую
поверхность диска.
|
E3
|
Torque Amplification Count
|
Количество
попыток скомпенсировать вращающий момент.
|
E4
|
Power-Off Retract Cycle
|
Количество
повторов автоматической парковки блока магнитных головок в результате
выключения питания.
|
E6
|
GMR Head Amplitude
|
Амплитуда
«дрожания» (расстояние повторяющегося перемещения блока магнитных головок).
|
E7
|
Temperature
|
Температура
жёсткого диска.
|
F0
|
Head flying hours
|
Время
позиционирования головки.
|
FA
|
Read error retry rate
|
Число
ошибок во время чтения жёсткого диска.
|
Комментариев нет:
Отправить комментарий