Автор Тема: SMART Диск и жадность  (Прочитано 5481 раз)

Оффлайн Kirikekeks

  • Полу-попутчик, полу-мудрец, полу-невежда, полу-подлец...
  • Давно тут
  • **
  • Сообщений: 314
    • Email
SMART Диск и жадность
« : 28.03.2014 22:39:39 »
Добрый день всеведующие!
Может кто разбирается в сообщениях смарта?
На сервере, Из жадности к двум новым дискам, по 3т добавил (оставил) родной пожилой на 250 гб. Все три собраны в страйп пул,  и маленький начал хандрить:
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 Data_Address_Mark_Errs  0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 2

Есть время на подумать? Очень не хочется разрушать пул. Опыта для уверенной замены диска не хватает, надо эмулировать и симулировать. Жадность - это плохо.
Ламер

Оффлайн МИНЗДРАВ

  • Странник_
  • *
  • Сообщений: 3 045
  • ALWK8 х64 Branch sysd & server-light_1.9.3sysV noX
    • http://yx-kak.ru/linux.htm
Re: SMART Диск и жадность
« Ответ #1 : 16.05.2014 22:38:08 »
ATA Error Count: 2
А Вы, его как к разъёму подключили? А то у меня тоже такая ошибка в смарте.

Оффлайн flint1975

  • Завсегдатай
  • *
  • Сообщений: 1 425
    • Email
Re: SMART Диск и жадность
« Ответ #2 : 18.05.2014 12:27:59 »
Если диск IDE то я бы сказал замените шлейф, если sata то тоже замените sata шнурок, но и проверьте блок питания на помехи или хотя бы на отсутствие вздутых конденсаторов.
бывает еще из-за деградации пайки южного моста - но это редкость.
Ошибка четности передачи данных.

Оффлайн flint1975

  • Завсегдатай
  • *
  • Сообщений: 1 425
    • Email
Re: SMART Диск и жадность
« Ответ #3 : 18.05.2014 12:29:45 »
Да, и не стягивайте плотно между собой шнурки сата.

Оффлайн asterix81

  • Завсегдатай
  • *
  • Сообщений: 150
Re: SMART Диск и жадность
« Ответ #4 : 19.05.2014 08:33:01 »
Да, и не стягивайте плотно между собой шнурки сата.
В смысле наводок?

Оффлайн flint1975

  • Завсегдатай
  • *
  • Сообщений: 1 425
    • Email
Re: SMART Диск и жадность
« Ответ #5 : 19.05.2014 11:27:02 »
Точно не могу судить, возможно наводки, возможно деформация коаксиального кабеля внутри шлейфа иногда приводят к ошибкам передачи по кабелю.

Оффлайн asterix81

  • Завсегдатай
  • *
  • Сообщений: 150
Re: SMART Диск и жадность
« Ответ #6 : 19.05.2014 12:59:02 »
Точно не могу судить, возможно наводки, возможно деформация коаксиального кабеля внутри шлейфа иногда приводят к ошибкам передачи по кабелю.
Много проблем возникало и возникает в местах контакта кабеля и устройств. Например у меня много примеров когда чуть чуть повернутый SATA-разъем у "винта" давал сбои в передаче. А с разъёмом питания SATA ешё веселее.
 Например в одной крупной сборочной компании висела Инструкция где ЖИРНЫМИ БУКВАМИ было написано: ЕСЛИ У ВИНТЧЕСТЕРА ЕСТЬ СТАНДАРТНЫЙ РАЗЪЕМ ПИТАНИЯ, ИСПОЛЬЗОВАТЬ ТОЛЬКО!!! ЕГО!!!

Оффлайн МИНЗДРАВ

  • Странник_
  • *
  • Сообщений: 3 045
  • ALWK8 х64 Branch sysd & server-light_1.9.3sysV noX
    • http://yx-kak.ru/linux.htm
Re: SMART Диск и жадность
« Ответ #7 : 19.05.2014 18:59:58 »
Может кто разбирается в сообщениях смарта?
Я тоже ещё не очень шустро анализирую выводы смарта, хотя мануал прочёл на русском.
Подскажите, знатоки, мой смарт для абсолютно нулёвого винчестера, нормальные показатели выдаёт?
[root@host-242 ~]# smartctl --all /dev/sdb
smartctl 6.1 2013-03-16 r3800 [i686-linux-3.12.17-std-def-alt1] (ALT Linux 6.1-alt2)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     ST1000NM0033-9ZM173
Serial Number:    Z1W0YQKL
LU WWN Device Id: 5 000c50 0654f0e5a
Firmware Version: SN03
User Capacity:    1 000 204 886 016 bytes [1,00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Mon May 19 18:56:12 2014 VOLT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (   97) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 120) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x50bd) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   081   074   044    Pre-fail  Always       -       124544832
  3 Spin_Up_Time            0x0003   098   098   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       4
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       657906
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       2
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       4
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   064   054   045    Old_age   Always       -       36 (Min/Max 30/36)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       4
194 Temperature_Celsius     0x0022   036   046   000    Old_age   Always       -       36 (0 21 0 0 0)
195 Hardware_ECC_Recovered  0x001a   030   026   000    Old_age   Always       -       124544832
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

[root@host-242 ~]#
Аппаратных ошибок, что-то больше ожидаемого. Даже на самых старых винтах, у меня там нули!
« Последнее редактирование: 19.05.2014 19:11:40 от МИНЗДРАВ »

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 10 259
Re: SMART Диск и жадность
« Ответ #8 : 19.05.2014 20:29:43 »
См. критичные / некритичные атрибуты:
http://www.opennet.ru/base/sys/smart_hdd_mon.txt.html

Оффлайн МИНЗДРАВ

  • Странник_
  • *
  • Сообщений: 3 045
  • ALWK8 х64 Branch sysd & server-light_1.9.3sysV noX
    • http://yx-kak.ru/linux.htm
Re: SMART Диск и жадность
« Ответ #9 : 19.05.2014 21:15:40 »
Тогда получается у нулёвого винчестера все цифры в столбце THRESH должны быть нулёвыми?
А у меня почемуто отношение, в строке 10 Spin-Up Retry Count, по скинутой вами инструкции (там написано "что когда цифра в столбце VALUE будет меньше цифры в столбце THRESH, то это кирдык), близко к смерти, на первом-же включении! (хотя сам параметр ( в столбце RAW_VALUE) равен нулю)
Или я не так понял?

P.S. Блин, вот нефарт! Когда не знал ничего про смарт - всегда c винтами везло. По 15 лет пахали, вернее ещё вообще ни один не сдох.

Оффлайн МИНЗДРАВ

  • Странник_
  • *
  • Сообщений: 3 045
  • ALWK8 х64 Branch sysd & server-light_1.9.3sysV noX
    • http://yx-kak.ru/linux.htm
Re: SMART Диск и жадность
« Ответ #10 : 19.05.2014 21:42:44 »
Похоже трындец моему новому винту?
7 Seek_Error_Rate, столбик VALUE, на глазах прям, с цифры 100 до 60 упал.
а строка 195 Hardware_ECC_Recovered, в том-же столбце, с 30 до 27 упала.
Правильные мои догадки насчёт трындца новому винту? Или глаза у страха велики?
root@host-242 ~# smartctl -a /dev/sdb
smartctl 6.1 2013-03-16 r3800 [i686-linux-3.12.17-std-def-alt1] (ALT Linux 6.1-alt2)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     ST1000NM0033-9ZM173
Serial Number:    Z1W0YQKL
LU WWN Device Id: 5 000c50 0654f0e5a
Firmware Version: SN03
User Capacity:    1 000 204 886 016 bytes [1,00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Mon May 19 21:42:13 2014 VOLT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (   97) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 120) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x50bd) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   080   070   044    Pre-fail  Always       -       105283334
  3 Spin_Up_Time            0x0003   098   098   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       5
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   062   060   030    Pre-fail  Always       -       1678523
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       5
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   050   049   045    Old_age   Always       -       50 (Min/Max 48/50)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       5
194 Temperature_Celsius     0x0022   050   051   000    Old_age   Always       -       50 (0 21 0 0 0)
195 Hardware_ECC_Recovered  0x001a   026   026   000    Old_age   Always       -       105283334
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

[root@host-242 ~]#
]
Ничё не понятно.

Оффлайн asterix81

  • Завсегдатай
  • *
  • Сообщений: 150
Re: SMART Диск и жадность
« Ответ #11 : 20.05.2014 10:44:16 »
[quote author=МИНЗДРАВ link=topic=32253.msg229676#msg229676 date=1400521364]

[root@host-242 ~]#
]
Ничё не понятно.
[/quote]

Может пока не сеять панику?..  Обкатается, притрётся  :-)  (может на новом диске более новая версия смарт? и ее неправильно опознаёт утилита смарттулс (дата выпуска 13 года))

Оффлайн МИНЗДРАВ

  • Странник_
  • *
  • Сообщений: 3 045
  • ALWK8 х64 Branch sysd & server-light_1.9.3sysV noX
    • http://yx-kak.ru/linux.htm
Re: SMART Диск и жадность
« Ответ #12 : 20.05.2014 10:59:26 »
А что значит SMART III в этом описании? В наших репах какой смарт, по оной классификиции?
См. критичные / некритичные атрибуты:
http://www.opennet.ru/base/sys/smart_hdd_mon.txt.html

Оффлайн Kalt

  • Завсегдатай
  • *
  • Сообщений: 996
Re: SMART Диск и жадность
« Ответ #13 : 20.05.2014 11:01:33 »
Правильные мои догадки насчёт трындца новому винту? Или глаза у страха велики?
  ...В 2009 году, снять подозрения помогла утилита с сайта производителя. После проверки ею, отнёс HDD в магазин. Где получил другой, работающий до сих пор. :-)
P.S.
  HDD работал месяца 3...
« Последнее редактирование: 20.05.2014 11:04:56 от Kalt »
Intel Xeon X3440 2,53GHz, MSI H55- G43, DDR3- 4x2GB, GF GT710

Оффлайн flint1975

  • Завсегдатай
  • *
  • Сообщений: 1 425
    • Email
Re: SMART Диск и жадность
« Ответ #14 : 20.05.2014 11:41:38 »
Похоже трындец моему новому винту?
  1 Raw_Read_Error_Rate     0x000f   080   070   044    Pre-fail  Always       -       105283334
195 Hardware_ECC_Recovered  0x001a   026   026   000    Old_age   Always       -       105283334
На эти два параметра у Seagate не надо обращать внимания, просто сигейтовцы честно поступают и в лог (смарт) пишут, что при чтении данные были скорректированы по избыточному коду.
главное чтобы они сильно не различались, в идеале равны (как у вас и есть).
На некоторых версиях firmware у сигейтов эти атрибуты в 0 (дабы не пугать пользователей), но это редко бывает.