Автор Тема: Это нормально или жесткий диск скоро помрет?  (Прочитано 17878 раз)

Оффлайн Mr.Madguy

  • Давно тут
  • **
  • Сообщений: 249
Не знаю, с кем еще можно по этому поводу посоветоваться.

Старому диску 7 лет. Его SMART выглядит вот так:
Спойлер
Такая картина уже давно, но якобы при появлении битых секторов существует 40% вероятность, что диск сдохнет в ближайшие месяцы.

Потому я решил купить новый. Купил с расчетом на то, что не буду ставить систему с нуля, а просто скопирую один диск полностью на другой. Скопировал без ошибок. Но SMART нового диска выглядит вот так:
Спойлер
Проще говоря он греется заметно сильнее и выдает очень много ошибок позиционирования головок и чтения/записи. Ошибки позиционирования изначально просели, но потом постепенно улучшались. Застряли вот на этом значении, что все равно плохо. Ошибки чтения/записи плавают, т.е. то улучшаются примерно до 84, то опять падают до 60 с чем то.

Это вообще нормальный SMART для нового диска или его стоит попытаться поменять по гарантии? Я обращался в тех поддержку Seagate и там сказали, что если диск проходит длительный тест без ошибок, то с ним все в порядке. Ошибок не было. Я конечно понимаю, что другие производители вообще скрывают эти параметры и у них всегда "зеленые" 100%, если все "в порядке", но все таки 60% на новом диске как то вызывают беспокойство.

Оффлайн Kalt

  • Завсегдатай
  • *
  • Сообщений: 996
...Да возьмите вы с офсайта  свежую V- 5.03: http://hdd.by/victoria/ . Там же есть инструкция. За 3 минуты будет выстроен график вашего HDD. Далее определитесь. Удачи!..
Intel Xeon X3440 2,53GHz, MSI H55- G43, DDR3- 4x2GB, GF GT710

Оффлайн Антон Мидюков

  • alt linux team
  • ***
  • Сообщений: 5 183
  • antohami@
Проще говоря он греется заметно сильнее и выдает очень много ошибок позиционирования головок и чтения/записи.

Температура ниже 50 градусов - норма. Где вы увидели ошибки у нового? Мой диагноз - пациент здоров.

Оффлайн Mr.Madguy

  • Давно тут
  • **
  • Сообщений: 249
Температура ниже 50 градусов - норма. Где вы увидели ошибки у нового? Мой диагноз - пациент здоров.
Просто сравните Raw read error rate и Seek error rate у семилетнего диска, отработавшего 16к часов, и абсолютно нового. У старого ни один параметр здоровья не падает ниже 80%.
...Да возьмите вы с офсайта  свежую V- 5.03: http://hdd.by/victoria/ . Там же есть инструкция. За 3 минуты будет выстроен график вашего HDD. Далее определитесь. Удачи!..
Я уже не помню, почему я пользовался именно той версией. Обновился. Да они в принципе особо не отличаются. Я уже прогонял полный тест утилитой SeaBoot. Он завершился без ошибок. Скорость чтения отличная. Почти 240Мб/с в начале диска при заявленных 220-ти. Во многом из за этого я и выбрал именно этот диск. Но вот время доступа почему-то страдает. Возможно это из за того, что диск является системным и иногда ось его занимает под свои нужды.
« Последнее редактирование: 23.10.2019 20:31:35 от Mr.Madguy »

Оффлайн Александр Ерещенко

  • Завсегдатай
  • *
  • Сообщений: 1 161
У Seagate несколько отличаются регистры SMART от общепринятых, поэтому и показываются такие странные слишком огромные некоторые значения.
Чем смотреть, чтобы была поправка на Seagate, не подскажу, сам не знаю. Приходится ориентироваться на оставшиеся регистры с правдоподобными значениями.

Оффлайн Kalt

  • Завсегдатай
  • *
  • Сообщений: 996
Чем смотреть,
...Да тем же самым. График покажет:
Intel Xeon X3440 2,53GHz, MSI H55- G43, DDR3- 4x2GB, GF GT710

Оффлайн Mr.Madguy

  • Давно тут
  • **
  • Сообщений: 249
...Да тем же самым. График покажет:
Ну как бы даже в инструкции написано, что это не для диагностики диска, а просто для измерения скорости доступа. Что то типа бэнчмарка. Показателем является только количество медленных секторов, которые являются кандидатами в битые, или вообще ошибок чтения, т.е. по сути битых секторов. В принципе я потестил на другом компьютере и там картина примерно такая же, так что в этом плане все должно быть нормально. Скорость доступа вообще супер.
У Seagate несколько отличаются регистры SMART от общепринятых, поэтому и показываются такие странные слишком огромные некоторые значения.
Чем смотреть, чтобы была поправка на Seagate, не подскажу, сам не знаю. Приходится ориентироваться на оставшиеся регистры с правдоподобными значениями.
Ну как бы программы диагностики по SMART никогда и не используют RAW значения для измерения. Только для каких то очевидных значений, типа числа битых секторов и температуры. Они используют вот те два значения, которые измеряются в некоторых относительных единицах. Threshold считается за критическое значение "диск помирает". А здоровье считается в % от него. И вот как то не очень приятно, когда максимальное значение 100, критическое 45, а у тебя новый диск сразу имеет 60. Ну да. Оно постепенно улучшилось до 73, но это все равно в районе 60% здоровья, что не нормально для нового диска.

Я даже грешным делом начал подумывать о том, чтобы просто купить еще один диск. Бэкап для бэкапа так сказать. Я купил этот диск через интернет и он мог быть поврежден при доставке. Как я потом узнал, такой же диск можно было купить и рядом с домом, просто дороже. Начал уже подумывать о том, чтобы, как говорится, заплатить за спокойствие, купить второй такой же и объединить их в RAID 1. Это так же может повысить скорость чтения. В теории до 450Мб/с, т.е. приблизить систему по скорости к SSD. Может и время доступа улучшится. Просто это опасная процедура. Есть риск потери данных. Объединение в RAID скорее всего удалит с дисков все данные и их придется копировать заново. А копия уже чутка устарела. А назад скопировать уже не получится.

И если второй диск поведет себя так же, то вопросов нет. Значит просто особенность модели. Оно просто тонкий. Из за этого сильно греется, несмотря на наличие фронтального кулера. Диск расширяется, отсюда и ошибки. А так же в нем по слухам применяется новая технология черепичной записи. Но на эту процедуру денег жалко. Лучше SSD хороший купить.
« Последнее редактирование: 24.10.2019 09:14:08 от Mr.Madguy »

Оффлайн rits

  • Завсегдатай
  • *
  • Сообщений: 1 043
  • ITS
релокейт 0, на остальное забей если не понимаешь, что эти параметры означают, - пациент в принципе здоров, иначе читай мануалы, если есть желание.

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 10 259
Не знаю, с кем еще можно по этому поводу посоветоваться.

Старому диску 7 лет. Его SMART выглядит вот так:
Спойлер

Атрибуты на которые стоит обратить внимание (значение колонки Raw отличное от нуля и чем выше, тем хуже):

05 Reallocated Sector Count - количество релоцированых секторов; сыпятся блины диска
07 Seek Error Rate - частота ошибок при позиционировании блока магнитных головок; связано с ухудшением БМГ или качества поверхности блинов
10 Spin-up retries - число повторных попыток раскрутки дисков; растёт при ухудшении механики

Мой Seagate 7200.10 сдох на восьмом году интенсивной работы (полный износ механики).
« Последнее редактирование: 25.10.2019 22:26:49 от Speccyfighter »

Оффлайн Mr.Madguy

  • Давно тут
  • **
  • Сообщений: 249
Атрибуты на которые стоит обратить внимание (значение колонки Raw отличное от нуля и чем выше, тем хуже):

05 Reallocated Sector Count - количество релоцированых секторов; сыпятся блины диска
07 Seek Error Rate - частота ошибок при позиционировании блока магнитных головок; связано с ухудшением БМГ или качества поверхности блинов
10 Spin-up retries - число повторных попыток раскрутки дисков; растёт при ухудшении механики

Мой Seagate 7200.10 сдох на восьмом году интенсивной работы (полный износ механики).
Ну со старым диском все понятно. Время летит незаметно. Казалось бы недавно купил. А ему уже 7 лет. Но правда бэды появились уже очень давно. И с тех пор их количество не увеличивается. Что возможно означает, что это софт-бэды, которые появились в результате потери питания. Я же не знаю, пытается ли контроллер перед отправкой сектора в список бэдов восстановить его перезаписью или он только пытается его читать и если CRC не совпадает, то просто тупо отправляет его в бэды, даже если с ним все нормально? Даже начал искать способы их сбросить, но к сожалению это без специального оборудования не возможно.

Мой старый диск прослужил 10 лет. Правда последнее время перед смертью не использовался, т.к. я уже купил новый и переставил систему на него. Просто стоял в компьютере. О его смерти я узнал по тормозам компьютера, а потом и невозможности загрузится. Так получилось, что загрузочная запись осталась именно на нем. По каким-то причинам при установке Windows она даже не предупреждает, что комп загружается не с того диска и загрузчик тоже стоит не на том диске.

Мне даже интересно стало. Может он еще жив? Тогда я просто еще не знал всех этих нюансов. У меня просто был случай, когда у WD бэд появился прямо в области журнала файловой системы. Из за этого он постоянно подвисал на минуту. Но простой прогон чекдиском исправил проблему и он пока еще жив. А тот диск я просто сразу заменил на новый. Было много геммора и шаманства, чтобы сохранить буквы дисков и не переставлять всю систему заново. Можно было бы достать его с полки и попробовать погонять тестами. Хотя вряд ли он жив. Тормоза всей системы намекают на то, что там было уже что то плохо с электроникой.

И вот потому и возник вопрос. А нормально ли для нового диска иметь такой высокий Seek error rate? На старом диске например наихудший Seek error rate такой же, т.е. есть шанс, что со временем он улучшится. Я обратился в поддержку Seagate в надежде на то, что уж они то про свою продукцию должны знать больше, чем кто либо ни было. Было бы идеально найти человека с таким же диском и сравнить SMARTы. И у кого, как ни у поддержки должна быть такая инфа? Но, как всегда, эти надежды не оправдались. Там начали пинять на бэды и на то, что бэды возможно были "скопированы" со старого диска, в возможности чего я лично сомневаюсь, т.к. релокейт делается аппаратно и для ОСи все должно быть прозрачно. Т.к. только бэды могут быть поводом для замены диска по гарантии. А они только и знают, что предложить тест своей фирменной утилитой, хотя она, если честно, не очень, т.к. только говорит, пройден ли тест или нет и не показывает никаких подробностей. Но полный тест бэды не выявил. Так что не гарантийный случай.

Возвращать продавцу как то не хочется, т.к. это очень много геммора. Это возможно, т.к. продавец допускает замену даже по причине "мне просто не понравилось", но все равно придется удалять все данные, куда то везти, возможно проходить экспертизу. И не факт, что после всех мучений новый диск не будет таким же или еще хуже. Вот теперь и сомневаюсь. Взять еще один диск или не взять? Взять такой же или от другого производителя? Если брать такой же, то делать ли RAID 1, чтобы хоть какой-то профит был, или не рисковать? К тому же я планировал в ближайшем будущем так же купить новый SSD. Денег жалко.
« Последнее редактирование: 26.10.2019 09:32:07 от Mr.Madguy »

Оффлайн Nicom

  • Завсегдатай
  • *
  • Сообщений: 631
объединить их в RAID 1.
Просто это опасная процедура. Есть риск потери данных. Объединение в RAID скорее всего удалит с дисков все данные и их придется копировать заново.
Нет никакого риска потери данных, если мы говорим про софт массив созданный md.
Просто создаёте degraded RAID1 массив из одного нового диска. Копируете на него данные с помощью утилиты dd. А потом добавляете в этот массив старый диск и делаете rebuild массива.

По поводу S.M.A.R.T.
Плавающие значения некритичных параметров у Seagate , сужу по практике наблюдения за этими HDD и по описаниям в сети, являются нормой.
Причём значение параметра 01 у них почти всегда равно значению из параметра 195, что, вроде бы, разные вещи.
То есть, нельзя говорить об ушатанной механике диска по параметру 01 и 07. А вот о том насколько хорошо закреплён сам HDD в корпусе компьютера можно косвенно судить по параметру 07.

Взять еще один диск или не взять? Взять такой же или от другого производителя? Если брать такой же, то делать ли RAID 1, чтобы хоть какой-то профит был, или не рисковать?
Я отказался от Seagate после того, как на сервере в зеркальном массиве у меня одновременно посыпались пластины на обоих ES2 (энтерпрайзный вариант винтов). Часть файлов мне так и не удалось восстановить.
В Вашем случае, нет смысла брать второй Seagate для RAID1. Возьмите второй диск другого производителя. Но и RAID1 не отменяет контроля за дисками через smartd.
Если есть финансовая возможность сделать зеркальный массив, то ей стОит воспользоваться.
« Последнее редактирование: 27.10.2019 02:20:39 от Nicom »

Оффлайн Mr.Madguy

  • Давно тут
  • **
  • Сообщений: 249
объединить их в RAID 1.
Просто это опасная процедура. Есть риск потери данных. Объединение в RAID скорее всего удалит с дисков все данные и их придется копировать заново.
Нет никакого риска потери данных, если мы говорим про софт массив созданный md.
Просто создаёте degraded RAID1 массив из одного нового диска. Копируете на него данные с помощью утилиты dd. А потом добавляете в этот массив старый диск и делаете rebuild массива.

По поводу S.M.A.R.T.
Плавающие значения некритичных параметров у Seagate , сужу по практике наблюдения за этими HDD и по описаниям в сети, являются нормой.
Причём значение параметра 01 у них почти всегда равно значению из параметра 195, что, вроде бы, разные вещи.
То есть, нельзя говорить об ушатанной механике диска по параметру 01 и 07. А вот о том насколько хорошо закреплён сам HDD в корпусе компьютера можно косвенно судить по параметру 07.
Да я хотел сделать аппаратный RAID 1, т.к. материнка его поддерживает. Скорее всего это даст максимальный прирост в скорости работы. Прочитал инструкцию, а там написано, что данные на обоих дисках будут потеряны. Даже если для RAID 1 это не так, то все равно стремно. Это не софт, а прошивка и там все может быть сделано по тупому. Возмет да и форматнет винты. Ну это не страшно, т.к. есть исходный диск и я все критичные данные на нем обновлял, но все равно как то рискованно. Буду теперь рассматривать вариант с софтовым RAID 1.

Да, 01 равно 195. И это в принципе не совсем одно и тоже. Это зафиксированные ошибки и исправленные ошибки. Просто типа все ошибки исправляются и потому значения не отличаются друг от друга.

Диск в корпусе у меня закреплен хорошо. На все 4 винта. Вибрации вроде нет. В объяснении к параметру 07 есть 3 варианта причины. Износ механики, вибрации и перегрев. Я скорее склоняюсь к 3му, т.к. диск по каким то причинам сильнее греется, чем старый. Но к примеру у меня есть переносной HGST и он тоже сильно греется. Скорее всего это такая особенность модели. Из за тонкого корпуса. Так же этот параметр постепенно улучшается. Возможно из за тепловой рекалибровки или за счет перезаписи данных в моих температурных условиях. Медленнее, чем в начале, но он уже дорос до 74. И возможно со временем доползет до заветных 80. У старого диска ведь тоже худшее значение 60. Т.е. оно когда то таким было.

P.S. Вроде Intel RST позволяет сделать RAID 1 без потери данных. Правда не понятно, будет ли прирост в скорости, т.к. его почему то обещают только для RAID 0.

А вообщет я пока не разобрался. Есть три способа создать RAID и я пока не знаю, какой из них лучше. Какой потенциально может дать прирост скорости. Хотелось бы хардварный, но возможно как раз таки софтварный в этом плане лучше.
1) Хардварный рейд. Вроде как его создание приведет к потере данных на дисках. Есть исходные данные, но они немного устарели, да и рисковано как то все это. Хотелось бы как то обойтись без этого.
2) Создать рейд при помощи утилиты Intel RST. Потери данных не будет, но пока не пойму, будет ли такой рейд хардварным или совтварным. И будет ли он чем то отличаться от обычного созданного ОСью. Походу не работает для системного диска. Облом.
3) Создать рейд средствами ОСи. Без потери данных. Будет 100% софтварным. В Windows доступно только в Pro версиях, так что тоже облом.

P.P.S. А плавает параметр 01 потому, что RAW значение периодически переполняется. Когда оно переполняется, RAW значение становится равным 0, а сам параметр некоторое время после этого равен 100. После чего он резко просаживается до ~65, а потом постепенно восстанавливается обратно примерно до 84. Пока опять не сбросится.
« Последнее редактирование: 27.10.2019 21:42:24 от Mr.Madguy »

Оффлайн Mr.Madguy

  • Давно тут
  • **
  • Сообщений: 249
Вот нашел время полностью протестить диски.

Со старым все понятно. Он каким то образом умудрился нахватать бэдов в самом конце диска. В области, которая даже не используется. Как умудрился? Кто его знает. Может это заводские. В остальном он в хорошем состоянии. Даже жалко как то.
Спойлер

А вот с новым не все так однозначно. На медленные сектора обращать особого внимания не стоит, т.к. диск системный и винда нет нет, да к нему время от времени обращается, что приводит к подтормаживаниям. Но стоит ли верить этому тесту? Ведь походу пустое пространство вообще не читается.
Спойлер
« Последнее редактирование: 02.11.2019 13:27:43 от Mr.Madguy »

Оффлайн Kalt

  • Завсегдатай
  • *
  • Сообщений: 996
А вот с новым не все так однозначно.
...Так же как и со старым. Ответ есть у автора данного теста. И если вам покоя не даёт ваш диск, то самое правильное решение, это тест от производителя. Как пример приведу собственный опыт. Увидев странную работу ОС, обратился к производителю, протестировал HDD и получил рекомендацию на замену диска в магазине, что я и сделал. Попытка отказать мне была развеяна именно тестом от производителя. Диск поменяли на аналогичный и он до сих пор у меня в работе. В этом году уже 10 лет между прочим...
Intel Xeon X3440 2,53GHz, MSI H55- G43, DDR3- 4x2GB, GF GT710

Оффлайн Mr.Madguy

  • Давно тут
  • **
  • Сообщений: 249
...Так же как и со старым. Ответ есть у автора данного теста. И если вам покоя не даёт ваш диск, то самое правильное решение, это тест от производителя. Как пример приведу собственный опыт. Увидев странную работу ОС, обратился к производителю, протестировал HDD и получил рекомендацию на замену диска в магазине, что я и сделал. Попытка отказать мне была развеяна именно тестом от производителя. Диск поменяли на аналогичный и он до сих пор у меня в работе. В этом году уже 10 лет между прочим...
Да я не о том. Я о том, что 350Мб/с - это не реалистичное для этого диска значение. А это значит, что благодаря TRIM контроллер может просто знать, где у него ничего не записано, и даже не читать эти участки. А это значит, что тест в этом случае не имеет смысла, т.к. реально ничего с диска вообще не читается.