Автор Тема: Raid1 на SSDшниках  (Прочитано 1197 раз)

Оффлайн Александр Ерещенко

  • Завсегдатай
  • *
  • Сообщений: 1 161
Re: Raid1 на SSDшниках
« Ответ #30 : 22.03.2024 15:46:30 »
Вы учитываете только математическое ожидание
  и забываете про дисперсию,
Это конечно так, но на практике регулярно встречался с тем, что отсутствует мониторинг (хоть какой) состояние рейда, и о том, что какой-то один винт выпал из рейда иногда узнают через несколько месяцев после события, и то случайно. :)

Оффлайн Чён

  • Давно тут
  • **
  • Сообщений: 129
    • Email
Re: Raid1 на SSDшниках
« Ответ #31 : 22.03.2024 16:35:51 »
умирать они будут приблизительно в одно и то же время.
Вот этого-то и боюсь!

Оффлайн буратино-42

  • Давно тут
  • **
  • Сообщений: 92
Re: Raid1 на SSDшниках
« Ответ #32 : 22.03.2024 18:01:43 »
отсутствует мониторинг (хоть какой) состояние рейда, и о том, что какой-то один винт выпал из рейда иногда узнают через несколько месяцев после события, и то случайно.
следуя Вашей логике:
 тому, кто раз в несколько месяцев проверяет отказ дисков,
  или делает это случайным образом,
   поможет установка неодинаковых?

Вы это в серьёз?

Оффлайн Nicom

  • Завсегдатай
  • *
  • Сообщений: 630
Re: Raid1 на SSDшниках
« Ответ #33 : 22.03.2024 22:27:29 »
умирать они будут приблизительно в одно и то же время.
Вот этого-то и боюсь!
Во первых, далеко не факт, что в примерно одно время умрут оба одинаковых накопителя в массиве, и в моей практике это подтверждалось. Но надо не лениться и настраивать средства оповещения, как сказали выше.

Во вторых, массивы не отменяют резервное копирование. Любой массив позволяет серверу оставаться в работе при выходе из строя одного из дисков, но массив не защищает от порчи информации. А правильно настроенное резервное копирование защищает.

Это конечно так, но на практике регулярно встречался с тем, что отсутствует мониторинг (хоть какой) состояние рейда, и о том, что какой-то один винт выпал из рейда иногда узнают через несколько месяцев после события, и то случайно. :)
Это описывается фразой: - "Х...к, х...к и в продакшен".
Не любят у нас люди читать документацию. А ведь раньше были самой читающей страной в мире.

Оффлайн буратино-42

  • Давно тут
  • **
  • Сообщений: 92
Re: Raid1 на SSDшниках
« Ответ #34 : 23.03.2024 06:08:00 »
Во первых, далеко не факт, что в примерно одно время умрут оба одинаковых накопителя в массиве, и в моей практике это подтверждалось

В одном предложение - два противоположных утверждения:
 1 - "не факт", 2 -"это подтверждалось".

Что же у Вас "подтверждалось", что "факт" ?
Варианты:
а) одинаковые диски - одновременно отказали
или
б) неодинаковые диски - одновременно отказали
или
в) ?

Оффлайн Чён

  • Давно тут
  • **
  • Сообщений: 129
    • Email
Re: Raid1 на SSDшниках
« Ответ #35 : 23.03.2024 11:32:42 »
отсутствует мониторинг (хоть какой)
А есть команда, проверяющая работоспособность дисков?

Оффлайн Александр Ерещенко

  • Завсегдатай
  • *
  • Сообщений: 1 161
Re: Raid1 на SSDшниках
« Ответ #36 : 23.03.2024 12:53:55 »
отсутствует мониторинг (хоть какой) состояние рейда, и о том, что какой-то один винт выпал из рейда иногда узнают через несколько месяцев после события, и то случайно.
следуя Вашей логике:
 тому, кто раз в несколько месяцев проверяет отказ дисков,
  или делает это случайным образом,
   поможет установка неодинаковых?

Вы это в серьёз?
Следуя моей логике, при отказе одного диска по причине износа (для SSD это ярко выражено) очень велика вероятность, что в скором времени выйдет из строя и второй диск - одинаковые характеристики, одинаковое кол-во записанных данных (речь же про ssd в рейде 1). Т.е. легко проморгать выход из строя одного устройства, не принять вовремя нужных действий и уже словить выход из строя и второго диска.
Когда два диска с разным ресурсом, возможно второй диск может и дольше проживёт, и есть вероятность, что отказ первого успеют заметить раньше, чем навернётся рейд целиком.

Это всё для ситуации, когда контроль делается очень эпизодически, что не есть хорошо, но встречается в жизни.

Оффлайн Александр Ерещенко

  • Завсегдатай
  • *
  • Сообщений: 1 161
Re: Raid1 на SSDшниках
« Ответ #37 : 23.03.2024 12:54:24 »
отсутствует мониторинг (хоть какой)
А есть команда, проверяющая работоспособность дисков?
smartctl

Оффлайн Чён

  • Давно тут
  • **
  • Сообщений: 129
    • Email
Re: Raid1 на SSDшниках
« Ответ #38 : 23.03.2024 13:11:04 »
smartctl
[kisa@host-46 ~]$ smartctl
bash: smartctl: команда не найдена
[kisa@host-46 ~]$

Чтото не так.


От рута:
[root@host-46 ~]# smartctl
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-6.1.77-un-def-alt1] (ALT Sisyphus 7.2-alt1)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

ERROR: smartctl requires a device name as the final command-line argument.


Use smartctl -h to get a usage summary

[root@host-46 ~]#
« Последнее редактирование: 23.03.2024 13:23:05 от Чён »

Оффлайн Nicom

  • Завсегдатай
  • *
  • Сообщений: 630
Re: Raid1 на SSDшниках
« Ответ #39 : 23.03.2024 15:13:39 »
Чтото не так.
ERROR: smartctl requires a device name as the final command-line argument.
Вам разве ни о чём не говорит эта строчка?
smartctl --help
smartctl -a /dev/sda

При создании массива, нужно в файле /etc/mdadm.conf прописать переменную MAILADDR с адресом e-mail, на который будут приходить сообщения о проблемах с массивом.

smartd тоже умеет отправлять почту при проблемах с дисками, но это должно быть настроено в /etc/smartd.conf через указание параметра -m с адресом.

В обоих местах, проще всего указать в качестве адреса просто root и настроить файл /etc/aliases, в котором уже сделать соответствие адреса root реальному адресу почты. Всё равно отправкой почты будет заниматься postfix.

Что же у Вас "подтверждалось", что "факт" ?
Факт в том, что одинаковые SSD в одном массиве дохнут в разное время и по разным причинам.