Автор Тема: Raid1 на SSDшниках (Прочитано 1197 раз)

Александр Ерещенко · « **Ответ #30 :** 22.03.2024 15:46:30 »

Цитата: буратино-42 от 22.03.2024 10:10:43

Вы учитываете только математическое ожидание
и забываете про дисперсию,

Это конечно так, но на практике регулярно встречался с тем, что отсутствует мониторинг (хоть какой) состояние рейда, и о том, что какой-то один винт выпал из рейда иногда узнают через несколько месяцев после события, и то случайно. :)

Чён · « **Ответ #31 :** 22.03.2024 16:35:51 »

Цитата: Александр Ерещенко от 22.03.2024 07:42:51

умирать они будут приблизительно в одно и то же время.

Вот этого-то и боюсь!

буратино-42 · « **Ответ #32 :** 22.03.2024 18:01:43 »

Цитата: Александр Ерещенко от 22.03.2024 15:46:30

отсутствует мониторинг (хоть какой) состояние рейда, и о том, что какой-то один винт выпал из рейда иногда узнают через несколько месяцев после события, и то случайно.

следуя Вашей логике:
тому, кто раз в несколько месяцев проверяет отказ дисков,
или делает это случайным образом,
поможет установка неодинаковых?

Вы это в серьёз?

Nicom · « **Ответ #33 :** 22.03.2024 22:27:29 »

Цитата: Чён от 22.03.2024 16:35:51

Цитата: Александр Ерещенко от 22.03.2024 07:42:51
умирать они будут приблизительно в одно и то же время.
Вот этого-то и боюсь!

Во первых, далеко не факт, что в примерно одно время умрут оба одинаковых накопителя в массиве, и в моей практике это подтверждалось. Но надо не лениться и настраивать средства оповещения, как сказали выше.

Во вторых, массивы не отменяют резервное копирование. Любой массив позволяет серверу оставаться в работе при выходе из строя одного из дисков, но массив не защищает от порчи информации. А правильно настроенное резервное копирование защищает.

Цитата: Александр Ерещенко от 22.03.2024 15:46:30

Это конечно так, но на практике регулярно встречался с тем, что отсутствует мониторинг (хоть какой) состояние рейда, и о том, что какой-то один винт выпал из рейда иногда узнают через несколько месяцев после события, и то случайно. :)

Это описывается фразой: - "Х...к, х...к и в продакшен".
Не любят у нас люди читать документацию. А ведь раньше были самой читающей страной в мире.

буратино-42 · « **Ответ #34 :** 23.03.2024 06:08:00 »

Цитата: Nicom от 22.03.2024 22:27:29

Во первых, далеко не факт, что в примерно одно время умрут оба одинаковых накопителя в массиве, и в моей практике это подтверждалось

В одном предложение - два противоположных утверждения:
1 - "не факт", 2 -"это подтверждалось".

Что же у Вас "подтверждалось", что "факт" ?
Варианты:
а) одинаковые диски - одновременно отказали
или
б) неодинаковые диски - одновременно отказали
или
в) ?

Чён · « **Ответ #35 :** 23.03.2024 11:32:42 »

Цитата: Александр Ерещенко от 22.03.2024 15:46:30

отсутствует мониторинг (хоть какой)

А есть команда, проверяющая работоспособность дисков?

Александр Ерещенко · « **Ответ #36 :** 23.03.2024 12:53:55 »

Цитата: буратино-42 от 22.03.2024 18:01:43

Цитата: Александр Ерещенко от 22.03.2024 15:46:30
отсутствует мониторинг (хоть какой) состояние рейда, и о том, что какой-то один винт выпал из рейда иногда узнают через несколько месяцев после события, и то случайно.
следуя Вашей логике:
тому, кто раз в несколько месяцев проверяет отказ дисков,
или делает это случайным образом,
поможет установка неодинаковых?

Вы это в серьёз?

Следуя моей логике, при отказе одного диска по причине износа (для SSD это ярко выражено) очень велика вероятность, что в скором времени выйдет из строя и второй диск - одинаковые характеристики, одинаковое кол-во записанных данных (речь же про ssd в рейде 1). Т.е. легко проморгать выход из строя одного устройства, не принять вовремя нужных действий и уже словить выход из строя и второго диска.
Когда два диска с разным ресурсом, возможно второй диск может и дольше проживёт, и есть вероятность, что отказ первого успеют заметить раньше, чем навернётся рейд целиком.

Это всё для ситуации, когда контроль делается очень эпизодически, что не есть хорошо, но встречается в жизни.

Александр Ерещенко · « **Ответ #37 :** 23.03.2024 12:54:24 »

Цитата: Чён от 23.03.2024 11:32:42

Цитата: Александр Ерещенко от 22.03.2024 15:46:30
отсутствует мониторинг (хоть какой)
А есть команда, проверяющая работоспособность дисков?

smartctl

Чён · « **Ответ #38 :** 23.03.2024 13:11:04 »

Цитата: Александр Ерещенко от 23.03.2024 12:54:24

smartctl

[kisa@host-46 ~]$ smartctl
bash: smartctl: команда не найдена
[kisa@host-46 ~]$

Чтото не так.

От рута:
[root@host-46 ~]# smartctl
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-6.1.77-un-def-alt1] (ALT Sisyphus 7.2-alt1)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

ERROR: smartctl requires a device name as the final command-line argument.

Use smartctl -h to get a usage summary

[root@host-46 ~]#

Nicom · « **Ответ #39 :** 23.03.2024 15:13:39 »

Цитата: Чён от 23.03.2024 13:11:04

Чтото не так.

Цитата: Чён от 23.03.2024 13:11:04

ERROR: smartctl requires a device name as the final command-line argument.

Вам разве ни о чём не говорит эта строчка?

Код: [Выделить]

smartctl --help
smartctl -a /dev/sda

При создании массива, нужно в файле /etc/mdadm.conf прописать переменную MAILADDR с адресом e-mail, на который будут приходить сообщения о проблемах с массивом.

smartd тоже умеет отправлять почту при проблемах с дисками, но это должно быть настроено в /etc/smartd.conf через указание параметра -m с адресом.

В обоих местах, проще всего указать в качестве адреса просто root и настроить файл /etc/aliases, в котором уже сделать соответствие адреса root реальному адресу почты. Всё равно отправкой почты будет заниматься postfix.

Цитата: буратино-42 от 23.03.2024 06:08:00

Что же у Вас "подтверждалось", что "факт" ?

Факт в том, что одинаковые SSD в одном массиве дохнут в разное время и по разным причинам.

Форум сообщества
Альт Линукс