Автор Тема: altlinux 7.0.1 из коробки, установка на mirror(1), без винта не грузится  (Прочитано 20122 раз)

Оффлайн PSV

  • Участник
  • *
  • Сообщений: 361
Перед переходом с office server 4 на p7 всячески проверяю сервак на стрессоустойчивость.
Взял два нулевых, идентичных винта по 1ТБ. Установил по инструкции на зеркальный райд массив(mirror(1)). Разбиение делал: своп, 100гБ система, отстаток. Установил. Запустил, обновил(дистриб, ядро ответило, что самое новое), ребутнул.
Пошаманил с доппрогами/postgresql/локальный бекап. Вставил в fstab монтирование сетевого диска для слива локального бекапа. Переодически делал ребуты, выдергивал кабель.
Все было нормально. Выключил. Отцепил один винт. Включаю.
Косяк 1: шрифты большие, правая часть со статусами не видна.
Косяк 2: загрузка доходит до
initrd: processing kernel events и подвисает. Потом выскакивает:
initrd: loop: ERROR: /root: not mounted
initrd: stage 'loop' failed
initrd: this shell remains here for debug purposes. Press ctrl-d to continue (initparams)
Жмем ctrl-d, комп выводит кучу строк, и перегружается.
Как-то странно зеркальный райд сработал :) По идее, умер винт да умер. Загрузились и работаем дальше. Потом выключили, подцепили замену, включили, загрузились, восстановили mirror + boot и забыли об этом.
Уважаемые гуру, что делать-то?
А так же. просвятите по вопросу: как-то можно определить программно, какой из винтов вылетел? Суть в следующем: вылетает райд, умер один из винтов. Как определить какой? Или есть жесткое соотношение:
SATA_1 на матрешке  -sda
SATA_2 - sdb??
« Последнее редактирование: 13.08.2013 11:35:12 от PSV »

Оффлайн ruslandh

  • Поспешай не торопясь !
  • Модератор глобальный
  • *****
  • Сообщений: 32 361
  • Учиться .... Телепатами не рождаются, ими ....
Вы какой дистрибутив пробовали?

Вот тут что-то подобное:
https://bugzilla.altlinux.org/show_bug.cgi?id=28879

Оффлайн berkut_174

  • Мастер
  • ***
  • Сообщений: 7 152
А так же. просвятите по вопросу: как-то можно определить программно, какой из винтов вылетел? Суть в следующем: вылетает райд, умер один из винтов. Как определить какой? Или есть жесткое соотношение:
Создание_и_установка_на_RAID » Действия при выходе одного жёсткого диска из строя
Сноси Винду, переходи на Линукс ! :)

Оффлайн PSV

  • Участник
  • *
  • Сообщений: 361
Вы какой дистрибутив пробовали?

Вот тут что-то подобное:
https://bugzilla.altlinux.org/show_bug.cgi?id=28879
Загрузил с оффсайта образ: altlinux-7.0.1-centaurus-x86_64-ru-install-dvd5

berkut_174. в том-то и вопрос: как мне с ходу определить, какой ИМЕННО винт(в данном случае из двух) умер!!!!
Т.е. вы приходите на работу, а тут раз, и райд полумертвый. По хорошему ваши действия: определил какой винт умер(КАК???), взял такой же емкости, выкл, замена, вкл, восстановление. И только потом выяснение, что же было.
Ссылка, что вы кинули, нужна, когда вы уже заменили мертвый на живой винты. Т.е. там пропущен этап определения проблемного винта.

Оффлайн ruslandh

  • Поспешай не торопясь !
  • Модератор глобальный
  • *****
  • Сообщений: 32 361
  • Учиться .... Телепатами не рождаются, ими ....
Цитировать
1. Посмотрите, что сломалось:
[root@localhost ~]# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sda2[0]
      4723008 blocks [2/1] [U_]
     
md0 : active (auto-read-only) raid1 sda1[0]
      513984 blocks [2/1] [U_]
Из вывода видно, что диск sdb недоступен: U_ показывает отсутствие второго раздела под RAID.
Вообще-то они вроде местами не меняются (три раза плюю через левое плечо :) )

Оффлайн PSV

  • Участник
  • *
  • Сообщений: 361
Подключил винт обратно, все загрузилось. Что бы два раза не вставать, отключил другой винт. Ситуация повторилась один в один.
Что мне делать-то? Все делал по инструкции: http://www.altlinux.org/%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_%D0%B8_%D1%83%D1%81%D1%82%D0%B0%D0%BD%D0%BE%D0%B2%D0%BA%D0%B0_%D0%BD%D0%B0_RAID#.D0.94.D0.B5.D0.B9.D1.81.D1.82.D0.B2.D0.B8.D1.8F_.D0.BF.D1.80.D0.B8_.D0.B2.D1.8B.D1.85.D0.BE.D0.B4.D0.B5_.D0.BE.D0.B4.D0.BD.D0.BE.D0.B3.D0.BE_.D0.B6.D1.91.D1.81.D1.82.D0.BA.D0.BE.D0.B3.D0.BE_.D0.B4.D0.B8.D1.81.D0.BA.D0.B0_.D0.B8.D0.B7_.D1.81.D1.82.D1.80.D0.BE.D1.8F
Вывод каких команд показать?
Может я криво спрашиваю :(. Попробую по другому:  диск sdb - как мне определить какой это физический диск из двух идентичных(один размер/производитель/скорость, только порты подключения разные)? SATA_1 или SATA_2?

Оффлайн PSV

  • Участник
  • *
  • Сообщений: 361
[pavel@tsthost2 ~]$ cat /proc/mdstat
Personalities : [raid1]
md5 : active raid1 sdb3[1] sda3[0]
      856313792 blocks [2/2] [UU]

md3 : active raid1 sdb1[1] sda1[0]
      9616320 blocks [2/2] [UU]

md4 : active raid1 sdb2[1] sda2[0]
      110828480 blocks [2/2] [UU]

unused devices: <none>
У нас есть физические диски: sda и sdb. Вот как мне сейчас 100% определить и отключить sda?
Т.е. упрощенно: ставлю на комп 2 мобилрека, подписываю их маркером А/В. Вылетает винт в райде, как мне отправить персонал с нулевым винтом, что бы выдернули нужный рэк и заменили сбойный винт?
PS сильно извиняюсь, если это ламерский вопрос. но не могу понять :(

PPS
[root@tsthost2 ~]# blkid -c /dev/null
/dev/sdb1: UUID="713bf167-01b5-5d25-6d8c-cd7481e5bf4e" TYPE="linux_raid_member"
/dev/sdb2: UUID="25d98361-51cd-5260-6f6f-1c8490789c74" TYPE="linux_raid_member"
/dev/sdb3: UUID="cd9023ca-c8c9-2c27-3c4c-202d1e88febf" TYPE="linux_raid_member"
/dev/sda1: UUID="713bf167-01b5-5d25-6d8c-cd7481e5bf4e" TYPE="linux_raid_member"
/dev/sda2: UUID="25d98361-51cd-5260-6f6f-1c8490789c74" TYPE="linux_raid_member"
/dev/sda3: UUID="cd9023ca-c8c9-2c27-3c4c-202d1e88febf" TYPE="linux_raid_member"
/dev/md4: UUID="b50d6897-2de4-4fb4-bbc7-3110d3bad485" TYPE="ext4"
/dev/md3: UUID="3d631567-11c4-4c5d-9e3b-34cb6a35fa81" TYPE="swap"
/dev/md5: UUID="680144c0-d3a9-4b0a-9e6c-c8a8a404156e" TYPE="ext4"
« Последнее редактирование: 13.08.2013 12:23:52 от PSV »

Оффлайн PSV

  • Участник
  • *
  • Сообщений: 361
[root@tsthost2 ~]# uname -a
Linux tsthost2 3.8.13.4-std-def-alt1.M70P.2 #1 SMP Tue Jul 16 11:08:06 UTC 2013 x86_64 GNU/Linux
[root@tsthost2 ~]# cat /etc/altlinux-release
ALT Linux 7.0.1 Centaurus  (Pholus)

Оффлайн berkut_174

  • Мастер
  • ***
  • Сообщений: 7 152
Вот как мне сейчас 100% определить и отключить sda?
Ясно к чему вы...
Можно посмотреть серийник диска или глянуть вывод 'dmesg|grep scsi' (хотя могут отличаться от нумерации на плате).
« Последнее редактирование: 13.08.2013 15:26:43 от berkut_174 »
Сноси Винду, переходи на Линукс ! :)

Оффлайн ruslandh

  • Поспешай не торопясь !
  • Модератор глобальный
  • *****
  • Сообщений: 32 361
  • Учиться .... Телепатами не рождаются, ими ....
А вы при установке выбрали sytemd или SysVinit

Оффлайн PSV

  • Участник
  • *
  • Сообщений: 361
А вы при установке выбрали sytemd или SysVinit
100% не ручаюсь за правдивый ответ, но, по моему, такого не спрашивало :(
Причем, скорее всего не спрашивало, так как я делал переустановку 2 раза, неправильно разбил диски.

Оффлайн PSV

  • Участник
  • *
  • Сообщений: 361
Вот как мне сейчас 100% определить и отключить sda?
Ясно к чему вы...
Можно посмотреть серийник диска или глянуть вывод 'dmes|grep scsi' (хотя могут отличаться от нумерации на плате).
[root@tsthost2 ~]# dmes | grep scsi
-bash: dmes: command not found
[root@tsthost2 ~]# apt-get install util-linux
Reading Package Lists... Done
Building Dependency Tree... Done
util-linux is already the newest version.

А по серийнику, это как?
« Последнее редактирование: 13.08.2013 13:30:43 от PSV »

Оффлайн ksa

  • Модератор глобальный
  • *****
  • Сообщений: 9 049
Вот как мне сейчас 100% определить и отключить sda?
Ясно к чему вы...
Можно посмотреть серийник диска или глянуть вывод 'dmes|grep scsi' (хотя могут отличаться от нумерации на плате).
[root@tsthost2 ~]# dmes | grep scsi
-bash: dmes: command not found
[root@tsthost2 ~]# apt-get install util-linux
Reading Package Lists... Done
Building Dependency Tree... Done
util-linux is already the newest version.
dmesg | grep scsi

Оффлайн ksa

  • Модератор глобальный
  • *****
  • Сообщений: 9 049
Вот как мне сейчас 100% определить и отключить sda?
Очень просто. Втыкаете винт, помеченный как A, в sata1 (и это будет sdA), второй, помеченный как B, втыкаете, соот-но, в sata2 (и это будет sdB). Если sda сдох, значит меняем А, если сдох не sda, то меняем В :) Вроде бы смены назначенных в системе имён для дисков быть не должно (вернее, я не припомню случая, когда стоявшие годами винты вдруг сменили назначенные имена, а вот с одной из дешевых гигабитных сетевух от укропа частенько такое наблюдал - там мас почему-то был разный при загрузке...).

Оффлайн PSV

  • Участник
  • *
  • Сообщений: 361
[root@tsthost2 ~]# dmesg | grep scsi
[    0.367171] ACPI: bus type scsi registered
[    0.521604] scsi0 : ata_piix
[    0.521792] scsi1 : ata_piix
[    0.677148] scsi2 : ata_piix
[    0.677224] scsi3 : ata_piix
[    0.701689] scsi 0:0:1:0: Direct-Access     ATA      ST1000DM003-1CH1 CC46 PQ: 0 ANSI: 5
[    0.701914] scsi 1:0:0:0: Direct-Access     ATA      ST1000DM003-1CH1 CC46 PQ: 0 ANSI: 5
выкл, переткнул SATA_2->SATA_3, вкл
[root@tsthost2 ~]# dmesg | grep scsi
[    0.366115] ACPI: bus type scsi registered
[    0.521589] scsi0 : ata_piix
[    0.521792] scsi1 : ata_piix
[    0.677125] scsi2 : ata_piix
[    0.677182] scsi3 : ata_piix
[    0.733486] scsi 1:0:0:0: Direct-Access     ATA      ST1000DM003-1CH1 CC46 PQ: 0 ANSI: 5
[    0.733691] scsi 1:0:1:0: Direct-Access     ATA      ST1000DM003-1CH1 CC46 PQ: 0 ANSI: 5
похоже можно и определить. Спасибо!
А что по основному вопросу, с зеркалом, посоветуете делать?