Автор Тема: Мигают красным индикаторы HDD: Сервер DEPO Storm 3350K4  (Прочитано 1973 раз)

Оффлайн xdsl

  • Давно тут
  • **
  • Сообщений: 129
Ставлю ALtLinux 7.0 на сабж (http://www.depo.ru/config_depo_c1824_i139493_m2.aspx)
4 SATA-диска, контроллер - интегрированный SATA, RAID отключен, 1 SSD для системы
Сразу после загрузки ядра начинают мигать красным индикаторы на двух дисках из четырех.
Однако никаких видимых нарушений функциональности нет, диски находятся, собираются в RAID, без проблем работают.

Установка Windows на этот сервер таких проблем не создает, следовательно: либо есть аппаратный конфликт и виндовс его не видит/игнорирует; либо нет аппаратного конфликта и проблемы в модулях ядра или в ядре линукса.

Кто-нибудь сталкивался с такой проблемой? Как победить? 

Оффлайн ruslandh

  • Поспешай не торопясь !
  • Модератор глобальный
  • *****
  • Сообщений: 30 110
  • Учиться .... Телепатами не рождаются, ими ....
    • Email
Сразу после загрузки ядра начинают мигать красным индикаторы на двух дисках из четырех.
А что это мигание означает?

Оффлайн dango

  • Мастер
  • ***
  • Сообщений: 1 538
Ставлю ALtLinux 7.0
Огласите, пожалуйста, дистрибутив, версию, платформу.
А вот это я не понял:
RAID отключен
диски находятся, собираются в RAID, без проблем работают.
У вас там soft-RAID?
на двух дисках из четырех.
какой RAID?
Хорошо бы услышать, как устанавливали систему?
либо нет аппаратного конфликта и проблемы в модулях ядра или в ядре линукса.
В любом случае, надо смотреть в логах.
Без фанатизма!
Лучше слов могут быть только дела

Оффлайн xdsl

  • Давно тут
  • **
  • Сообщений: 129
raid там интеловский, встроенный, альтом все равно не поддерживаемый, поэтому в биосе отключил, поставил ACHI.
В любом случае, до рейда не доходит, проблемы - сразу после загрузки ядра. Включал рейд, собирал, отключал - картина одна.
На материнку - прямое подключение SATA, без всяких контроллеров.

Дистрибутив оказался без разницы, грузился и с альта 5.0 и с дебиана не помню какой версии. Только дело доходит до теста дисков, сразу начинают мигать два слота из четырех. При этом никаких нареканий к дискам нет, все работает.

На задней панели дискового массива написано SAS 743TQ Rev 3.0

В логах вызывают подозрение следующие строки:

kernel: [    3.604532] ACPI Warning: SystemIO range 0x0000000000000428-0x000000000000042f conflicts with OpRegion 0x0000000000000400-0x000000000000047f (\PMIO) (20131218/utaddress-258)
kernel: [    3.604568] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
kernel: [    3.604572] ACPI Warning: SystemIO range 0x0000000000000500-0x000000000000052f conflicts with OpRegion 0x000000000000052c-0x000000000000052c (\GINV) (20131218/utaddress-258)
kernel: [    3.604575] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
kernel: [    3.604611] lpc_ich: Resource conflict(s) found affecting gpio_ich


Оффлайн ruslandh

  • Поспешай не торопясь !
  • Модератор глобальный
  • *****
  • Сообщений: 30 110
  • Учиться .... Телепатами не рождаются, ими ....
    • Email

Оффлайн ruslandh

  • Поспешай не торопясь !
  • Модератор глобальный
  • *****
  • Сообщений: 30 110
  • Учиться .... Телепатами не рождаются, ими ....
    • Email
альта 5.0 ?
А что это такое?

https://www.altlinux.org/Branches/5.0 ? Ветка 5.0 (2008/осень)

Оффлайн ruslandh

  • Поспешай не торопясь !
  • Модератор глобальный
  • *****
  • Сообщений: 30 110
  • Учиться .... Телепатами не рождаются, ими ....
    • Email
А если поиграть с параметрами ядра. типа:
https://www.altlinux.org/Первая_помощь

Цитировать
-    Безопасный режим — отключаются все параметры ядра, которые могут вызвать проблемы при загрузке
-    Без ACPI — режим с отключённым ACPI, где ACPI (англ. Advanced Configuration and Power Interface — усовершенствованный интерфейс управления конфигурацией и питанием) — открытый промышленный стандарт, впервые выпущенный в декабре 1996 года и разработанный совместно компаниями HP, Intel, Microsoft, Phoenix и Toshiba, который определяет общий интерфейс для обнаружения аппаратного обеспечения, управления питанием и конфигурации материнской платы и устройств.
-    Без локального APIC — режим с отключённым Local APIC, где APIC (англ. Advanced Programmable Interrupt Controller) — улучшенный программируемый контроллер прерываний. APIC состоит из двух модулей: Local APIC и  IO APIC:

        LOCAL APIC — располагается в ядре процессора, если система многоядерна - в каждом ядре.
        I/O APIC — контроллер, расположенный на системной плате, обычно как часть микросхем обрамления процессора (например, микросхема Intel 82489DX).

Local APIC впервые был добавлен в процессоре Intel Pentium (ядро P54). Начиная с этого процессора, каждый следующий снабжался интегрированным Local APIC-ом. Иногда в проблемных материнских платах отключение этого параметра позволяет установить и использовать ОС.Так-же с помощью строчки «Параметры загрузки» можно задать другие параметры ядра, наиболее известные из них — связанные с отключением KMS и задания работы видеокарты или материнской платы — nomodeset, modeset=1, xforcevesa, acpi_blacklist=vendor, acpi_os=linux и другие.



Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 5 729
  • Sunny 273 RUS crew
raid там интеловский, встроенный, альтом все равно не поддерживаемый, поэтому в биосе отключил, поставил ACHI.
Мне серверный Интел попадается иногда. Последний, что был, имел два контроллера:
00:1f.2 SATA controller: Intel Corporation C600/X79 series chipset 6-Port SATA AHCI Controller (rev 06)
08:00.0 Serial Attached SCSI controller: Intel Corporation C602 chipset 4-Port SATA Storage Control Unit (rev 06)
Соответственно, разные разъёмы. Первый - ahci, а вот второй, если как RAID, то не помню, что там, а если не как RAID, но на SAS-разъёме, то драйвер isci, он есть. Там ещё прикольный баг вылез с инсталлятором в своё время: https://bugzilla.altlinux.org/29452. Можно, заодно, проверить.

Оффлайн xdsl

  • Давно тут
  • **
  • Сообщений: 129
Спасибо всем за помощь. Причину проблемы не нашел, но обошел. У меня 8 слотов под HDD, заполнено 4 нижних. Переставил диски из проблемных слотов в пустые, перебросил sata-коннекторы и вуаля - все работает без красных алертов. Заодно и диски развел друг от друга подальше, во избежание перегрева.

Ошибки в логах при этом сохранились.


Оффлайн gvy

  • alt linux team
  • ***
  • Сообщений: 888
    • Email
На всякий стоит спросить ребят из DEPO всё-таки.
--
Michael Shigorin

Оффлайн yaleks

  • Мастер
  • ***
  • Сообщений: 3 940
это может быть баг в BIOS как у "конкурентов" - http://habrahabr.ru/company/stss/blog/273247/
Цитировать
Так вот эти 2 передних SATA-порта имеют нумерацию №0 и №1. Соответственно порты SATA в Mini-SAS форм-факторе начинают нумероваться с №2 и так далее. Выяснился глюк нумерации при подключении дисков через бэкплейн с использованием Mini-SAS интегрированного контроллера. Контроллер нумерует диски начиная с №2, а бэкплейн — с №0. В результате этого сдвига нумерации, когда драйвер пытается сигнализировать об опасности, он отправляет на бэкплейн номер своего порта, например №2. А бэкплейн воспринимает этот номер, как номер своего порта и мигает лампочкой корзины, в которую установлен диск с номером 4 по нумерации контроллера.