Автор Тема: ОС Альт Рабочая станция К 11: внезапные перезагрузки [решено]  (Прочитано 3175 раз)

Оффлайн Dron.ru

  • Участник
  • *
  • Сообщений: 67
Дано:
Комп с тремя SSD дисками, на каждом из них своя система (windows7, ОС Альт Рабочая станция К 11, windows 11), каждый диск зашифрован соответствующим способом (cryptodisk, luks, bitlocker)

"Подробнее"
Операционная система: ALT 11.1
Версия KDE Plasma: 6.3.4
Версия KDE Frameworks: 6.13.0
Версия Qt: 6.8.2
Версия ядра: 6.12.29-6.12-alt1 (64-бита)
Графическая платформа: Wayland
Процессоры: 16 × AMD Ryzen 7 1700 Eight-Core Processor
Память: 31,3 ГиБ ОЗУ
Графический процессор: AMD Radeon RX 560 Series
Производитель: Gigabyte Technology Co., Ltd.
Название продукта: AX370-Gaming K3

Graphics:
  Device-1: AMD Baffin [Radeon RX 550 640SP / 560/560X] driver: amdgpu
    v: kernel
  Display: server: X.Org v: 1.24.1.6 with: Xwayland v: 24.1.6 driver: X:
    loaded: amdgpu unloaded: fbdev,modesetting,vesa dri: radeonsi gpu: amdgpu
    resolution: 3440x1440~100Hz
  API: EGL v: 1.5 drivers: radeonsi,swrast
    platforms: gbm,x11,surfaceless,device
  API: OpenGL v: 4.6 compat-v: 4.5 vendor: amd mesa v: 24.3.4 renderer: AMD
    Radeon RX 560 Series (radeonsi polaris11 LLVM 18.1.8 DRM 3.61
    6.12.29-6.12-alt1)
  API: Vulkan v: 1.4.304 drivers: N/A surfaces: xcb,xlib


  *-display
       description: VGA compatible controller
       product: Baffin [Radeon RX 550 640SP / RX 560/560X]
       vendor: Advanced Micro Devices, Inc. [AMD/ATI]
       physical id: 0
       bus info: pci@0000:07:00.0
       logical name: /dev/fb0
       version: cf
       width: 64 bits
       clock: 33MHz
       capabilities: pm pciexpress msi vga_controller bus_master cap_list rom fb
       configuration: depth=32 driver=amdgpu latency=0 resolution=3440,1440
       resources: irq:67 memory:d0000000-dfffffff memory:e0000000-e01fffff ioport:e000(size=256) memory:fcf00000-fcf3ffff memory:c0000-dffff

Проблема:
Alt-linux раз в 0-4 часа зависает намертво, либо уходит в перезагрузку (X11 и wayland). После перезагрузки в логе нахожу такие строки:

мая 31 14:46:36 ru-home kernel: mce: [Hardware Error]: Machine check events logged
мая 31 14:46:36 ru-home kernel: mce: [Hardware Error]: CPU 7: Machine Check: 0 Bank 5: bea0000000000108
мая 31 14:46:36 ru-home kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffffa614c4e6 MISC d012000100000000 SYND 4d000000 IPID 500b000000000
мая 31 14:46:36 ru-home kernel: mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1748691980 SOCKET 0 APIC e microcode 8001139

мая 31 20:49:59 ru-home kernel: mce: [Hardware Error]: Machine check events logged
мая 31 20:49:59 ru-home kernel: mce: [Hardware Error]: CPU 6: Machine Check: 0 Bank 0: baa0000000060185
мая 31 20:49:59 ru-home kernel: mce: [Hardware Error]: TSC 0 MISC d012000100000000 SYND 2d030000 IPID b000000000
мая 31 20:49:59 ru-home kernel: mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1748713782 SOCKET 0 APIC c microcode 8001139

Лог как-бы намекает что проблема аппаратная и надо выкидывать память/процессор/комп, но есть нюансы:
- в alt-linux сбой возникает внезапно при полном бездействии или активной нагрузке, при низкой и высокой температуре процессора с равной вероятностью.
- два дня работы мемтеста не выдало ни одной ошибки
- в windows7 и windows11 проблема ни разу не возникла ни при бездействии, ни при длительных экстремальных нагрузках (грузил все ядра и память круглосуточно при сборке своего проекта + 3D игры)
- bios актуальна на текущую дату, при перепрошивке сбрасывал cmos, текущие настройки bios по дефолту

Что ещё планирую сделать:
- заменить шнур и порт sata3 диска с alt-linux
- поработать в live версии alt-linux
- поработать в alt-linux в консоли без входа в графический интерфейс (с включенным и отключенным sddm)

Есть идеи что ещё можно сделать для решения проблемы или её локализации?
« Последнее редактирование: 05.05.2026 14:36:53 от Dron.ru »

Оффлайн hasculdr

  • Участник
  • *
  • Сообщений: 685
Андервольтом проца не занимались? Если да - попробовать с умолчальными настройками напряжения.

Оффлайн Dron.ru

  • Участник
  • *
  • Сообщений: 67
Андервольтом проца не занимались? Если да - попробовать с умолчальными настройками напряжения.
Все настройки bios дефолтные. Да и если б проблема была в напряжении, то проявлялась бы на всех ОС.

Оффлайн Dron.ru

  • Участник
  • *
  • Сообщений: 67
Сейчас сижу в Альте жду появления проблемы в cinnamon. Пока из видимых различий только то, что Яндекс браузер в wayland при запуске говорит, что аппаратное ускорение включить не удалось, а в cinnamon и X11 не говорит о проблеме с аппаратным ускорением.

Оффлайн gosts 87

  • Участник
  • *
  • Сообщений: 3 780
  • Дмитрий/Dmitry/德米特里/दिमित्री
Яндекс браузер в wayland при запуске говорит, что аппаратное ускорение включить не удалось, а в cinnamon и X11 не говорит о проблеме с аппаратным ускорением.
https://bugzilla.altlinux.org/52623

Оффлайн tarasov-it1

  • Участник
  • *
  • Сообщений: 188
Есть идеи что ещё можно сделать для решения проблемы или её локализации?
Я тоже пару раз ловил на сабже внезапные перезагрузки, но логи не смотрел. А какой у Вас процессор?

Оффлайн zerg

  • ненужная строка
  • alt linux team
  • ***
  • Сообщений: 2 672
  • ненужная строка
    • Найдётся всё
- заменить шнур и порт sata3 диска с alt-linux
Помню, как у меня безбожно глючило всё и по симптомам вообще никак до этого догадаться было нельзя. Решилось заменой шнура SATA.
Убрать этот мусор можно переключателем: Не показывать подписи других пользователей.

Оффлайн Dron.ru

  • Участник
  • *
  • Сообщений: 67
А какой у Вас процессор?
В спойлере первого сообщения темы вся информация об оборудовании.

Пара дней работы в altlinux P11 cinnamon без перезагрузок показала, что проблема 100% не аппаратная и касается только altlinux P11 KDE (X11 + wayland). Вариант с неисправным диском/шнуром/портом sata3 также отпадает. При этом данная ОС клонированная на другие компьютеры с теми же настройками работает исправно. Похоже KDE сбоит на некоторых видах оборудования.
« Последнее редактирование: 10.06.2025 13:12:19 от Dron.ru »

Оффлайн иеромонах Василий (Телехов)

  • Участник
  • *
  • Сообщений: 102
В этой теме я указал замеченную проблему с ядром 6.12.29., которое вызывает сбой драйвера amdgpu. Из-за этого возможны падения графики, зависания системы, невозможность переключиться в консоль. Помогает только жесткая перезагрузка и то только до очередного зависания. Посмотрите вывод команды dmesg от рута. Если у вас присутствуют в выводе строки наподобие[amdgpu 0000:03:00.0: amdgpu: [drm] amdgpu: DP AUX transfer fail:4  то это ваш случай. Помогает откат на более старую версию ядра.
С уважением, иеромонах Василий.

Оффлайн Dron.ru

  • Участник
  • *
  • Сообщений: 67
Спасибо за подсказку, попробую другие ядра.

Оффлайн Dron.ru

  • Участник
  • *
  • Сообщений: 67
Откатился до ядра 6.12.27-6.12-alt1, проблема исчезла. Похоже можно её локализовать такой связкой: ядро 6.12.29-6.12-alt1 + оболочка KDE + драйвер amdgpu + видеокарта AMD Radeon

Оффлайн иеромонах Василий (Телехов)

  • Участник
  • *
  • Сообщений: 102
оболочка KDE
От DE не зависит. Окружение рабочего стола может быть любым. Для воспроизведения бага нужны ядро 6.12.29, драйвер amdgpu и, либо процессор AMD со встроенной графикой, либо видеокарта AMD.
С уважением, иеромонах Василий.

Оффлайн tarasov-it1

  • Участник
  • *
  • Сообщений: 188
Только что получил просто черный экран после простоя, на сочетания клавиш реакции нет. После принудительной перезагрузки вывел в файл лог событий, помогите разобраться:

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 579
Только что получил просто черный экран после простоя, на сочетания клавиш реакции нет. После принудительной перезагрузки вывел в файл лог событий
А смысл в "после"? Смысл есть в "до". Но самое интересное, скорее всего, не сохранится. Есть шанс получить интересное, если писать лог на соседний компьютер, причём ещё не забыть и про https://www.altlinux.org/Netconsole, може туда kernel panic попасть сможет. Ещё может вот это помочь: https://www.altlinux.org/SerialLogin

Из простого: а пингаться тоже перестаёт? Может по ssh пустит. Хотя, если пустит, значит система в принципе работает, и в логе что-то должно быть. Но не в той части, что после перезагрузки, а в той, что до.
« Последнее редактирование: 16.06.2025 11:14:38 от asy »

Оффлайн tarasov-it1

  • Участник
  • *
  • Сообщений: 188
А смысл в "после"? Смысл есть в "до"
Я использовал команду journalctl -b -1 > /home/user/debug.log - это же логи с предыдущего запуска системы