Дано:Комп с тремя SSD дисками, на каждом из них своя система (windows7, ОС Альт Рабочая станция К 11, windows 11), каждый диск зашифрован соответствующим способом (cryptodisk, luks, bitlocker)
"Подробнее"
Операционная система: ALT 11.1
Версия KDE Plasma: 6.3.4
Версия KDE Frameworks: 6.13.0
Версия Qt: 6.8.2
Версия ядра: 6.12.29-6.12-alt1 (64-бита)
Графическая платформа: Wayland
Процессоры: 16 × AMD Ryzen 7 1700 Eight-Core Processor
Память: 31,3 ГиБ ОЗУ
Графический процессор: AMD Radeon RX 560 Series
Производитель: Gigabyte Technology Co., Ltd.
Название продукта: AX370-Gaming K3
Graphics:
Device-1: AMD Baffin [Radeon RX 550 640SP / 560/560X] driver: amdgpu
v: kernel
Display: server: X.Org v: 1.24.1.6 with: Xwayland v: 24.1.6 driver: X:
loaded: amdgpu unloaded: fbdev,modesetting,vesa dri: radeonsi gpu: amdgpu
resolution: 3440x1440~100Hz
API: EGL v: 1.5 drivers: radeonsi,swrast
platforms: gbm,x11,surfaceless,device
API: OpenGL v: 4.6 compat-v: 4.5 vendor: amd mesa v: 24.3.4 renderer: AMD
Radeon RX 560 Series (radeonsi polaris11 LLVM 18.1.8 DRM 3.61
6.12.29-6.12-alt1)
API: Vulkan v: 1.4.304 drivers: N/A surfaces: xcb,xlib
*-display
description: VGA compatible controller
product: Baffin [Radeon RX 550 640SP / RX 560/560X]
vendor: Advanced Micro Devices, Inc. [AMD/ATI]
physical id: 0
bus info: pci@0000:07:00.0
logical name: /dev/fb0
version: cf
width: 64 bits
clock: 33MHz
capabilities: pm pciexpress msi vga_controller bus_master cap_list rom fb
configuration: depth=32 driver=amdgpu latency=0 resolution=3440,1440
resources: irq:67 memory:d0000000-dfffffff memory:e0000000-e01fffff ioport:e000(size=256) memory:fcf00000-fcf3ffff memory:c0000-dffff
Проблема:Alt-linux раз в 0-4 часа зависает намертво, либо уходит в перезагрузку (X11 и wayland). После перезагрузки в логе нахожу такие строки:
мая 31 14:46:36 ru-home kernel: mce: [Hardware Error]: Machine check events logged
мая 31 14:46:36 ru-home kernel: mce: [Hardware Error]: CPU 7: Machine Check: 0 Bank 5: bea0000000000108
мая 31 14:46:36 ru-home kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffffa614c4e6 MISC d012000100000000 SYND 4d000000 IPID 500b000000000
мая 31 14:46:36 ru-home kernel: mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1748691980 SOCKET 0 APIC e microcode 8001139
мая 31 20:49:59 ru-home kernel: mce: [Hardware Error]: Machine check events logged
мая 31 20:49:59 ru-home kernel: mce: [Hardware Error]: CPU 6: Machine Check: 0 Bank 0: baa0000000060185
мая 31 20:49:59 ru-home kernel: mce: [Hardware Error]: TSC 0 MISC d012000100000000 SYND 2d030000 IPID b000000000
мая 31 20:49:59 ru-home kernel: mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1748713782 SOCKET 0 APIC c microcode 8001139
Лог как-бы намекает что проблема аппаратная и надо выкидывать память/процессор/комп, но есть нюансы:
- в alt-linux сбой возникает внезапно при полном бездействии или активной нагрузке, при низкой и высокой температуре процессора с равной вероятностью.
- два дня работы мемтеста не выдало ни одной ошибки
- в windows7 и windows11 проблема ни разу не возникла ни при бездействии, ни при длительных экстремальных нагрузках (грузил все ядра и память круглосуточно при сборке своего проекта + 3D игры)
- bios актуальна на текущую дату, при перепрошивке сбрасывал cmos, текущие настройки bios по дефолту
Что ещё планирую сделать:- заменить шнур и порт sata3 диска с alt-linux
- поработать в live версии alt-linux
- поработать в alt-linux в консоли без входа в графический интерфейс (с включенным и отключенным sddm)
Есть идеи что ещё можно сделать для решения проблемы или её локализации?