Автор Тема: [Решено] Asus G51j после обновления до 4.9.110 начал перегреваться  (Прочитано 22933 раз)

Оффлайн ApB

  • Завсегдатай
  • *
  • Сообщений: 412
Приветствую!
После обновления ядра до 4.9.110 бук начал перегреваться.
Грешил на систему охлаждения - перебрал, сменил термопасты и термопрокладки - результат тот-же. Пиковая температура выросла до 75 град.
« Последнее редактирование: 22.08.2018 10:46:33 от ApB »

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 19 908
    • Домашняя страница
    • Email
Приветствую!
После обновления ядра до 4.9.110 бук начал перегреваться.
Грешил на систему охлаждения - перебрал, сменил термопасты и термопрокладки - результат тот-же. Пиковая температура выросла до 75 град.
Попробуйте kernel-image-std-def-4.9.118-alt0.M80P.1 или kernel-image-un-def-4.14.61-alt0.M80P.1                                                                                                 
Андрей Черепанов (cas@)

Оффлайн Rider

  • /usr/sbin/control
  • *******
  • Сообщений: 1 136
Приветствую!
После обновления ядра до 4.9.110 бук начал перегреваться.
Грешил на систему охлаждения - перебрал, сменил термопасты и термопрокладки - результат тот-же. Пиковая температура выросла до 75 град.

Покажите вывод команды:
 cat /proc/acpi/bbswitch

Оффлайн ApB

  • Завсегдатай
  • *
  • Сообщений: 412
Покажите вывод команды:
 cat /proc/acpi/bbswitch
cat /proc/acpi/bbswitch
cat: /proc/acpi/bbswitch: Нет такого файла или каталога

Оффлайн ApB

  • Завсегдатай
  • *
  • Сообщений: 412
Попробуйте kernel-image-std-def-4.9.118-alt0.M80P.1 или kernel-image-un-def-4.14.61-alt0.M80P.1

Обновился до kernel-image-std-def-4.9.118-alt0.M80P.1 ... пока вроде температура падать начала ... до 57

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 19 908
    • Домашняя страница
    • Email
Попробуйте kernel-image-std-def-4.9.118-alt0.M80P.1 или kernel-image-un-def-4.14.61-alt0.M80P.1

Обновился до kernel-image-std-def-4.9.118-alt0.M80P.1 ... пока вроде температура падать начала ... до 57
Для ASUS это нормально под Linux. Уж очень любит ASUS слишком новые ACPI. Я свой мог выключить только на un-def, да и то тачпад до сих пор видится как мышка. :(
Андрей Черепанов (cas@)

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 10 259
Asus G51j

Это геймерский ноутбук 2010-го года выпуска. Снят с производства.
Поставлялся с процессором Intel® Core™ i7-720QM: 4 ядра, 8 потоков, базовая частота 1.60 GHz, Turbo Boost - 2.80 GHz.

После обновления ядра до 4.9.110 бук начал перегреваться.

Привыкайте к этому дерьму в Линукс. Торвальдс любит периодически такие номера откалывать. Поэтому никогда не удаляйте стабильно работающее ядро и держите его в резерве. Это должно стать правилом.

Пиковая температура выросла до 75 град.

Бешено высокая температура. У меня Pentium M 770 2005-го года при постоянной максимальной нагрузке (стрим-видео) так не нагревался.
Можно уточнить:

Процессор
$ grep 'model name' /proc/cpuinfo | sort -u

Turbo Boost (1 - выключен; 0 - включен)
$ cat /sys/devices/system/cpu/intel_pstate/no_turbo

Текущая частота на ядрах процессора
$ grep MHz /proc/cpuinfo

Максимальная частота ядер процессора (kHz)
$ grep . /sys/devices/system/cpu/cpu*/cpufreq/cpuinfo_max_freq

Текущая температура процессора, - или через sensors или:
$ grep . /sys/devices/virtual/thermal/thermal_zone0/temp

Бесконечный цикл (прерывание по Ctrl+c):
(отобразит частоту на ядрах процессора и температуру процессора;
при наличии Turbo Boost, он не должен процессором использоваться постоянно или слишком часто на пиках (частота выше штатной), иначе температура процессора резко возрастёт)
$ while true; \
do \
clear; \
grep MHz /proc/cpuinfo; \
cputemp=`grep . /sys/devices/virtual/thermal/thermal_zone0/temp`; \
echo $[$cputemp/1000]; \
sleep 1; \
done

Например вывод этого цикла на Intel Broadwell-U
cpu MHz : 1111.718
cpu MHz : 955.937
cpu MHz : 1059.375
cpu MHz : 801.484
40

Обновился до kernel-image-std-def-4.9.118-alt0.M80P.1 ... пока вроде температура падать начала ... до 57

Тоже многовато.
ИМХО:
Температура должна быть на "холодном ходу" не выше 50-ти градусов.


Тема подобная вашей уже разбиралась тут:
https://forum.altlinux.org/index.php?topic=30120.0
Так что будьте с ядром и Торвальдсом настороже. Периодически это ломается.

Оффлайн ApB

  • Завсегдатай
  • *
  • Сообщений: 412
Цитировать
grep 'model name' /proc/cpuinfo | sort -u
model name : Intel(R) Core(TM) i7 CPU       Q 720  @ 1.60GHz

Цитировать
cat /sys/devices/system/cpu/intel_pstate/no_turbo
cat: /sys/devices/system/cpu/intel_pstate/no_turbo: Нет такого файла или каталога

Цитировать
grep MHz /proc/cpuinfo
cpu MHz : 933.000
cpu MHz : 933.000
cpu MHz : 933.000
cpu MHz : 933.000
cpu MHz : 933.000
cpu MHz : 1066.000
cpu MHz : 933.000
cpu MHz : 933.000



Цитировать
grep . /sys/devices/system/cpu/cpu*/cpufreq/cpuinfo_max_freq
/sys/devices/system/cpu/cpu0/cpufreq/cpuinfo_max_freq:1600000
/sys/devices/system/cpu/cpu1/cpufreq/cpuinfo_max_freq:1600000
/sys/devices/system/cpu/cpu2/cpufreq/cpuinfo_max_freq:1600000
/sys/devices/system/cpu/cpu3/cpufreq/cpuinfo_max_freq:1600000
/sys/devices/system/cpu/cpu4/cpufreq/cpuinfo_max_freq:1600000
/sys/devices/system/cpu/cpu5/cpufreq/cpuinfo_max_freq:1600000
/sys/devices/system/cpu/cpu6/cpufreq/cpuinfo_max_freq:1600000
/sys/devices/system/cpu/cpu7/cpufreq/cpuinfo_max_freq:1600000


Цитировать
grep . /sys/devices/virtual/thermal/thermal_zone0/temp
54000



Цитировать
while true; \
do \
clear; \
grep MHz /proc/cpuinfo; \
cputemp=`grep . /sys/devices/virtual/thermal/thermal_zone0/temp`; \
echo $[$cputemp/1000]; \
sleep 1; \
done

cpu MHz : 933.000
cpu MHz : 1333.000
cpu MHz : 933.000
cpu MHz : 933.000
cpu MHz : 933.000
cpu MHz : 933.000
cpu MHz : 933.000
cpu MHz : 1600.000
55


Оффлайн ApB

  • Завсегдатай
  • *
  • Сообщений: 412
Прогон десятка пятнадцатиминутных StressItOut не дал результатов кроме прогрева видяхи до 87 и проца до 70. Да, я погорячился на счёт температуры ... попутал с другими железками. Для данного бука это не пик ... ща рабочая около 60/60 проц/видео.
[02:36:03] StressItOut версия 0.1 запущена с PID 7819 14-авг-18.
[02:36:03] Ядро: Linux version 4.9.118-std-def-alt0.M80P.1 (builder@localhost.localdomain) (gcc version 5.3.1 20151207 (ALT Linux 5.3.1-alt3) (GCC) ) #1 SMP Tue Aug 7 14:18:59 UTC 2018
[02:36:03] Система работает: 0 д, 1 ч, 4 м, 59 с
[02:36:03] Процессор: Intel(R) Core(TM) i7 CPU Q 720 @ 1.60GHz
[02:36:03] Память: 11944 MiB (6424 MiB free)
[02:36:03] Жесткие диски:/dev/sdb: 1000.2 GB (931.51 GiB)
/dev/sda: 128.0 GB (119.24 GiB)
[02:36:03] Оптические приводы: Оптических устройств не найдено
[02:36:03] Сетевые интерфейсы:
[02:36:03] Разрешение экрана: 1366 x 768 pixels, 24 bpp
[02:36:03] Кол-во идеальных потоков процессора: 8
[02:36:03] версия libsensors: 3.4.0
Беда по ходу в другом ...
когда повесил топ, то зависания сопровождались загрузкой системы (проц более 100%) трёх демонов:
tracker-miner-fs
tracker-extract
gnome-documents.
При этом не ясно почему, но растёт температура видяхи и следом за ней идёт проц ... с отставанием на 10 градусов.

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 10 259
когда повесил топ, то зависания сопровождались загрузкой системы (проц более 100%) трёх демонов:
tracker-miner-fs
tracker-extract
gnome-documents.
При этом не ясно почему, но растёт температура видяхи и следом за ней идёт проц ... с отставанием на 10 градусов.

Ой блин! Тут весь интернет завален загрузкой CPU этой индексацией.
Я бы отключил к чёртовой матери эту индексацию.
Там написано что это такое инновационное решение. Если это такая инновация, пусть они сами себе её в глотку затолкают.

Оффлайн Rider

  • /usr/sbin/control
  • *******
  • Сообщений: 1 136
Ещё для ноутов есть отличная утилита powertop, которая позволяет найти узкое место в плане потребления энергии.

Оффлайн Rider

  • /usr/sbin/control
  • *******
  • Сообщений: 1 136
У меня на ноуте самое жрущее место - это nvidia. Отключаю её сразу первым делом.
$ cat /proc/acpi/bbswitch
0000:01:00.0 OFF

Оффлайн ApB

  • Завсегдатай
  • *
  • Сообщений: 412
Отключение miner-tracker-fs и сопустствующих служб к результату требуемому не привели.
В логе содержатся следующие ошибки:
usr/libexec/gdm-x-session[1378]: (II) NVIDIA(0): Virtual screen size determined to be 1366 x 768
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)

.....

авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: AER: Corrected error received: id=0018
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0018(Transmitter ID)
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:   device [8086:d138] error status/mask=00001000/00002000
авг 15 11:33:33 comp-core-i7-26c38c kernel: pcieport 0000:00:03.0:    [12] Replay Timer Timeout 

Оффлайн ApB

  • Завсегдатай
  • *
  • Сообщений: 412
При попытке воспользоваться firefox,anydesk,teamview - система зависает практически мгновенно.

Оффлайн ApB

  • Завсегдатай
  • *
  • Сообщений: 412
Очередной кусок лога перед зависанием системы:
авг 15 13:27:34 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:27:36 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:27:36 comp-core-i7-26c38c kernel: NVRM: GPU at PCI:0000:01:00: GPU-d5aa637c-74a9-4f61-c970-646e64d7575d
авг 15 13:27:36 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 8, Channel 00000007
авг 15 13:27:38 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:27:42 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:27:44 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:27:46 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:27:48 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:27:57 comp-core-i7-26c38c /usr/libexec/gdm-x-session[1376]: (WW) NVIDIA(0): WAIT (0, 4, 0x8000, 0x0000efc0, 0x0000efc0)
авг 15 13:27:57 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 8, Channel 00000007
авг 15 13:27:59 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:28:03 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:28:05 comp-core-i7-26c38c kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
авг 15 13:28:05 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 6, PE0007
авг 15 13:28:10 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 6, PE0007
авг 15 13:28:12 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 6, PE0007
авг 15 13:28:13 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 69, Class Error: ChId 0007, Class 00008597, Offset 000017b4, Data 3f800000, Er
авг 15 13:28:14 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ChID 0007, Class 00008597, Offset 000017b4, Data 00000
авг 15 13:28:14 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ChID 0007, Class 00008597, Offset 000017b4, Data 00000
авг 15 13:28:14 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ChID 0007, Class 00008597, Offset 000017b4, Data 00000
авг 15 13:28:15 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ChID 0007, Class 00008597, Offset 000017b4, Data 00000
авг 15 13:28:15 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ChID 0007, Class 00008597, Offset 000015e0, Data 00000
авг 15 13:28:21 comp-core-i7-26c38c /usr/libexec/gdm-x-session[1376]: (II) event16 - (II) Logitech M705: (II) SYN_DROPPED event - some input events ha
авг 15 13:28:36 comp-core-i7-26c38c kernel: NVRM: Xid (PCI:0000:01:00): 6, PE0007