Автор Тема: Аварийная перезагрузка ALT Linux 7.0 Centaurus [решено]  (Прочитано 1812 раз)

Оффлайн maxiva

  • Завсегдатай
  • *
  • Сообщений: 172
Примерно раз в месяц сервер, который до этого отработал пару лет - перезагружается. Или просто виснет, да так, что отключается видеосигнал на монитор, клавиатура тоже вне реакции. Реагирует только на аппаратный Reset.
Блок питания уже поменял (грешил на плюс минус пять вольт) на дорогой и рабочий из магазина.
После ресета работает как новенький еще месяц.
Уважаемое сообщество, куда можно посмотреть?
В логах до аварии такое:
/var/log/kernel/errors
5d c3 <55> 89 e5 57 89 c7 56 53 83 ec 04 64 8b 1d 10 80 76 c1 8d 76 00
Oct 12 03:05:18 server-cr kernel: [2218515.868002] CPU: 0 PID: 0 Comm: swapper/0 Not tainted 3.14.79-std-def-alt0.M70P.1 #1
Oct 12 03:05:18 server-cr kernel: [2218515.868002] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Oct 12 03:05:18 server-cr kernel: [2218515.868002] task: c167ba40 ti: c1670000 task.ti: c1670000
Oct 12 03:05:18 server-cr kernel: [2218515.868002] Stack:
Oct 12 03:05:18 server-cr kernel: [2218515.868002] Call Trace:
Oct 12 03:05:18 server-cr kernel: [2218515.868002] Code: ae f0 66 90 89 e0 31 d2 25 00 e0 ff ff 83 c0 08 89 d1 0f 01 c8 64 a1 74 86 76 c1 8b 40 04 8b 40 08 a8 08 75 0d 31 c0 fb 0f 01 c9 <eb> 0b 90 8d 74 26 00 fb 66 66 90 66 90 89 e0 25 00 e0 ff ff 83
Oct 12 03:05:41 server-cr kernel: [2218540.064001] BUG: soft lockup - CPU#1 stuck for 22s! [smbd:7012]
Oct 12 03:05:41 server-cr kernel: [2218540.064001] CPU: 1 PID: 7012 Comm: smbd Not tainted 3.14.79-std-def-alt0.M70P.1 #1
Oct 12 03:05:41 server-cr kernel: [2218540.064001] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Oct 12 03:05:41 server-cr kernel: [2218540.064001] task: f3be2db0 ti: f3b8c000 task.ti: f3b8c000
Oct 12 03:05:41 server-cr kernel: [2218540.064001] Stack:
Oct 12 03:05:42 server-cr kernel: [2218540.064001] Call Trace:
Oct 12 03:05:42 server-cr kernel: [2218540.064001] Code: 0f b6 c6 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 83 e8 01 74 11 <0f> b6 11 38 d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d c3 89 c8 89 f2
Oct 12 03:06:09 server-cr kernel: [2218568.064001] BUG: soft lockup - CPU#1 stuck for 22s! [smbd:7012]
Oct 12 03:06:09 server-cr kernel: [2218568.064001] CPU: 1 PID: 7012 Comm: smbd Not tainted 3.14.79-std-def-alt0.M70P.1 #1
Oct 12 03:06:09 server-cr kernel: [2218568.064001] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Oct 12 03:06:09 server-cr kernel: [2218568.064001] task: f3be2db0 ti: f3b8c000 task.ti: f3b8c000
Oct 12 03:06:10 server-cr kernel: [2218568.064001] Stack:
Oct 12 03:06:10 server-cr kernel: [2218568.064001] Call Trace:
Oct 12 03:06:10 server-cr kernel: [2218568.064001] Code: f0 66 0f c1 10 0f b6 c6 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 <83> e8 01 74 11 0f b6 11 38 d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d
Oct 12 03:06:37 server-cr kernel: [2218596.064001] BUG: soft lockup - CPU#1 stuck for 22s! [smbd:7012]
Oct 12 03:06:37 server-cr kernel: [2218596.064001] CPU: 1 PID: 7012 Comm: smbd Not tainted 3.14.79-std-def-alt0.M70P.1 #1
Oct 12 03:06:37 server-cr kernel: [2218596.064001] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Oct 12 03:06:37 server-cr kernel: [2218596.064001] task: f3be2db0 ti: f3b8c000 task.ti: f3b8c000
Oct 12 03:06:37 server-cr kernel: [2218596.064001] Stack:
Oct 12 03:06:38 server-cr kernel: [2218596.064001] Call Trace:
Oct 12 03:06:38 server-cr kernel: [2218596.064001] Code: f0 66 0f c1 10 0f b6 c6 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 <83> e8 01 74 11 0f b6 11 38 d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d
Oct 12 03:07:05 server-cr kernel: [2218624.064002] BUG: soft lockup - CPU#1 stuck for 22s! [smbd:7012]
Oct 12 03:07:05 server-cr kernel: [2218624.064002] CPU: 1 PID: 7012 Comm: smbd Not tainted 3.14.79-std-def-alt0.M70P.1 #1
Oct 12 03:07:05 server-cr kernel: [2218624.064002] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Oct 12 03:07:05 server-cr kernel: [2218624.064002] task: f3be2db0 ti: f3b8c000 task.ti: f3b8c000
Oct 12 03:07:06 server-cr kernel: [2218624.064002] Stack:
Oct 12 03:07:06 server-cr kernel: [2218624.064002] Call Trace:
Oct 12 03:07:06 server-cr kernel: [2218624.064002] Code: f0 66 0f c1 10 0f b6 c6 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 <83> e8 01 74 11 0f b6 11 38 d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d
Oct 12 03:07:33 server-cr kernel: [2218652.064001] BUG: soft lockup - CPU#1 stuck for 22s! [smbd:7012]
Oct 12 03:07:33 server-cr kernel: [2218652.064001] CPU: 1 PID: 7012 Comm: smbd Not tainted 3.14.79-std-def-alt0.M70P.1 #1
Oct 12 03:07:33 server-cr kernel: [2218652.064001] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Oct 12 03:07:33 server-cr kernel: [2218652.064001] task: f3be2db0 ti: f3b8c000 task.ti: f3b8c000
Oct 12 03:07:33 server-cr kernel: [2218652.064001] Stack:
Oct 12 03:07:34 server-cr kernel: [2218652.064001] Call Trace:
Oct 12 03:07:34 server-cr kernel: [2218652.064001] Code: 0f b6 c6 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 83 e8 01 74 11 <0f> b6 11 38 d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d c3 89 c8 89 f2
Oct 12 03:08:01 server-cr kernel: [2218680.064001] BUG: soft lockup - CPU#1 stuck for 22s! [smbd:7012]
Oct 12 03:08:01 server-cr kernel: [2218680.064001] CPU: 1 PID: 7012 Comm: smbd Not tainted 3.14.79-std-def-alt0.M70P.1 #1
Oct 12 03:08:01 server-cr kernel: [2218680.064001] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Oct 12 03:08:01 server-cr kernel: [2218680.064001] task: f3be2db0 ti: f3b8c000 task.ti: f3b8c000
Oct 12 03:08:01 server-cr kernel: [2218680.064001] Stack:
Oct 12 03:08:02 server-cr kernel: [2218680.064001] Call Trace:
Oct 12 03:08:02 server-cr kernel: [2218680.064001] Code: f0 66 0f c1 10 0f b6 c6 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 <83> e8 01 74 11 0f b6 11 38 d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d

/var/log/kernel/info
Oct 12 02:35:01 server-cr kernel: mod
Oct 12 02:35:17 server-cr kernel: [2216715.744001] sending NMI to all CPUs:
Oct 12 02:35:41 server-cr kernel: mod
Oct 12 02:36:37 server-cr last message repeated 2 times
Oct 12 02:37:33 server-cr last message repeated 2 times
Oct 12 02:38:01 server-cr kernel: mod
Oct 12 02:38:17 server-cr kernel: [2216895.756001] sending NMI to all CPUs:
Oct 12 02:38:41 server-cr kernel: mod
Oct 12 02:39:37 server-cr last message repeated 2 times
Oct 12 02:40:33 server-cr last message repeated 2 times
Oct 12 02:41:01 server-cr kernel: mod
Oct 12 02:41:17 server-cr kernel: [2217075.768001] sending NMI to all CPUs:
Oct 12 02:41:41 server-cr kernel: mod
Oct 12 02:42:37 server-cr last message repeated 2 times
Oct 12 02:43:33 server-cr last message repeated 2 times
Oct 12 02:44:01 server-cr kernel: mod
Oct 12 02:44:17 server-cr kernel: [2217255.780001] sending NMI to all CPUs:
Oct 12 02:44:41 server-cr kernel: mod
Oct 12 02:45:37 server-cr last message repeated 2 times
Oct 12 02:46:33 server-cr last message repeated 2 times
Oct 12 02:47:01 server-cr kernel: mod
Oct 12 02:47:17 server-cr kernel: [2217435.792001] sending NMI to all CPUs:
Oct 12 02:47:41 server-cr kernel: mod
Oct 12 02:48:37 server-cr last message repeated 2 times
Oct 12 02:49:33 server-cr last message repeated 2 times
Oct 12 02:50:01 server-cr kernel: mod
Oct 12 02:50:17 server-cr kernel: [2217615.804001] sending NMI to all CPUs:
Oct 12 02:50:41 server-cr kernel: mod
Oct 12 02:51:37 server-cr last message repeated 2 times
Oct 12 02:52:33 server-cr last message repeated 2 times
Oct 12 02:53:01 server-cr kernel: mod
Oct 12 02:53:17 server-cr kernel: [2217795.816001] sending NMI to all CPUs:
Oct 12 02:53:41 server-cr kernel: mod
Oct 12 02:54:37 server-cr last message repeated 2 times
Oct 12 02:55:33 server-cr last message repeated 2 times
Oct 12 02:56:01 server-cr kernel: mod
Oct 12 02:56:17 server-cr kernel: [2217975.828001] sending NMI to all CPUs:
Oct 12 02:56:41 server-cr kernel: mod
Oct 12 02:57:37 server-cr last message repeated 2 times
Oct 12 02:58:33 server-cr last message repeated 2 times
Oct 12 02:59:01 server-cr kernel: mod
Oct 12 02:59:17 server-cr kernel: [2218155.840001] sending NMI to all CPUs:
Oct 12 02:59:41 server-cr kernel: mod
Oct 12 03:00:37 server-cr last message repeated 2 times
Oct 12 03:01:33 server-cr last message repeated 2 times
Oct 12 03:02:01 server-cr kernel: mod
Oct 12 03:02:17 server-cr kernel: [2218335.852001] sending NMI to all CPUs:
Oct 12 03:02:41 server-cr kernel: mod
Oct 12 03:03:37 server-cr last message repeated 2 times
Oct 12 03:04:33 server-cr last message repeated 2 times
Oct 12 03:05:01 server-cr kernel: mod
Oct 12 03:05:17 server-cr kernel: [2218515.864001] sending NMI to all CPUs:
Oct 12 03:05:41 server-cr kernel: mod
Oct 12 03:06:37 server-cr last message repeated 2 times
Oct 12 03:07:33 server-cr last message repeated 2 times

В других логах вроде больше криминала не обнаружил.
Вентиляция и охлаждение сервера - в норме (корпус не выше 19 градусов).
Что это может быть? Я спинным мозгом понимаю, что это скорее всего - железо, но что конкретно? И почему с почти равной периодичностью?
« Последнее редактирование: 16.12.2016 13:09:04 от maxiva »

Оффлайн YYY

  • Мастер
  • ***
  • Сообщений: 5 964
разобрать, спеть шаманскую песенку и постучать в бубен, собрать :)

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 104
В логах до аварии такое:
Это именно перед аварией появляется, или, всё же, всегда присутствует ? Я бы статистику пособирал посредством collectd ещё (всю, какую получится: загрузка, температура, напряжения и т.п.). Причём, если есть ещё сервер, настроил бы слив данных туда. Ещё бы netconsole настроил на слив данных в syslog на другой сервер. Ещё можно попробовать другое ядро на всякий случай.

Оффлайн montigomo

  • Давно тут
  • **
  • Сообщений: 359
  • Montigomo
    • Email
Из опыта могу сказать, что процессоры "Celeron" имеют такую особенность: по мере ослабления заряда батарейки CMOS компьютер самопроизвольно начинает перезагружаться.
Иными словами: если "сдохла" батарейка CR2032, питающая BIOS, то машина может самопроизвольно перезагружаться.
Если в сервере процессор Celeron, то замените батарейку.
Алексей ЕФАНОВ, г. СПб.; ноутбук Lenovo Т420;
BaseAlt Workstation 10.1 МАТЕ (x86_64)

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 104
Из опыта могу сказать, что процессоры "Celeron" имеют такую особенность: по мере ослабления заряда батарейки CMOS компьютер самопроизвольно начинает перезагружаться.
Что-то в первый раз слышу.

Оффлайн maxiva

  • Завсегдатай
  • *
  • Сообщений: 172
Батарейку менял вместе с блоком питания.
Сам сервер кушает вкусное электричество из APC Smart.
Ошибка, описанная в первом посте, появляется строго перед тем, как сервер уходит в страну теней.
И это уже не первый раз (иначе бы не обратился к уважаемому сообществу). Ошибки каждый раз - одинаковые полностью.
Перед аварией 11 октября точно такая же авария была 15 сентября.
Sep 15 20:06:16 server-cr kernel: [3818260.656002] CPU: 0 PID: 0 Comm: swapper/0 Not tainted 3.14.74-std-def-alt0.M70P.1 #1
Sep 15 20:06:17 server-cr kernel: [3818260.656002] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Sep 15 20:06:17 server-cr kernel: [3818260.656002] task: c167ba40 ti: c1670000 task.ti: c1670000
Sep 15 20:06:17 server-cr kernel: [3818260.656002] Stack:
Sep 15 20:06:17 server-cr kernel: [3818260.656002] Call Trace:
Sep 15 20:06:17 server-cr kernel: [3818260.656002] Code: ae f0 66 90 89 e0 31 d2 25 00 e0 ff ff 83 c0 08 89 d1 0f 01 c8 64 a1 74 86 76 c1 8b 40 04 8b 40 08 a8 08 75 0d 31 c0 fb 0f 01 c9 <eb> 0b 90 8d 74 26 00 fb 66 66 90 66 90 89 e0 25 00 e0 ff ff 83
Sep 15 20:06:43 server-cr kernel: [3818288.064001] BUG: soft lockup - CPU#1 stuck for 22s! [smbd:7009]
Sep 15 20:06:44 server-cr kernel: [3818288.064001] CPU: 1 PID: 7009 Comm: smbd Not tainted 3.14.74-std-def-alt0.M70P.1 #1
Sep 15 20:06:44 server-cr kernel: [3818288.064001] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Sep 15 20:06:44 server-cr kernel: [3818288.064001] task: f1f2a290 ti: f4a1e000 task.ti: f4a1e000
Sep 15 20:06:45 server-cr kernel: [3818288.064001] Stack:
Sep 15 20:06:45 server-cr kernel: [3818288.064001] Call Trace:
Sep 15 20:06:45 server-cr kernel: [3818288.064001] Code: c1 10 0f b6 c6 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 83 e8 01 <74> 11 0f b6 11 38 d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d c3 89 c8
Sep 15 20:07:11 server-cr kernel: [3818316.064001] BUG: soft lockup - CPU#1 stuck for 22s! [smbd:7009]
Sep 15 20:07:13 server-cr kernel: [3818316.064001] CPU: 1 PID: 7009 Comm: smbd Not tainted 3.14.74-std-def-alt0.M70P.1 #1
Sep 15 20:07:13 server-cr kernel: [3818316.064001] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Sep 15 20:07:13 server-cr kernel: [3818316.064001] task: f1f2a290 ti: f4a1e000 task.ti: f4a1e000
Sep 15 20:07:13 server-cr kernel: [3818316.064001] Stack:
Sep 15 20:07:13 server-cr kernel: [3818316.064001] Call Trace:
Sep 15 20:07:14 server-cr kernel: [3818316.064001] Code: 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 83 e8 01 74 11 0f b6 11 <38> d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d c3 89 c8 89 f2 66 66 90
Sep 15 20:07:39 server-cr kernel: [3818344.064001] BUG: soft lockup - CPU#1 stuck for 23s! [smbd:7009]
Sep 15 20:07:40 server-cr kernel: [3818344.064001] CPU: 1 PID: 7009 Comm: smbd Not tainted 3.14.74-std-def-alt0.M70P.1 #1
Sep 15 20:07:40 server-cr kernel: [3818344.064001] Hardware name: System manufacturer System Product Name/P5B-VM SE, BIOS 0601    08/23/2007
Sep 15 20:07:40 server-cr kernel: [3818344.064001] task: f1f2a290 ti: f4a1e000 task.ti: f4a1e000
Sep 15 20:07:40 server-cr kernel: [3818344.064001] Stack:
Sep 15 20:07:40 server-cr kernel: [3818344.064001] Call Trace:
Sep 15 20:07:41 server-cr kernel: [3818344.064001] Code: 0f b6 c6 38 d0 75 01 c3 55 89 e5 83 ec 10 89 5d f8 89 c3 83 e3 fe 89 75 fc 0f b6 f3 b8 00 80 00 00 eb 08 90 f3 90 83 e8 01 74 11 <0f> b6 11 38 d3 75 f2 8b 5d f8 8b 75 fc 89 ec 5d c3 89 c8 89 f2
Sep 15 20:07:53 server-cr kernel: [3818357.147799] Out of memory: Kill process 6726 (bacula-dir) score 13 or sacrifice child
Sep 15 20:07:53 server-cr kernel: [3818357.147803] Killed process 6726 (bacula-dir) total-vm:144580kB, anon-rss:57576kB, file-rss:1236kB
Sep 15 20:08:07 server-cr kernel: [3818372.064001] BUG: soft lockup - CPU#1 stuck for 23s! [smbd:7009]
Sep 15 20:08:42 server-cr kernel: [3818372.064001] CPU: 1 PID: 7009 Comm: smbd Not tainted 3.14.74-std-def-alt0.M70P.1 #1
« Последнее редактирование: 14.10.2016 12:12:43 от maxiva »

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 104
Сам сервер кушает вкусное электричество из APC Smart.
Я больше про то, что показывает lmsensors или ipmitool. Кстати, ошибка про "BUG: soft lockup - CPU#1 stuck for" гуглится сдесь же: https://forum.altlinux.org/index.php?topic=36793.0. Может и оно...

А может и вот так: https://ubuntuforums.org/showthread.php?t=2205211
Цитировать
GREAT NEWS: After replacing the power supply, the crashes completely stopped!
« Последнее редактирование: 14.10.2016 12:35:54 от asy »

Оффлайн maxiva

  • Завсегдатай
  • *
  • Сообщений: 172
Поменял ядро на 4.1.34-un-def-alt0.M70P.1 #1 SMP PREEMPT Wed Oct 12 10:05:52 UTC 2016 i686 GNU/Linux
Посмотрим, как поведет себя.
Но заранее спасибо!

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 104
Посмотрим, как поведет себя.
collectd я бы, всё же, посавил. И плагин sensors включил, или ipmi, в зависисмости от того, что материнка поддерживает. ipmi лучше - там информации больше, как правило.

Оффлайн maxiva

  • Завсегдатай
  • *
  • Сообщений: 172
Посмотрим, как поведет себя.
collectd я бы, всё же, посавил. И плагин sensors включил, или ipmi, в зависисмости от того, что материнка поддерживает. ipmi лучше - там информации больше, как правило.

А есть какая-либо документация, как этим пользоваться?

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 104
А есть какая-либо документация, как этим пользоваться?
https://collectd.org/documentation.shtml

collectd - просто поставить и запустить, и он уже будет что-то писать (что - посмотреть список раскомментированных плагинов в конфиге).
lm_sensors3 - поставить, запустить sensors-detect. Если он что-то найдёт, запустить сервис lm_sensors и посмотреть, что показывает утилита sensors. Если что-то есть, то раскомментировать соответствующий плагин в конфиге collectd и доустановить collectd-sensors (collectd перезапустить).
ipmitool - установить, подгрузить модули ядра ipmi_devintf и ipmi_si, опросить сенсоры: "ipmitool sensor". Если покажет что-то, модули дописать в /etc/modules, доустановить collectd-ipmi, раскомментировать соответствующий плагин.
И, вообще, посмотреть список плагинов, может ещё что-то интересное будет. irq, swap и т.п.

Как смотреть. Можно web-интерфейс прикрутить прямо на сервер (collection3 или collection4 к примеру; последний есть в репозитории, первый - в контрибах в документации), можно kcollectd, но это к себе копировать rrd-шки, хотя можно свой компьютер, если включен постоянно, сделать collectd-сервером и сливать данные в онлайне.
« Последнее редактирование: 14.10.2016 15:19:06 от asy »

Оффлайн semenzagladko

  • Начинающий
  • *
  • Сообщений: 1
не туда копаете. смотреть надо на материнку. данная модель отличается проблематичностью. рекомендую или вообще её поменять (таки уже 9 лет точно пашет) или как минимум проверить конденсаторы.

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 104
Цитировать
collectd я бы, всё же, посавил. И плагин sensors включил, или ipmi, в зависисмости от того, что материнка поддерживает. ipmi лучше - там информации больше, как правило.
А есть какая-либо документация, как этим пользоваться?
https://collectd.org/documentation.shtml

Но на английском.
« Последнее редактирование: 31.10.2016 19:33:33 от asy »

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 104
не туда копаете. смотреть надо на материнку. данная модель отличается проблематичностью. рекомендую или вообще её поменять (таки уже 9 лет точно пашет) или как минимум проверить конденсаторы.
Если дело в конденсаторах, то перепайка помогает в большинстве случаев (не конкретно у этой материнки, а вообще), так что, может, и не надо выкидывать сразу.

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 10 259
Sep 15 20:07:53 server-cr kernel: [3818357.147799] Out of memory: Kill process 6726 (bacula-dir) score 13 or sacrifice child
Sep 15 20:07:53 server-cr kernel: [3818357.147803] Killed process 6726 (bacula-dir) total-vm:144580kB, anon-rss:57576kB, file-rss:1236kB

Out of memory: процесс 6726 bacula-dir был убит.

Я бы тут, в usnet почитал:
https://plumbr.eu/blog/memory-leaks/out-of-memory-kill-process-or-sacrifice-child
https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Performance_Tuning_Guide/s-memory-captun.html
https://www.kernel.org/doc/gorman/html/understand/understand016.html