Автор Тема: p8 Срубается пользовательская сессия  (Прочитано 11563 раз)

Оффлайн Lblss

  • Начинающий
  • *
  • Сообщений: 13
Точнее, рубится только сессия в ГУИ.  Внешне проявляется просто - экран гаснет и через секунду или даже ранее появляется экран входа в систему. Разумеется, все открытые приложения вместе с несохраненными данными летят коту под хвост.

Когда началось. Приблизительно в сентябре или октябре стал замечать. Возможно, оно связано с обновлением системы/ПО, которое проводится не вполне регулярно. Однако, однозначно утверждать не могу.

Как часто проявляется проблема. Случайным образм. Может за сутки раза три выскочить, а может и неделя пройти без происшествий.

Под спойлером ниже фрагмент сегодняшнего лога. Просмотрел несколько инцидентов ранее, строчка "Assertion 'pid > 1' failed at" присутствует почти всегда, а само событие соседствует с запуском задания из крона. По итогам в / образовались сегодня два файла коры:
-rw-------   1 root root 1,6M янв 14 08:47 .874
-rw-------   1 root root 9,7M янв 14 08:47 .917
Иногда один только бывает, бОльшего размера.

А вот что дальше делать, как найти и устранить проблему - тут я не понимаю, куда и как двигаться. Возможно, в коре можно что-то найти, но как и что искать и что оно даст... не занимался такими вещами.

Спойлер
янв 14 08:46:02 vk-pc.local crond[803]: pam_tcb(crond:session): Session closed for vk
янв 14 08:46:24 vk-pc.local ntpd[23764]: sendto: Network is unreachable
янв 14 08:47:01 vk-pc.local crond[870]: pam_tcb(crond:session): Session opened for vk by (uid=0)
янв 14 08:47:01 vk-pc.local systemd-logind[874]: Assertion 'pid > 1' failed at ../src/login/logind-dbus.c:2948, function manager_start_scope(). Aborting.
янв 14 08:47:01 vk-pc.local named[1379]: network unreachable resolving 'hlb.apr-1180c-0.edgecastdns.net/A/IN': 2606:2800:c::5#53
янв 14 08:47:01 vk-pc.local named[1379]: network unreachable resolving 'hlb.apr-1180c-0.edgecastdns.net/A/IN': 2606:2800:c::6#53
янв 14 08:47:01 vk-pc.local named[1379]: network unreachable resolving 'hlb.apr-1180c-0.edgecastdns.net/A/IN': 2606:2800:3::5#53
янв 14 08:47:01 vk-pc.local crond[870]: pam_systemd(crond:session): Failed to create session: Message recipient disconnected from message bus without replyin
янв 14 08:47:01 vk-pc.local crond[872]: (vk) CMD (~/path/to/script.sh)
янв 14 08:47:01 vk-pc.local systemd[1]: systemd-logind.service: Main process exited, code=dumped, status=6/ABRT
янв 14 08:47:01 vk-pc.local systemd[1]: systemd-logind.service: Failed with result 'core-dump'.
янв 14 08:47:01 vk-pc.local systemd[1]: systemd-logind.service: Service has no hold-off time (RestartSec=0), scheduling restart.
янв 14 08:47:01 vk-pc.local systemd[1]: systemd-logind.service: Scheduled restart job, restart counter is at 2.
янв 14 08:47:01 vk-pc.local systemd[1]: Stopped Login Service.
янв 14 08:47:01 vk-pc.local systemd[1]: Starting Login Service...
янв 14 08:47:01 vk-pc.local crond[870]: pam_tcb(crond:session): Session closed for vk
янв 14 08:47:01 vk-pc.local systemd-logind[873]: New seat seat0.
янв 14 08:47:01 vk-pc.local systemd-logind[873]: Watching system buttons on /dev/input/event4 (Power Button)
янв 14 08:47:01 vk-pc.local systemd-logind[873]: Watching system buttons on /dev/input/event3 (Power Button)
янв 14 08:47:02 vk-pc.local systemd-logind[873]: Watching system buttons on /dev/input/event0 (AT Translated Set 2 keyboard)
янв 14 08:47:02 vk-pc.local systemd[1]: Started Login Service.
янв 14 08:47:02 vk-pc.local systemd-logind[873]: New session 14015 of user vk.
янв 14 08:47:02 vk-pc.local systemd-logind[873]: New session 18114 of user vk.
янв 14 08:47:02 vk-pc.local systemd-logind[873]: New session 17605 of user vk.
янв 14 08:47:02 vk-pc.local sddm[917]: Failed to read display number from pipe
янв 14 08:47:02 vk-pc.local sddm[917]: Display server failed to start. Exiting
янв 14 08:47:02 vk-pc.local systemd[1]: sddm.service: Main process exited, code=dumped, status=6/ABRT
янв 14 08:47:02 vk-pc.local org.kde.kglobalaccel[1936]: The X11 connection broke (error 1). Did the X11 server die?
янв 14 08:47:02 vk-pc.local org.kde.KScreen[1936]: The X11 connection broke (error 1). Did the X11 server die?
янв 14 08:47:02 vk-pc.local dbus-daemon[1936]: Activating service name='org.kde.kglobalaccel'
янв 14 08:47:02 vk-pc.local polkitd[718]: Unregistered Authentication Agent for unix-session:14015 (system bus name :1.29002, object path /org/kde/PolicyKit1
янв 14 08:47:02 vk-pc.local org.a11y.atspi.Registry[2390]: XIO:  fatal IO error 11 (Resource temporarily unavailable) on X server ":0"
янв 14 08:47:02 vk-pc.local org.a11y.atspi.Registry[2390]:       after 67651 requests (67651 known processed) with 0 events remaining.
янв 14 08:47:02 vk-pc.local org.kde.kuiserver[1936]: The X11 connection broke (error 1). Did the X11 server die?
янв 14 08:47:02 vk-pc.local org.kde.kglobalaccel[1936]: qt.qpa.screen: QXcbConnection: Could not connect to display :0
янв 14 08:47:02 vk-pc.local org.kde.kglobalaccel[1936]: Could not connect to any X display.
янв 14 08:47:02 vk-pc.local dbus-daemon[1936]: Activated service 'org.kde.kglobalaccel' failed: Process org.kde.kglobalaccel exited with status 1
янв 14 08:47:02 vk-pc.local sddm-helper[992]: pam_tcb(sddm:session): Session closed for vk
янв 14 08:47:02 vk-pc.local systemd[1]: sddm.service: Failed with result 'core-dump'.
янв 14 08:47:02 vk-pc.local systemd-logind[873]: Session 14015 logged out. Waiting for processes to exit.
янв 14 08:47:02 vk-pc.local systemd[1]: sddm.service: Service RestartSec=100ms expired, scheduling restart.
янв 14 08:47:02 vk-pc.local systemd[1]: sddm.service: Scheduled restart job, restart counter is at 2.
янв 14 08:47:02 vk-pc.local systemd[1]: Stopped Simple Desktop Display Manager.
янв 14 08:47:02 vk-pc.local systemd[1]: Starting Simple Desktop Display Manager...
янв 14 08:47:02 vk-pc.local systemd[1]: Started Simple Desktop Display Manager.
янв 14 08:47:03 vk-pc.local sddm-helper[943]: pam_unix(sddm-greeter:session): Session opened for sddm by (uid=0)
янв 14 08:47:03 vk-pc.local systemd[1]: Created slice User Slice of UID 484.
янв 14 08:47:03 vk-pc.local systemd[1]: Starting User Runtime Directory /run/user/484...
янв 14 08:47:03 vk-pc.local systemd-logind[873]: New session c1 of user sddm.
янв 14 08:47:03 vk-pc.local systemd[1]: Started User Runtime Directory /run/user/484.
янв 14 08:47:03 vk-pc.local systemd[1]: Starting User Manager for UID 484...
янв 14 08:47:03 vk-pc.local systemd[947]: pam_tcb(systemd-user:session): Session opened for sddm by (uid=0)
янв 14 08:47:03 vk-pc.local systemd[947]: Starting D-Bus User Message Bus Socket.
янв 14 08:47:03 vk-pc.local systemd[947]: Reached target Timers.
янв 14 08:47:03 vk-pc.local systemd[947]: Reached target Paths.
янв 14 08:47:03 vk-pc.local systemd[947]: Listening on D-Bus User Message Bus Socket.
янв 14 08:47:03 vk-pc.local systemd[947]: Reached target Sockets.
янв 14 08:47:03 vk-pc.local systemd[947]: Reached target Basic System.
янв 14 08:47:03 vk-pc.local systemd[947]: Reached target Default.
янв 14 08:47:03 vk-pc.local systemd[947]: Startup finished in 58ms.
янв 14 08:47:03 vk-pc.local systemd[1]: Started User Manager for UID 484.
янв 14 08:47:03 vk-pc.local systemd[1]: Started Session c1 of user sddm.
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: inotify_add_watch("/usr/share/wayland-sessions") failed: "No such file or directory"
янв 14 08:47:03 vk-pc.local systemd[947]: Started D-Bus User Message Bus.
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: Loading file:///usr/share/sddm/themes/breeze/Main.qml...
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: QObject: Cannot create children for a parent that is in a different thread.
                                                  (Parent is QGuiApplication(0x7ffdca061fd0), parent's thread is QThread(0x1c4e4c0), current thread is QThrea
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: QObject: Cannot create children for a parent that is in a different thread.
                                                  (Parent is QGuiApplication(0x7ffdca061fd0), parent's thread is QThread(0x1c4e4c0), current thread is QThrea
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: QObject: Cannot create children for a parent that is in a different thread.
                                                  (Parent is QGuiApplication(0x7ffdca061fd0), parent's thread is QThread(0x1c4e4c0), current thread is QThrea
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: QObject::installEventFilter(): Cannot filter events for objects in a different thread.
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: QObject: Cannot create children for a parent that is in a different thread.
                                                  (Parent is QGuiApplication(0x7ffdca061fd0), parent's thread is QThread(0x1c4e4c0), current thread is QThrea
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: QObject: Cannot create children for a parent that is in a different thread.
                                                  (Parent is QGuiApplication(0x7ffdca061fd0), parent's thread is QThread(0x1c4e4c0), current thread is QThrea
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: QObject::installEventFilter(): Cannot filter events for objects in a different thread.
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: Cannot watch QRC-like path ":/icons/hicolor/index.theme"
янв 14 08:47:03 vk-pc.local sddm-greeter[955]: file:///usr/share/sddm/themes/breeze/components/VirtualKeyboard.qml:20:1: module "QtQuick.VirtualKeyboard" is
янв 14 08:47:24 vk-pc.local ntpd[23764]: sendto: Network is unreachable
янв 14 08:48:01 vk-pc.local crond[1021]: pam_tcb(crond:session): Session opened for vk by (uid=0)
янв 14 08:48:01 vk-pc.local crond[1023]: pam_tcb(crond:session): Session opened for root by (uid=0)
янв 14 08:48:01 vk-pc.local crond[1022]: pam_tcb(crond:session): Session opened for vk by (uid=0)

Оффлайн Lblss

  • Начинающий
  • *
  • Сообщений: 13
Судя по количеству прочтений и ответов, ситуация либо обычная и описана во всех книжках для чайников, либо неразрешима...

Оффлайн Антон Мидюков

  • alt linux team
  • ***
  • Сообщений: 5 183
  • antohami@
crontab -l

Оффлайн Lblss

  • Начинающий
  • *
  • Сообщений: 13
В заданиях крона:
1. Шелл-скрипт снимает значения трафика с интерфейса и пишет в лог - ежеминутрно.
2. wget с целью "дернуть" скрипт на улаленном сервере - раз в две минуты
3. ping серией пакетов до шлюза провайдера - раз в десять минут
4. Шелл-скрипт мониторит сеть и интерфейс ppp и перезапускает подключение при проблемах (ну провайдер такой).
Все задания работают с 2012 года примерно.

На соседство с недоступностью сети обратил внимание. Только сеть бывает недоступна в разы чаще, чем случается описанная проблема, если за сутки полчаса суммарно не наберется недоступности - у провайдера день зря прошел.

Оффлайн Антон Мидюков

  • alt linux team
  • ***
  • Сообщений: 5 183
  • antohami@
Отключите временно cron, останется ли проблема?

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 116
.xsession-errors в домашнем каталоге присутствует? Только он не сказать, что удобен к просмотру...

Оффлайн Lblss

  • Начинающий
  • *
  • Сообщений: 13
.xsession-errors в домашнем каталоге присутствует? Только он не сказать, что удобен к просмотру...
Именно такого нет, есть с номером дисплея .xsession-errors\:0
Что в нем смотреть/искать следует?
Насколько понял, этот файл пишется с нуля при запуске X-сессии. А она автоматически стартует после сбоя... Выходит, если что и было от предыдущей, затерто при старте.

Оффлайн Lblss

  • Начинающий
  • *
  • Сообщений: 13
Отключите временно cron, останется ли проблема?
Логичным было бы предположить, что если крон не будет открывать сессию для задания, то и падения именно по причине старта пользовательского задания из крона, которое тут имеет место, не будет. Есть предложение исходить из этого предположения. Или я чего-то не понимаю.

Ладно, спрошу по другому.
Что за pid пытается тут "Assertion 'pid > 1' failed at" использовать systemd-logind и как узнать, что с ним случилось по имеющемуся core-dump, о котором идет сделана запись через пару строк ниже?
Вопрос о том, как заставить нормально работать logind, если это он косячит, будет следующим. Хотя, конечно, это может и pam косячить...

янв 18 06:34:01 vk-pc.local crond[10158]: pam_tcb(crond:session): Session opened for vk by (uid=0)
янв 18 06:34:01 vk-pc.local crond[10163]: pam_tcb(crond:session): Session opened for vk by (uid=0)
янв 18 06:34:01 vk-pc.local systemd-logind[16969]: Assertion 'pid > 1' failed at ../src/login/logind-dbus.c:2948, function manager_start_scope(). Aborting.
янв 18 06:34:01 vk-pc.local systemd[1]: systemd-logind.service: Main process exited, code=dumped, status=6/ABRT
янв 18 06:34:01 vk-pc.local systemd[1]: systemd-logind.service: Failed with result 'core-dump'.
янв 18 06:34:01 vk-pc.local crond[10163]: pam_systemd(crond:session): Failed to create session: Message recipient disconnected from message bus without reply
янв 18 06:34:01 vk-pc.local systemd[1]: systemd-logind.service: Service has no hold-off time (RestartSec=0), scheduling restart.
янв 18 06:34:01 vk-pc.local crond[10158]: pam_systemd(crond:session): Failed to create session: Message recipient disconnected from message bus without reply

Оффлайн Prorace

  • Начинающий
  • *
  • Сообщений: 22
Lblss
Получилось у вас побороть эту напасть? Столкнулись с тем же в P9, после ввода в домен так же выкидывает

Оффлайн Lblss

  • Начинающий
  • *
  • Сообщений: 13
Увы, и ах. Похоже, но не могу сказать, что абсолютно уверен, в моем случае проблема как-то связана с неожиданным пропаданием интерфейса ppp (соединение PPPoE, радиоканал). Пока инет работает исправно - нет проблемы, как лагает безбожно - можно нарваться на описанное. Чертовщина какая-то, объяснить не могу.

Думал до p9 обновиться, да если и там такая же байда... подожду.

Оффлайн Prorace

  • Начинающий
  • *
  • Сообщений: 22
Думал до p9 обновиться, да если и там такая же байда... подожду.
Тоже решили пока повременить с переходом на девятку, искали причину вылета так и не нашли..

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 10 259
Судя по всему, эта проблема не первой свежести.
Благодарности отправлять инноватору Лёньке Поттерингу (который не может разобраться в собственном менеджере):
"pam_systemd(login:session): Failed to create session: Connection timed out" on boot (pam_systemd should use a much longer timeout for the OpenSession bus call, since it starts the --user systemd instance which might block for a long time) #2863
https://github.com/systemd/systemd/issues/2863

Оффлайн Lblss

  • Начинающий
  • *
  • Сообщений: 13
А можно ли эту приблуду совсем отключить или, может быть, есть какая-то альтернатива для нее?

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 10 259
А можно ли эту приблуду совсем отключить

Что отключить? systemd? :-)
# apt-cache show pam_systemd | sed -n '14,16p'
Description: Register user sessions in the systemd login manager
 pam_systemd registers user sessions with the systemd login manager
 systemd-logind.service, and hence the systemd control group hierarchy.

или, может быть, есть какая-то альтернатива для нее?

Из xfce-sysv, эта куча говна убрана совсем. А в релиз от 20191212 входит блокировщик, блокирующий установку systemd и любых пакетов требующих его. Альтернатива работает через рулезы (читай набор костылей). Лёша Гладков, пытался сделать всё что можно, чтобы подружить elogind в одном репозитории с systemd. Но из-за мудака Поттеринга, делающего всё, чтобы этого не произошло, это невозможно.
Ещё лет 6-7 назад говорил, что с ростом объёма кода будет потеря контроля над кодом системного менеджера. Это понятно любому мало-мальски приличному чайнику. И только дебил Поттеринг этого не видит, что происходит в системах на systemd.

Оффлайн Lblss

  • Начинающий
  • *
  • Сообщений: 13
Что отключить? systemd? :-)
Ну дык было же время, когда его не было в системе. По крайней мере, Альтлинукс на моем домашнем компе с 2008 года живет, когда я после множества всяких проб посчитал этот дистрибутив вполне приличным и подходящим. Ну вот в последнее время какие-то разочарования, начиная от "пропадания" привычного /var/log/messages. Конечно, с прогрессом спорить не вижу смысла...

Из xfce-sysv, эта куча говна убрана совсем. А в релиз от 20191212 входит блокировщик, блокирующий установку systemd и любых пакетов требующих его.
Эммм... так понимаю, "медицина тут бессильна, нужны коновалы". В смысле, намек на переустановку системы "с нуля" и пробовать, что получилось. Верно мыслю?