Автор Тема: Периодическое пропадание сети  (Прочитано 462 раз)

Оффлайн ОлегК

  • Начинающий
  • *
  • Сообщений: 17
Имеется два сервера, на которых установлена ОС «Альт Рабочая станция» 10.
Конфигурация серверов идентичная: Intel Xeon 3,3 GHz/4GB/2Tbx8/LSI MegaRaid 1-8i, 1Gb with BBU/DVDRW/560W.
При нахождении серверов в сети происходят сбои в работе серверов. Ошибка подтверждается, например,  периодическим нарушением прохождения Ping как между серверами, так и между каждым сервером и другими устройствами в сети . При этом прохождение ping наблюдается в течение определенного времени (около 3 мин), по истечении которого ping прекращают проходить. Возобновление ping наблюдается, приблизительно, через 5 мин. Также восстановить Ping можно отключением/подключением сетевого кабеля.
При прямом подключении серверов без коммутатора также наблюдается эта ошибка.
Параметры системы
[tkm@host-1 ~]$ cat /etc/os-release
NAME="ALT Workstation"
VERSION="10.1"
ID=altlinux
VERSION_ID=10.1
PRETTY_NAME="ALT Workstation 10.1 (Autolycus)"
ANSI_COLOR="1;33"
CPE_NAME="cpe:/o:alt:workstation:10.1"
BUILD_ID="ALT Workstation 10.1"
HOME_URL="https://basealt.ru/"
BUG_REPORT_URL="https://bugs.altlinux.org/"

[tkm@host-1 ~]$ uname -a
Linux host-1 5.10.195-std-def-alt1 #1 SMP Mon Sep 25 11:52:36 UTC 2023 x86_64 GNU/Linux

[tkm@host-1 ~]$ apt-repo
rpm [p10] http://ftp.altlinux.org/pub/distributions/ALTLinux p10/branch/x86_64 classic
rpm [p10] http://ftp.altlinux.org/pub/distributions/ALTLinux p10/branch/x86_64-i586 classic
rpm [p10] http://ftp.altlinux.org/pub/distributions/ALTLinux p10/branch/noarch classic
Другие устройства в сети подобных проблем не испытывают.
Требуются советы по диагностированию и по устранению причины сбоев.


Оффлайн NickM

  • Завсегдатай
  • *
  • Сообщений: 904
Re: Периодическое пропадание сети
« Ответ #1 : 28.09.2023 16:19:23 »
Припоминаю, что был какой-то баг на сетевых от "Intel I219-V" или что-то такого рода, надо бы напрячь память и вспомнить, ага.

Оффлайн rits

  • Завсегдатай
  • *
  • Сообщений: 1 046
  • ITS
Re: Периодическое пропадание сети
« Ответ #2 : 28.09.2023 17:04:04 »
У меня был такой случай, когда принтер HP переставал видиться  за vpn, причем таких моделей несколько, а вот переставал видится, именно один какой нибудь. Пришлось на шлюзе, через который бегал трафик принтера, запустить снифер трафика
tcpdump -i ether1 -l -e -n -t  'host 192.168.8.31' and 'arp' | tee /tmp/hp.dmp.txt
а на другом компьютере, пинговать хост до тех пор, пока пинг принтера за vpn не пропадал.
Как только трафик пропал, я сразу смотрел общение принтера по arp пакетам.
Оказалось, что мой принтер после перезапуска пинговался, а как перестал, то до этого он обменялся какой то информацией с сетевым коммутатором Netgear. Как только я вывел вебинтерфейс Netgear из под сети, сеть на HP стала работать стабильно.
Видимо, коммутатор объявил принтеру, что он теперь шлюз (есть такой протокол), принтер послушно согласился и пинговался только в своей подсети. Так, что разгребай свою локалку и причин может быть много, включая дебильные сетевухи в сервере.

Оффлайн Nicom

  • Завсегдатай
  • *
  • Сообщений: 646
Re: Периодическое пропадание сети
« Ответ #3 : 28.09.2023 18:46:38 »
Припоминаю, что был какой-то баг на сетевых от "Intel I219-V" или что-то такого рода,
Там проблема в драйвере e1000e с таймером tso, остаётся только отключить этот таймер.
https://forum.altlinux.org/index.php?topic=46537.msg372940#msg372940

Оффлайн ОлегК

  • Начинающий
  • *
  • Сообщений: 17
Re: Периодическое пропадание сети
« Ответ #4 : 01.10.2023 19:12:06 »
Для уточнения условий возникновения ошибки направляю ifconfig, systemd и фрагмент журнала journalctl
 
Там проблема в драйвере e1000e с таймером tso, остаётся только отключить этот таймер.
https://forum.altlinux.org/index.php?topic=46537.msg372940#msg372940
tso отключали - без результата.
Переустанавливали ОС - с Ubuntu 22.04 пропадания сети не наблюдалось.

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 105
Re: Периодическое пропадание сети
« Ответ #5 : 01.10.2023 19:40:14 »
Конфигурация серверов идентичная: Intel Xeon 3,3 GHz/4GB/2Tbx8/LSI MegaRaid 1-8i, 1Gb with BBU/DVDRW/560W.
Не важно от слова "совсем".
какой-то баг на сетевых от "Intel I219-V"
Вот это - важно. ОлегК, у того сервера какой сетевой контроллер? Именно I219-V?
Переустанавливали ОС - с Ubuntu 22.04 пропадания сети не наблюдалось.
Какое там ядро и какой драйвер? Со всеми интеловскими драверами много нюансов, и есть общий: есть драйвер в ядре и есть драйвер отдельно. В каких-то случаях лучше работает один, в каких-то другой, плюс ещё версия. Бывало, что и старое ядро использовали в некоторых случаях.

У нас эксплуатируется множество сетевых карт Intel, от 100М (ага, живы ещё) до 10GbE. Все работают, но перебор параметров и выбор драйвера имеет место. Правда, в последнее время, везде перешли на "in tree" драйвера.
« Последнее редактирование: 01.10.2023 19:44:03 от asy »

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 105
Re: Периодическое пропадание сети
« Ответ #6 : 01.10.2023 19:47:00 »
journalctl_alt10.txt (996.13 кБ - загружено 2 раз.)
И кто там будет выбирать про драйвер? Сложно было использовать grep и убрать ненужное? Тут не техподдержка, люди своё время тратить должны.

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 105
Re: Периодическое пропадание сети
« Ответ #7 : 01.10.2023 19:52:09 »
$ cat journalctl_alt10.txt | grep -i ether
окт 01 10:55:32 host-2 kernel: igb: Intel(R) Gigabit Ethernet Network Driver
окт 01 10:55:32 host-2 kernel: igb 0000:02:00.0: Intel(R) Gigabit Ethernet Network Connection
окт 01 10:55:32 host-2 kernel: igb 0000:03:00.0: Intel(R) Gigabit Ethernet Network Connection
окт 01 10:55:32 host-2 kernel: usbcore: registered new interface driver cdc_ether
окт 01 10:55:33 host-2 kernel: ax88179_178a 1-4:2.0 eth0: register 'ax88179_178a' at usb-0000:00:14.0-4, ASIX AX88179 USB 3.0 Gigabit Ethernet, 92:89:4d:ad:4b:eb
окт 01 10:55:34 host-2 kernel: ax88179_178a 1-4:2.1 eth1: register 'ax88179_178a' at usb-0000:00:14.0-4, ASIX AX88179 USB 3.0 Gigabit Ethernet, 4a:f3:64:13:9a:be
окт 01 10:55:35 host-2 kernel: ax88179_178a 1-4:2.0 enp0s20f0u4c2: unregister 'ax88179_178a' usb-0000:00:14.0-4, ASIX AX88179 USB 3.0 Gigabit Ethernet
окт 01 10:55:35 host-2 kernel: ax88179_178a 1-4:2.1 enp0s20f0u4c2i1: unregister 'ax88179_178a' usb-0000:00:14.0-4, ASIX AX88179 USB 3.0 Gigabit Ethernet
окт 01 10:55:37 host-2 kernel: ax88179_178a 1-4:1.0 eth0: register 'ax88179_178a' at usb-0000:00:14.0-4, ASIX AX88179 USB 3.0 Gigabit Ethernet, f8:e4:3b:07:96:8b
окт 01 10:55:39 host-2 NetworkManager[2442]: <info>  [1696146939.8996] manager: (eno1): new Ethernet device (/org/freedesktop/NetworkManager/Devices/2)
окт 01 10:55:39 host-2 NetworkManager[2442]: <info>  [1696146939.9285] manager: (eno2): new Ethernet device (/org/freedesktop/NetworkManager/Devices/3)
окт 01 10:55:39 host-2 NetworkManager[2442]: <info>  [1696146939.9560] manager: (enp0s20f0u4): new Ethernet device (/org/freedesktop/NetworkManager/Devices/4)
окт 01 10:55:40 host-2 NetworkManager[2442]: <info>  [1696146940.8268] manager: (enp0s20f0u5u2c2): new Ethernet device (/org/freedesktop/NetworkManager/Devices/5)
окт 01 12:33:06 host-2 kernel: ax88179_178a 1-4:1.0 enp0s20f0u4: unregister 'ax88179_178a' usb-0000:00:14.0-4, ASIX AX88179 USB 3.0 Gigabit Ethernet
И, судя по всему, у Вас вообще e1000e не используется. Есть какя-то сетевая карта (точнее две) с драйверм igb (тоже Интел; всё, написанное ранее, справедливо), и есть непонятное на USB. Что за USB-шные сетевые? И, собственно, с какой из них проблема?
« Последнее редактирование: 01.10.2023 19:57:44 от asy »

Оффлайн ОлегК

  • Начинающий
  • *
  • Сообщений: 17
Re: Периодическое пропадание сети
« Ответ #8 : 01.10.2023 20:20:25 »
Вот это - важно. ОлегК, у того сервера какой сетевой контроллер? Именно I219-V?
Согласно описанию материнской платы - X12STL-F в ее составе on-board контроллеры - Network Controllers - Dual LAN with 1GbE with Intel I210.
Что за USB-шные сетевые?
С целью эксперимента был вставлен переходник LAN-USB. Сеть пропадала как с использованием LAN-USB, так и без него.

Оффлайн Nicom

  • Завсегдатай
  • *
  • Сообщений: 646
Re: Периодическое пропадание сети
« Ответ #9 : 01.10.2023 23:12:55 »
А без докторвеба тоже отваливаются интерфейсы?

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 105
Re: Периодическое пропадание сети
« Ответ #10 : 02.10.2023 08:11:41 »
А без докторвеба тоже отваливаются интерфейсы?
А как видится связь с DrWeb? Это тоже странное предположение.
« Последнее редактирование: 02.10.2023 08:28:54 от asy »

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 105
Re: Периодическое пропадание сети
« Ответ #11 : 02.10.2023 08:17:36 »
Вот это - важно. ОлегК, у того сервера какой сетевой контроллер? Именно I219-V?
Согласно описанию материнской платы - X12STL-F в ее составе on-board контроллеры - Network Controllers - Dual LAN with 1GbE with Intel I210.
"lspci|grep Ether" покажите на всякий случай? У нас таких мало на самом деле, но есть:
0a:00.0 Ethernet controller: Intel Corporation I210 Gigabit Network Connection (rev 03)
        DeviceName:  Intel i210 Ethernet #1
        Subsystem: Super Micro Computer Inc Device 1533
        Kernel driver in use: igb
ethtool -i <кто он там> тоже стоит посмотреть, но, может быть, позже. Сеть у Вас через Network Managet настроена, или через etcnet?

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 10 259
Re: Периодическое пропадание сети
« Ответ #12 : 02.10.2023 09:07:02 »
Сеть у Вас через Network Managet настроена, или через etcnet?

У него через NM:
$ grep '14:12:52' journalctl_alt10.txt | head -n 4
окт 01 14:12:52 host-2 NetworkManager[2442]: <info>  [1696158772.0397] device (eno1): state change: ip-config -> failed (reason 'ip-config-unavailable', sys-iface-state: 'managed')
окт 01 14:12:52 host-2 NetworkManager[2442]: <info>  [1696158772.0407] manager: NetworkManager state is now CONNECTED_LOCAL
окт 01 14:12:52 host-2 NetworkManager[2442]: <warn>  [1696158772.0410] device (eno1): Activation: failed for connection 'Проводное соединение 1'
окт 01 14:12:52 host-2 NetworkManager[2442]: <info>  [1696158772.0413] device (eno1): state change: failed -> disconnected (reason 'none', sys-iface-state: 'managed')

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 105
Re: Периодическое пропадание сети
« Ответ #13 : 02.10.2023 09:09:55 »
У него через NM:
Это я видел, но там не очень понятно, где какие сетвевые карты. Могут же быть одни через etcnet, другие через NM, а интересует та, которая отпадает.

Оффлайн ОлегК

  • Начинающий
  • *
  • Сообщений: 17
Re: Периодическое пропадание сети
« Ответ #14 : 03.10.2023 10:02:30 »
Добрый день!
Ошибку удалось исправить. В графическом интерфейсе в центре управления при редактировании "Проводное соединение 1" мы установили метод "Вручную" (по умолчанию - "Автоматически (DHCP)").
Пропадание сети теперь не наблюдается.
Всем, кто пытался разобраться, большое спасибо!
« Последнее редактирование: 03.10.2023 10:04:26 от ОлегК »