Автор Тема: CUDA NVidia [решено]  (Прочитано 9882 раз)

Оффлайн zah

  • Давно тут
  • **
  • Сообщений: 129
  • ^_^
CUDA NVidia [решено]
« : 30.11.2020 15:42:54 »
    Всем привет!
Нашёл вот такую тему https://forum.altlinux.org/index.php?topic=6921.0
Если я правильно понял то для работы Cuda требуется поставить модуль ядра nvidia и пакеты libnvidia-opencl, libcuda.

После данных манипуляций CUDA не работает. Нужно собирать ручками?
« Последнее редактирование: 18.12.2020 19:44:34 от Skull »

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 19 239
    • Домашняя страница
    • Email
Re: CUDA NVidia
« Ответ #1 : 30.11.2020 15:45:39 »
    Всем привет!
Нашёл вот такую тему https://forum.altlinux.org/index.php?topic=6921.0
Если я правильно понял то для работы Cuda требуется поставить модуль ядра nvidia и пакеты libnvidia-opencl, libcuda.

После данных манипуляций CUDA не работает. Нужно собирать ручками?
Да.
Андрей Черепанов (cas@)

Оффлайн zah

  • Давно тут
  • **
  • Сообщений: 129
  • ^_^
Re: CUDA NVidia
« Ответ #2 : 30.11.2020 15:48:14 »
    Всем привет!
Нашёл вот такую тему https://forum.altlinux.org/index.php?topic=6921.0
Если я правильно понял то для работы Cuda требуется поставить модуль ядра nvidia и пакеты libnvidia-opencl, libcuda.

После данных манипуляций CUDA не работает. Нужно собирать ручками?
Да.
Вот прям как тут описано для p5?
https://www.altlinux.org/CUDA

Оффлайн zerg

  • ненужная строка
  • alt linux team
  • ***
  • Сообщений: 2 261
  • ненужная строка
    • Найдётся всё
Re: CUDA NVidia
« Ответ #3 : 02.12.2020 13:58:36 »
libnvidia-opencl
Тогда уж ocl-nvidia.
Убрать этот мусор можно переключателем: Не показывать подписи других пользователей.

Оффлайн zerg

  • ненужная строка
  • alt linux team
  • ***
  • Сообщений: 2 261
  • ненужная строка
    • Найдётся всё
Re: CUDA NVidia
« Ответ #4 : 02.12.2020 13:59:41 »
Вот прям как тут описано для p5?
https://www.altlinux.org/CUDA
Нет. Драйвер собирать не надо. Достаточно установить его из репозитория, если не установлен.
Убрать этот мусор можно переключателем: Не показывать подписи других пользователей.

Оффлайн zah

  • Давно тут
  • **
  • Сообщений: 129
  • ^_^
Re: CUDA NVidia
« Ответ #5 : 08.12.2020 17:32:26 »
libnvidia-opencl
У меня стоит:
kernel-modules-nvidia-un-def
libcuda
libnvidia-opencl

и всё равно ругань:
can't initialize CUDA engine, cuda exception in [main, 539], unknown error. Is NVIDIA driver installed?

Оффлайн yaleks

  • Мастер
  • ***
  • Сообщений: 6 141
Re: CUDA NVidia
« Ответ #6 : 08.12.2020 18:17:27 »
А в Xorg какой драйвер? При наличии nouveau не работает CUDA.
Я не помню добавили ли в альт утилиту nvidia-smi, но она умеет подгружать всё что нужно.

Оффлайн zah

  • Давно тут
  • **
  • Сообщений: 129
  • ^_^
Re: CUDA NVidia
« Ответ #7 : 08.12.2020 18:37:16 »
А в Xorg какой драйвер? При наличии nouveau не работает CUDA.
Я не помню добавили ли в альт утилиту nvidia-smi, но она умеет подгружать всё что нужно.
# lshw -c video | grep driver
       configuration: driver=nvidia latency=0

nvidia-smi в репозитории не нашёл, если его собрать и поставить это исправит проблему?

Оффлайн zerg

  • ненужная строка
  • alt linux team
  • ***
  • Сообщений: 2 261
  • ненужная строка
    • Найдётся всё
Re: CUDA NVidia
« Ответ #8 : 09.12.2020 09:58:30 »
Я не помню добавили ли в альт утилиту nvidia-smi, но она умеет подгружать всё что нужно.
Если nouveau задействован, не сумеет.
Убрать этот мусор можно переключателем: Не показывать подписи других пользователей.

Оффлайн zerg

  • ненужная строка
  • alt linux team
  • ***
  • Сообщений: 2 261
  • ненужная строка
    • Найдётся всё
Re: CUDA NVidia
« Ответ #9 : 09.12.2020 10:00:29 »
# lshw -c video | grep driver
       configuration: driver=nvidia latency=0
Покажите
cat /proc/driver/nvidia/versionи
lspci -nn | grep '\[03'
Убрать этот мусор можно переключателем: Не показывать подписи других пользователей.

Оффлайн zah

  • Давно тут
  • **
  • Сообщений: 129
  • ^_^
Re: CUDA NVidia
« Ответ #10 : 09.12.2020 10:06:55 »
lspci -nn | grep '\[03'
# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module  450.57  Sun Jul  5 14:42:25 UTC 2020
GCC version:  gcc version 8.4.1 20200305 (ALT p9 8.4.1-alt0.p9.1) (GCC)

# lspci -nn | grep '\[03'
01:00.0 VGA compatible controller [0300]: NVIDIA Corporation GP104 [GeForce GTX 1070] [10de:1b81] (rev a1)

Оффлайн zerg

  • ненужная строка
  • alt linux team
  • ***
  • Сообщений: 2 261
  • ненужная строка
    • Найдётся всё
Re: CUDA NVidia
« Ответ #11 : 09.12.2020 14:14:41 »
450.57
Версия пакета libcuda должна соответствовать версии драйвера. Сделайте
apt-get update
apt-get dist-upgrade
update-kernel
reboot
и проверьте.
Убрать этот мусор можно переключателем: Не показывать подписи других пользователей.

Оффлайн zah

  • Давно тут
  • **
  • Сообщений: 129
  • ^_^
Re: CUDA NVidia
« Ответ #12 : 09.12.2020 20:34:29 »
450.57
Версия пакета libcuda должна соответствовать версии драйвера. Сделайте
apt-get update
apt-get dist-upgrade
update-kernel
reboot
и проверьте.

Система была обновлена до упора. Обновил kernel-modules-nvidia-un-def явно указав 450.80.02-alt1, теперь у меня sddm не стартует:
● sddm.service - Simple Desktop Display Manager
   Loaded: loaded (/lib/systemd/system/sddm.service; enabled; vendor preset: enabled)
  Drop-In: /lib/systemd/system/display-manager.service.d
           └─plymouth-quit.conf
   Active: failed (Result: core-dump) since Wed 2020-12-09 20:27:54 MSK; 3min 40s ago
     Docs: man:sddm(1)
           man:sddm.conf(5)
  Process: 9108 ExecStartPre=/bin/plymouth quit --retain-splash (code=exited, status=1/FAILURE)
  Process: 9109 ExecStart=/usr/bin/sddm (code=dumped, signal=ABRT)
 Main PID: 9109 (code=dumped, signal=ABRT)

дек 09 20:27:54 comp.localdomain systemd[1]: sddm.service: Main process exited, code=dumped, status=6/ABRT
дек 09 20:27:54 comp.localdomain systemd[1]: sddm.service: Failed with result 'core-dump'.
дек 09 20:27:54 comp.localdomain systemd[1]: sddm.service: Scheduled restart job, restart counter is at 5.
дек 09 20:27:54 comp.localdomain systemd[1]: Stopped Simple Desktop Display Manager.
дек 09 20:27:54 comp.localdomain systemd[1]: sddm.service: Start request repeated too quickly.
дек 09 20:27:54 comp.localdomain systemd[1]: sddm.service: Failed with result 'core-dump'.
дек 09 20:27:54 comp.localdomain systemd[1]: Failed to start Simple Desktop Display Manager.
в dmesg:
...
NVRM: API mismatch: the client has the version 450.80.02, but
NVRM: this kernel module has the version 450.57.  Please
NVRM: make sure that this kernel module and all NVIDIA driver
NVRM: components have the same version.

Оффлайн zah

  • Давно тут
  • **
  • Сообщений: 129
  • ^_^
Re: CUDA NVidia
« Ответ #13 : 09.12.2020 20:53:38 »
Переключился на стабильную версию ядра, sddm в норме.
Теперь kernel-modules-nvidia-un-def-450.80.02 = libcuda-450.80.02
Тем не менее драйверов не видно:
ERROR: Can't initialize CUDA engine, cuda exception in [main, 539], unknown error. Is NVIDIA driver installed?

Оффлайн zah

  • Давно тут
  • **
  • Сообщений: 129
  • ^_^
Re: CUDA NVidia
« Ответ #14 : 16.12.2020 14:38:09 »
450.57
Версия пакета libcuda должна соответствовать версии драйвера. Сделайте
apt-get update
apt-get dist-upgrade
update-kernel
reboot
и проверьте.

Проблему может решить использование поприетарных драйверов с помощью nvidia_glx_common ?