Автор Тема: Часть контейнеров VZ после сбоя по питанию не грузится.  (Прочитано 3156 раз)

Оффлайн Ilya Evseev

  • Участник
  • *
  • Сообщений: 52
Имеется ALTLinux p5, ядро 2.6.32-ovz-smp-alt3.
/var/lib/vz на reiserfs на RAID1.

Произошёл сбой по питанию: UPS скомандовал серверу выключаться,
сервер стал выключаться, в этот момент UPS отрубил питание.

RAID рассыпался, на reiserfs куча ошибок, но fsck вроде всё восстановил,
транзакции повторились, монтирование проходит без ошибок.

Однако теперь при старте VZ часть контейнеров не запускается:
# /etc/init.d/vz start
Loading module vzdquota:                                                         [ DONE ]
Loading module vzcpt:                                                            [ DONE ]
Loading module vzrst:                                                            [ DONE ]
Loading module vzethdev:                                                         [ DONE ]
Configuring cpuunits limit for VE0 to 1000:                                      [ DONE ]
Starting VE 1000:                                                                [ DONE ]
Starting VE 1001: Starting container ...
vzquota : (warning) Incorrect quota shutdown for id 1001, recalculating disk usage
vzquota : (error) quota check : lstat `altlinux.png': Permission denied
vzquota on failed [1]
                                                                                 [FAILED]
Starting VE 1002: Starting container ...
vzquota : (warning) Incorrect quota shutdown for id 1002, recalculating disk usage
vzquota : (error) quota check : lstat `sshd': Permission denied
vzquota on failed [1]
                                                                                 [FAILED]
Starting VE 1003: Starting container ...
vzquota : (warning) Incorrect quota shutdown for id 1003, recalculating disk usage
vzquota : (error) quota check : lstat `warnings': Permission denied
vzquota on failed [1]
                                                                                 [FAILED]
Starting VE 1004:                                                                [ DONE ]
Starting VE 1005: Starting container ...
vzquota : (warning) Incorrect quota shutdown for id 1005, recalculating disk usage
vzquota : (error) quota check : lstat `info.5.bz2': Permission denied
vzquota on failed [1]
                                                                                 [FAILED]
Starting VE 1006:                                                                [ DONE ]
Starting VE 1007: Unable to create lock file /var/lib/vz/lock/1007.lckcIJuP0, use --skiplock option: Read-only file system
Unable to lock container
                                                                                 [FAILED]
#
Вопрос: как это исправить?

Вручную контейнер не запустить:
# vzctl start 1002
Unable to create lock file /var/lib/vz/lock/1002.lckbgRNo0, use --skiplock option: Read-only file system
Unable to lock container
 
# mount | grep /var
/dev/md2 on /var/lib/vz type reiserfs (rw,nosuid)

# ls -l /var/lib/vz/lock/
total 4
-rw------- 1 root root 6 Dec 10 20:52 1006.lck

# vzlist
  CTID      NPROC STATUS  IP_ADDR         HOSTNAME
  1000         14 running 10.12.1.15      s1000.local
  1004          5 running 10.12.1.18      s1004.local
  1006          3 running 10.12.1.17      s1006.local
/var/lib/vz смонтирован нормально, но в подкаталоге lock всего один файл,
хотя запущено три контейнера. Для остальных выдаётся ошибка "Read-only file system".

А также "Permission denied" при первой попытке запуска
после "Incorrect quota shutdown for id xxxx, recalculating disk usage".

Оффлайн Ilya Evseev

  • Участник
  • *
  • Сообщений: 52
Помогло отмонтирование ФС и выполнение "reiserfsck -y --fix-fixable --rebuild-tree /dev/md0".
После этого все VE запустились нормально.

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 20 168
    • Домашняя страница
Имеется ALTLinux p5, ядро 2.6.32-ovz-smp-alt3.
Это ядро практически неработоспособно.
Андрей Черепанов (cas@)

Оффлайн dubrsl

  • alt linux team
  • ***
  • Сообщений: 238
Имеется ALTLinux p5, ядро 2.6.32-ovz-smp-alt3.
/var/lib/vz на reiserfs на RAID1.
Насколько мне известно, то ovz рекомендует ext3. IMHO вы сильно рискуете.
WBR,
Slava

Оффлайн Ilya Evseev

  • Участник
  • *
  • Сообщений: 52
Имеется ALTLinux p5, ядро 2.6.32-ovz-smp-alt3.
Это ядро практически неработоспособно.
Не расскажете вкратце - почему неработоспособно, и на какое переходить?
Был бы особенно признателен за пруфлинки. :-\

Оффлайн Ilya Evseev

  • Участник
  • *
  • Сообщений: 52
Имеется ALTLinux p5, ядро 2.6.32-ovz-smp-alt3.
/var/lib/vz на reiserfs на RAID1.
Насколько мне известно, то ovz рекомендует ext3. IMHO вы сильно рискуете.
В чём заключается риск? Насколько можно судить, ext3 рекомендуется только из-за поддержки квот:
http://wiki.openvz.org/Quick_installation
"per-container disk quota is supported only for ext2/ext3 filesystems.
So use one of these filesystems (ext3 is recommended) if you need per-container disk quota. "

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 371
В чём заключается риск? Насколько можно судить, ext3 рекомендуется только из-за поддержки квот:
По идее да, но так как квоты нужны подавляющему числу пользователей OVZ, то только этот вариант и может считаться хорошо протестированным пользователями. На других ФС могут быть вытоптаны не все грабли.

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 20 168
    • Домашняя страница
Не расскажете вкратце - почему неработоспособно, и на какое переходить?
Был бы особенно признателен за пруфлинки. :-\
При использовании в отделе тестирования виртуальные машины зависали при выключении, да и мейнтейнер ядра предупреждал устно, что это ядро скорее нерабочее. Откатились на 2.6.27. Единственное отлаженное поддерживаемое OVZ ядро — 2.6.18. Сейчас допиливается в RedHat 2.6.32, но ему далеко до стабильности.
Андрей Черепанов (cas@)

Оффлайн Ilya Evseev

  • Участник
  • *
  • Сообщений: 52
Откатились на 2.6.27. Единственное отлаженное поддерживаемое OVZ ядро — 2.6.18.
Имеется в виду kernel-image-ovz-rhel#2.6.18-alt11 ?
А с kernel-image-ovz-smp#2.6.27-alt9 могут быть проблемы?

Оффлайн Карлсон

  • Участник
  • *
  • Сообщений: 1 699
А с kernel-image-ovz-smp#2.6.27-alt9 могут быть проблемы?

У меня
$ uname -r
2.6.32-ovz-el-alt6
нормально работает на сервере. Правда, без особой нагрузки. До этого было 2.6.27, тоже проблем не заметил. Так что все индивидуально, от железа и задач зависит. Нужно просто брать и проверять.