VMmanager: Автоматическое выявление проблем

Материал из ISPWiki
Перейти к: навигация, поиск

Иерархия: VMmanager KVM -> Дополнительно
VMmanager Cloud -> Дополнительно

Автоматическое выявление проблем

В случае возникновения проблем со связью с узлами кластера VMmanager автоматически регистрирует их и начинает автоматически отслеживать их состояние. Проблемный узел исключается из списка доступных для создания виртуальных машин. В случае, если VMmanager выявил, что проблема перестала быть актуальной, узел кластера возвращается в список доступных.

Подробно о работе модуля отслеживания проблем можно узнать в статье "Уведомления о проблемах".

В настоящее время регистрируются и отслеживаются следующие проблемы:

  • Нет связи по SSH;
  • VMmanager не смог подключиться к libvirt на узле кластера;


Нет связи по ssh

В процессе работы VMmanager обнаружил, что уже добавленный узел не отвечает на ssh-запрос, или VMmanager не смог пройти авторизацию.

Возможные причины возникновения проблемы:

  • Изменился закрытый ключ либо изменилось местонахождение ключа (параметры sshPrivatKey и sshPublicKey в файле конфигурации)
  • В файле /root/.ssh/authorized_keys на узле кластера отсутствует открытый ключ VMmanager
  • Нет связи с узлом кластера (необходимо проверить настройки сети);
  • Нет доступа к NFS-хранилищу с шаблонами ОС.

VMmanager не смог подключиться к libvirt на узле кластера

  • На узле кластера не функционирует libvirt (остановлен или удален сервис)
  • Сокет для связи с сервисом libvirt находится в нестандартной директории (в CentOS сокет обычно находится в /var/run/libvirt/libvirt-sock);
  • Нет связи по ssh (см. выше)

Нет доступа к NFS-хранилищу с шаблонами ОС

  • NFS-хранилище с шаблонами ОС находится на основном узле. Поэтому нужно проверить правила экспорта:
root@msk-vkvm-master-190:~# exportfs 
/nfsshare     	10.7.2.10
/nfsshare     	10.7.2.11
/nfsshare     	10.7.2.12
/nfsshare     	10.7.2.13
Узел должен быть в списке экспорта.
  • Проверьте правила iptables. Порты для NFS должны быть открыты;
  • На узлах кластера, в /etc/fstab должна быть правильная запись для /nfsshare с указанием IP-адреса основного узла;
  • Попробуйте перемонтировать /nfsshare вручную.