Диагностика сервера в DCImanager

Материал из ISPWiki
Перейти к: навигация, поиск


Начиная с версии 5.71 изменилась работа диагностики сервера.

Запуск диагностики

Чтобы провести диагностику сервера необходимо в списке "Серверы" выбрать необходимый сервер, нажать на кнопку "Операции". В появившейся форме в выпадающем списке "Тип операции" выбрать "Провести диагностику". В выпадающем списке "Провести диагностику" необходимо выбрать шаблон диагностирования, по умолчанию выбран шаблон "Diag-x86_64", поставляемый вместе с DCImanager. Можно использовать любой другой шаблон, подробнее о создании шаблонов . Если требуется, чтобы после диагностики была произведена очистка дисков, то необходимо отметить поле "Очистить диски".

Требования

  • У диагностируемого сервера (далее "Сервер") должен быть указан MAC-адрес.
  • "Сервер" должен быть доступен с сервера DCImanager (далее "DCImanager").
  • На "Сервере" должна быть настроена загрузка по сети.
  • У "Сервера" должно быть настроено подключение к "Распределителю питания", либо у "Сервера" должен быть настроен IPMI. В противном случае после запуска Диагностики, "Сервер" необходимо перезапустить вручную.
  • На "DCImanager" должен быть настроен DHCP. ("Гобальные настройки" -> "Настройки DHCP" -> "Интерфейсы").

Схема работы

После запуска диагностики на "Сервере" в конфигурационном файле DHCP создается блок, разрешающий работу с MAC-адресом "Сервера". Как только "Сервер" пройдет процедуру авторизации через DHCP на него будет загружен шаблон диагностики. После загрузки шаблона, будет запущен скрипт проверки "Сервера" (подразумевается шаблон "Diag-x86_64"). Будет определено: модель процессора, количество оперативной памяти, наличие аппаратного рейд-контроллера, по возможности наличие жестких дисков. Будет проверено быстродействие: скорость локального соединения; по возможности: скорость чтения и SMART-информация жесткого диска. Если на "Сервере" будет обнаружен IPMI, то будет осуществлена его настройка: назначен IP-адрес, сеть, Gateway, добавлен пользователь и задан пароль. Полученная информация будет отправлена на "DCImanager". "Сервер" в зависимости от значения поля "Глобальные настройки" -> "Отключать серверы после диагностики" будет либо выключен, либо останется включенным.

Обработка результатов диагностики

Если на сервере будет обнаружен аппаратный рейд, то команда "smartctl" скорее всего не сможет корректно отдать информацию по жестким дискам. В таком случае на "Сервере" будет установлен флаг "Сервер имеет проблемы с оборудованием" и в форме редактирования "Сервера" будет предложено задать жесткие диски вручную. При проведении диагностики от "Сервера" отвязываются все жесткие диски, привязанные ранее, если же будет обнаружен аппаратный рейд, то будут отвязаны только те жесткие диски, что были привязаны в результате обработки диагностики; диски заданные вручную в этом случае останутся на своих местах.

Если у "Сервера" не задан "Тип шасси", то на "Сервере" будет установлен флаг "Сервер имеет проблемы с оборудованием".


Если же "Тип шасси" установлен, то будет проверена соответствие типа шасси и обнаруженного оборудования: количество процессоров (должно быть отлично от 0 и не быть более заданного в типе шасси), количество RAM (должно быть отлично от 0 и не быть более заданного в типе шасси), количество жестких дисков (должно быть не более заданного в типе шасси). Если есть отклонения от типа шасси то на то на "Сервере" будет установлен флаг "Сервер имеет проблемы с оборудованием"


Если информация по жестким дискам есть в наличии то будут проверены следующие параметры: скорость чтения (пороговое значение задается в "Типы оборудования" -> "Жесткие диски" -> "Типы жестких дисков", по умолчанию 100 Mb/s), параметры SMART (параметры для проверки задаются в "Типы оборудования" -> "Жесткие диски" -> "Типы жестких дисков", по умолчанию проверяются Reallocated_Sector, Seek_Error_Rate, UDMA_CRC_Error_Count, Current_Pending_Sector, Offline_Uncorrectable, Media_Wearout_Indicator). Если по параметрам жесткого диска имеются отклонения, то на "Сервере" будет установлен флаг "Сервер имеет проблемы с оборудованием".


Если скорость локального соединения ниже, чем 80% от заданного параметром "LocalSpeedThreshold" (по умолчанию 80 Mb/s), то на "Сервере" будет установлен флаг "Сервер имеет проблемы с оборудованием".