Глава 8. Администрирование кластера

В следующей главе описываются различные административные задачи, выполняемые после установки и настройки кластера.

Отображение состояния кластера и службы

Наблюдение за состоянием кластера и его служб помогает определять и решать проблемы в кластерной среде. Для просмотра состояния службы используются следующие инструменты:

Обратите внимание, состояние кластера определяется с точки зрения кластерной системы, в которой администратор использует этот инструмент. Для получения полной информации о состоянии кластера, воспользуйтесь этим инструментах во всех кластерных системах.

Состояние кластера и службы включает в себя следующую информацию:

В следующих таблицах описано как анализировать информацию о состоянии, отображаемую командой clustat и графическим инструментом управления кластера.

Таблица 8-1. Состояние узла кластера

Состояние узлаОписание
UP (Включен)Кластерная система связывается с другой кластерной системой и получает доступ к кворумным разделам.
DOWN (Отключен)Узел кластера не может связаться с другим узлом.

Таблица 8-2. Состояние переключателя питания

Состояние переключателя питанияОписание
OKПереключатель питания работает нормально.
WrnНевозможно получить состояние переключателя питания.
ErrПроизошел сбой или ошибка.
GoodПереключатель питания работает нормально.
UnknownДругой узел кластера ОТКЛЮЧЕН.
Timeout (таймаут)Переключатель питания не отвечает на команды демона, возможно, по причине отсоединения последовательного кабеля.
Error (Ошибка)Произошел сбой или ошибка.
None (Отсутствует)В конфигурации кластера не используются переключатели питания.
Initializing (Инициализация)Переключатель инициализируется, получить определенное состояние не удается.

Таблица 8-3. Состояние пульсирующего канала

Состояние пульсирующего каналаОписание
OKПульсирующий канал работает нормально.
WrnПолучить состояние канала не удается.
ErrПроизошел сбой или ошибка.
ONLINE (РАБОТАЕТ)Пульсирующий канал работает нормально.
OFFLINE (НЕ РАБОТАЕТ)Другой узел кластера похоже, ВКЛЮЧЕН, но не отвечает на пульсирующие опросы этого канала.
UNKNOWN (НЕИЗВЕСТНО)Состояние другой кластерной системы получить не удается, возможно потому что система ОТКЛЮЧЕНА или не запущены кластерные демоны.

Таблица 8-4. Состояние службы

Состояние службыОписание
running (работает)Ресурсы службы настроены и доступны на кластерной системе, выполняющей службу. Состояние службы running (работает) - устойчивое состояние. Из этого состояния, служба может перейти в состояние stopping (останавливается) (например, если предпочитаемый узел включается в кластер)
disabled (отключена)Служба отключена, и не связана ни с одним узлом. Состояние службы disabled (отключена) - также устойчивое состояние. Из этого состояния, служба может перейти в состояние starting (запускается) (если администратор затребовал запуск службы).
starting (запускается)Служба находится в процессе запуска. Состояние службы starting (запускается) - переходное состояние. Служба остается в состоянии starting (запускается) до успешного запуска или ошибки. Из этого состояния, служба может перейти в состояние running (работает) (если запуск службы удался), состояние stopped (остановлена) (если запуск службы не удался), или состояние error (ошибка) (если состояние ресурсов службы определить не удается).
stopping (останавливается)Служба находится в процессе остановки. Состояние службы stopping - переходное состояние. Служба остается в состоянии stopping (останавливается) до успешной остановки службы или отказа. Из этого состояния, служба может перейти в состояние stopped (остановлена) (если остановка службы удалась), в состояние running (если остановка службы не удалась и служба может быть запущена).
stopped (остановлена)Служба не работает ни на одной из кластерных систем, не имеет назначенного владельца и никаких ресурсов, настроенных в кластерных системе. Состояние службы stopped (остановлена) - устойчивое состояние. Из этого состояния, служба может перейти в состояние disabled (отключена) (если пользователь затребовал отключение службы), или состояние starting (запускается) (если предпочитаемый узел включается в кластер).

Для отображения снимка текущего состояния кластера, вызовите утилиту clustat. Например:

clustat
Cluster Status Monitor (Fileserver Test Cluster)
07:46:05
Cluster alias: clu1alias.boston.redhat.com

===================== M e m b e r   S t a t u s =======================
  Member         Status     Node Id    Power Switch
  -------------- ---------- ---------- ------------
  clu1           Up         0          Good
  clu2           Up         1          Good

=================== H e a r t b e a t   S t a t u s ===================
  Name                           Type       Status
  ------------------------------ ---------- ------------
  clu1         <--> clu2         network    ONLINE

=================== S e r v i c e   S t a t u s =======================
                                        Last             Monitor
Restart
Service         Status   Owner          Transition       Interval Count

  ------------- -------- ------------- ---------------- ------------
  nfs1          started  clu1          16:07:42 Feb 27  15       0
  nfs2          started  clu2          00:03:52 Feb 28  2        0
  nfs3          started  clu1          07:43:54 Feb 28  90       0

Для наблюдения за кластером и обновления его состояния через определенный интервал времени, выполните команду clustat с параметром командной строки -i time, где time указывает число секунд между обновлениями состояния.