Red Hat Cluster Manager: Руководство по установке и администрированию Red Hat Cluster Manager | ||
---|---|---|
Назад | Вперед |
В следующей главе описываются различные административные задачи, выполняемые после установки и настройки кластера.
Наблюдение за состоянием кластера и его служб помогает определять и решать проблемы в кластерной среде. Для просмотра состояния службы используются следующие инструменты:
Команда clustat
Сообщения в файле протокола
Графическая оболочка для наблюдения за кластером
Обратите внимание, состояние кластера определяется с точки зрения кластерной системы, в которой администратор использует этот инструмент. Для получения полной информации о состоянии кластера, воспользуйтесь этим инструментах во всех кластерных системах.
Состояние кластера и службы включает в себя следующую информацию:
Состояние системы узла кластера
Состояние переключателя питания
Состояние пульсирующего канала
Состояние службы и кластерная система, выполняющая службу
Состояние мониторинга службы кластерной системы
В следующих таблицах описано как анализировать информацию о состоянии, отображаемую командой clustat и графическим инструментом управления кластера.
Таблица 8-1. Состояние узла кластера
Состояние узла | Описание |
---|---|
UP (Включен) | Кластерная система связывается с другой кластерной системой и получает доступ к кворумным разделам. |
DOWN (Отключен) | Узел кластера не может связаться с другим узлом. |
Таблица 8-2. Состояние переключателя питания
Состояние переключателя питания | Описание |
---|---|
OK | Переключатель питания работает нормально. |
Wrn | Невозможно получить состояние переключателя питания. |
Err | Произошел сбой или ошибка. |
Good | Переключатель питания работает нормально. |
Unknown | Другой узел кластера ОТКЛЮЧЕН. |
Timeout (таймаут) | Переключатель питания не отвечает на команды демона, возможно, по причине отсоединения последовательного кабеля. |
Error (Ошибка) | Произошел сбой или ошибка. |
None (Отсутствует) | В конфигурации кластера не используются переключатели питания. |
Initializing (Инициализация) | Переключатель инициализируется, получить определенное состояние не удается. |
Таблица 8-3. Состояние пульсирующего канала
Состояние пульсирующего канала | Описание |
---|---|
OK | Пульсирующий канал работает нормально. |
Wrn | Получить состояние канала не удается. |
Err | Произошел сбой или ошибка. |
ONLINE (РАБОТАЕТ) | Пульсирующий канал работает нормально. |
OFFLINE (НЕ РАБОТАЕТ) | Другой узел кластера похоже, ВКЛЮЧЕН, но не отвечает на пульсирующие опросы этого канала. |
UNKNOWN (НЕИЗВЕСТНО) | Состояние другой кластерной системы получить не удается, возможно потому что система ОТКЛЮЧЕНА или не запущены кластерные демоны. |
Таблица 8-4. Состояние службы
Состояние службы | Описание |
---|---|
running (работает) | Ресурсы службы настроены и доступны на кластерной системе, выполняющей службу. Состояние службы running (работает) - устойчивое состояние. Из этого состояния, служба может перейти в состояние stopping (останавливается) (например, если предпочитаемый узел включается в кластер) |
disabled (отключена) | Служба отключена, и не связана ни с одним узлом. Состояние службы disabled (отключена) - также устойчивое состояние. Из этого состояния, служба может перейти в состояние starting (запускается) (если администратор затребовал запуск службы). |
starting (запускается) | Служба находится в процессе запуска. Состояние службы starting (запускается) - переходное состояние. Служба остается в состоянии starting (запускается) до успешного запуска или ошибки. Из этого состояния, служба может перейти в состояние running (работает) (если запуск службы удался), состояние stopped (остановлена) (если запуск службы не удался), или состояние error (ошибка) (если состояние ресурсов службы определить не удается). |
stopping (останавливается) | Служба находится в процессе остановки. Состояние службы stopping - переходное состояние. Служба остается в состоянии stopping (останавливается) до успешной остановки службы или отказа. Из этого состояния, служба может перейти в состояние stopped (остановлена) (если остановка службы удалась), в состояние running (если остановка службы не удалась и служба может быть запущена). |
stopped (остановлена) | Служба не работает ни на одной из кластерных систем, не имеет назначенного владельца и никаких ресурсов, настроенных в кластерных системе. Состояние службы stopped (остановлена) - устойчивое состояние. Из этого состояния, служба может перейти в состояние disabled (отключена) (если пользователь затребовал отключение службы), или состояние starting (запускается) (если предпочитаемый узел включается в кластер). |
Для отображения снимка текущего состояния кластера, вызовите утилиту clustat. Например:
clustat Cluster Status Monitor (Fileserver Test Cluster) 07:46:05 Cluster alias: clu1alias.boston.redhat.com ===================== M e m b e r S t a t u s ======================= Member Status Node Id Power Switch -------------- ---------- ---------- ------------ clu1 Up 0 Good clu2 Up 1 Good =================== H e a r t b e a t S t a t u s =================== Name Type Status ------------------------------ ---------- ------------ clu1 <--> clu2 network ONLINE =================== S e r v i c e S t a t u s ======================= Last Monitor Restart Service Status Owner Transition Interval Count ------------- -------- ------------- ---------------- ------------ nfs1 started clu1 16:07:42 Feb 27 15 0 nfs2 started clu2 00:03:52 Feb 28 2 0 nfs3 started clu1 07:43:54 Feb 28 90 0 |
Для наблюдения за кластером и обновления его состояния через определенный интервал времени, выполните команду clustat с параметром командной строки -i time, где time указывает число секунд между обновлениями состояния.