Проверка конфигурации кластера

Чтобы убедиться в правильности настроек кластерного программного обеспечения, воспользуйтесь следующими инструментами, расположенными в каталоге /sbin:

В следующих разделах эти инструменты рассматриваются более подробно.

Проверка кворумных разделов

Кворумные разделы каждой кластерной системы должны относиться к одному физическому устройству. Запустите программу cludiskutil с параметром -t для проверки определения кворумных разделов и их доступности.

Если команда выполнилась успешно, запустите следующую команду cludiskutil -p в двух кластерных системах для просмотра заголовка кворумных разделов. Если выводимые данные отличаются в разных кворумных системах, это означает, что кворумные разделы указывают на разные устройства. Убедитесь в том, что неформатированные устройства определены и правильно указаны в файле /etc/sysconfig/rawdevices. Обратитесь к разделу Настройка кворумных разделов в главе 2 за дополнительной информацией.

В следующем примере показаны кворумные разделы, ссылающиеся на одно физическое устройство в двух кластерных системах (devel0 and devel1):

/sbin/cludiskutil -p----- Shared State Header ------
Magic# = 0x39119fcd
Version = 1
Updated on Thu Sep 14 05:43:18 2000
Updated by node 0
--------------------------------


/sbin/cludiskutil -p
----- Shared State Header ------
Magic# = 0x39119fcd
Version = 1
Updated on Thu Sep 14 05:43:18 2000
Updated by node 0
--------------------------------

Значения полей Magic# и Version будут равны, независимо от применяемой кластерной конфигурации. В последних двух строках указана дата инициализация кворумных разделов с помощью команды cludiskutil -I, и номер кластерной системы, выполнявшей инициализацию.

Если при выполнении команды cludiskutil с параметром -p в разных кластерных системах получаются разные результаты, выполните следующее:

Выполнив эти действия, перезапустите утилиту cludiskutil с параметром -p.

Проверка переключателей питания

Ели в вашей конфигурации кластера используются переключатели питания с сетевым или последовательным интерфейсом, проверьте их после установки программного обеспечения кластера, выполнив команду clustonith. Выполнив эту команду в каждой кластерной системе, убедитесь, что она может удаленно отключить другую систему. Если проверка прошла успешно, можно переходить к запуску кластера. Если вы используете сторожевые таймеры или не используете никаких переключателей питания, этот тест можно опустить.

Команда clustonith может проверить работу переключателя питания, только при не работающем кластере. Это объясняется тем, что в случае с переключателями, подключенными через последовательный порт, только одна программа в один момент времени может обращаться к этому порту. Программа clustonith используется для проверки состояния программного обеспечения кластера. Если кластерное программное обеспечение запущено, программа прерывается и сообщает о необходимости остановить кластер.

Формат команды clustonith показан ниже:

clustonith [-sSlLvr] [-t devicetype] [-F options-file] \
          [-p stonith-parameters] 
Options:
-s              Silent mode, supresses error and log messages
-S              Display switch status
-l              List the hosts a switch can access
-L              List the set of supported switch types
-r hostname     Power cycle the specified host
-v              Increases verbose debugging level

Проверяя работу переключателей питания, сначала необходимо убедиться, что каждый узел кластера может взаимодействовать с подключенным к нему переключателем питания. В следующем примере использования команды clustonith на экран выводятся сообщение, говорящее о том, что узел кластера может связаться с переключателем питания:

   clustonith -S
WTI Network Power Switch device OK.

Пример сообщеия, возвращаемого командой clustonith, когда узел не может связаться с подключенным к нему переключателем питания, показан ниже:
   clustonith -S 
Unable to determine power switch type. 
Unable to determine default power switch type. 

Если вы встретили такую ошибку, выполните следующие проверки:

Проверив соединение с переключателем, попытайтесь выключить/включить другой узел кластера. Перед выполнением этой команды, рекомендуется проверить, что другой узел кластера в данный момент не выполняет какие-либо важные действия. Ниже приведена команда, выполняющая отключение/включение другого узла:

clustonith -r clu3
Successfully power cycled host clu3. 

Отображение текущей версии программного обеспечения кластера

Выполните команду rpm -qа clumanager для отображения версии установленного кластерного RPM-пакета. Убедитесь в том, что в каждой кластерной системе используется программное обеспечение одной версии.