Информация в следующих разделах может помочь вам в управлении конфигурацией программного обеспечения кластера.
В кластере применяются механизмы внутрикластерных соединений, обеспечивающие целостность данных и корректное поведение кластера в случае сбоя. Кластер использует эти механизмы для:
Управления системой, когда она становится членом кластера
Определения состояния кластерных систем
Управления поведением кластера во время переноса
Механизмы кластерных соединений перечислены ниже:
Общие (кворумные) разделы
Время от времени каждая кластерная система записывает метку времени и своё состояние в основной и теневой общие разделы, которые представляют собой неформатированные разделы общего хранилища. Каждый узел считывает состояние системы и метку времени, записанные другими узлами, и определяет, соответствуют ли эти данные текущему времени. Узлы пытаются прочитать информацию с первичного общего раздела. Если этот раздел испорчен, кластерные системы читают информацию с теневого общего раздела и в то же время исправляют основной раздел. Целостность данных сохраняется с помощью контрольных сумм и любые несоответствия между разделами исправляются автоматически.
Если узел после перезапуска не может произвести запись в оба общих раздела, включаться в кластер ему не разрешается. Кроме этого, если работающий узел не может продолжать запись в оба раздела, она исключает себя из кластера, выключаясь.
Общие разделы используются в качестве механизма связи в кластерах с двумя узлами, не использующих сетевой арбитраж.
Удалённый мониторинг переключателя питания
Время от времени, каждая узел проверяет состояние подключения к удалённому переключателю питания, если таковой используется. Узел использует полученную информацию как вспомогательную, для определения состояния других узлов кластера. Полное отсутствие подключения к переключателю питания не приводит к автоматическому выполнению переноса. Если переключатель питания не смог отключить повисший узел, перенос не выполняется, так как инфраструктура кластера не может быть уверена в текущем состоянии узла.
Проверки пульса Ethernet
Узлы системы соединяются между собой с помощью Ethernet подключений точка-точка. Время от времени, каждый узел проверяет эти соединения, выдавая импульсы (ping). Кластер использует эту информацию для определения состояния узлов и обеспечения правильной работы кластера. Полное отсутствие пульса не приводит к автоматическому выполнению переноса.
Если узел определяет, что метка времени другого узла устарела, он проверяет наличие пульса. Если он по-прежнему получает импульсы от другого узла, программное обеспечение кластера не делает ничего. Если узел достаточно долго не обновляет свою метку времени и не отвечает на пульсирующий ping, он считается отказавшим.
Кластер будет продолжать работу до тех пор, пока хотя бы одна кластерная система может произвести запись в общие разделы, даже если откажут все остальные механизмы соединений.
Учтите, что общий раздел в некоторых конфигурациях с двумя узлами используется только в качестве резерва. Главным фактором определяющим, какие узлы кластера активны, а какие – нет, является алгоритм сетевого членства. Если узел не обновляет свою метку времени в такой конфигурации, это никогда не приведёт к переносу, пока демон clumembd не сообщит, что узел отключен.