[Linux-ha-jp] stonithプラグインのパラメータについて

Zurück zum Archiv-Index

NAKAHIRA Kazutomo nakahira_kazutomo_b1****@lab*****
2015年 3月 24日 (火) 13:52:48 JST


TO:福田さん

中平と申します。横から失礼いたします。

standby_wait_timeですが、記述を省略した場合はデフォルト値として
25秒が設定され、基本的にはデフォルト値のまま使用して頂くことを
推奨しています。

もし仮に、福田さんの環境で現用機と DCノード(クラスタ管理ノード)
が必ず一致するような運用をされている場合は、standby_wait_time
に 10秒を設定しフェイルオーバ時間を短縮させても問題がないと
思いますが、そうでない場合は相撃ちが起きる可能性があります。

これは、現用機が DCノードでない場合、クラスタ間通信の途絶後
DCノードの役割を引き継いで STONITHを実行するまでの間に数秒
かかる場合があるためで、状況によっては予備機が先に STONITHを
実行したり、相撃ちを生じます。

standby_wait_timeをデフォルト値より短く設定する場合は、
上記を考慮したうえで切り替え試験を実施し、相撃ちや予備機が
生き残ることがないことを確認してから、設定を採用するように
して下さい。

以上です。

On 2015/03/24 12:21, renay****@ybb***** wrote:
> 福田さん
>
> お疲れ様です。山内です。
>
> standby_wait_timeを入れて頂いて結構です。
> たぶん、以前、例として開示したcrmは、あくまで例で、そのあたりは、考慮していなかっただけだと思います。
>
> 以上です。
>
>
>
> ----- Original Message -----
>> From: Masamichi Fukuda - elf-systems <masamichi_fukud****@elf-s*****>
>> To: 山内英生 <renay****@ybb*****>; "linux****@lists*****" <linux****@lists*****>
>> Date: 2015/3/24, Tue 12:01
>> Subject: stonithプラグインのパラメータについて
>>
>>
>> 山内さん
>>
>> こんにちは、福田です。
>> その後、こちらではpacemaker1.1.12 build:561c4cf がとりあえず動いている状態です。
>>
>> 済みませんが、stonithプラグインのパラメータについて質問させて下さい。
>>
>> stonith-helperのパラメータについてです。
>>
>> 2013/8/3のOSC2013の資料には、standby_wait_time秒スリープして相撃ちを防止すると書いてあります。
>> 以前参考に頂いたコンフィグには、fencing_topologyを記述して、pcmk_reboot_retriesとpcmk_reboot_timeoutというパラメータが入って、standby_wait_timeは抜けていたかと思います。
>>
>> pacemaker1.1.12ではstandby_wait_timeの記述は必要無いのでしょうか。
>>
>> こちらでは、今次のようなコンフィグファイルを作っています。
>>
>>
>> ### Cluster Option ###
>> property \
>>      no-quorum-policy="ignore" \
>>      stonith-enabled="true" \
>>      startup-fencing="false" \
>>      stonith-timeout="710s" \
>>      crmd-transition-delay="2s"
>>
>> ### Resource Default ###
>> rsc_defaults \
>>      resource-stickiness="INFINITY" \
>>      migration-threshold="1"
>>
>> ### Group Configuration ###
>> group HAvarnish \
>>      vip_208 \
>>      varnishd
>>
>> group grpStonith1 \
>>      Stonith1-1 \
>>      Stonith1-2 \
>>      Stonith1-3
>>
>> group grpStonith2 \
>>      Stonith2-1 \
>>      Stonith2-2 \
>>      Stonith2-3
>>
>> ### Clone Configuration ###
>> clone clone_ping \
>>      ping
>>
>> ### Fencing Topology ###
>> fencing_topology \
>>      lbv1.beta.com: Stonith1-1 Stonith1-2 Stonith1-3 \
>>      lbv2.beta.com: Stonith2-1 Stonith2-2 Stonith2-3
>>
>> ### Primitive Configuration ###
>> primitive vip_208 ocf:heartbeat:IPaddr2 \
>>      params \
>>          ip="192.168.17.208" \
>>          nic="eth0" \
>>          cidr_netmask="24" \
>>      op start interval="0s" timeout="90s" on-fail="restart" \
>>      op monitor interval="5s" timeout="60s" on-fail="restart" \
>>      op stop interval="0s" timeout="100s" on-fail="fence"
>>
>> primitive varnishd lsb:varnish \
>>      op start interval="0s" timeout="90s" on-fail="restart" \
>>      op monitor interval="10s" timeout="60s" on-fail="restart" \
>>      op stop interval="0s" timeout="100s" on-fail="fence"
>>
>> primitive ping ocf:pacemaker:ping \
>>      params \
>>          name="default_ping_set" \
>>          host_list="192.168.17.254" \
>>          multiplier="100" \
>>          dampen="1" \
>>      op start interval="0s" timeout="90s" on-fail="restart" \
>>      op monitor interval="10s" timeout="60s" on-fail="restart" \
>>      op stop interval="0s" timeout="100s" on-fail="fence"
>>
>>
>> primitive Stonith1-2 stonith:external/xen0 \
>>      params \
>>          pcmk_reboot_timeout="60s" \
>>          hostlist="lbv1.beta.com:/etc/xen/lbv1.cfg" \
>>          dom0="xen0.beta.com" \
>>      op start interval="0s" timeout="60s" on-fail="restart" \
>>      op monitor interval="3600s" timeout="60s" on-fail="restart" \
>>      op stop interval="0s" timeout="60s" on-fail="ignore"
>>
>> primitive Stonith1-3 stonith:meatware \
>>      params \
>>          pcmk_reboot_timeout="600s" \
>>          hostlist="lbv1.beta.com" \
>>      op start interval="0s" timeout="60s" \
>>      op monitor interval="3600s" timeout="60s" \
>>      op stop interval="0s" timeout="60s"
>>
>> primitive Stonith2-1 stonith:external/stonith-helper \
>>      params \
>>          pcmk_reboot_retries="1" \
>>          pcmk_reboot_timeout="40s" \
>>          hostlist="lbv2.beta.com" \
>>          dead_check_target="192.168.17.133 10.0.17.133" \
>>          standby_wait_time="10" \
>>          standby_check_command="/usr/local/sbin/crm_resource -r varnishd -W | grep -q `hostname`" \
>>          run_online_check="yes" \
>>      op start interval="0s" timeout="60s" on-fail="restart" \
>>      op stop interval="0s" timeout="60s" on-fail="ignore"
>>
>> primitive Stonith2-2 stonith:external/xen0 \
>>      params \
>>          pcmk_reboot_timeout="60s" \
>>          hostlist="lbv2.beta.com:/etc/xen/lbv2.cfg" \
>>          dom0="xen0.beta.com" \
>>      op start interval="0s" timeout="60s" on-fail="restart" \
>>      op monitor interval="3600s" timeout="60s" on-fail="restart" \
>>      op stop interval="0s" timeout="60s" on-fail="ignore"
>>
>> primitive Stonith2-3 stonith:meatware \
>>      params \
>>          pcmk_reboot_timeout="600s" \
>>          hostlist="lbv2.beta.com" \
>>      op start interval="0s" timeout="60s" \
>>      op monitor interval="3600s" timeout="60s" \
>>      op stop interval="0s" timeout="60s"
>>
>> ### Resource Location ###
>> location HA_location-1 HAvarnish \
>>      rule 200: #uname eq lbv1.beta.com \
>>      rule 100: #uname eq lbv2.beta.com
>>
>> location HA_location-2 HAvarnish \
>>      rule -INFINITY: not_defined default_ping_set or default_ping_set lt 100
>>
>> location HA_location-3 grpStonith1 \
>>      rule -INFINITY: #uname eq lbv1.beta.com
>>
>> location HA_location-4 grpStonith2 \
>>      rule -INFINITY: #uname eq lbv2.beta.com
>>
>> 宜しくお願いします。
>>
>> 以上
>>
>>
>>
>>
>> 2015年3月20日 17:16 <renay****@ybb*****>:
>>
>> 福田さん
>>>
>>>
>>> お疲れ様です。山内です。
>>>
>>>> こちらの環境で、PM1.1.12のbuild:e32080bからbuild:561c4cfへ何度か戻したりしているうちにリブートを繰り返すようになってしまいました。
>>>
>>> この時ですが、戻したりする前に、
>>> 1)使っていたバージョンのソースディレクトリで、make uninstall
>>> 2)/var/lib/pacemaker/cib, /var/lib/pacemaker/pengineのディレクトリ中身を削除
>>> しておいた方がよいです。
>>>
>>>> そこで、再度debian7.8をクリーンインストールしてPM1.1.12 build:561c4cfをインストールしました。
>>>> あと、ご指摘頂いたパスを通したところ、こちらでもstonith-helperの起動までは確認できました。
>>>
>>>
>>> そうでしたか・・・・良かったですね。
>>> といっても、build:e32080bが動かないと問題ですが・・・・
>>>
>>> また、週末に時間が取れたら、こちらでもやってみます。
>>> 進展があれば、ご連絡いたします。
>>>
>>> 以上です。
>>>
>>>
>>>
>>>
>> --
>>
>> ELF Systems
>> Masamichi Fukuda
>> mail to: masamichi_fukud****@elf-s*****
>>
>>
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>
>
>


-- 
NTT オープンソースソフトウェアセンタ
中平 和友
TEL: 03-5860-5135 FAX: 03-5463-6490
Mail: nakahira_kazutomo_b1****@lab*****




Linux-ha-japan メーリングリストの案内
Zurück zum Archiv-Index