[Linux-ha-jp] stonithプラグインのパラメータについて

Zurück zum Archiv-Index

Masamichi Fukuda - elf-systems masamichi_fukud****@elf-s*****
2015年 3月 24日 (火) 14:19:07 JST


中平さん、山内さん

こんにちは、福田です。

standby_wait_timeについての情報をありがとうございます。

>もし仮に、福田さんの環境で現用機と DCノード(クラスタ管理ノード)
>が必ず一致するような運用をされている場合は、standby_
>
> wait_time
> に 10秒を設定しフェイルオーバ時間を短縮させても問題がないと
> 思いますが、そうでない場合は相撃ちが起きる可能性があります。

なるほど、そういった可能性があるのですね。
今のところ、現用機とDCノードは一致させるようにしたいとは思っています。

>standby_wait_
>
> timeをデフォルト値より短く設定する場合は、
> 上記を考慮したうえで切り替え試験を実施し、相撃ちや予備機が
> 生き残ることがないことを確認してから、設定を採用するように
> して下さい。

わかりました。
切替試験の際には、上記のことを念頭にやってみます。

宜しくお願いします。

以上


2015年3月24日 13:52 NAKAHIRA Kazutomo <nakahira_kazutomo_b1****@lab*****>:

> TO:福田さん
>
> 中平と申します。横から失礼いたします。
>
> standby_wait_timeですが、記述を省略した場合はデフォルト値として
> 25秒が設定され、基本的にはデフォルト値のまま使用して頂くことを
> 推奨しています。
>
> もし仮に、福田さんの環境で現用機と DCノード(クラスタ管理ノード)
> が必ず一致するような運用をされている場合は、standby_wait_time
> に 10秒を設定しフェイルオーバ時間を短縮させても問題がないと
> 思いますが、そうでない場合は相撃ちが起きる可能性があります。
>
> これは、現用機が DCノードでない場合、クラスタ間通信の途絶後
> DCノードの役割を引き継いで STONITHを実行するまでの間に数秒
> かかる場合があるためで、状況によっては予備機が先に STONITHを
> 実行したり、相撃ちを生じます。
>
> standby_wait_timeをデフォルト値より短く設定する場合は、
> 上記を考慮したうえで切り替え試験を実施し、相撃ちや予備機が
> 生き残ることがないことを確認してから、設定を採用するように
> して下さい。
>
> 以上です。
>
> On 2015/03/24 12:21, renay****@ybb***** wrote:
> > 福田さん
> >
> > お疲れ様です。山内です。
> >
> > standby_wait_timeを入れて頂いて結構です。
> > たぶん、以前、例として開示したcrmは、あくまで例で、そのあたりは、考慮していなかっただけだと思います。
> >
> > 以上です。
> >
> >
> >
> > ----- Original Message -----
> >> From: Masamichi Fukuda - elf-systems <masamichi_fukud****@elf-s*****>
> >> To: 山内英生 <renay****@ybb*****>; "
> linux****@lists*****" <linux****@lists*****>
> >> Date: 2015/3/24, Tue 12:01
> >> Subject: stonithプラグインのパラメータについて
> >>
> >>
> >> 山内さん
> >>
> >> こんにちは、福田です。
> >> その後、こちらではpacemaker1.1.12 build:561c4cf がとりあえず動いている状態です。
> >>
> >> 済みませんが、stonithプラグインのパラメータについて質問させて下さい。
> >>
> >> stonith-helperのパラメータについてです。
> >>
> >> 2013/8/3のOSC2013の資料には、standby_wait_time秒スリープして相撃ちを防止すると書いてあります。
> >>
> 以前参考に頂いたコンフィグには、fencing_topologyを記述して、pcmk_reboot_retriesとpcmk_reboot_timeoutというパラメータが入って、standby_wait_timeは抜けていたかと思います。
> >>
> >> pacemaker1.1.12ではstandby_wait_timeの記述は必要無いのでしょうか。
> >>
> >> こちらでは、今次のようなコンフィグファイルを作っています。
> >>
> >>
> >> ### Cluster Option ###
> >> property \
> >>      no-quorum-policy="ignore" \
> >>      stonith-enabled="true" \
> >>      startup-fencing="false" \
> >>      stonith-timeout="710s" \
> >>      crmd-transition-delay="2s"
> >>
> >> ### Resource Default ###
> >> rsc_defaults \
> >>      resource-stickiness="INFINITY" \
> >>      migration-threshold="1"
> >>
> >> ### Group Configuration ###
> >> group HAvarnish \
> >>      vip_208 \
> >>      varnishd
> >>
> >> group grpStonith1 \
> >>      Stonith1-1 \
> >>      Stonith1-2 \
> >>      Stonith1-3
> >>
> >> group grpStonith2 \
> >>      Stonith2-1 \
> >>      Stonith2-2 \
> >>      Stonith2-3
> >>
> >> ### Clone Configuration ###
> >> clone clone_ping \
> >>      ping
> >>
> >> ### Fencing Topology ###
> >> fencing_topology \
> >>      lbv1.beta.com: Stonith1-1 Stonith1-2 Stonith1-3 \
> >>      lbv2.beta.com: Stonith2-1 Stonith2-2 Stonith2-3
> >>
> >> ### Primitive Configuration ###
> >> primitive vip_208 ocf:heartbeat:IPaddr2 \
> >>      params \
> >>          ip="192.168.17.208" \
> >>          nic="eth0" \
> >>          cidr_netmask="24" \
> >>      op start interval="0s" timeout="90s" on-fail="restart" \
> >>      op monitor interval="5s" timeout="60s" on-fail="restart" \
> >>      op stop interval="0s" timeout="100s" on-fail="fence"
> >>
> >> primitive varnishd lsb:varnish \
> >>      op start interval="0s" timeout="90s" on-fail="restart" \
> >>      op monitor interval="10s" timeout="60s" on-fail="restart" \
> >>      op stop interval="0s" timeout="100s" on-fail="fence"
> >>
> >> primitive ping ocf:pacemaker:ping \
> >>      params \
> >>          name="default_ping_set" \
> >>          host_list="192.168.17.254" \
> >>          multiplier="100" \
> >>          dampen="1" \
> >>      op start interval="0s" timeout="90s" on-fail="restart" \
> >>      op monitor interval="10s" timeout="60s" on-fail="restart" \
> >>      op stop interval="0s" timeout="100s" on-fail="fence"
> >>
> >>
> >> primitive Stonith1-2 stonith:external/xen0 \
> >>      params \
> >>          pcmk_reboot_timeout="60s" \
> >>          hostlist="lbv1.beta.com:/etc/xen/lbv1.cfg" \
> >>          dom0="xen0.beta.com" \
> >>      op start interval="0s" timeout="60s" on-fail="restart" \
> >>      op monitor interval="3600s" timeout="60s" on-fail="restart" \
> >>      op stop interval="0s" timeout="60s" on-fail="ignore"
> >>
> >> primitive Stonith1-3 stonith:meatware \
> >>      params \
> >>          pcmk_reboot_timeout="600s" \
> >>          hostlist="lbv1.beta.com" \
> >>      op start interval="0s" timeout="60s" \
> >>      op monitor interval="3600s" timeout="60s" \
> >>      op stop interval="0s" timeout="60s"
> >>
> >> primitive Stonith2-1 stonith:external/stonith-helper \
> >>      params \
> >>          pcmk_reboot_retries="1" \
> >>          pcmk_reboot_timeout="40s" \
> >>          hostlist="lbv2.beta.com" \
> >>          dead_check_target="192.168.17.133 10.0.17.133" \
> >>          standby_wait_time="10" \
> >>          standby_check_command="/usr/local/sbin/crm_resource -r
> varnishd -W | grep -q `hostname`" \
> >>          run_online_check="yes" \
> >>      op start interval="0s" timeout="60s" on-fail="restart" \
> >>      op stop interval="0s" timeout="60s" on-fail="ignore"
> >>
> >> primitive Stonith2-2 stonith:external/xen0 \
> >>      params \
> >>          pcmk_reboot_timeout="60s" \
> >>          hostlist="lbv2.beta.com:/etc/xen/lbv2.cfg" \
> >>          dom0="xen0.beta.com" \
> >>      op start interval="0s" timeout="60s" on-fail="restart" \
> >>      op monitor interval="3600s" timeout="60s" on-fail="restart" \
> >>      op stop interval="0s" timeout="60s" on-fail="ignore"
> >>
> >> primitive Stonith2-3 stonith:meatware \
> >>      params \
> >>          pcmk_reboot_timeout="600s" \
> >>          hostlist="lbv2.beta.com" \
> >>      op start interval="0s" timeout="60s" \
> >>      op monitor interval="3600s" timeout="60s" \
> >>      op stop interval="0s" timeout="60s"
> >>
> >> ### Resource Location ###
> >> location HA_location-1 HAvarnish \
> >>      rule 200: #uname eq lbv1.beta.com \
> >>      rule 100: #uname eq lbv2.beta.com
> >>
> >> location HA_location-2 HAvarnish \
> >>      rule -INFINITY: not_defined default_ping_set or default_ping_set
> lt 100
> >>
> >> location HA_location-3 grpStonith1 \
> >>      rule -INFINITY: #uname eq lbv1.beta.com
> >>
> >> location HA_location-4 grpStonith2 \
> >>      rule -INFINITY: #uname eq lbv2.beta.com
> >>
> >> 宜しくお願いします。
> >>
> >> 以上
> >>
> >>
> >>
> >>
> >> 2015年3月20日 17:16 <renay****@ybb*****>:
> >>
> >> 福田さん
> >>>
> >>>
> >>> お疲れ様です。山内です。
> >>>
> >>>>
> こちらの環境で、PM1.1.12のbuild:e32080bからbuild:561c4cfへ何度か戻したりしているうちにリブートを繰り返すようになってしまいました。
> >>>
> >>> この時ですが、戻したりする前に、
> >>> 1)使っていたバージョンのソースディレクトリで、make uninstall
> >>> 2)/var/lib/pacemaker/cib, /var/lib/pacemaker/pengineのディレクトリ中身を削除
> >>> しておいた方がよいです。
> >>>
> >>>> そこで、再度debian7.8をクリーンインストールしてPM1.1.12 build:561c4cfをインストールしました。
> >>>> あと、ご指摘頂いたパスを通したところ、こちらでもstonith-helperの起動までは確認できました。
> >>>
> >>>
> >>> そうでしたか・・・・良かったですね。
> >>> といっても、build:e32080bが動かないと問題ですが・・・・
> >>>
> >>> また、週末に時間が取れたら、こちらでもやってみます。
> >>> 進展があれば、ご連絡いたします。
> >>>
> >>> 以上です。
> >>>
> >>>
> >>>
> >>>
> >> --
> >>
> >> ELF Systems
> >> Masamichi Fukuda
> >> mail to: masamichi_fukud****@elf-s*****
> >>
> >>
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux****@lists*****
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >
> >
> >
>
>
> --
> NTT オープンソースソフトウェアセンタ
> 中平 和友
> TEL: 03-5860-5135 FAX: 03-5463-6490
> Mail: nakahira_kazutomo_b1****@lab*****
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>
>


-- 
ELF Systems
Masamichi Fukuda
mail to: *masamichi_fukud****@elf-s***** <elfsy****@gmail*****>*
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Download 



Linux-ha-japan メーリングリストの案内
Zurück zum Archiv-Index