Pacemaker の挙動について (Linux-ha-jp) - Linux-HA Japan

山内様

山本です。補足いただきありがとうございます。

watchdog については以下ということで理解しました。

　タイマーのカウント値：deadtime の値 + 10msec
　タイマーのリセット間隔：自ノードが keepalive の status メッセージを受けっとタイミング

つまり単純な例として以下条件でいうと最長 12秒 + 10msec ということになるのでしょうか？

　deadtime = 10
　keepalive = 2

何度も申し訳ございません。お手すきで構いませんのでご教示いただけると幸いです。

以上宜しくお願い申し上げます。

--- On Mon, 2013/2/18, renay****@ybb***** <renay****@ybb*****> wrote:

> 山本さん
> 
> こんにちは、山内です。
> 
> すいません。
> 良く見ると、１点回答が漏れていましたね。
> 再度補足しておきます。
> 
> > > > ◆ Q1 watchdog について
> > > > ha.cf に watchdog の設定をしております。
> > > > 
> > > > 何秒間隔でタイマーを定期的にリセットしているのでしょうか？
> > > > # OS は RedHat 6.3 です。
> 
> watchdogとしてのタイムアウトは、先に回答した時間でセットされています。
> ＃このタイムアウト期間、watchdogに書き込みがなければ、自ノード故障としてOS処理。
> 
> 実際にHeartbeat+Pacemaker構成で、Heartbeatがwatchdogに書き込みを行う周期は
> 複数あるのですが、基本的には、ノードのstatusメッセージ（常にやり取りしています。このメッセージもdeadtimeなどの判定材料です）をkeepalive間隔でやり取りしたタイミングです。
> よって、keepalive=2の場合は、遅れがなければ、2s毎にstatusメッセージのノード通信が行われますが、このメッセージを自ノードが受け取った時に、watchdogに書き込みを行っています。
> 
> 以上です。
> 
> 
> 
> 
> 
> --- On Mon, 2013/2/18, kyama****@yahoo***** <kyama****@yahoo*****> wrote:
> 
> > 山内 様
> > 
> > お世話になっております。山本です。
> > 
> > 以下の件、ご回答いただきましてありがとうございました。
> > 
> > > > ◆ Q1 watchdog について
> > ▼
> > 実環境にて試してみたところ、確かに山内様のおっしゃる挙動となりました。
> > 
> > > > ◆ Q2 障害検知の間隔について
> > ▼
> > keepalive は単なるハートビート間隔ということで理解しました。
> > 
> > ご回答いただき大変助かりました。重ねてお礼申し上げます。
> > 
> > 以上宜しくお願いいたします。
> > 
> > --- On Sun, 2013/2/17, renay****@ybb***** <renay****@ybb*****> wrote:
> > 
> > > 山本さん
> > > 
> > > 今晩は、山内です。
> > > 
> > > 
> > > > Pacemaker 初心者です。
> > > > いくつか質問がございますのでご教示いただけると幸いです。
> > > > 
> > > > ◆ Q1 watchdog について
> > > > ha.cf に watchdog の設定をしております。
> > > > 
> > > > 何秒間隔でタイマーを定期的にリセットしているのでしょうか？
> > > > # OS は RedHat 6.3 です。
> > > 
> > > watchdogタイマー間隔は、HeartbeatとPacemaker組み合わせた場合、Heartbeat側で設定処理されていて、ha.cfのdeadtime値のmsec値＋10msec値で設定されています。
> > > 
> > > > 
> > > > ◆ Q2 障害検知の間隔について
> > > > Linux-HA ユーザーズガイドに以下記載があります。
> > > > 
> > > > ------
> > > > Heartbeatはノード故障を0.5秒以内に確実に探知します。
> > > > ------
> > > > 
> > > > ha.cf に記載する keepalive の値との関連性がよくわかりません。
> > > > 
> > > > keepalive 2 とすれば最大 2秒以内に障害を検知するイメージですが、間違いでしょうか？
> > > 
> > > keepalive自体は通信間隔の設定ですので、
> > > ノード故障(Heartbeatのノード間の通信が切れる）は、deadtimeの設定が利用されます。
> > > 仮にkeepalive間隔が守られない場合には、確かWARNINGが出るだけで、deadtime経過後にノード故障となります。
> > > 
> > > ＃logconvの方は、有識者の方の回答に委ねます。
> > > 
> > > 以上です。
> > > 
> > > > 
> > > > _______________________________________________
> > > > Linux-ha-japan mailing list
> > > > Linux****@lists*****
> > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > 
> > > 
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux****@lists*****
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > 
> > 
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

Linux-HA Japan
Fork
pm_logconv-cs
pm_diskd
pm_logconv-hb
pm_extras
doc
pm_crmgen
vm-ctl
pm_kvm_tools

[Linux-ha-jp] Pacemaker の挙動について

Linux-HA Japan Forkpm_logconv-cspm_diskdpm_logconv-hbpm_extrasdocpm_crmgenvm-ctlpm_kvm_tools

[Linux-ha-jp] Pacemaker の挙動について

Linux-HA Japan
Fork
pm_logconv-cs
pm_diskd
pm_logconv-hb
pm_extras
doc
pm_crmgen
vm-ctl
pm_kvm_tools