[Linux-ha-jp] Pacemaker の挙動について

Zurück zum Archiv-Index

kyama****@yahoo***** kyama****@yahoo*****
2013年 2月 18日 (月) 13:20:08 JST


山内様

山本です。補足いただきありがとうございます。

watchdog については以下ということで理解しました。

 タイマーのカウント値:deadtime の値 + 10msec
 タイマーのリセット間隔:自ノードが keepalive の status メッセージを受けっとタイミング

つまり単純な例として以下条件でいうと最長 12秒 + 10msec ということになるのでしょうか?

 deadtime = 10
 keepalive = 2

何度も申し訳ございません。お手すきで構いませんのでご教示いただけると幸いです。

以上宜しくお願い申し上げます。

--- On Mon, 2013/2/18, renay****@ybb***** <renay****@ybb*****> wrote:

> 山本さん
> 
> こんにちは、山内です。
> 
> すいません。
> 良く見ると、1点回答が漏れていましたね。
> 再度補足しておきます。
> 
> > > > ◆ Q1 watchdog について
> > > > ha.cf に watchdog の設定をしております。
> > > > 
> > > > 何秒間隔でタイマーを定期的にリセットしているのでしょうか?
> > > > # OS は RedHat 6.3 です。
> 
> watchdogとしてのタイムアウトは、先に回答した時間でセットされています。
> #このタイムアウト期間、watchdogに書き込みがなければ、自ノード故障としてOS処理。
> 
> 実際にHeartbeat+Pacemaker構成で、Heartbeatがwatchdogに書き込みを行う周期は
> 複数あるのですが、基本的には、ノードのstatusメッセージ(常にやり取りしています。このメッセージもdeadtimeなどの判定材料です)をkeepalive間隔でやり取りしたタイミングです。
> よって、keepalive=2の場合は、遅れがなければ、2s毎にstatusメッセージのノード通信が行われますが、このメッセージを自ノードが受け取った時に、watchdogに書き込みを行っています。
> 
> 以上です。
> 
> 
> 
> 
> 
> --- On Mon, 2013/2/18, kyama****@yahoo***** <kyama****@yahoo*****> wrote:
> 
> > 山内 様
> > 
> > お世話になっております。山本です。
> > 
> > 以下の件、ご回答いただきましてありがとうございました。
> > 
> > > > ◆ Q1 watchdog について
> > ▼
> > 実環境にて試してみたところ、確かに山内様のおっしゃる挙動となりました。
> > 
> > > > ◆ Q2 障害検知の間隔について
> > ▼
> > keepalive は単なるハートビート間隔ということで理解しました。
> > 
> > ご回答いただき大変助かりました。重ねてお礼申し上げます。
> > 
> > 以上宜しくお願いいたします。
> > 
> > --- On Sun, 2013/2/17, renay****@ybb***** <renay****@ybb*****> wrote:
> > 
> > > 山本さん
> > > 
> > > 今晩は、山内です。
> > > 
> > > 
> > > > Pacemaker 初心者です。
> > > > いくつか質問がございますのでご教示いただけると幸いです。
> > > > 
> > > > ◆ Q1 watchdog について
> > > > ha.cf に watchdog の設定をしております。
> > > > 
> > > > 何秒間隔でタイマーを定期的にリセットしているのでしょうか?
> > > > # OS は RedHat 6.3 です。
> > > 
> > > watchdogタイマー間隔は、HeartbeatとPacemaker組み合わせた場合、Heartbeat側で設定処理されていて、ha.cfのdeadtime値のmsec値+10msec値で設定されています。
> > > 
> > > > 
> > > > ◆ Q2 障害検知の間隔について
> > > > Linux-HA ユーザーズガイドに以下記載があります。
> > > > 
> > > > ------
> > > > Heartbeatはノード故障を0.5秒以内に確実に探知します。
> > > > ------
> > > > 
> > > > ha.cf に記載する keepalive の値との関連性がよくわかりません。
> > > > 
> > > > keepalive 2 とすれば最大 2秒以内に障害を検知するイメージですが、間違いでしょうか?
> > > 
> > > keepalive自体は通信間隔の設定ですので、
> > > ノード故障(Heartbeatのノード間の通信が切れる)は、deadtimeの設定が利用されます。
> > > 仮にkeepalive間隔が守られない場合には、確かWARNINGが出るだけで、deadtime経過後にノード故障となります。
> > > 
> > > #logconvの方は、有識者の方の回答に委ねます。
> > > 
> > > 以上です。
> > > 
> > > > 
> > > > _______________________________________________
> > > > Linux-ha-japan mailing list
> > > > Linux****@lists*****
> > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > 
> > > 
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux****@lists*****
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > 
> > 
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> 





Linux-ha-japan メーリングリストの案内
Zurück zum Archiv-Index