kyama****@yahoo*****
kyama****@yahoo*****
2013年 2月 18日 (月) 13:20:08 JST
山内様 山本です。補足いただきありがとうございます。 watchdog については以下ということで理解しました。 タイマーのカウント値:deadtime の値 + 10msec タイマーのリセット間隔:自ノードが keepalive の status メッセージを受けっとタイミング つまり単純な例として以下条件でいうと最長 12秒 + 10msec ということになるのでしょうか? deadtime = 10 keepalive = 2 何度も申し訳ございません。お手すきで構いませんのでご教示いただけると幸いです。 以上宜しくお願い申し上げます。 --- On Mon, 2013/2/18, renay****@ybb***** <renay****@ybb*****> wrote: > 山本さん > > こんにちは、山内です。 > > すいません。 > 良く見ると、1点回答が漏れていましたね。 > 再度補足しておきます。 > > > > > ◆ Q1 watchdog について > > > > ha.cf に watchdog の設定をしております。 > > > > > > > > 何秒間隔でタイマーを定期的にリセットしているのでしょうか? > > > > # OS は RedHat 6.3 です。 > > watchdogとしてのタイムアウトは、先に回答した時間でセットされています。 > #このタイムアウト期間、watchdogに書き込みがなければ、自ノード故障としてOS処理。 > > 実際にHeartbeat+Pacemaker構成で、Heartbeatがwatchdogに書き込みを行う周期は > 複数あるのですが、基本的には、ノードのstatusメッセージ(常にやり取りしています。このメッセージもdeadtimeなどの判定材料です)をkeepalive間隔でやり取りしたタイミングです。 > よって、keepalive=2の場合は、遅れがなければ、2s毎にstatusメッセージのノード通信が行われますが、このメッセージを自ノードが受け取った時に、watchdogに書き込みを行っています。 > > 以上です。 > > > > > > --- On Mon, 2013/2/18, kyama****@yahoo***** <kyama****@yahoo*****> wrote: > > > 山内 様 > > > > お世話になっております。山本です。 > > > > 以下の件、ご回答いただきましてありがとうございました。 > > > > > > ◆ Q1 watchdog について > > ▼ > > 実環境にて試してみたところ、確かに山内様のおっしゃる挙動となりました。 > > > > > > ◆ Q2 障害検知の間隔について > > ▼ > > keepalive は単なるハートビート間隔ということで理解しました。 > > > > ご回答いただき大変助かりました。重ねてお礼申し上げます。 > > > > 以上宜しくお願いいたします。 > > > > --- On Sun, 2013/2/17, renay****@ybb***** <renay****@ybb*****> wrote: > > > > > 山本さん > > > > > > 今晩は、山内です。 > > > > > > > > > > Pacemaker 初心者です。 > > > > いくつか質問がございますのでご教示いただけると幸いです。 > > > > > > > > ◆ Q1 watchdog について > > > > ha.cf に watchdog の設定をしております。 > > > > > > > > 何秒間隔でタイマーを定期的にリセットしているのでしょうか? > > > > # OS は RedHat 6.3 です。 > > > > > > watchdogタイマー間隔は、HeartbeatとPacemaker組み合わせた場合、Heartbeat側で設定処理されていて、ha.cfのdeadtime値のmsec値+10msec値で設定されています。 > > > > > > > > > > > ◆ Q2 障害検知の間隔について > > > > Linux-HA ユーザーズガイドに以下記載があります。 > > > > > > > > ------ > > > > Heartbeatはノード故障を0.5秒以内に確実に探知します。 > > > > ------ > > > > > > > > ha.cf に記載する keepalive の値との関連性がよくわかりません。 > > > > > > > > keepalive 2 とすれば最大 2秒以内に障害を検知するイメージですが、間違いでしょうか? > > > > > > keepalive自体は通信間隔の設定ですので、 > > > ノード故障(Heartbeatのノード間の通信が切れる)は、deadtimeの設定が利用されます。 > > > 仮にkeepalive間隔が守られない場合には、確かWARNINGが出るだけで、deadtime経過後にノード故障となります。 > > > > > > #logconvの方は、有識者の方の回答に委ねます。 > > > > > > 以上です。 > > > > > > > > > > > _______________________________________________ > > > > Linux-ha-japan mailing list > > > > Linux****@lists***** > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan > > > > > > > > > > _______________________________________________ > > > Linux-ha-japan mailing list > > > Linux****@lists***** > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan > > > > > > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan >