[Linux-ha-jp] Heartbeatで管理している仮想IPが切り替わりについて

Zurück zum Archiv-Index

萩原 司朗 hagih****@simpl*****
2009年 6月 8日 (月) 12:13:14 JST


 萩原です。
 
 池田様、色々確認ありがとうございます。
 参考にさせていただきます。
 
 現状、
 サーバの何らかしらの負荷によってHeartbeatが監視出来なくなり切り替わっ
ているとは思いますが原因が特定出来ないのと、負荷が少しくらい掛ったくらい
では仮想IPの切り替わりは起こって欲しくないので、

> * モニター故障の検知は行わない
> * ノードダウン時の切り替えは行う

というのはこちらとしては要件を満たしていると思いますので、
モニター検知の設定を外して様子を見てみます。

ありがとうございました。
 
 
 
>荻原様
>
>池田です。
>
>> ⇒ノードダウン時に仮想IPアドレスが切り替わり(モニターによる切り替わりは
>> 無し)という要件であれば、モニターのコンフィグを削除すればバージョン2.1.
>> 4で削除した場合,
>> モニター故障の検知が出来なかってもノードダウン時の仮想IP切り替えには影響
>> はしないと思うのですが、
>> それでもデフォルト値が設定されてしまっていて何らかしら仮想IPに対するモニ
>> ターを行っているということでしょうか?
>
> * モニター故障の検知は行わない
> * ノードダウン時の切り替えは行う
>という条件であれば、cib.xmlにop関連の設定を行う必要はありません。
>(見慣れないのでちょっと奇妙な感じはしますが。。。)
>Heartbeat 2.1.4で確認してみましたが設定がない場合でも
>ノードダウン時の切り替えは成功しました。
>
>また、デフォルト値についてはこちらが勘違いしていました。
>申し訳ありません。
>RAにはmetadataの記述があり、この値がデフォルト値で
>採用されると思っていましたが
>これはあくまでGUIで設定するときの参考値です。
>モニターのinterval値などをcib.xmlで設定しなかった場合は
>モニターは実行されないようです。
>
>参考
>http://www.gossamer-threads.com/lists/linuxha/users/44481
>
>以上よろしくお願いいたします。
>
>池田淳子
>
>
>
>> -----Original Message-----
>> From: linux****@lists*****
>> [mailto:linux****@lists*****] On Behalf Of 萩原 司
>>>> Sent: Thursday, June 04, 2009 7:45 PM
>> To: linux****@lists*****
>> Subject: Re: [Linux-ha-jp] Heartbeatで管理している仮想IPが切り替わりにつ
>> いて
>>
>>  萩原です。
>>
>>  池田様、ありがとうございます。
>>  すいませんがインラインで。
>>
>> >萩原様
>> >
>> >池田です。
>> >
>> >>  上記項目がコンフィグにある場合に
>> >>  ifconfig eth0:0 down
>> >>  として仮想IPアドレスがサーバからなくなっても仮想IPに対するタイムアウ
>>>> >> が発生しませんでした。
>> >
>> >モニター処理のタイムアウトが発生しないということでしょうか?
>> ⇒モニター設定をしているにもかかわらず手動で仮想IPを削除した時にタイムア
>> ウトによる仮想IPの切り替えは発生しませんでした。
>>
>> >
>> >>  このコンフィグがあれば仮想IPをモニターすると思っていたのでモニター出
>>>> >> なくなると切り替わると思っていました。
>> >
>> >そのとおりです。
>> >interval値の間隔で仮想IPの生存を確認してます。
>> ⇒だと思っていたのですがタイムアウトが発生しなかったのでコンフィグの意味
>> 合いがわからなくなりました。。
>>
>> >
>> >>  このコンフィグが無い場合にノードダウン時、heartbeatの障害発生時などは
>> >> 問題なく仮想IPは切り替わるとおもって問題ないでしょうか?
>> >>  無くてもノードダウン時の挙動に問題なければコンフィグから削除しようと
>>>> >> っています。
>> >>  実際切り替わって問題なさそうには見えたのですがコンフィグがある場合と
>>>> >> い場合での挙動の違いがいまいちわからないです。
>> >
>> >「問題なさそうに見えた」という動作がなにを指すのかよくわからないのですが
>> >(タイムアウトは発生しないが切り替え動作は成功する?)
>> ⇒問題なさそうに見えたというのはコンフィグがあってもなくてもノードダウン
>> 時には仮想IPは切り替わったということで書きました。
>>
>> >各環境でさまざまな要件があるかと思いますので
>> >op(start, monitor, stop)の設定値は明示的に指定したほうが
>> >よいのではないでしょうか。
>> >設定しない場合は、デフォルト値が採用されるはずですが
>> >Heartbaet 2.1.4でopの設定を省略してみたところ
>> >モニター故障を検知できなかったので
>> >設定していたほうが安全かと思います。
>> ⇒ノードダウン時に仮想IPアドレスが切り替わり(モニターによる切り替わりは
>> 無し)という要件であれば、モニターのコンフィグを削除すればバージョン2.1.
>> 4で削除した場合,
>> モニター故障の検知が出来なかってもノードダウン時の仮想IP切り替えには影響
>> はしないと思うのですが、
>> それでもデフォルト値が設定されてしまっていて何らかしら仮想IPに対するモニ
>> ターを行っているということでしょうか?
>>
>> 文章がおかしいかもしれませんがよろしくお願いします。
>>
>>
>> >
>> >以上よろしくお願いいたします。
>> >
>> >池田淳子
>> >
>> >
>> >
>> >> -----Original Message-----
>> >> From: linux****@lists*****
>> >> [mailto:linux****@lists*****] On Behalf Of 萩原
>>>> >> 朗
>> >> Sent: Wednesday, June 03, 2009 6:37 PM
>> >> To: linux****@lists*****
>> >> Subject: Re: [Linux-ha-jp] Heartbeatで管理している仮想IPが切り替わりに
>>>> >> いて
>> >>
>> >>  萩原です。
>> >>
>> >>  cib.xmlについて教えていただきたいです。
>> >>  サーバ2台で実験してみました。
>> >>
>> >>  <operations>
>> >>     <op id="IPaddr_192_168_123_1_mon" interval="5s" name="monitor"
>> >> timeout="5s"/>
>> >>   </operations>
>> >>
>> >>  上記項目がコンフィグにある場合に
>> >>  ifconfig eth0:0 down
>> >>  として仮想IPアドレスがサーバからなくなっても仮想IPに対するタイムアウ
>>>> >> が発生しませんでした。
>> >>
>> >>  このコンフィグがあれば仮想IPをモニターすると思っていたのでモニター出
>>>> >> なくなると切り替わると思っていました。
>> >>
>> >>  このコンフィグが無い場合にノードダウン時、heartbeatの障害発生時などは
>> >> 問題なく仮想IPは切り替わるとおもって問題ないでしょうか?
>> >>  無くてもノードダウン時の挙動に問題なければコンフィグから削除しようと
>>>> >> っています。
>> >>  実際切り替わって問題なさそうには見えたのですがコンフィグがある場合と
>>>> >> い場合での挙動の違いがいまいちわからないです。
>> >>
>> >>  すいませんが、よろしくお願いいたします。
>> >>
>> >>
>> >> > 萩原です。
>> >> >
>> >> > 池田様、返答ありがとうございます。
>> >> >
>> >> > 直近の二回発生している切替時にmessagesのログには
>> >> > いきなりモニタータイムアウトからのログしか記述されてません。
>> >> > ので
>> >> >
>> >> > ただ、切替時、sarの結果ではioは確かに高い数値になってました。
>> >> >
>> >> > Heartbeat単体で出力されるには高い数値だと思います。
>> >> >
>> >> > なのでその負荷によって仮想IPだけに障害が発生した可能性も捨てきれない
>>>> >> >で返信していただいた内容を確認して負荷の原因及び
>> >> > モニターのタイムアウト値を伸ばすことを考えてみます。
>> >> >
>> >> > 以上
>> >> >
>> >> >>池田です。
>> >> >>
>> >> >>添付していただいたログをみる限りでは
>> >> >>ノード名「csmap02」で18:04:14頃、仮想IPの監視が
>> >> >>タイムアウトし、フェイルオーバが発生したということしか
>> >> >>わかりません。
>> >> >>同時刻の syslog などにはインターフェースに関連する
>> >> >>メッセージは出力されていないのでしょうか?
>> >> >>
>> >> >>>  サーバの実アドレスに対しての外部からの監視ではタイムアウトが発生
>> して
>> >> い
>> >> >>> ないので切り替わる理由がわかりません。
>> >> >>
>> >> >>サーバの実アドレスに問題はなくとも
>> >> >>仮想IPだけに障害が発生する可能性はないのでしょうか。
>> >> >>
>> >> >>>  また、Heartbeat自体がサーバの負荷により確認が不能になる場合がある
>>>> >> す
>> >> >>> れば今のcib.xmlの設定は5秒間隔でタイムアウト5秒にしているのですが
>>>> >> 在の
>> >> >>> コンフィグより最適な設定などがあればご教授いただきたいです。
>> >> >>
>> >> >>サーバの過負荷によってモニターの監視タイムアウトが
>> >> >>発生する可能性はあります。
>> >> >>タイムアウト値については、各サーバの要件、
>> >> >>特にフェイルオーバ時間に関連してきますので
>> >> >>一般的に最適な値というのは難しいかと思います。
>> >> >>タイムアウト値を長くすると、フェイルオーバ時間
>> >> >>(サービス停止時間)も長くなります。
>> >> >>
>> >> >>リソースのフェイルオーバ時間(最大)
>> >> >> =   モニターの監視間隔
>> >> >>   + モニターのタイムアウト値
>> >> >>   + ストップのタイムアウト値
>> >> >>  + スタートのタイムアウト値
>> >> >>
>> >> >>正常にフェイルオーバできる場合は、各タイムアウト値は無視されます。
>> >> >>フェイルオーバ時間に厳しい制限がある場合
>> >> >>5秒という値は悪い値ではないと思います。
>> >> >>フェイルオーバ時間が5分以内であればいい、というような要件であれば
>> >> >>タイムアウト値は1分ほど設定していても問題はないかと思います。
>> >> >>
>> >> >>以上よろしくお願いいたします。
>> >> >>
>> >> >>池田淳子
>> >> >>
>> >> >>
>> >> >>> -----Original Message-----
>> >> >>> From: linux****@lists*****
>> >> >>> [mailto:linux****@lists*****] On Behalf Of
>>>>> >> 司
>> >> >>> 朗
>> >> >>> Sent: Friday, May 29, 2009 6:10 PM
>> >> >>> To: linux****@lists*****
>> >> >>> Subject: [Linux-ha-jp] Heartbeatで管理している仮想IPが切り替わりに
>>>> >> いて
>> >> >>>
>> >> >>>
>> >> >>>  萩原と申します。
>> >> >>>
>> >> >>>  アクティブ系 3台
>> >> >>>  スタンバイ系 1台
>> >> >>>  の計4台でHeartbeatの構成を設定しているのですが障害ではないと思わ
>>>> >> る場
>> >> >>> 合に仮想IPが切り替わってしまいます。
>> >> >>>
>> >> >>>  ログには仮想IPをモニターしているIPアドレスに対してタイムアウトが
>>>> >> 生し
>> >> >>> た後に切り替わっていると記述されてるのですが、
>> >> >>>  サーバの実アドレスに対しての外部からの監視ではタイムアウトが発生
>> して
>> >> い
>> >> >>> ないので切り替わる理由がわかりません。
>> >> >>>
>> >> >>>  この仮想IPの監視自体は、その仮想IPが動作しているHeartbeatから行
>>>> >> てい
>> >> >>> るものなのでしょうか?
>> >> >>>  また、Heartbeat自体がサーバの負荷により確認が不能になる場合がある
>>>> >> す
>> >> >>> れば今のcib.xmlの設定は5秒間隔でタイムアウト5秒にしているのですが
>>>> >> 在の
>> >> >>> コンフィグより最適な設定などがあればご教授いただきたいです。
>> >> >>>  タイムアウト5秒なら結構長いような気はするのですが。。
>> >> >>>
>> >> >>>  すいませんが、よろしくお願いいたします。
>> >> >>
>> >> >>_______________________________________________
>> >> >>Linux-ha-japan mailing list
>> >> >>Linux****@lists*****
>> >> >>http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>> >> >
>> >>
>> >-------------------------------text/plain-------------------------------
>> >> >_______________________________________________
>> >> >Linux-ha-japan mailing list
>> >> >Linux****@lists*****
>> >> >http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>> >
>> >_______________________________________________
>> >Linux-ha-japan mailing list
>> >Linux****@lists*****
>> >http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>>
>> _______________________________________________
>> Linux-ha-japan mailing list
>> Linux****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>
>_______________________________________________
>Linux-ha-japan mailing list
>Linux****@lists*****
>http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan





Linux-ha-japan メーリングリストの案内
Zurück zum Archiv-Index