Takehiro Matsushima
takeh****@gmail*****
2012年 3月 24日 (土) 15:26:25 JST
san様 松島です。 ログを拝見していて気になったのですが、heartbeatに対してdrbdの設定は行なっていますでしょうか。 heartbeatがDRBDを管理下に置いていないため、Failoverせず、Secondaryに対してmountしようとして エラーになっているのではないでしょうか。 とすると、Dual Primaryにした場合、どちらもmount可能な状態ですのでうまくいったと考えられます。 私個人といたしましてはDual Primaryの運用はおすすめできません(会社でひどい目にあっています)。 何か解決のヒントになればと思います。 -- Takehiro Matsushima <takeh****@gmail*****> 2012年3月24日14:38 "三反田@ひむか流通ネットワーク" <santa****@himuk*****>: > sanです。 > > 松島様 > > レスありがとうございます。 > > 色々調べてましたら、Dual−Primary モードの有効化があるのを知り > 設定しましたら、ない事も内容にフェイルオーバーでもマウントOKです。 > データ整合性でも、両ノードで同期が取れています。 > PostgreSQLへの連続insert中に、Heartbeatサービス停止(Failover発生)し > 数秒待ってると、片方のノードでPostgreSQLが起動して、連続insertの再開 > されました。データ及び件数も合ってはいましたネ。 > > > > ただ、Single-Primary モードはいかんせん、?状態ですが。 > > > > ■参考にしたURL ※一番利用したものだけ > http://itpro.nikkeibp.co.jp/article/COLUMN/20081121/319719/?ST=oss > http://www.oss-d.net/ha/postgresql#m96b5da7 > > ■ha.cfです > ------------------------------------------------------------------------------ > crm on > use_logd on > > debug 0 > udpport 694 > keepalive 2 > warntime 20 > deadtime 24 > initdead 48 > > ##bcast eth0 > bcast eth1 > > auto_failback off > > node cluster1 > node cluster2 > > watchdog /dev/watchdog > respawn root /usr/lib64/heartbeat/pingd -m 100 -a default_ping_set > ping 10.0.31.204 > respawn root /etc/ha.d/monitoring/heartbeat_logmoni.sh monitor > respawn root /usr/local/bin/check_service #サービス監視スクリプト > ------------------------------------------------------------------------------ > > ■(failover失敗時のログ抜粋 > Mar 24 11:12:34 cluster2 Filesystem[5210]: [5240]: INFO: Running start for /dev/drbd0 on /data > Mar 24 11:12:35 cluster2 lrmd: [2870]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) /dev/drbd0: Wrong medium type > Mar 24 11:12:35 cluster2 lrmd: [2870]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) mount: block device /dev/drbd0 is write-protected, mounting read-only > Mar 24 11:12:35 cluster2 lrmd: [2870]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) mount: Wrong medium type > Mar 24 11:12:35 cluster2 Filesystem[5210]: [5253]: ERROR: Couldn't mount filesystem /dev/drbd0 on /data > Mar 24 11:12:35 cluster2 crmd: [2873]: ERROR: process_lrm_event: LRM operation prm:Filesystem:ap:Filesystem_start_0 (call=7, rc=1) Error unknown error > Mar 24 11:12:35 cluster2 tengine: [3605]: WARN: status_from_rc: Action start on cluster2 failed (target: <null> vs. rc: 1): Error > Mar 24 11:12:35 cluster2 tengine: [3605]: WARN: update_failcount: Updating failcount for prm:Filesystem:ap:Filesystem on dcc84c45-40b4-4ff4-a367-e659990e2df7 after failed start: rc=1 > > ------------------------------------------- > > Mar 24 12:50:37 cluster2 lrmd: [2954]: info: rsc:prm:Filesystem:ap:Filesystem: start > Mar 24 12:50:37 cluster2 Filesystem[5253]: [5283]: INFO: Running start for /dev/drbd0 on /data > Mar 24 12:50:37 cluster2 lrmd: [2954]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) /dev/drbd0: Wrong medium type > Mar 24 12:50:37 cluster2 lrmd: [2954]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) mount: block device /dev/drbd0 is write-protected, mounting read-only > Mar 24 12:50:37 cluster2 lrmd: [2954]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) mount: Wrong medium type > Mar 24 12:50:37 cluster2 Filesystem[5253]: [5296]: ERROR: Couldn't mount filesystem /dev/drbd0 on /data > Mar 24 12:50:37 cluster2 crmd: [2957]: ERROR: process_lrm_event: LRM operation prm:Filesystem:ap:Filesystem_start_0 (call=7, rc=1) Error unknown error > Mar 24 12:50:37 cluster2 tengine: [3630]: WARN: status_from_rc: Action start on cluster2 failed (target: <null> vs. rc: 1): Error > Mar 24 12:50:37 cluster2 tengine: [3630]: WARN: update_failcount: Updating failcount for prm:Filesystem:ap:Filesystem on dcc84c45-40b4-4ff4-a367-e659990e2df7 after failed start: rc=1 > > > > > > (2012/03/24 13:59), Takehiro Matsushima wrote: >> san 様 >> >> 松島と申します、こんにちは。 >> >> お手数ですが、参考にされたURLとご教示いただけますでしょうか。 >> 設定が異なるようでしたらcrmの設定を記載いただけるとなにかわかるかもしれません。 >> (failover失敗時にログにエラーが出ているようでしたらそちらもお願いします) >> >> colocationに引っかかっているような気はしておりますが... >> >> >> よろしくお願いいたします >> > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan