DRBDのPrimaryとSecondaryが切り替わらない (Linux-ha-jp) - Linux-HA Japan

san様

松島です。

ログを拝見していて気になったのですが、heartbeatに対してdrbdの設定は行なっていますでしょうか。
heartbeatがDRBDを管理下に置いていないため、Failoverせず、Secondaryに対してmountしようとして
エラーになっているのではないでしょうか。
とすると、Dual Primaryにした場合、どちらもmount可能な状態ですのでうまくいったと考えられます。

私個人といたしましてはDual Primaryの運用はおすすめできません(会社でひどい目にあっています)。

何か解決のヒントになればと思います。

-- 
Takehiro Matsushima
<takeh****@gmail*****>


2012年3月24日14:38 "三反田@ひむか流通ネットワーク" <santa****@himuk*****>:
> sanです。
>
> 松島様
>
> レスありがとうございます。
>
> 色々調べてましたら、Dual−Primary　モードの有効化があるのを知り
> 設定しましたら、ない事も内容にフェイルオーバーでもマウントOKです。
> データ整合性でも、両ノードで同期が取れています。
> PostgreSQLへの連続insert中に、Heartbeatサービス停止（Failover発生）し
> 数秒待ってると、片方のノードでPostgreSQLが起動して、連続insertの再開
> されました。データ及び件数も合ってはいましたネ。
>
>
>
> ただ、Single-Primary　モードはいかんせん、？状態ですが。
>
>
>
> ■参考にしたURL　※一番利用したものだけ
> http://itpro.nikkeibp.co.jp/article/COLUMN/20081121/319719/?ST=oss
> http://www.oss-d.net/ha/postgresql#m96b5da7
>
> ■ha.cfです
> ------------------------------------------------------------------------------
> crm on
> use_logd on
>
> debug 0
> udpport 694
> keepalive 2
> warntime 20
> deadtime 24
> initdead 48
>
> ##bcast eth0
> bcast eth1
>
> auto_failback off
>
> node cluster1
> node cluster2
>
> watchdog /dev/watchdog
> respawn root /usr/lib64/heartbeat/pingd -m 100 -a default_ping_set
> ping 10.0.31.204
> respawn root /etc/ha.d/monitoring/heartbeat_logmoni.sh monitor
> respawn root /usr/local/bin/check_service                      #サービス監視スクリプト
> ------------------------------------------------------------------------------
>
> ■(failover失敗時のログ抜粋
> Mar 24 11:12:34 cluster2 Filesystem[5210]: [5240]: INFO: Running start for /dev/drbd0 on /data
> Mar 24 11:12:35 cluster2 lrmd: [2870]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) /dev/drbd0: Wrong medium type
> Mar 24 11:12:35 cluster2 lrmd: [2870]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) mount: block device /dev/drbd0 is write-protected, mounting read-only
> Mar 24 11:12:35 cluster2 lrmd: [2870]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) mount: Wrong medium type
> Mar 24 11:12:35 cluster2 Filesystem[5210]: [5253]: ERROR: Couldn't mount filesystem /dev/drbd0 on /data
> Mar 24 11:12:35 cluster2 crmd: [2873]: ERROR: process_lrm_event: LRM operation prm:Filesystem:ap:Filesystem_start_0 (call=7, rc=1) Error unknown error
> Mar 24 11:12:35 cluster2 tengine: [3605]: WARN: status_from_rc: Action start on cluster2 failed (target: <null> vs. rc: 1): Error
> Mar 24 11:12:35 cluster2 tengine: [3605]: WARN: update_failcount: Updating failcount for prm:Filesystem:ap:Filesystem on dcc84c45-40b4-4ff4-a367-e659990e2df7 after failed start: rc=1
>
> -------------------------------------------
>
> Mar 24 12:50:37 cluster2 lrmd: [2954]: info: rsc:prm:Filesystem:ap:Filesystem: start
> Mar 24 12:50:37 cluster2 Filesystem[5253]: [5283]: INFO: Running start for /dev/drbd0 on /data
> Mar 24 12:50:37 cluster2 lrmd: [2954]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) /dev/drbd0: Wrong medium type
> Mar 24 12:50:37 cluster2 lrmd: [2954]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) mount: block device /dev/drbd0 is write-protected, mounting read-only
> Mar 24 12:50:37 cluster2 lrmd: [2954]: info: RA output: (prm:Filesystem:ap:Filesystem:start:stderr) mount: Wrong medium type
> Mar 24 12:50:37 cluster2 Filesystem[5253]: [5296]: ERROR: Couldn't mount filesystem /dev/drbd0 on /data
> Mar 24 12:50:37 cluster2 crmd: [2957]: ERROR: process_lrm_event: LRM operation prm:Filesystem:ap:Filesystem_start_0 (call=7, rc=1) Error unknown error
> Mar 24 12:50:37 cluster2 tengine: [3630]: WARN: status_from_rc: Action start on cluster2 failed (target: <null> vs. rc: 1): Error
> Mar 24 12:50:37 cluster2 tengine: [3630]: WARN: update_failcount: Updating failcount for prm:Filesystem:ap:Filesystem on dcc84c45-40b4-4ff4-a367-e659990e2df7 after failed start: rc=1
>
>
>
>
>
> (2012/03/24 13:59), Takehiro Matsushima wrote:
>> san 様
>>
>> 松島と申します、こんにちは。
>>
>> お手数ですが、参考にされたURLとご教示いただけますでしょうか。
>> 設定が異なるようでしたらcrmの設定を記載いただけるとなにかわかるかもしれません。
>> (failover失敗時にログにエラーが出ているようでしたらそちらもお願いします)
>>
>> colocationに引っかかっているような気はしておりますが...
>>
>>
>> よろしくお願いいたします
>>
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan

Linux-HA Japan
Fork
pm_logconv-cs
pm_diskd
pm_logconv-hb
pm_extras
doc
pm_crmgen
vm-ctl
pm_kvm_tools

[Linux-ha-jp] DRBDのPrimaryとSecondaryが切り替わらない

Linux-HA Japan Forkpm_logconv-cspm_diskdpm_logconv-hbpm_extrasdocpm_crmgenvm-ctlpm_kvm_tools

[Linux-ha-jp] DRBDのPrimaryとSecondaryが切り替わらない

Linux-HA Japan
Fork
pm_logconv-cs
pm_diskd
pm_logconv-hb
pm_extras
doc
pm_crmgen
vm-ctl
pm_kvm_tools