Hayato Shinomiya
hayat****@stars*****
2012年 1月 12日 (木) 09:51:05 JST
黒木様 篠宮です。 早速のご返信、誠に有り難うございます。 以下、ご指摘頂いた箇所について、ログ等の抜粋を記載 させて頂きます。 > このような場合は/var/log/messagesを調べるのが > ファーストステップになります。messagesにDRBDがPrimaryに > なって、Secandaryになる過程が記録されます。crm_monの > 結果を見る限りDRBDのエラーが発生しているようですので、 > messagesからエラーの部分を抜き出してみて下さい。 <ログ抜粋> Jan 12 03:07:33 node1 lrmd: [3649]: info: rsc:res_drbd:1:19: stop Jan 12 03:07:33 node1 crmd: [3652]: info: process_lrm_event: LRM operation res_drbd:1_monitor_20000 (call=17, status=1, cib-update=0, confirmed=true) Cancelled Jan 12 03:07:33 node1 kernel: block drbd0: peer( Primary -> Unknown ) conn( Connected -> Disconnecting ) pdsk( UpToDate -> DUnknown ) Jan 12 03:07:33 node1 kernel: block drbd0: short read expecting header on sock: r=-512 Jan 12 03:07:33 node1 kernel: block drbd0: asender terminated Jan 12 03:07:33 node1 kernel: block drbd0: Terminating asender thread Jan 12 03:07:33 node1 kernel: block drbd0: Connection closed Jan 12 03:07:33 node1 kernel: block drbd0: conn( Disconnecting -> StandAlone ) Jan 12 03:07:33 node1 kernel: block drbd0: receiver terminated Jan 12 03:07:33 node1 kernel: block drbd0: Terminating receiver thread Jan 12 03:07:33 node1 kernel: block drbd0: disk( UpToDate -> Diskless ) Jan 12 03:07:33 node1 kernel: block drbd0: drbd_bm_resize called with capacity == 0 Jan 12 03:07:33 node1 kernel: block drbd0: worker terminated Jan 12 03:07:33 node1 kernel: block drbd0: Terminating worker thread Jan 12 03:07:33 node1 lrmd: [3649]: info: RA output: (res_drbd:1:stop:stdout) Jan 12 03:07:33 node1 kernel: block drbd0: State change failed: Disk state is lower than outdated Jan 12 03:07:33 node1 kernel: block drbd0: state = { cs:StandAlone ro:Secondary/Unknown ds:Diskless/DUnknown r--- } Jan 12 03:07:33 node1 kernel: block drbd0: wanted = { cs:StandAlone ro:Secondary/Unknown ds:Outdated/DUnknown r--- } Jan 12 03:07:33 node1 lrmd: [3649]: info: RA output: (res_drbd:1:stop:stdout) > 次にDRBD単体で動作確認を行なってみて下さい。 > Heartbeatを止めて、drbdadmコマンド正常に > 切り替わるかどうか確認します。 以下のコマンドを実行して、手動にてDRBDが切り替わる ことを確認しました。 <実施内容> primary側(node1)にて実施 umount /drbd drbdadm secondary r0 元secondary側(node2)にて実施 drbdadm primary r0 mount /dev/drbd0 /drbd <実施結果> /var/log/messagesに以下が出力 kernel: block drbd0: role( Primary -> Secondary ) 以上となります。 ご教授の程、宜しくお願い致します。 On Thu, 12 Jan 2012 09:01:06 +0900 Hiroshi Kuroki <hkuro****@3ware*****> wrote: > 篠宮様 > > 黒木と申します。 > > このような場合は/var/log/messagesを調べるのが > ファーストステップになります。messagesにDRBDがPrimaryに > なって、Secandaryになる過程が記録されます。crm_monの > 結果を見る限りDRBDのエラーが発生しているようですので、 > messagesからエラーの部分を抜き出してみて下さい。 > > 次にDRBD単体で動作確認を行なってみて下さい。 > Heartbeatを止めて、drbdadmコマンド正常に > 切り替わるかどうか確認します。 > > 以上2つの確認でDRBDのエラーを見つけられると思います。 > > On Wed, 11 Jan 2012 21:09:07 +0900 > Hayato Shinomiya <hayat****@stars*****> wrote: > > > 篠宮と申します。 > > > > はじめて投稿させていただきます。 > > heartbeat v3 および DRBDに関して、以下の問題で困っています。 > > > > <問題点> > > 両ノードが正常に起動し、active側をシャットダウンしたところ > > standby側のDRBDが、slave状態のままフェイルオーバーしません。 > > ※一瞬primaryになるのですが、slave状態になります。 > > > > <正常時> > > ============ > > Last updated: Wed Jan 11 20:58:18 2012 > > Stack: Heartbeat > > Current DC: node1 (58598433-729f-4266-9c7f-2a02e306e090) - partition with > > quorum > > Version: 1.0.12-unknown > > 2 Nodes configured, unknown expected votes > > 1 Resources configured. > > ============ > > > > Online: [ node1 node2 ] > > > > Master/Slave Set: ms_drbd > > Masters: [ node1 ] > > Slaves: [ node2 ] > > > > <異常時> > > ============ > > Last updated: Wed Jan 11 20:59:41 2012 > > Stack: Heartbeat > > Current DC: node2 (58598433-729f-4266-9c7f-2a02e306e090) - partition > > with quorum > > Version: 1.0.12-unknown > > 2 Nodes configured, unknown expected votes > > 1 Resources configured. > > ============ > > > > Online: [ node2 ] > > OFFLINE: [ node1 ] > > > > Master/Slave Set: ms_drbd > > Slaves: [ node2 ] > > Stopped: [ drbd_hadoop:1 ] > > > > Failed actions: > > drbd_hadoop:0_promote_0 (node=node2, call=641, rc=1, > > status=complete): unknown error > > > > <環境> > > heartbeat-3.0.3-2.3.el5 > > pacemaker-1.0.12-1.el5.centos > > drbd83-8.3.8-1.el5.centos > > kernel 2.6.18-238.12.1.el5 (OS:CentOS 5.7) > > > > > > <Pacemaker設定> > > 以下の設定は、以前メーリングリストに投稿された内容を元に > > 設定しています。 > > 参考元:http://sourceforge.jp/projects/linux-ha/lists/archive/japan/2011-December/000996.html > > > > primitive drbd_hadoop ocf:linbit:drbd \ > > params drbd_resource="r0" drbdconf="/etc/drbd.conf" \ > > op monitor interval="10s" \ > > op start interval="0s" timeout="240s" on-fail="restart" \ > > op monitor interval="10s" role="Master" timeout="20s" on-fail="restart" \ > > op monitor interval="20s" role="Slave" timeout="20s" on-fail="restart" \ > > op promote interval="0s" timeout="90s" on-fail="restart" \ > > op demote interval="0s" timeout="90s" on-fail="block" \ > > op stop interval="0s" timeout="100s" on-fail="block" > > ms ms_drbd drbd_hadoop \ > > meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true" > > location l_hadoop ms_drbd \ > > rule $id="l_hadoop-rule" $role="master" 200: #uname eq node1 \ > > rule $id="l_hadoop-rule-0" $role="master" 100: #uname eq node2 > > property $id="cib-bootstrap-options" \ > > dc-version="1.0.12-unknown" \ > > cluster-infrastructure="Heartbeat" \ > > last-lrm-refresh="1326270814" \ > > stonith-enabled="false" \ > > no-quorum-policy="stop" \ > > default-action-timeout="240" \ > > default-resource-stickiness="0" \ > > symmetric-cluster="true" \ > > startup-fencing="true" \ > > stop-orphan-resources="true" \ > > remove-after-stop="false" > > > > 大変お手数ですが、どなたかご教授くださいますよう、お願い致します。 > > > > 以上です。 > > > > _______________________________________________ > > Linux-ha-japan mailing list > > Linux****@lists***** > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan > > > > > -- > ---------------------------------------------------------------------- > 黒木 博 (株)サードウェア > > Kuroki Hiroshi 135-0034 東京都江東区永代2-31-13 ヴィラオークラ2F > hkuro****@3ware***** URL: http://www.3ware.co.jp/ > Phone: 03-4530-8670 Fax: 03-5809-8260 -- ******************************** スターシステムズ株式会社 東京都港区南青山7-10-3 南青山STビル5F 篠宮 隼人 TEL:03-5774-4086 FAX:03-3409-3135 E-Mail:hayat****@stars***** ********************************