[Linux-ha-jp] DRBD primaryに昇格しない

Zurück zum Archiv-Index

Hayato Shinomiya hayat****@stars*****
2012年 1月 12日 (木) 09:51:05 JST


黒木様

篠宮です。


早速のご返信、誠に有り難うございます。

以下、ご指摘頂いた箇所について、ログ等の抜粋を記載
させて頂きます。
> このような場合は/var/log/messagesを調べるのが
> ファーストステップになります。messagesにDRBDがPrimaryに
> なって、Secandaryになる過程が記録されます。crm_monの
> 結果を見る限りDRBDのエラーが発生しているようですので、
> messagesからエラーの部分を抜き出してみて下さい。

<ログ抜粋>
Jan 12 03:07:33 node1 lrmd: [3649]: info: rsc:res_drbd:1:19: stop
Jan 12 03:07:33 node1 crmd: [3652]: info: process_lrm_event: LRM operation res_drbd:1_monitor_20000 (call=17, status=1, cib-update=0, confirmed=true) Cancelled
Jan 12 03:07:33 node1 kernel: block drbd0: peer( Primary -> Unknown ) conn( Connected -> Disconnecting ) pdsk( UpToDate -> DUnknown ) 
Jan 12 03:07:33 node1 kernel: block drbd0: short read expecting header on sock: r=-512
Jan 12 03:07:33 node1 kernel: block drbd0: asender terminated
Jan 12 03:07:33 node1 kernel: block drbd0: Terminating asender thread
Jan 12 03:07:33 node1 kernel: block drbd0: Connection closed
Jan 12 03:07:33 node1 kernel: block drbd0: conn( Disconnecting -> StandAlone ) 
Jan 12 03:07:33 node1 kernel: block drbd0: receiver terminated
Jan 12 03:07:33 node1 kernel: block drbd0: Terminating receiver thread
Jan 12 03:07:33 node1 kernel: block drbd0: disk( UpToDate -> Diskless ) 
Jan 12 03:07:33 node1 kernel: block drbd0: drbd_bm_resize called with capacity == 0
Jan 12 03:07:33 node1 kernel: block drbd0: worker terminated
Jan 12 03:07:33 node1 kernel: block drbd0: Terminating worker thread
Jan 12 03:07:33 node1 lrmd: [3649]: info: RA output: (res_drbd:1:stop:stdout)  
Jan 12 03:07:33 node1 kernel: block drbd0: State change failed: Disk state is lower than outdated
Jan 12 03:07:33 node1 kernel: block drbd0:   state = { cs:StandAlone ro:Secondary/Unknown ds:Diskless/DUnknown r--- }
Jan 12 03:07:33 node1 kernel: block drbd0:  wanted = { cs:StandAlone ro:Secondary/Unknown ds:Outdated/DUnknown r--- }
Jan 12 03:07:33 node1 lrmd: [3649]: info: RA output: (res_drbd:1:stop:stdout)  


> 次にDRBD単体で動作確認を行なってみて下さい。
> Heartbeatを止めて、drbdadmコマンド正常に
> 切り替わるかどうか確認します。
以下のコマンドを実行して、手動にてDRBDが切り替わる
ことを確認しました。

<実施内容>
 primary側(node1)にて実施
  umount /drbd
  drbdadm secondary r0

 元secondary側(node2)にて実施
  drbdadm primary r0
  mount /dev/drbd0 /drbd

<実施結果>
  /var/log/messagesに以下が出力
   kernel: block drbd0: role( Primary -> Secondary ) 


以上となります。
ご教授の程、宜しくお願い致します。


On Thu, 12 Jan 2012 09:01:06 +0900
Hiroshi Kuroki <hkuro****@3ware*****> wrote:

> 篠宮様
> 
> 黒木と申します。
> 
> このような場合は/var/log/messagesを調べるのが
> ファーストステップになります。messagesにDRBDがPrimaryに
> なって、Secandaryになる過程が記録されます。crm_monの
> 結果を見る限りDRBDのエラーが発生しているようですので、
> messagesからエラーの部分を抜き出してみて下さい。
> 
> 次にDRBD単体で動作確認を行なってみて下さい。
> Heartbeatを止めて、drbdadmコマンド正常に
> 切り替わるかどうか確認します。
> 
> 以上2つの確認でDRBDのエラーを見つけられると思います。
> 
> On Wed, 11 Jan 2012 21:09:07 +0900
> Hayato Shinomiya <hayat****@stars*****> wrote:
> 
> > 篠宮と申します。
> > 
> > はじめて投稿させていただきます。
> > heartbeat v3 および DRBDに関して、以下の問題で困っています。
> > 
> > <問題点>
> >  両ノードが正常に起動し、active側をシャットダウンしたところ
> >  standby側のDRBDが、slave状態のままフェイルオーバーしません。
> >  ※一瞬primaryになるのですが、slave状態になります。
> > 
> > <正常時>
> > ============
> > Last updated: Wed Jan 11 20:58:18 2012
> > Stack: Heartbeat
> > Current DC: node1 (58598433-729f-4266-9c7f-2a02e306e090) - partition with
> > quorum
> > Version: 1.0.12-unknown
> > 2 Nodes configured, unknown expected votes
> > 1 Resources configured.
> > ============
> > 
> > Online: [ node1 node2 ]
> > 
> >  Master/Slave Set: ms_drbd
> >      Masters: [ node1 ]
> >      Slaves: [ node2 ]
> > 
> > <異常時>
> > ============
> > Last updated: Wed Jan 11 20:59:41 2012
> > Stack: Heartbeat
> > Current DC: node2 (58598433-729f-4266-9c7f-2a02e306e090) - partition
> > with quorum
> > Version: 1.0.12-unknown
> > 2 Nodes configured, unknown expected votes
> > 1 Resources configured.
> > ============
> > 
> > Online: [ node2 ]
> > OFFLINE: [ node1 ]
> > 
> >  Master/Slave Set: ms_drbd
> >      Slaves: [ node2 ]
> >      Stopped: [ drbd_hadoop:1 ]
> > 
> > Failed actions:
> >     drbd_hadoop:0_promote_0 (node=node2, call=641, rc=1,
> > status=complete): unknown error
> > 
> > <環境>
> >  heartbeat-3.0.3-2.3.el5
> >  pacemaker-1.0.12-1.el5.centos
> >  drbd83-8.3.8-1.el5.centos
> >  kernel 2.6.18-238.12.1.el5 (OS:CentOS 5.7)
> >  
> > 
> > <Pacemaker設定>
> >  以下の設定は、以前メーリングリストに投稿された内容を元に
> >  設定しています。
> >  参考元:http://sourceforge.jp/projects/linux-ha/lists/archive/japan/2011-December/000996.html
> > 
> >  primitive drbd_hadoop ocf:linbit:drbd \
> >         params drbd_resource="r0" drbdconf="/etc/drbd.conf" \
> >         op monitor interval="10s" \
> >         op start interval="0s" timeout="240s" on-fail="restart" \
> >         op monitor interval="10s" role="Master" timeout="20s" on-fail="restart" \
> >         op monitor interval="20s" role="Slave" timeout="20s" on-fail="restart" \
> >         op promote interval="0s" timeout="90s" on-fail="restart" \
> >         op demote interval="0s" timeout="90s" on-fail="block" \
> >         op stop interval="0s" timeout="100s" on-fail="block"
> > ms ms_drbd drbd_hadoop \
> >         meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"
> > location l_hadoop ms_drbd \
> >         rule $id="l_hadoop-rule" $role="master" 200: #uname eq node1 \
> >         rule $id="l_hadoop-rule-0" $role="master" 100: #uname eq node2
> > property $id="cib-bootstrap-options" \
> >         dc-version="1.0.12-unknown" \
> >         cluster-infrastructure="Heartbeat" \
> >         last-lrm-refresh="1326270814" \
> >         stonith-enabled="false" \
> >         no-quorum-policy="stop" \
> >         default-action-timeout="240" \
> >         default-resource-stickiness="0" \
> >         symmetric-cluster="true" \
> >         startup-fencing="true" \
> >         stop-orphan-resources="true" \
> >         remove-after-stop="false"
> > 
> > 大変お手数ですが、どなたかご教授くださいますよう、お願い致します。
> > 
> > 以上です。
> > 
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux****@lists*****
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > 
> 
> 
> -- 
> ----------------------------------------------------------------------
> 黒木   博         (株)サードウェア
> 
> Kuroki Hiroshi   135-0034 東京都江東区永代2-31-13 ヴィラオークラ2F
> hkuro****@3ware*****         URL: http://www.3ware.co.jp/
> Phone: 03-4530-8670        Fax: 03-5809-8260

-- 

********************************
 スターシステムズ株式会社
 東京都港区南青山7-10-3
  南青山STビル5F
 篠宮 隼人
 TEL:03-5774-4086
 FAX:03-3409-3135 
 E-Mail:hayat****@stars*****
********************************





Linux-ha-japan メーリングリストの案内
Zurück zum Archiv-Index