[Linux-ha-jp] heartbeatのフェイルオーバー時postgres起動について

Zurück zum Archiv-Index

renay****@ybb***** renay****@ybb*****
2011年 5月 23日 (月) 10:32:52 JST


高橋さん

こんにちは、メイトリックスの山内です。

postgreSQL自体にstartがかかっている気配がないまま、リソースの移動処理(状態遷移)が終わっていますので、何かcib情報に問題があると思われます。

/var/lib/heartbeat/pengine/pe-warn-25.bz2

のファイルがあると少しわかるかも知れません。

Heartbeatバージョンが2.1.3と古めなので、状態遷移の作成にxxx_ech_db01サーバの消失(ログでいうLOST)が関連しているかも知れません。

以上、よろしく御願いいたします。


--- On Fri, 2011/5/20, takahasi hideo <hideo_tk960****@hotma*****> wrote:

>  高橋と申します。
>  
> heartbeat、DRBD、postgresqlを使用して、
> データベースクラスタサーバを構築しております
>  
> xxx_ech_db01サーバ (master)障害が発生時、
> xxx_ech_db02サーバ(slave)にフェイルオーバーを行うように設定しております。
>  
> xxx_ech_db01サーバ障害(postgresにて処理に負荷が発生し、postgresのサービスが異常終了)が発生した時に、
> xxx_ech_db02サーバにフェイルオーバーされていたのですが(masterにはなっており、mountもされていました)
> がpostgresのサービスが起動しておりませんでした。
> 
> サーバ構成は以下になります。
> 2台とも同じものとなっております
> OS RedHat ES4.0 
> 
> ◆カーネルバージョン:
> Linux 2.6.9-67.ELsmp #1 SMP Wed Nov 7 13:56:44 EST 2007 x86_64 x86_64 x86_64 GNU/Linux
> heartbest 2.1.3
> DRBD 0.7.2
> postgres8.2.3
>  
> 前々回にもxxx_ech_db01サーバに障害(postgresにて処理に負荷が発生し、postgresのサービスが異常終了)が発生した時は、
> xxx_ech_db02サーバにフェイルオーバーが、
> 実行され、postgresのサービスも正常に起動しておりました。
>  
> syslogを確認いたしましたところ、
> 前々回は以下のログが出力されておりましたが、
> 今回のログには出力されておりませんでした。
>  
> tengine: [5011]: info: send_rsc_command: Initiating action 34: start pgsql0_start_0 on ech-db02
> crmd: [18567]: info: do_lrm_rsc_op: Performing op=pgsql0_start_0 key=34:0:0:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)
> lrmd: [18564]: info: rsc:pgsql0: start
>  
> 原因が分からず困っております。
> ほかに必要な情報はございますでしょうか?
>  
> cib.xmlのファイル設定は以下となります。
> <cib generated="true" admin_epoch="0" have_quorum="true" ignore_dtd="false" num_peers="2" cib_feature_revision="2.0" crm_feature_set="2.0" epoch="106" num_updates="3" cib-last-written="Fri Mar 18 04:25:44 2011" ccm_transition="2" dc_uuid="xxxxxx-fb58-4b77-8755-aee23da6a63d">
>    <configuration>
>      <crm_config>
>        <cluster_property_set id="cib-bootstrap-options">
>          <attributes>
>            <nvpair id="cib-bootstrap-options-dc-version" name="dc-version" value="2.1.4-fb84f606a422 tip"/>
>          </attributes>
>        </cluster_property_set>
>        <cluster_property_set id="default_cluster_properties" score="10">
>          <attributes>
>            <nvpair id="default-sticky" name="default_resource_stickiness" value="INFINITY"/>
>          </attributes>
>        </cluster_property_set>
>      </crm_config>
>      <nodes>
>        <node id="XXXXXXXX-ff8a-429a-81c2-db36ebb522e7" uname="xxx-ech-db01" type="normal"/>
>        <node id="XXXXXXXX-fb58-4b77-8755-aee23da6a63d" uname="xxx-ech-db02" type="normal"/>
>      </nodes>
>      <resources>
>        <master_slave id="ms-drbd0">
>          <meta_attributes id="ma-ms-drbd0">
>            <attributes>
>              <nvpair id="ma-ms-drbd0-1" name="clone_max" value="2"/>
>              <nvpair id="ma-ms-drbd0-2" name="clone_node_max" value="1"/>
>              <nvpair id="ma-ms-drbd0-3" name="master_max" value="1"/>
>              <nvpair id="ma-ms-drbd0-4" name="master_node_max" value="1"/>
>              <nvpair id="ma-ms-drbd0-5" name="notify" value="yes"/>
>              <nvpair id="ma-ms-drbd0-6" name="globally_unique" value="false"/>
>            </attributes>
>          </meta_attributes>
>          <primitive id="drbd0" class="ocf" provider="heartbeat" type="drbd">
>            <instance_attributes id="ia-drbd0">
>              <attributes>
>                <nvpair id="ia-drbd0-1" name="drbd_resource" value="drbd0"/>
>              </attributes>
>            </instance_attributes>
>          </primitive>
>        </master_slave>
>        <group id="postDb">
>          <primitive class="ocf" provider="heartbeat" type="IPaddr" id="iPaddr">
>            <instance_attributes id="ia_ipaddr">
>              <attributes>
>                <nvpair id="ia_ipaddr" name="ip" value="192.168.XX.XXX"/>
>              </attributes>
>            </instance_attributes>
>          </primitive>
>          <primitive class="ocf" provider="heartbeat" type="Filesystem" id="fs0">
>            <meta_attributes id="ma-fs0">
>              <attributes/>
>            </meta_attributes>
>            <instance_attributes id="ia-fs0">
>              <attributes>
>                <nvpair id="ia-fs0-1" name="fstype" value="ext3"/>
>                <nvpair id="ia-fs0-2" name="directory" value="/data"/>
>                <nvpair id="ia-fs0-3" name="device" value="/dev/drbd0"/>
>              </attributes>
>            </instance_attributes>
>          </primitive>
>          <primitive class="ocf" provider="heartbeat" type="pgsql" id="pgsql0">
>            <instance_attributes id="ia-pgsql0">
>              <attributes>
>                <nvpair id="ia-pgsql0-1" name="pgctl" value="/usr/local/pgsql/bin/pg_ctl"/>
>                <nvpair id="ia-pgsql0-2" name="psql" value="/usr/local/pgsql/bin/psql"/>
>                <nvpair id="ia-pgsql0-3" name="pgdata" value="/data/pgsql/data/"/>
>                <nvpair id="ia-pgsql0-4" name="pgdba" value="postgres"/>
>                <nvpair id="ia-pgsql0-6" name="logfile" value="/var/log/postgresql/postgresql_log"/>
>              </attributes>
>            </instance_attributes>
>            <operations>
>              <op id="apPostgreSQLDB_start" name="start" timeout="60s" on_fail="fence"/>
>              <op id="apPostgreSQLDB_monitor" name="monitor" interval="30s" timeout="60s" on_fail="fence"/>
>              <op id="apPostgreSQLDB_stop" name="stop" timeout="60s" on_fail="fence"/>
>            </operations>
>          </primitive>
>        </group>
>      </resources>
>      <constraints>
>        <rsc_location id="rsc_location_group_1" rsc="ms-drbd0">
>          <rule id="prefered_location_group_1" role="Master" score="100">
>            <expression id="prefered_location_group_1_expr" attribute="#uname" operation="eq" value="xxx-ECH-DB01"/>
>          </rule>
>        </rsc_location>
>        <rsc_order id="drbd0_before_fs0" from="postDb" action="start" to="ms-drbd0" to_action="promote"/>
>        <rsc_colocation id="fs0_on_drbd0" to="ms-drbd0" to_role="Master" from="postDb" score="infinity"/>
>      </constraints>
>    </configuration>
>  </cib>
>  
> 以上 よろしくお願いします。
> 
>   
> 
>  		 	   		  





Linux-ha-japan メーリングリストの案内
Zurück zum Archiv-Index