坂井田保彦
yasuh****@gmail*****
2008年 2月 26日 (火) 17:53:26 JST
坂井田と申します。 ご存じの方がいらっしゃいましたら、2つほど教えていただけないでしょうか? (1)リソース起動用スクリプトが起動しない場合の条件について heartbeatは管理下のリソースを起動させるために/etc/ha.d/resource.d/、/etc/init.d/の 起動スクリプトを実行させようとすると思いますが、実行しない場合があり困っています。 実行するための条件というものがあるのでしょうか? 具体的にはpostgreSQL 8.2.6のスクリプトが起動しません。 このスクリプトはソースからpostgreSQLを入れたときに cp /usr/local/src/postgresql-8.2.6/contrib/start-scripts/linux /etc/rc.d/init.d/postgresql として、コピーしたものです。 スクリプトはそれ単体で起動することを確認しています。 /etc/init.d/postgresql start と入力した場合には起動します。 また、何かの理由でPIDファイルが残っていてpostgresが起動しない、というわけではありませんでした。 (2)リソースを終了させられない場合の挙動について 文末の2つのログについて教えていただけないでしょうか。 heartbeatの管理リソースとしてpostgreSQLを起動しています。 ログはResourceManagerがpostgreSQLプロセスを終了させられないためにheartbeatが異常終了している、ということだと思いますが heartbeatがOSをリブートさせる場合と、させない場合があります。どのような違いでこういう動作をするのでしょうか? この現象は 1.heartbeatが起動中に手動でpostgresqlサービスをストップ。 2.heartbeatを手動でストップさせる。 3.heartbeatは管理リソースであるpostgresqlをストップさせようとさせる。 4.しかし、すでにpostgresqlはストップしているため終了させられない。 という場合に起こるようです。 ■OSリブートする場合 ResourceManager[6477]: 2008/02/24_04:11:10 info: Releasing resource group: node1 drbddisk Filesystem::/dev/drbd0::/data::ext3 192.168.1.1/24 postgresql ResourceManager[6477]: 2008/02/24_04:11:10 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:12:12 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:12:13 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:12:13 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:13:15 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:13:16 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:13:16 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:14:17 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:14:18 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:14:18 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:15:20 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:15:21 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:15:21 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:16:22 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:16:23 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:16:23 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:17:25 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:17:26 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:17:26 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:18:28 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:18:29 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:18:29 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:19:30 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:19:32 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:19:32 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:20:33 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:20:35 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:20:35 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:21:37 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:21:38 info: Retrying failed stop operation [postgresql] ResourceManager[6477]: 2008/02/24_04:21:38 info: Running /etc/init.d/postgresql stop ResourceManager[6477]: 2008/02/24_04:22:40 ERROR: Return code 1 from /etc/init.d/postgresql ResourceManager[6477]: 2008/02/24_04:22:40 CRIT: Resource STOP failure. Reboot required! ResourceManager[6477]: 2008/02/24_04:22:40 CRIT: Killing heartbeat ungracefully! ■OSリブートしない場合 ResourceManager[7265]: 2008/02/23_23:00:22 info: Releasing resource group: node1 drbddisk Filesystem::/dev/drbd0::/data::ext3 192.168.1.1/24 postgresql ResourceManager[7265]: 2008/02/23_23:00:23 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:23 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:25 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:25 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:25 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:26 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:26 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:27 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:28 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:28 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:29 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:30 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:30 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:30 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:32 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:32 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:32 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:33 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:33 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:35 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:36 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:36 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:36 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:37 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:37 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:38 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:39 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:39 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:40 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:41 info: Retrying failed stop operation [postgresql] ResourceManager[7265]: 2008/02/23_23:00:41 info: Running /etc/ha.d/resource.d/postgresql stop ResourceManager[7265]: 2008/02/23_23:00:41 ERROR: Return code 1 from /etc/ha.d/resource.d/postgresql ResourceManager[7265]: 2008/02/23_23:00:42 ERROR: Resource script for postgresql probably not LSB-compliant. ResourceManager[7265]: 2008/02/23_23:00:42 WARN: it (postgresql) MUST succeed on a stop when already stopped ResourceManager[7265]: 2008/02/23_23:00:42 WARN: Machine reboot narrowly avoided! 以上、宜しくお願い致します。