[Linux-ha-jp] Re: 2月20日リリースのPostgreSQL9.xでの挙動の変化について

Zurück zum Archiv-Index

kazuh****@goo***** kazuh****@goo*****
2014年 2月 27日 (木) 15:02:15 JST


松島さん

ひがしです。お世話になっております。

私の環境で、PostgreSQL単体で再現しました。
PostgreSQL単体でも再現したことから、おそらくPostgreSQLのバグではないかと
思います。


以下手順でPostgreSQLをリカバリモード起動→promote→immediate停止を繰り返すと
松嶋さん環境と同様の事象(PostgreSQLが起動しない)が発生しました。

  $ vim /var/lib/pgsql/9.3/data/recovery.conf →手動でリカバリモードに
  $ pg_ctl start     →リカバリモードで起動
  $ pg_ctl promote   →Masterに昇格
  $ pg_ctl stop -m i →immediateで停止
  $ mv recovery.done recovery.conf → 再び手動でリカバリモードに
  $ pg_ctl start →起動しない場合あり!!

起動しない場合は、psqlで接続しようとすると以下のようなメッセージでエラーになります。
psql: FATAL:  the database system is starting up
いつまで待ってもこの状態が続きます。

ただし、必ず再現するわけではなく、正常に起動する場合もありました。
(何回も繰り返しているうちに今現在は再現しなくなってしまいました。
debugログを取りたかったのですが・・・)


PostgreSQLの観点から調査したいので、もし、可能でしたら、PostgreSQLのログレベルを
debug5にして再現させていただけないでしょうか?
(log_min_messagesをdebug5に設定しPostgreSQL再起動)



なお、推測ですが、immediateによるPG停止後に発生するようなので、
pgsql RAのstop_escalateを10など、1以上の値にしimmediateでの停止を避けると、
暫定的に回避できるかもしれません。
(immediateによる停止の前にfastによる停止をし、stop_escalate秒
待つようになります。)

またはPostgreSQL9.2系をご使用いただくのも手かと思います。


今後も調査を続けますが、現時点では以上です。
よろしくお願いいたします。


2014/02/27 (Thu) 10:41, "Takehiro Matsushima" <takeh****@gmail*****> wrote:
> 松島です。更に連投申し訳ございません。
> 
> 早とちりだったようです。
> Pacemaker stopかstartかは無関係でした。
> コミュニティ版を使ってinitdbしたらその後は発生しません。
> 
> Nightly(2月20日版)のPacemaker+Corosyncを使うとその後から動かなくなりました。
> コミュニティ版に戻しても、initdbして作りなおさないと動きませんでした。
> 
> resource-agentsだけはNightlyを共通して使っていますので、RAのせいではないと思いますが...
> 
> #本番環境にはコミュニティ版を使用していくつもりではいます。
> 
> 
> 2014年2月27日 7:45 Takehiro Matsushima <takeh****@gmail*****>:
> > お世話になっております、松島です。
> > 連投申し訳ございません。
> >
> > 更に追試しました。
> > Nightly版からコミュニティ版に変更しても現象に変化はありませんでした。
> > 以下コミュニティ版で、かつ単一ノードのみを使って実験しています。
> >
> > 1. Pacemaker stopの状態で...
> > 1.1. PostgreSQL9.3.3でinitdbしてバックアップしていたデータを注入(150MBくらいのSQL)
> > 1.2. Pacemaker start/stopを繰り返す
> > 1.3. 現象の再現
> >
> > 2. Pacemaker startの状態で...
> > 2.1. (1.1.)と同じ作業
> > 2.2. (1.2.)と同じ作業
> > 2.3. 現象再現せず
> > 2.4. 2ノード構成でフェイルオーバー→完全停止→1ノード運転→2ノード運転を繰り返す
> > 2.4. 現象再現せず
> >
> > という結果となりました。
> > 取り急ぎ報告とさせていただきます。
> >
> > --
> > Regards,
> > Takehiro Matsushima
> 
> 
> 
> -- 
> Regards,
> Takehiro Matsushima
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> 





Linux-ha-japan メーリングリストの案内
Zurück zum Archiv-Index