AKIBA Makoto
akiba****@acroq*****
2016年 9月 21日 (水) 16:41:34 JST
お世話になっております。 秋葉と申します。よろしくお願い致します。 現在、pacemaker + corosync のクラスタ上で PostgreSQL を 動作させているデータベースサーバがあるのですが、 稼働中にOSのメモリ使用量が増加し続ける問題が起きています。 原因を把握したいのですが、何か該当する現象や確認ポイント などありますでしょうか? 環境は以下のようになっております。 OS: CentOS Linux release 7.2.1511 (Core) kernel - 3.10.0-327.18.2.el7 glibc - 2.17-106.el7_2.6 Systemd: 219-19.el7_2.9 / 219-19.el7_2.12 (※) Pacemaker: 1.1.13-10.el7_2.2 Corosync: 2.3.4-7.el7_2.1 PostgreSQL: 9.4.8-1PGDG.rhel7 (※)systemdのバージョンはどちらでも発生しました 2台のサーバでHotStandby構成にしてPostgreSQLを運用しています。 (両サーバでPostgreSQLが起動し、hot-standby構成にしている) Active側にVIPを割り当てるようにして、アプリケーションからは VIPに接続するようにしています。 これまでに観察して見えているのは以下の事象になります。 (1) OS起動しクラスタ状態を正常にした状態で、少しずつ OSの空きメモリ量(free+buffer+cache)が減少し続ける。 →1日あたり30〜100MB程度ずつ減少する ※DBサーバ自体は4GBメモリを搭載 ※VIPがある/なしに関わらず減少傾向にある。 (2) メモリ使用量が大きいプロセスを確認すると、PID=1の systemd プロセスで、数十秒ごとに4〜8KB程度増加する。 (3) 契機は不明だが、時折数十〜数百MB程度空き容量が増える (回復する)ことがある。 (長期的に見てトータルでは減少し続ける) (4) pacemaker + corosyncを使わず、1台のみで動作させている 開発サーバでは(1)〜(2)のようなメモリ使用量の増減が 発生していないように見える。 →この点があり、何か手がかりが無いかと考え、 こちらのMLに質問をポストさせていただきました。 長文にて恐縮ですが、情報等いただけましたら幸いです。 よろしくお願い致します。 ---------------- AKIBA Makoto akiba****@acroq*****