NAKAHIRA Kazutomo
nakahira_kazutomo_b1****@lab*****
2014年 1月 16日 (木) 10:03:27 JST
TO:コヤマさん 中平と申します。 > corosync-cfgtool -s した時の ノードIDは -1062731513 なのに、 > corosync-quorumtool -l した時のノードIDが 3232235783 になっていることです。 > 本家のマニュアルでは、この値は各ホストごとに、同じ値になっていましたが、自分の環境では異なる値が出ている点です。 > これが、設定ミスによるものなのか、それともパッケージに問題があるのかが判断できないでおります。 unsigned longの 3232235783 = longの -1062731513 ですので、 corosyncが保持するノードIDの値は同じだが、表示するコマンドに よってノードIDを扱う変数型が異なっており、上記のような違いが 生じているものと考えられます。 これは設定ミス等ではなく、単にコマンドの表示の問題で、 クラスタの動作にはとくに影響はないかと思います。 (2014/01/16 9:31), renay****@ybb***** wrote: > コヤマさん > > こんにちは、山内です。 > >>> ご指摘の通りcorosync環境(及び、Heartbeatのv2モード以降)では、シリアルポートでのHA通信は利用できません。 >>> >>> インターコネクト回線は専用でも併用でも個人的には回線の負荷状況によりますが、利用可能だと思っています。 >> >> やはり、シリアルポート経由ではインターコネクト回線はできないのですね。 >> LANポート利用でも併用されておられるということなので、私もそうしたいと思います。 >> >> corosync-2.3.1 >> pacemaker-1.1.10 >> >> host1 host2 >> eth0(192.168.1.7) --- eth0(192.168.1.254) >> >> ===== coronosync.conf ============ >> totem { >> version: 2 >> crypto_cipher: none >> crypto_hash: none >> secauth: off >> interface { >> ringnumber: 0 >> bindnetaddr: 192.168.1.0 >> mcastaddr: 239.255.1.1 >> mcastport: 5405 >> ttl: 1 >> } >> } >> >> logging { >> fileline: off >> to_stderr: no >> to_logfile: yes >> logfile: /var/log/cluster/corosync.log >> to_syslog: yes >> debug: off >> timestamp: on >> logger_subsys { >> subsys: QUORUM >> debug: off >> } >> } >> >> >> quorum { >> provider: corosync_votequorum >> expected_votes: 2 >> } >> >> ==================================== >> >> 上記構成で試した所、ちょっとしたトラブルに見舞われています。 >> >> >> # corosync-cfgtool -s >> Printing ring status. >> Local node ID -1062731513 >> RING ID 0 >> id = 192.168.1.7 >> status = ring 0 active with no faults >> duo:/etc/corosync # >> >> >> >> # corosync-quorumtool -l >> >> Membership information >> ---------------------- >> Nodeid Votes Name >> 3232235783 1 host1.private.com (local) >> 3232236030 1 host2.private.com >> (ホスト名は、書き換えてあります) >> >> # corosync-cmapctl | grep members >> runtime.totem.pg.mrp.srp.members.3232235783.config_version (u64) = 0 >> runtime.totem.pg.mrp.srp.members.3232235783.ip (str) = r(0) ip(192.168.1.7) >> runtime.totem.pg.mrp.srp.members.3232235783.join_count (u32) = 1 >> runtime.totem.pg.mrp.srp.members.3232235783.status (str) = joined >> runtime.totem.pg.mrp.srp.members.3232236030.config_version (u64) = 0 >> runtime.totem.pg.mrp.srp.members.3232236030.ip (str) = r(0) ip(192.168.1.254) >> runtime.totem.pg.mrp.srp.members.3232236030.join_count (u32) = 1 >> runtime.totem.pg.mrp.srp.members.3232236030.status (str) = joined >> >> ここで問題なのが、 >> >> corosync-cfgtool -s した時の ノードIDは -1062731513 なのに、 >> corosync-quorumtool -l した時のノードIDが 3232235783 になっていることです。 >> 本家のマニュアルでは、この値は各ホストごとに、同じ値になっていましたが、自分の環境では異なる値が出ている点です。 >> これが、設定ミスによるものなのか、それともパッケージに問題があるのかが判断できないでおります。 > > 私の方でも動作環境(corosync2.3.2+PM1.1.11)で確認してみましたが、このIDの相違には問題ないようです。 > #私も、ID値の相違については、気にしていませんでした・・・ > #気になるようでしたら、確認はしてみますが・・・ > >> # crm_mon -1 >> Last updated: Thu Jan 16 00:18:49 2014 >> Last change: Thu Jan 16 00:11:29 2014 by hacluster via crmd on host1.private.com >> Stack: corosync >> Current DC: host1.private.com (3232235783) - partition with quorum >> Version: 1.1.10-1.2-d9bb763 >> 2 Nodes configured >> 0 Resources configured >> >> Online: [ host1.private.com host2.private.com ] >> >> >> crm_mon を見る限り、同期がとれていますし、 >> crm configure property no-quorum-policy=ignore などのセットアップをActiveで行うと、 >> ちゃんと、standbyの方で反映されています。 >> >> >> もうひとつの問題は、systemctl stop pacemaker.service や systemctl stop corosync.service >> した際に、素直に停止できず、30分~1時間ほどハングアップしてしまう点です。 >> これが、systemdによる不具合なのか、pacemakerやcorosyncのパッケージ問題なのかが判断できていません。 > > 実際に事象が起きた、OSのバージョンや動作環境(仮想?実?)はどうなっていますでしょうか? > > > 以上、宜しくお願いいたします。 > > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan > -- NTTデータ先端技術株式会社 中平 和友 TEL: 03-5860-5135 FAX: 03-5463-6490 Mail: nakahira_kazutomo_b1****@lab*****