Jun Oizumi
vagus****@gmail*****
2010年 6月 3日 (木) 01:28:01 JST
大泉です。 2010/6/2 NIIBE Yutaka : > Jun Oizumi wrote: >> # 昨日上げた zipcode.t は「1行1エントリ」形式にしてありますが、 > > 感想ですが、この方が(anthy の形式より)使いやすいですよね。 > Anthy 同梱のは実装のため、この形式になってるのかな。 分かりませんが、どっちの形式でも使えることを考えると、特に実装上の 理由からではなく、単に cannadic の形式に合わせただけなのかもしれません。 # Cannadic が 1行複数エントリ(読みの重複を認めない)形式になっているのは、 # 「Canna の辞書も基本的には 1行1エントリ形式だが、mkbindic すると前処理で # sort される。それをやられると編纂時の並び順を壊されてしまうので、前処理を # 飛ばして、直接 crxdic コマンドに渡せるよう、予め 1行複数エントリ形式にしておく」 # ということだったと思います。確か。 > これを保守するところを pkg-anthy.alioth.debian.org で作って、Debian で > packaging するようにしたいと思います。 宜しくお願い致します。 > このデータの形式と利用方法についてですが、 > > (1) 形式を検討すればファイルの大きや利用の性能など改善できる。 > しかし、これにはアクセスするライブラリなどを用意しなければいけない。 > > (2) 都道府県名、市町村名、... と構造を持たした方が良いかもしれない。 > > とかなんとか、考えまして、とりあえず、現在の形式(人間が見てわかる)で packaging > したいと思います。将来的にはアクセスライブラリがあるといいな、と。 > > 今後、Anthy の方でこれを使うにあたっては、Anthy の利用に則して(例えば昨 > 日の圧縮方法を使うとか)フォーマットを変えて使うことにしたいと思います。 お任せ致します。