[Anthy-dev 3747] Re: 郵便番号のデータ

Zurück zum Archiv-Index

Jun Oizumi vagus****@gmail*****
2010年 6月 3日 (木) 01:28:01 JST


大泉です。

2010/6/2 NIIBE Yutaka :
> Jun Oizumi wrote:
>> # 昨日上げた zipcode.t は「1行1エントリ」形式にしてありますが、
>
> 感想ですが、この方が(anthy の形式より)使いやすいですよね。
> Anthy 同梱のは実装のため、この形式になってるのかな。

分かりませんが、どっちの形式でも使えることを考えると、特に実装上の
理由からではなく、単に cannadic の形式に合わせただけなのかもしれません。

# Cannadic が 1行複数エントリ(読みの重複を認めない)形式になっているのは、
# 「Canna の辞書も基本的には 1行1エントリ形式だが、mkbindic すると前処理で
# sort される。それをやられると編纂時の並び順を壊されてしまうので、前処理を
# 飛ばして、直接 crxdic コマンドに渡せるよう、予め 1行複数エントリ形式にしておく」
# ということだったと思います。確か。

> これを保守するところを pkg-anthy.alioth.debian.org で作って、Debian で
> packaging するようにしたいと思います。

宜しくお願い致します。

> このデータの形式と利用方法についてですが、
>
>  (1) 形式を検討すればファイルの大きや利用の性能など改善できる。
>     しかし、これにはアクセスするライブラリなどを用意しなければいけない。
>
>  (2) 都道府県名、市町村名、... と構造を持たした方が良いかもしれない。
>
> とかなんとか、考えまして、とりあえず、現在の形式(人間が見てわかる)で packaging
> したいと思います。将来的にはアクセスライブラリがあるといいな、と。
>
> 今後、Anthy の方でこれを使うにあたっては、Anthy の利用に則して(例えば昨
> 日の圧縮方法を使うとか)フォーマットを変えて使うことにしたいと思います。

お任せ致します。




Anthy-dev メーリングリストの案内
Zurück zum Archiv-Index