[Anthy-dev 3251] Re: anthy-dic-toolと文字エンコーディング

Zurück zum Archiv-Index

Jun Oizumi vagus****@gmail*****
2006年 11月 29日 (水) 10:25:12 JST


大泉です。

横レスすみません。

> > それと、file_dicについてですが、手元にあるanthy-8322のanthy.dicを見ると
> > 12MBなので、UTF-8にするとだいたい18MBになるのでしょうけれど、そうすると
> > やっぱりパフォーマンスに大きく影響するんでしょうか。私の感覚ではそんなも
> > んか、という感じなのですが。
> パフォーマンスは変わらないと思いますが、そんだけ容量が大きくなると
> すると言い訳か工夫を考えてからやるべきかなと検討しています。
> 軽い圧縮をかけるのと、両方のエンコーディングを
> 1ファイルにいれるのを案として検討しています。

共有辞書の UTF-8 化を心待ちにしております。

alt-cannadic ではメンテ用の方の hold ディレクトリの中に hold-gt-tankanji-hikanji
というファイルがあり、これには euc-jp にない記号類(いわゆる機種依存文字?)が
まとめてあり、anthy の共有辞書が UTF-8 化されるのを待っています。
また、jis 第3第4水準の単漢字辞書も8割方できあがっています。
(まだ 200 語ほど漢和辞典を引かなければならないのが残っていますが)。

「表示できるのに入力できない」という中途半端な状態に終止符を。
# できれば vista が出る前に :-p



Anthy-dev メーリングリストの案内
Zurück zum Archiv-Index