Takashi Nakamoto
blued****@openo*****
2006年 12月 7日 (木) 02:39:42 JST
中本@scim-anthyの改造計画進行中です。 Yusuke TABATA <yusuk****@w5*****> wrote: > 田畑です。 > > Takashi Nakamoto wrote: > > 今のところ個人辞書の各エントリは > > (品詞)*(頻度) (単語) > > となっていますが、これにカテゴリを導入して > > (品詞)*(頻度)*(カテゴリ) (単語) > > という形にしてみたらどうでしょう。 > > > 一番やりたいことは、個人辞書の管理をするときにカテゴリごとに削除したり > > 追加したり、あるいはアップデートできるようにすることです。 > anthy側でやることもできるとは思うんですが、辞書ツール側で対応した > 方が良いんじゃないかなと思ったりもします。 > anthyはなるべくシンプルかつ高速、省メモリであることが望まれるので、 > そのレイヤーで持つ機能は最小限に抑え、その代わり、辞書ツールが他の > 属性も含めたrichな情報を持ち、ユーザの希望によって調合された辞書を > anthyに登録するといったモデルの方が良いと思うのですが、 > いかがでしょうか? そういう方向性には大賛成です。 ただ、ここでいう(カテゴリ)は、さまざまな属性を表すhash値だと思えば高速、 省メモリの特徴をキープしたまま、ちょっとした機能アップが計れそうな気が しています。ユーザの希望を調合した結果を頻度や品詞ではなく、カテゴリと してまとめておくと変換のしかたに幅を持たせられないでしょうか。 例えば、MS-IMEにある変換モード「人名/地名」のようにしたいときには、 (たぶん)Anthyでは人名と地名の頻度が高い辞書に切り替えることによって実 現できると思いますが、カテゴリを使えば辞書を切り替えずに(メモリ上の頻 度をいじることで)できるようになると。(私の勝手な推測であることに注意) カテゴリという言い方が悪いかもしれませんが、単なる単語の分野別の分類で はなく、その単語にある様々な属性を一意に特定するためのものだと考えたら どうでしょう。 また、個人辞書管理ツール側ではもっと豊富な情報をもっておくようにするこ とを考えています。例えば、「このカテゴリの単語は http://hogehoge にある 辞書と同期する。」とか。 ダメかな。。。 ちなみに、「個人辞書でカテゴリ単位でアップデートするなど」という理由に ついては、個人辞書管理ツール側がさぼりたいだけです。ただ、やっぱりそれ が一番の理由 orz -- 中本 崇志 (Takashi Nakamoto) E-mail: blued****@bpost***** Blog: http://bd.tank.jp/diary/