Yusuke TABATA
yusuk****@w5*****
2006年 11月 23日 (木) 10:36:25 JST
田畑です。 Hideyuki SHIRAI (白井秀行) wrote: > ところが 8317 を使っていると、まれに「出てこない漢字」があるのに > 気付きました。 > > たとえば、"iku" => "行く" です。 指摘ありがとうございます。 anthyでは候補を生成する時に候補の形式にスコアを付けて、 そのスコアが低いもの(今は最高スコアの1/3)から候補を 生成しないという処理をします。 「いく」であれば *名詞「異口」 *単漢字「育」 *動詞「行く」 *形容詞「良く」 *接頭辞+名詞「異区」 のようなパターンがあって、この中で使いそうな構造の 順に並べて低いものを使わないようにします。 問題は *"行く"の構造のスコアが低いこと *使いそうなのに閾値を越えてないこと とりあえず、anthy-8322では閾値を下げるという安易な対処を して逃げました。スコアがまともになるようにする方法は 今から検討させてください。 -- -- CHAOS AND CHANCE! Yusuke TABATA