Jun Oizumi
vagus****@gmail*****
2007年 3月 15日 (木) 01:38:31 JST
大泉です。 早速の対応、ありがとうございます。 > なんか一気に配布物が巨大化してますが、 gcanna.ctd, gcannaf.ctd, gtankan.ctd の 3つだけを置き換えて頂ければよかったんですが (^^; 他のはメンテ用なので。すみません、説明不足でした。 > いくつか性能が落ちる理由があるにも関わらず、まずまずの性能で > チューニングのベースとしては良い感じだと思います。 とは言え、今のところやはり人柱用ですね。 とりあえずこれを使って(内海さんの wikicanna も参考にしながら)、Yahoo! の hit 数では おかしいところを修正していきます。 > > # 8706 で試してみたところでは、これまで誤変換を避けるために個別に頻度を > > # 調節していたものがぶっ飛んだ分、むしろちょっと悪くなったかな、という感じ > > # でした。 > タテマエ論からすると、小細工をしなくて良くなるのが良いアルゴリズムなんで、 > 変換エンジン開発者がなんとかすべきと思います。 > 新たな小細工を積み込む余地を作り出すためにはどんどん良い > アルゴリズムを模索し、古い小細工を消していくというのが健全と > 考えてます。 頼もしいです :-) こちらはこちらで、変換エンジンが正しい変換を行うのに必要な情報が辞書にない、という のを以前から感じており、いずれもっと情報を加えていきたいと思っています。 さしあたり、自動詞/他動詞くらいの情報は入れたいなぁ、と。 まだアイデアのレベルですが(もっと言うと、品詞コードを一から定義し直したいんですが)。