[Anthy-dev 3433] Re: 田畑さんの予想を gcanna.ctd に適用してみました

Zurück zum Archiv-Index

Jun Oizumi vagus****@gmail*****
2007年 3月 15日 (木) 01:38:31 JST


大泉です。

早速の対応、ありがとうございます。

> なんか一気に配布物が巨大化してますが、
gcanna.ctd, gcannaf.ctd, gtankan.ctd の 3つだけを置き換えて頂ければよかったんですが (^^;
他のはメンテ用なので。すみません、説明不足でした。

> いくつか性能が落ちる理由があるにも関わらず、まずまずの性能で
> チューニングのベースとしては良い感じだと思います。
とは言え、今のところやはり人柱用ですね。

とりあえずこれを使って(内海さんの wikicanna も参考にしながら)、Yahoo! の hit 数では
おかしいところを修正していきます。

> > # 8706 で試してみたところでは、これまで誤変換を避けるために個別に頻度を
> > # 調節していたものがぶっ飛んだ分、むしろちょっと悪くなったかな、という感じ
> > # でした。
> タテマエ論からすると、小細工をしなくて良くなるのが良いアルゴリズムなんで、
> 変換エンジン開発者がなんとかすべきと思います。
> 新たな小細工を積み込む余地を作り出すためにはどんどん良い
> アルゴリズムを模索し、古い小細工を消していくというのが健全と
> 考えてます。

頼もしいです :-)
こちらはこちらで、変換エンジンが正しい変換を行うのに必要な情報が辞書にない、という
のを以前から感じており、いずれもっと情報を加えていきたいと思っています。
さしあたり、自動詞/他動詞くらいの情報は入れたいなぁ、と。
まだアイデアのレベルですが(もっと言うと、品詞コードを一から定義し直したいんですが)。



Anthy-dev メーリングリストの案内
Zurück zum Archiv-Index