cannadic を拡充した"かな漢字変換辞書"です。
* 新語追加&誤登録修正(G-HAL さん、2ch)
* gtankan.ctd: 頻度付け直し
これまでは「教育漢字の何年生で習う漢字か」「常用漢字か」等で頻度を
つけており、読みは考慮していなかったが、読みを考慮するようにし、全体
的に名詞とそれほど変わらない値にまで上げてみた。
これまでは頻度が小さすぎて、たとえば「にゅう」で「入」や「乳」より、
「丹生」(地名)が先に出てたりしたので。
* 本家 Anthy はもうリリースされないようなので、それの対応。
* sample/: 廃止
* anthy/ : 新規作成
- anthy/mkworddic/compound.t, extra.t:
extra.t にあった複合語形式のものを compound.t に移動。
compound.t の誤登録修正(全部直したわけではない。まだたくさん残
ってる)
- anthy/mkworddic/dict.args.in:
anthy 同梱の古い alt-cannadic ではなく、このパッケージの辞書を
使うようにした。
compound.t, extra.t もこのパッケージのものを使用。
- anthy/calctrans/corpus_info, weak_words:
このパッケージの辞書を使って更新した corpus パラメータ。
(update_params0; update_params; update_params2×3)
* prepare.sh: 新規作成
このパッケージの辞書を使って anthy をビルドするための準備をする
スクリプト。
単に、dict.args.in, corpus_info, weak_words を本家のと入れ替え
てるだけ。
Canna : 246,385
Anthy all : 266,966
(main) : 240,729
(extra) : 26,237