[Anthy-dev 3802] Re: feature/alt-depgraph-new: mkdepword

Zurück zum Archiv-Index

Jun Oizumi vagus****@gmail*****
2010年 6月 24日 (木) 20:09:01 JST


大泉です。

突っ込んだところまで見て頂き、ありがとうございます。

2010/6/24 NIIBE Yutaka :
> それで、この形を生成してみようと思ったら、feature/alt-depgraph-new で
>
>        @「よ」終助 "よ" @_引用(共通)
>        @_引用(共通) "" @「って」終助(引用)
>        @「って」終助(引用) "って" @「よ」終助
>
> とノード遷移のループがあることを発見しました。
>
> これは意図的な記述でしょうか?

はい。

初めは、ループを根絶しようと思ったのですが、やってみたら「実質的に不可能」と
悟りました。やろうと思えば不可能ではないと思いますが、そうすると保守できない
くらいには煩雑になります。
なので、「たくさん枝が分岐して処理が重くなるようなループ」だけを回避することに
して、根絶は諦めました。

ちなみに、この種のループは(連文節変換系の)どの IME にもある程度はあるようです。
「していていていて…」とか「してくれていてくれていて…」等を変換してみると、
大抵の IME は1文節になると思います。
全部を試したわけではないですが、MS-IME(XP に入ってたもの)、ことえり、
Google IME はそうでした。

# ただし、現行 anthy ではあまり「…いていていて…」を繰り返さない方がいいです。
# 4つくらいから始めて、一つずつ増やす感じで。
## alt-depgraph では一応、この問題を回避したつもりです。

# 「付属語ツリー」と言わずに、「付属語グラフ」というのは、このループがあるからかと
# 素人考えで思ったり。




Anthy-dev メーリングリストの案内
Zurück zum Archiv-Index