[Anthy-dev 3406] Re: wikiのコーパス用例文収集

Zurück zum Archiv-Index

NOKUBI Takatsugu knok****@daion*****
2007年 3月 6日 (火) 08:16:36 JST


At Mon, 05 Mar 2007 20:27:28 +0900,
Yusuke TABATA wrote:
> 今のところ、IRCで周囲の人の発言の名詞を変えたり、コードのコメントを
> ついでに転記したりしてますが、確かに色々な所から取ってくる手法を
> 考えたいものですね。

  私も、日本語シソーラスを自動生成したり、大量の例文からSKK辞書に品詞
を自動割り当てしたい、などとという野望があって、そのためにさまざまなと
ころからテキストをとってくる方法としてPlaggerを使おうと思っています。
http://plagger.org/

  以前はWebクローラのWIREを使ってやろうと思い、SWIGによるbindingを作っ
ていろいろ試していたのですが、コーパスやシソーラスなど、信頼できるテキ
ストにしぼって集めるのであればPlaggerの方がいいだろうと今は思っていま
す。
http://www.daionet.gr.jp/~knok/trac/trac.cgi/wiki/Wire-Swig
-- 
野首 貴嗣
E-mail: knok****@daion*****
	knok****@namaz***** / knok****@debia*****




Anthy-dev メーリングリストの案内
Zurück zum Archiv-Index