[morogram-users] Re: 1000字あたりの使用頻度の実装化

Zurück zum Archiv-Index

Shigeki Moro s-mor****@hanaz*****
2003年 10月 25日 (土) 08:23:28 JST


もろです。

On Sat, 25 Oct 2003 00:23:08 +0900
Yoichiro AKIYAMA <akiya****@karit*****> san wrote:

> > フランス語ですがNグラムと統計モデルを使って言語の分析をしている人
> > (院生)に協力をお願いしたところOKをもらえたのが収穫でした。
> 
>  これは興味深いですね。
> 
>  我ながら不明にも表音文字文化圏の言語は形態素解析の方が有利だと
>  思い込んでいただけに、フランス語で N-gram というのはちょっと
>  驚きました。

Nグラムは別に文字に限定してないので(morogram は文字に限定してま
すが (^_^;;)、フランス語でNグラムって言ったら、普通(彼も)単語
ごとですね。単語の前後の共起関係です。

今、Webから消えたような気がする藤原ngramは、単語単位のNグラムが
できたと思います。

Shigeki Moro

Hanazono University
s-mor****@hanaz*****
http://www.ya.sakura.ne.jp/~moro/

/bb|[^b]{2}/ that is the question.





morogram-users メーリングリストの案内
Zurück zum Archiv-Index