[morogram-users] Fw: N-gramツール(morogram-0.7.1.exe)に関しての要望

Zurück zum Archiv-Index

dune FZH01****@nifty*****
2009年 5月 11日 (月) 19:34:54 JST


Abudo Hariri <abudu****@gmail*****>さんのメッセージを転送します。

安田敏博 さま
丁寧なお返事をありがとうございました。説明が不十分で大変申し訳ござ
いませんでした。
日本語が私にとって外国語なので、ご理解よろしくお願い致します。

>
> morogram*.exeを使っていただき、ありがとうございます。
> ご要望に対応したいと思っています。
>
> (1)「開くと保存」ダイアログを英語(or ウイグル語)表記にするのは、対
> 応の仕方を調べてみます。
よろしくお願い致します。
> (2)「解析するファイルを半角スペースによって分解して、分解した単位の
> N-gramを取る」「--W オプションでの、単位を更に分解したい」
> この要望について、内容確認させてください。
>
> (2a)「『開くと保存』ダイアログでファイルを開いた場合でも、--wオプ
> ションが指定できるようにする」ということでしょうか。
はい。それが可能でしたら有難いのです。面倒であれば、コマンドラインで
指定してやりますので、大丈夫です。
> (2b)「『開くと保存』ダイアログで複数のファイルを選択できるようにする
> (ファイル名の欄に複数のファイルを半角スペースで区切って入力できるよ
> うにする)」ということでしょうか。
これは、そういう意味ではありません。無視して下さい。
> (2c)「『--W オプションでの、単位を更に分解』とは、今の文字または単語
> 単位の処理を、さらに別の単位に拡張できないか」ということでしょうか。
はい、すなわち、「men uyghur bolimen」という文を -wオプションでやれば、
1.men uyghur bolimen
2.uyghur boimen
3.men uyghur
4.men
5.uyghur
6.bolime
のように分解されますね。拡張が可能でしたこの単位をさらに文字レベルで
分解したいのです。
今ままで、すなわち、何もオプション付けない場合は、間の空白が無くなるの
で、以上の文が「menuyghurbolimen」の形で分析されるのです。私の望みは文
集を一回 --w で分解し、さらにこの分解単位を文字レベルで分解したいので。
今のソースプログラムの中での空白を削除すれば行くかも知りませんが、私の
目的は今の状態を保った状態で、オプションの形での解決を望みます。
ウイグルで、中国語の研究をする人が多くあります。今の状態で中国の漢字の
研究ができるので今の状態を拡張して頂きたいと思っています。
説明がまた不十分かも知りませんが、よろしくお願い致します。

> Abudo Haririさんの<676d0****@mail*****>から
>>安田敏博 さま
>>
>>突然のメールで大変失礼致します。千葉大学大学院自然科学研究科のアブドハリリと申
>>します。
>>中国の新疆ウイグル自治区から来日した者です。今ウイグル語の形態論を中心にして研
>>究を行っています。
>>最近は、安田敏博様が作ったN-gramツール(morogram-0.7.1.exe)を使っています。い
>>ろいろな使いやすい環境を提供したことを心から
>>感謝します。ありがとうございました。
>>現代ウイグル語を表記している文字がアラビア文字であり、文節単位で
>>分かち書きされています。ウイグル語は強い膠着性の特徴を持って言語であるので、こ
>>の分かち書き単位をかなり複雑であり、形態素解析により語幹
>>を認定する必要があります。そのため、最近日本語形態素解析器MeCab にウイグル語の
>>辞書を追加して、ウイグル語解析ツールを公開しました。
>>今回は、安田敏博のN-gramツール(morogram-0.7.1.exe)ツールもウイグル語言語学者
>>に紹介したいと思っています。
>>ここで少しお願いがありますが、考えて頂ければ大変を有難いのです。
>>一つは、解析するファイル選択する時の「開くと保存」のところを英語に変更して頂き
>>たいのです(本当にはウイグル文字にしたいのですが)。
>>二つ目は、解析するファイルを半角スペースによって分解して、分解した単位の
>>N-gramを取ることが可能でしょうか。
>>すなわち、今の --W オプションでの、単位を更に分解したいと思ったのです。目的は
>>、語幹と語尾の関係を明らかにすることです。
>>これを一つのオプションにして頂ければ大変有難いのです。
>>どうかよろしくお願い致します。
>>
>>アブドハリリ
>>
>>
>>--
>>----------------------------------------------------------------------------------------------------------
>>アブドレイム・アブドハリリ
>>ABUDUREYIMU/ABUDUHALILI
>>
>>千葉大学大学院自然科学研究科 博士後期課程
>>住所: 〒263-8522 千葉市稲毛区弥生町1-33
>>千葉大学文学部 土屋研究室
>>電話: 043-290-2277(研究室)  FAX:  043-290-2278 (研究室)
>>
>>E-mail: abudu****@gmail*****
>>           harir****@cogsc*****
>>HP  :    http://cogsci.l.chiba-u.ac.jp/~hariri
> --
> 安田敏博 FZH01****@nifty*****
> http://www.jognote.com/?id=n%B3%C8%8F%FD_%E1%88
> http://mixi.jp/show_friend.pl?id=19931031
> http://hpcgi1.nifty.com/dune/gwiki.pl
>
>



-- 
----------------------------------------------------------------------------------------------------------
アブドレイム・アブドハリリ
ABUDUREYIMU/ABUDUHALILI

千葉大学大学院自然科学研究科 博士後期課程
住所: 〒263-8522 千葉市稲毛区弥生町1-33
千葉大学文学部 土屋研究室
電話: 043-290-2277(研究室)  FAX:  043-290-2278 (研究室)

E-mail: abudu****@gmail*****
           harir****@cogsc*****
HP  :    http://cogsci.l.chiba-u.ac.jp/~hariri
-- 
安田敏博 FZH01****@nifty*****
http://www.jognote.com/?id=n%B3%C8%8F%FD_%E1%88
http://mixi.jp/show_friend.pl?id=19931031
http://hpcgi1.nifty.com/dune/gwiki.pl




morogram-users メーリングリストの案内
Zurück zum Archiv-Index