dune
FZH01****@nifty*****
2009年 5月 11日 (月) 19:34:54 JST
Abudo Hariri <abudu****@gmail*****>さんのメッセージを転送します。 安田敏博 さま 丁寧なお返事をありがとうございました。説明が不十分で大変申し訳ござ いませんでした。 日本語が私にとって外国語なので、ご理解よろしくお願い致します。 > > morogram*.exeを使っていただき、ありがとうございます。 > ご要望に対応したいと思っています。 > > (1)「開くと保存」ダイアログを英語(or ウイグル語)表記にするのは、対 > 応の仕方を調べてみます。 よろしくお願い致します。 > (2)「解析するファイルを半角スペースによって分解して、分解した単位の > N-gramを取る」「--W オプションでの、単位を更に分解したい」 > この要望について、内容確認させてください。 > > (2a)「『開くと保存』ダイアログでファイルを開いた場合でも、--wオプ > ションが指定できるようにする」ということでしょうか。 はい。それが可能でしたら有難いのです。面倒であれば、コマンドラインで 指定してやりますので、大丈夫です。 > (2b)「『開くと保存』ダイアログで複数のファイルを選択できるようにする > (ファイル名の欄に複数のファイルを半角スペースで区切って入力できるよ > うにする)」ということでしょうか。 これは、そういう意味ではありません。無視して下さい。 > (2c)「『--W オプションでの、単位を更に分解』とは、今の文字または単語 > 単位の処理を、さらに別の単位に拡張できないか」ということでしょうか。 はい、すなわち、「men uyghur bolimen」という文を -wオプションでやれば、 1.men uyghur bolimen 2.uyghur boimen 3.men uyghur 4.men 5.uyghur 6.bolime のように分解されますね。拡張が可能でしたこの単位をさらに文字レベルで 分解したいのです。 今ままで、すなわち、何もオプション付けない場合は、間の空白が無くなるの で、以上の文が「menuyghurbolimen」の形で分析されるのです。私の望みは文 集を一回 --w で分解し、さらにこの分解単位を文字レベルで分解したいので。 今のソースプログラムの中での空白を削除すれば行くかも知りませんが、私の 目的は今の状態を保った状態で、オプションの形での解決を望みます。 ウイグルで、中国語の研究をする人が多くあります。今の状態で中国の漢字の 研究ができるので今の状態を拡張して頂きたいと思っています。 説明がまた不十分かも知りませんが、よろしくお願い致します。 > Abudo Haririさんの<676d0****@mail*****>から >>安田敏博 さま >> >>突然のメールで大変失礼致します。千葉大学大学院自然科学研究科のアブドハリリと申 >>します。 >>中国の新疆ウイグル自治区から来日した者です。今ウイグル語の形態論を中心にして研 >>究を行っています。 >>最近は、安田敏博様が作ったN-gramツール(morogram-0.7.1.exe)を使っています。い >>ろいろな使いやすい環境を提供したことを心から >>感謝します。ありがとうございました。 >>現代ウイグル語を表記している文字がアラビア文字であり、文節単位で >>分かち書きされています。ウイグル語は強い膠着性の特徴を持って言語であるので、こ >>の分かち書き単位をかなり複雑であり、形態素解析により語幹 >>を認定する必要があります。そのため、最近日本語形態素解析器MeCab にウイグル語の >>辞書を追加して、ウイグル語解析ツールを公開しました。 >>今回は、安田敏博のN-gramツール(morogram-0.7.1.exe)ツールもウイグル語言語学者 >>に紹介したいと思っています。 >>ここで少しお願いがありますが、考えて頂ければ大変を有難いのです。 >>一つは、解析するファイル選択する時の「開くと保存」のところを英語に変更して頂き >>たいのです(本当にはウイグル文字にしたいのですが)。 >>二つ目は、解析するファイルを半角スペースによって分解して、分解した単位の >>N-gramを取ることが可能でしょうか。 >>すなわち、今の --W オプションでの、単位を更に分解したいと思ったのです。目的は >>、語幹と語尾の関係を明らかにすることです。 >>これを一つのオプションにして頂ければ大変有難いのです。 >>どうかよろしくお願い致します。 >> >>アブドハリリ >> >> >>-- >>---------------------------------------------------------------------------------------------------------- >>アブドレイム・アブドハリリ >>ABUDUREYIMU/ABUDUHALILI >> >>千葉大学大学院自然科学研究科 博士後期課程 >>住所: 〒263-8522 千葉市稲毛区弥生町1-33 >>千葉大学文学部 土屋研究室 >>電話: 043-290-2277(研究室) FAX: 043-290-2278 (研究室) >> >>E-mail: abudu****@gmail***** >> harir****@cogsc***** >>HP : http://cogsci.l.chiba-u.ac.jp/~hariri > -- > 安田敏博 FZH01****@nifty***** > http://www.jognote.com/?id=n%B3%C8%8F%FD_%E1%88 > http://mixi.jp/show_friend.pl?id=19931031 > http://hpcgi1.nifty.com/dune/gwiki.pl > > -- ---------------------------------------------------------------------------------------------------------- アブドレイム・アブドハリリ ABUDUREYIMU/ABUDUHALILI 千葉大学大学院自然科学研究科 博士後期課程 住所: 〒263-8522 千葉市稲毛区弥生町1-33 千葉大学文学部 土屋研究室 電話: 043-290-2277(研究室) FAX: 043-290-2278 (研究室) E-mail: abudu****@gmail***** harir****@cogsc***** HP : http://cogsci.l.chiba-u.ac.jp/~hariri -- 安田敏博 FZH01****@nifty***** http://www.jognote.com/?id=n%B3%C8%8F%FD_%E1%88 http://mixi.jp/show_friend.pl?id=19931031 http://hpcgi1.nifty.com/dune/gwiki.pl