dune
FZH01****@nifty*****
2003年 11月 4日 (火) 21:28:52 JST
極悪です。 Shigeki Moro さんの Re: Win32 スタンドアロン版 morogram から >Shigeki Moro さんの Re: Win32 スタンドアロン版 morogram から >リリース名にマルチバイト文字が使えないというのと関係ないですかね? どうも僕と SourceForge との相性が悪い?ようで・・・。会社から アクセスしてみても、しょっちゅう「サーバが見つからない」のエ ラーになります。 >> それと、リリースメモが Permission Denied と言われて見えませ >> ん。 > >すいません、権限を付け忘れました(というか、わかりづらいぞ >>sourceforge)。今はたぶん、リリースメモを書けると思います。 見えるようにはなりましたが、編集できません。書き換え・修正の フォームは出るのに、送信しても元の文章は更新されません。 アップしたスタンドアロン版の .zip には使い方の説明を入れてな いので、リリースノートに書こうとしていたものを、ここに書いて おきます(書く量が多いから書き込みに失敗しているわけでもなさ そうです)。 morogram-0.7.1w.exe は morogram のスタンドアロン版です。Perl や morogram-sort.exe は不要で、このプログラムだけでファイル を処理できます。文字コードは utf8 専用です。 morogram-0.7.1wCJKT.exe は morogram-0.7.1w.exe に文字コード 変換用モジュールをリンクさせたもので、オプションとして例えば --shiftjis を指定すると SJIS のテキストを処理できるようにな ります(将来は Guess モジュールをリンクして文字コードの自動判 別までやりたいなぁ、なんて思ってますがいつになることやら)。 D:% morogram-0.7.1wCJKT.exe --p --g=2, --f=6 --shiftjis D:\DATA\古典\源氏\篝火 morogram: N-gram tool version 0.7.1, by Shigeki Moro (moro****@ya*****). minimum number of frequency: 6 minimum number of gram : 2 largest number of gram : 256 delete punct : yes ignore case : yes regard &Mnnnnnn; : no print BOM : no filename : D:\DATA\古典\源氏\篝火 ------- First Stage ------- creating offset table...done. number of characters is 1415. offset length is 2. creating pointer table...done. sorting pointer table...done. counting coincidence number of characters...done. largest coincidence number is 8. ------- Second Stage ------ calculating 2-gram frequency. deleting temporary file(s)...done. Total time: 0 hour(s) 0 minute(s) 1 second(s) 6 したま 3 14 たまふ 3 7 たまへ 3 6 りたま 3 13 いと 2 7 かし 2 6 かな 2 7 こえ 2 7 こそ 2 9 こと 2 10 しき 2 11 した 2 7 して 2 26 たま 2 6 とも 2 6 なり 2 10 なる 2 6 にも 2 14 まふ 2 7 まへ 2 8 もの 2 6 りた 2 6 中将 2 6 出で 2 D:% 使える文字コードは --v で表示できます。EBCDIC-Based encodings というモジュールもありましたが、今回はリンクしていません。 D:% morogram-0.7.1wCJKT.exe --V Version: 0.7.1.1.0 7bit-jis AdobeStandardEncoding AdobeSymbol AdobeZdingbat ascii ascii-ctrl big5-eten big5-hkscs cp1006 cp1026 cp1047 cp1250 cp1251 cp1252 cp1253 cp1254 cp1255 cp1256 cp1257 cp1258 cp37 cp424 cp437 cp500 cp737 cp775 cp850 cp852 cp855 cp856 cp857 cp860 cp861 cp862 cp863 cp864 cp865 cp866 cp869 cp874 cp875 cp932 cp936 cp949 cp950 dingbats euc-cn euc-jp euc-kr gb12345-raw gb2312-raw gsm0338 hp-roman8 hz iso-2022-jp iso-2022-jp-1 iso-2022-kr iso-8859-1 iso-8859-10 iso-8859-11 iso-8859-13 iso-8859-14 iso-8859-15 iso-8859-16 iso-8859-2 iso-8859-3 iso-8859-4 iso-8859-5 iso-8859-6 iso-8859-7 iso-8859-8 iso-8859-9 iso-ir-165 jis0201-raw jis0208-raw jis0212-raw johab koi8-f koi8-r koi8-u ksc5601-raw MacArabic MacCentralEurRoman MacChineseSimp MacChineseTrad MacCroatian MacCyrillic MacDingbats MacFarsi MacGreek MacHebrew MacIcelandic MacJapanese MacKorean MacRoman MacRomanian MacRumanian MacSami MacSymbol MacThai MacTurkish MacUkrainian MIME-B MIME-Header MIME-Q nextstep null posix-bc shiftjis symbol UCS-2BE UCS-2LE UTF-16 UTF-16BE UTF-16LE UTF-32 UTF-32BE UTF-32LE utf8 viscii deleting temporary file(s)...done. Total time: 0 hour(s) 0 minute(s) 0 second(s) D:% -- FZH01****@nifty***** http://hpcgi1.nifty.com/dune/gwiki.pl?