• R/O
  • HTTP
  • SSH
  • HTTPS

chasen-web: Commit

Web page of ChaSen legacy.


Commit MetaInfo

Revision9964ff5314388aebf7095801a761db23812f9f95 (tree)
Zeit2011-11-25 16:50:42
AutorNOKUBI Takatsugu <knok@daio...>
CommiterNOKUBI Takatsugu

Log Message

Previous version.

Ändern Zusammenfassung

Diff

--- a/index.htm
+++ b/index.htm
@@ -5,461 +5,239 @@
55 <meta http-equiv="Content-Style-Type" content="text/css">
66 <meta http-equiv="Author" CONTENT="Masayuki Asahara">
77 <meta name="description" content="index">
8- <link rel=stylesheet href="http://web.archive.org/web/20070425234048cs_/http://chasen.naist.jp/~masayu-a/css/masayu-a.css">
8+ <link rel=stylesheet href="http://chasen.naist.jp/~masayu-a/css/masayu-a.css">
99 <title>chasen legacy -- an old morphological analyzer</title>
1010 </head>
11-
12-<!-- BEGIN WAYBACK TOOLBAR INSERT -->
13-
14-<script type="text/javascript" src="http://staticweb.archive.org/js/disclaim-element.js" ></script>
15-<script type="text/javascript" src="http://staticweb.archive.org/js/graph-calc.js" ></script>
16-<script type="text/javascript" src="http://staticweb.archive.org/jflot/jquery.min.js" ></script>
17-<script type="text/javascript">
18-//<![CDATA[
19-var firstDate = 820454400000;
20-var lastDate = 1325375999999;
21-var wbPrefix = "http://web.archive.org/web/";
22-var wbCurrentUrl = "http:\/\/chasen-legacy.sourceforge.jp\/";
23-
24-var curYear = -1;
25-var curMonth = -1;
26-var yearCount = 16;
27-var firstYear = 1996;
28-var imgWidth=400;
29-var yearImgWidth = 25;
30-var monthImgWidth = 2;
31-var trackerVal = "none";
32-var displayDay = "25";
33-var displayMonth = "Apr";
34-var displayYear = "2007";
35-var prettyMonths = ["Jan","Feb","Mar","Apr","May","Jun","Jul","Aug","Sep","Oct","Nov","Dec"];
36-
37-function showTrackers(val) {
38- if(val == trackerVal) {
39- return;
40- }
41- if(val == "inline") {
42- document.getElementById("displayYearEl").style.color = "#ec008c";
43- document.getElementById("displayMonthEl").style.color = "#ec008c";
44- document.getElementById("displayDayEl").style.color = "#ec008c";
45- } else {
46- document.getElementById("displayYearEl").innerHTML = displayYear;
47- document.getElementById("displayYearEl").style.color = "#ff0";
48- document.getElementById("displayMonthEl").innerHTML = displayMonth;
49- document.getElementById("displayMonthEl").style.color = "#ff0";
50- document.getElementById("displayDayEl").innerHTML = displayDay;
51- document.getElementById("displayDayEl").style.color = "#ff0";
52- }
53- document.getElementById("wbMouseTrackYearImg").style.display = val;
54- document.getElementById("wbMouseTrackMonthImg").style.display = val;
55- trackerVal = val;
56-}
57-function getElementX2(obj) {
58- var thing = jQuery(obj);
59- if((thing == undefined)
60- || (typeof thing == "undefined")
61- || (typeof thing.offset == "undefined")) {
62- return getElementX(obj);
63- }
64- return Math.round(thing.offset().left);
65-}
66-function trackMouseMove(event,element) {
67-
68- var eventX = getEventX(event);
69- var elementX = getElementX2(element);
70- var xOff = eventX - elementX;
71- if(xOff < 0) {
72- xOff = 0;
73- } else if(xOff > imgWidth) {
74- xOff = imgWidth;
75- }
76- var monthOff = xOff % yearImgWidth;
77-
78- var year = Math.floor(xOff / yearImgWidth);
79- var yearStart = year * yearImgWidth;
80- var monthOfYear = Math.floor(monthOff / monthImgWidth);
81- if(monthOfYear > 11) {
82- monthOfYear = 11;
83- }
84- // 1 extra border pixel at the left edge of the year:
85- var month = (year * 12) + monthOfYear;
86- var day = 1;
87- if(monthOff % 2 == 1) {
88- day = 15;
89- }
90- var dateString =
91- zeroPad(year + firstYear) +
92- zeroPad(monthOfYear+1,2) +
93- zeroPad(day,2) + "000000";
94-
95- var monthString = prettyMonths[monthOfYear];
96- document.getElementById("displayYearEl").innerHTML = year + 1996;
97- document.getElementById("displayMonthEl").innerHTML = monthString;
98- // looks too jarring when it changes..
99- //document.getElementById("displayDayEl").innerHTML = zeroPad(day,2);
100-
101- var url = wbPrefix + dateString + '/' + wbCurrentUrl;
102- document.getElementById('wm-graph-anchor').href = url;
103-
104- //document.getElementById("wmtbURL").value="evX("+eventX+") elX("+elementX+") xO("+xOff+") y("+year+") m("+month+") monthOff("+monthOff+") DS("+dateString+") Moy("+monthOfYear+") ms("+monthString+")";
105- if(curYear != year) {
106- var yrOff = year * yearImgWidth;
107- document.getElementById("wbMouseTrackYearImg").style.left = yrOff + "px";
108- curYear = year;
109- }
110- if(curMonth != month) {
111- var mtOff = year + (month * monthImgWidth) + 1;
112- document.getElementById("wbMouseTrackMonthImg").style.left = mtOff + "px";
113- curMonth = month;
114- }
115-}
116-//]]>
117-</script>
118-
119-<style type="text/css">body{margin-top:0!important;padding-top:0!important;min-width:800px!important;}#wm-ipp a:hover{text-decoration:underline!important;}</style>
120-<div id="wm-ipp" style="display:none; position:relative;padding:0 5px;min-height:70px;min-width:800px; z-index:9000;">
121-<div id="wm-ipp-inside" style="position:fixed;padding:0!important;margin:0!important;width:97%;min-width:780px;border:5px solid #000;border-top:none;background-image:url(http://staticweb.archive.org/images/toolbar/wm_tb_bk_trns.png);text-align:center;-moz-box-shadow:1px 1px 3px #333;-webkit-box-shadow:1px 1px 3px #333;box-shadow:1px 1px 3px #333;font-size:11px!important;font-family:'Lucida Grande','Arial',sans-serif!important;">
122- <table style="border-collapse:collapse;margin:0;padding:0;width:100%;"><tbody><tr>
123- <td style="padding:10px;vertical-align:top;min-width:110px;">
124- <a href="http://wayback.archive.org/web/" title="Wayback Machine home page" style="background-color:transparent;border:none;"><img src="http://staticweb.archive.org/images/toolbar/wayback-toolbar-logo.png" alt="Wayback Machine" width="110" height="39" border="0"/></a>
125- </td>
126- <td style="padding:0!important;text-align:center;vertical-align:top;width:100%;">
127-
128- <table style="border-collapse:collapse;margin:0 auto;padding:0;width:570px;"><tbody><tr>
129- <td style="padding:3px 0;" colspan="2">
130- <form target="_top" method="get" action="http://wayback.archive.org/web/form-submit.jsp" name="wmtb" id="wmtb" style="margin:0!important;padding:0!important;"><input type="text" name="url" id="wmtbURL" value="http://chasen-legacy.sourceforge.jp/" style="width:400px;font-size:11px;font-family:'Lucida Grande','Arial',sans-serif;" onfocus="javascript:this.focus();this.select();" /><input type="hidden" name="type" value="replay" /><input type="hidden" name="date" value="20070425234048" /><input type="submit" value="Go" style="font-size:11px;font-family:'Lucida Grande','Arial',sans-serif;margin-left:5px;" /><span id="wm_tb_options" style="display:block;"></span></form>
131- </td>
132- <td style="vertical-align:bottom;padding:5px 0 0 0!important;" rowspan="2">
133- <table style="border-collapse:collapse;width:110px;color:#99a;font-family:'Helvetica','Lucida Grande','Arial',sans-serif;"><tbody>
134-
135- <!-- NEXT/PREV MONTH NAV AND MONTH INDICATOR -->
136- <tr style="width:110px;height:16px;font-size:10px!important;">
137- <td style="padding-right:9px;font-size:11px!important;font-weight:bold;text-transform:uppercase;text-align:right;white-space:nowrap;overflow:visible;" nowrap="nowrap">
138-
139- Mar
140-
141- </td>
142- <td id="displayMonthEl" style="background:#000;color:#ff0;font-size:11px!important;font-weight:bold;text-transform:uppercase;width:34px;height:15px;padding-top:1px;text-align:center;" title="You are here: 23:40:48 Apr 25, 2007">APR</td>
143- <td style="padding-left:9px;font-size:11px!important;font-weight:bold;text-transform:uppercase;white-space:nowrap;overflow:visible;" nowrap="nowrap">
144-
145- <a href="http://web.archive.org/web/20070624112920/http://chasen-legacy.sourceforge.jp/" style="text-decoration:none;color:#33f;font-weight:bold;background-color:transparent;border:none;" title="24 Jun 2007"><strong>JUN</strong></a>
146-
147- </td>
148- </tr>
149-
150- <!-- NEXT/PREV CAPTURE NAV AND DAY OF MONTH INDICATOR -->
151- <tr>
152- <td style="padding-right:9px;white-space:nowrap;overflow:visible;text-align:right!important;vertical-align:middle!important;" nowrap="nowrap">
153-
154- <img src="http://staticweb.archive.org/images/toolbar/wm_tb_prv_off.png" alt="Previous capture" width="14" height="16" border="0" />
155-
156- </td>
157- <td id="displayDayEl" style="background:#000;color:#ff0;width:34px;height:24px;padding:2px 0 0 0;text-align:center;font-size:24px;font-weight: bold;" title="You are here: 23:40:48 Apr 25, 2007">25</td>
158- <td style="padding-left:9px;white-space:nowrap;overflow:visible;text-align:left!important;vertical-align:middle!important;" nowrap="nowrap">
159-
160- <a href="http://web.archive.org/web/20070524120406/http://chasen-legacy.sourceforge.jp/" title="12:04:06 May 24, 2007" style="background-color:transparent;border:none;"><img src="http://staticweb.archive.org/images/toolbar/wm_tb_nxt_on.png" alt="Next capture" width="14" height="16" border="0"/></a>
161-
162- </td>
163- </tr>
164-
165- <!-- NEXT/PREV YEAR NAV AND YEAR INDICATOR -->
166- <tr style="width:110px;height:13px;font-size:9px!important;">
167- <td style="padding-right:9px;font-size:11px!important;font-weight: bold;text-align:right;white-space:nowrap;overflow:visible;" nowrap="nowrap">
168-
169- 2006
170-
171- </td>
172- <td id="displayYearEl" style="background:#000;color:#ff0;font-size:11px!important;font-weight: bold;padding-top:1px;width:34px;height:13px;text-align:center;" title="You are here: 23:40:48 Apr 25, 2007">2007</td>
173- <td style="padding-left:9px;font-size:11px!important;font-weight: bold;white-space:nowrap;overflow:visible;" nowrap="nowrap">
174-
175- <a href="http://web.archive.org/web/20080502011322/http://chasen-legacy.sourceforge.jp/" style="text-decoration:none;color:#33f;font-weight:bold;background-color:transparent;border:none;" title="2 May 2008"><strong>2008</strong></a>
176-
177- </td>
178- </tr>
179- </tbody></table>
180- </td>
181-
182- </tr>
183- <tr>
184- <td style="vertical-align:middle;padding:0!important;">
185- <a href="http://wayback.archive.org/web/20070425234048*/http://chasen-legacy.sourceforge.jp/" style="color:#33f;font-size:11px;font-weight:bold;background-color:transparent;border:none;" title="See a list of every capture for this URL"><strong>35 captures</strong></a>
186- <div style="margin:0!important;padding:0!important;color:#666;font-size:9px;padding-top:2px!important;white-space:nowrap;" title="Timespan for captures of this URL">25 Apr 07 - 10 Nov 10</div>
187- </td>
188- <td style="padding:0!important;">
189- <a style="position:relative; white-space:nowrap; width:400px;height:27px;" href="" id="wm-graph-anchor">
190- <div id="wm-ipp-sparkline" style="position:relative; white-space:nowrap; width:400px;height:27px;background-color:#fff;cursor:pointer;border-right:1px solid #ccc;" title="Explore captures for this URL">
191- <img id="sparklineImgId" style="position:absolute; z-index:9012; top:0px; left:0px;"
192- onmouseover="showTrackers('inline');"
193- onmouseout="showTrackers('none');"
194- onmousemove="trackMouseMove(event,this)"
195- alt="sparklines"
196- width="400"
197- height="27"
198- border="0"
199- src="http://wayback.archive.org/jsp/graph.jsp?graphdata=400_27_1996:-1:000000000000_1997:-1:000000000000_1998:-1:000000000000_1999:-1:000000000000_2000:-1:000000000000_2001:-1:000000000000_2002:-1:000000000000_2003:-1:000000000000_2004:-1:000000000000_2005:-1:000000000000_2006:-1:000000000000_2007:3:000111010112_2008:-1:101111122102_2009:-1:111100000000_2010:-1:100111112110_2011:-1:000000000000"></img>
200- <img id="wbMouseTrackYearImg"
201- style="display:none; position:absolute; z-index:9010;"
202- width="25"
203- height="27"
204- border="0"
205- src="http://staticweb.archive.org/images/toolbar/transp-yellow-pixel.png"></img>
206- <img id="wbMouseTrackMonthImg"
207- style="display:none; position:absolute; z-index:9011; "
208- width="2"
209- height="27"
210- border="0"
211- src="http://staticweb.archive.org/images/toolbar/transp-red-pixel.png"></img>
212- </div>
213- </a>
214-
215- </td>
216- </tr></tbody></table>
217- </td>
218- <td style="text-align:right;padding:5px;width:65px;font-size:11px!important;">
219- <a href="javascript:;" onclick="document.getElementById('wm-ipp').style.display='none';" style="display:block;padding-right:18px;background:url(http://staticweb.archive.org/images/toolbar/wm_tb_close.png) no-repeat 100% 0;color:#33f;font-family:'Lucida Grande','Arial',sans-serif;margin-bottom:23px;background-color:transparent;border:none;" title="Close the toolbar">Close</a>
220- <a href="http://faq.web.archive.org/" style="display:block;padding-right:18px;background:url(http://staticweb.archive.org/images/toolbar/wm_tb_help.png) no-repeat 100% 0;color:#33f;font-family:'Lucida Grande','Arial',sans-serif;background-color:transparent;border:none;" title="Get some help using the Wayback Machine">Help</a>
221- </td>
222- </tr></tbody></table>
223-
224-</div>
225-</div>
226-<script type="text/javascript">
227- var wmDisclaimBanner = document.getElementById("wm-ipp");
228- if(wmDisclaimBanner != null) {
229- disclaimElement(wmDisclaimBanner);
230- }
231-</script>
232-<!-- END WAYBACK TOOLBAR INSERT -->
23311 <hr>
234-<h1>ChaSen -- 形態素解析器</h1>
12+<h1>ChaSen -- 形態素解析器</h1>
23513 <hr>
236-<h2>はじめに</h2>
14+<h2>はじめに</h2>
23715 <p>
238-形態素解析器とは、入力文を単語単位に分割し品詞を付与するツールである。
16+形態素解析器とは、入力文を単語単位に分割し品詞を付与するツールである。
23917 </p>
24018 <hr>
241-<h2>新着情報</h2>
19+<h2>新着情報</h2>
24220 <ul>
243-<li>2007-03-30 (Fri) chasen-2.4.0 リリース
21+<li>2007-10-13 (Sat) chasen-2.4.2 Windows バイナリを作成しなおしました。
24422 </ul>
24523 <hr>
246-<h2>茶筌の配布</h2>
247-<h3>ダウンロード</h3>
24+<h2>茶筌の配布</h2>
25+<h3>ダウンロード</h3>
24826 <p>
249-あらかじめ iconvと <a href="http://web.archive.org/web/20070425234048/http://chasen.org/~taku/software/darts/">Darts-0.31</a>のインストールが必要です。
27+あらかじめ iconvと <a href="http://chasen.org/~taku/software/darts/">Darts-0.31</a>のインストールが必要です。
25028 </p>
25129 <ul>
252-<li><a href="http://web.archive.org/web/20070425234048/http://sourceforge.jp/projects/chasen-legacy/">chasen-2.4.0</a>
30+<li><a href="http://sourceforge.jp/projects/chasen-legacy/">chasen-2.4.2</a>
25331 </ul>
25432 <p>
255-辞書は別配布になっています。
33+辞書は別配布になっています。
25634 </p>
25735 <ul>
258-<li><a href="http://web.archive.org/web/20070425234048/http://sourceforge.jp/projects/ipadic/">ipadic-2.7.0</a><br>
259-日本語辞書
260-<li><a href="http://web.archive.org/web/20070425234048/http://download.unidic.org/">UniDic</a><br>
261-日本語辞書
36+<li><a href="http://sourceforge.jp/projects/ipadic/">ipadic-2.7.0</a><br>
37+日本語辞書
38+<li><a href="http://download.unidic.org/">UniDic</a><br>
39+日本語辞書
26240 <li>NAIST-Japanese-dic<br>
263-日本語辞書(奈良先端大より公開予定)
41+日本語辞書(奈良先端大より公開予定)
26442 <li>NAIST-Chinese-dic<br>
265-中国語語辞書(奈良先端大より公開予定)
43+中国語語辞書(奈良先端大より公開予定)
26644 </ul>
267-<h3>著作権および仕様条件について</h3>
45+<h3>著作権および仕様条件について</h3>
26846 <p>
269-茶筌システムは,広く自然言語処理研究に資するため無償のソフトウェアとして開発されたものである.茶筌の著作権は,奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座(松本研究室)が保持する.本ソフトウェアの使用,改変,再配布については,特に制限を課すことはしない.詳しくはマニュアル裏表紙の copyright notice を参照のこと.
47+茶筌システムは,広く自然言語処理研究に資するため無償のソフトウェアとして開発されたものである.茶筌の著作権は,奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座(松本研究室)が保持する.本ソフトウェアの使用,改変,再配布については,特に制限を課すことはしない.詳しくはマニュアル裏表紙の copyright notice を参照のこと.
27048 </p>
27149 <p>
272-なお,本ソフトウェアの著作権者である奈良先端科学技術大学院大学は,原形あるいは改変された形で配布された本ソフトウェアに関連して生じる一切の損失に対して保証の責を負わないこととする.
50+なお,本ソフトウェアの著作権者である奈良先端科学技術大学院大学は,原形あるいは改変された形で配布された本ソフトウェアに関連して生じる一切の損失に対して保証の責を負わないこととする.
27351 </p>
27452 <p>
275-2.3.0 より、広告条項がなくなりました。また、Darts と iconv を必要としますので、 Darts や iconv をリンクした場合、Darts や iconv のライセンスが生成物に波及する場合がありますので御注意ください。
53+2.3.0 より、広告条項がなくなりました。また、Darts と iconv を必要としますので、 Darts や iconv をリンクした場合、Darts や iconv のライセンスが生成物に波及する場合がありますので御注意ください。
27654 </p>
27755 <p>
278-辞書とシステムの分離に伴ない、2.2.1 よりシステムの Copyright の記述が若干変更になりました。同包して配布する際、辞書とシステム両方の Copyright をよくお読みになってご利用ください。
56+辞書とシステムの分離に伴ない、2.2.1 よりシステムの Copyright の記述が若干変更になりました。同包して配布する際、辞書とシステム両方の Copyright をよくお読みになってご利用ください。
27957 </p>
28058 <hr>
281-<h2>辞書の作り方</h2>
282-<h3>辞書、文法定義ファイル</h3>
59+<h2>辞書の作り方</h2>
60+<h3>辞書、文法定義ファイル</h3>
28361 <p>
284-茶筌の辞書をつくるためには以下のファイルが必要です。
62+茶筌の辞書をつくるためには以下のファイルが必要です。
28563 </p>
28664 <ul>
287-<li>辞書定義ファイル
65+<li>辞書定義ファイル
28866 <ul>
28967 <li>*.dic</li>
29068 </ul>
291-<li>文法定義ファイル
69+<li>文法定義ファイル
29270 <ul>
293-<li>grammar.cha - 品詞定義ファイル </li>
294-<li>ctypes.cha - 活用型定義ファイル </li>
295-<li>cforms.cha - 活用形定義ファイル </li>
296-<li>connect.cha - 連接表定義ファイル </li>
71+<li>grammar.cha - 品詞定義ファイル </li>
72+<li>ctypes.cha - 活用型定義ファイル </li>
73+<li>cforms.cha - 活用形定義ファイル </li>
74+<li>connect.cha - 連接表定義ファイル </li>
29775 </ul>
29876 </ul>
29977 <p>
300-一般に、ユーザーが変更を加えるのは辞書定義ファイルのみです
78+一般に、ユーザーが変更を加えるのは辞書定義ファイルのみです
30179 </p>
302-<h3>辞書のコンパイル</h3>
80+<h3>辞書のコンパイル</h3>
30381 <p>
304-辞書のコンパイルには makeda コマンドを使います。この作業は文法定義ファイルのあるディレクトリでおこなう必要があります。
82+辞書のコンパイルには makeda コマンドを使います。この作業は文法定義ファイルのあるディレクトリでおこなう必要があります。
30583 </p>
30684 <pre>
30785 $ makeda dic_name input1.dic input2.dic
30886 </pre>
30987 <p>
310-dic_name には出力したい辞書ファイルのベースネーム(拡張子を除いたファイル名)を指定します。たとえば、user を指定すると、user.da、user.lex、user.dat が生成されます。入力の辞書定義ファイルは複数指定できます。入力のフォーマットは辞書定義ファイルのフォーマットを参照してください。
88+dic_name には出力したい辞書ファイルのベースネーム(拡張子を除いたファイル名)を指定します。たとえば、user を指定すると、user.da、user.lex、user.dat が生成されます。入力の辞書定義ファイルは複数指定できます。入力のフォーマットは辞書定義ファイルのフォーマットを参照してください。
31189 </p>
312-<h3>辞書の指定</h3>
90+<h3>辞書の指定</h3>
31391 <p>
314-前節で作成した辞書を使うには chasenrc で次のように指定します。
92+前節で作成した辞書を使うには chasenrc で次のように指定します。
31593 </p>
31694 <pre>
31795 (DADIC chadic user)
31896 </pre>
31997 <p>
320-この場合、chadic.* と user.* の両方を辞書に使います。
98+この場合、chadic.* と user.* の両方を辞書に使います。
32199 </p>
322-<h3>文法定義ファイルの変更</h3>
323-<h4>文法定義ファイルの変更時の注意点</h4>
100+<h3>文法定義ファイルの変更</h3>
101+<h4>文法定義ファイルの変更時の注意点</h4>
324102 <p>
325-品詞、活用定義と連接表定義の内容が矛盾していると茶筌は正しい解析をおこなえません。正しい連接表定義を作成できないときは、これらのファイルは変更してはいけません。
103+品詞、活用定義と連接表定義の内容が矛盾していると茶筌は正しい解析をおこなえません。正しい連接表定義を作成できないときは、これらのファイルは変更してはいけません。
326104 </p>
327105 <p>
328-文法定義ファイルを変更した場合、以下の手順で連接表のコンパイルをおこなってください。
106+文法定義ファイルを変更した場合、以下の手順で連接表のコンパイルをおこなってください。
329107 </p>
330-<h4>連接表のコンパイル</h4>
108+<h4>連接表のコンパイル</h4>
331109 <p>
332-連接表のコンパイルには makemat コマンドを使います。
110+連接表のコンパイルには makemat コマンドを使います。
333111 </p>
334112 <p>
335-文法定義ファイルのあるディレクトリで以下のように実行します。
113+文法定義ファイルのあるディレクトリで以下のように実行します。
336114 </p>
337115 <pre>
338116 $ makemat
339117 </pre>
340118 <p>
341-matrix.cha、table.cha が出力されます。
119+matrix.cha、table.cha が出力されます。
342120 </p>
343-<h3>文字コード</h3>
121+<h3>文字コード</h3>
344122 <p>
345-システム標準の文字コード(Unix では EUC-JP、Windows では Shift_JIS)以外の文字コードを使うには、その文字コードでの辞書を用意する必要があります。
123+システム標準の文字コード(Unix では EUC-JP、Windows では Shift_JIS)以外の文字コードを使うには、その文字コードでの辞書を用意する必要があります。
346124 </p>
347125 <ol>
348-<li>当該文字コードで書かれた文法定義ファイル、辞書定義ファイルを用意する
349-<li>makemat、makeda に -i オプションで当該文字コードを指定して、連接表と辞書をコンパイルする
350-<li> 茶筌実行時に -i オプションで当該文字コードを指定する
126+<li>当該文字コードで書かれた文法定義ファイル、辞書定義ファイルを用意する
127+<li>makemat、makeda に -i オプションで当該文字コードを指定して、連接表と辞書をコンパイルする
128+<li> 茶筌実行時に -i オプションで当該文字コードを指定する
351129 </ol>
352130 <p>
353--i オプションに指定できるのは e、s、w、a のいずれかで、それぞれ EUC-JP、Shift_JIS、UTF-8、ISO-8859-1 を指定します。
131+-i オプションに指定できるのは e、s、w、a のいずれかで、それぞれ EUC-JP、Shift_JIS、UTF-8、ISO-8859-1 を指定します。
354132 </p>
355133 <hr>
356-<h2>FAQ(たぶん)よくある</h2>
134+<h2>FAQ(たぶん)よくある</h2>
357135 <ul>
358-<li>WinCha (茶筌 Ver. 2.1 for Windows) がインストールできません。
136+<li>WinCha (茶筌 Ver. 2.1 for Windows) がインストールできません。
359137 <p>
360-cha21244.exe ではなく cha21244sp5.exe を使ってください。
138+cha21244.exe ではなく cha21244sp5.exe を使ってください。
361139 </p>
362140 <p>
363-それでもだめなときは Administrator 権限でインストールするとうまくいくかもしれません。メーリングリストでの過去の議論もご覧ください。
141+それでもだめなときは Administrator 権限でインストールするとうまくいくかもしれません。メーリングリストでの過去の議論もご覧ください。
364142 </p>
365-<li>UTF-8 は使えますか?
143+<li>UTF-8 は使えますか?
366144 <p>
367-使えます。*.cha と *.dic を UTF-8 に変換して以下のようにすると UTF-8 の辞書ができます。
145+使えます。*.cha と *.dic を UTF-8 に変換して以下のようにすると UTF-8 の辞書ができます。
368146 </p>
369147 <pre>
370148 $ `chasen-config --mkchadic`/makemat -i w
371149 $ `chasen-config --mkchadic`/makeda -i w chadic *.dic
372150 </pre>
373151 <p>
374-chasenrc で変換した文法ファイルと辞書を指定し、茶筌本体にも UTF-8 で処理するようオプションを指定します。
152+chasenrc で変換した文法ファイルと辞書を指定し、茶筌本体にも UTF-8 で処理するようオプションを指定します。
375153 </p>
376154 <pre>
377155 $ chasen -i w UTF8.txt
378156 </pre>
379157 <p>
380-必要に応じて chasenrc も UTF-8 に変更してください。
158+必要に応じて chasenrc も UTF-8 に変更してください。
381159 </p>
382-<li>libchasen をリンクしようとすると「Undefined Symbol "cerr"」みたいなエラーがでる
160+<li>libchasen をリンクしようとすると「Undefined Symbol "cerr"」みたいなエラーがでる
383161 <p>
384-libchasen は一部 C++ のコードを含んでいます。そのためリンクするときは C++ 用のリンカを使うか、C++ の標準ライブラリ(libstdc++ など)をリンクするようにしてください。
385-半角文字が未知語になります
162+libchasen は一部 C++ のコードを含んでいます。そのためリンクするときは C++ 用のリンカを使うか、C++ の標準ライブラリ(libstdc++ など)をリンクするようにしてください。
163+半角文字が未知語になります
386164 </p>
387165 <p>
388-IPADIC には半角文字は登録されていません。あらかじめ入力文を全角文字に変換するか、辞書に半角文字のエントリを追加してください。
389-&quot;[&quot;(ASCII文字)が単語の最小単位になりません
166+IPADIC には半角文字は登録されていません。あらかじめ入力文を全角文字に変換するか、辞書に半角文字のエントリを追加してください。
167+&quot;[&quot;(ASCII文字)が単語の最小単位になりません
390168 </p>
391169 <p>
392-茶筌は日本語文字列を解析する際、連続するASCII文字を単語の最小単位とするため、単語 &quot;[&quot; を登録しても &quot;[&quot;で区切られません。
170+茶筌は日本語文字列を解析する際、連続するASCII文字を単語の最小単位とするため、単語 &quot;[&quot; を登録しても &quot;[&quot;で区切られません。
393171 </p>
394172 <p>
395-chasenrc ファイル(/usr/local/share/chasen/dic/ipadic/chasenrc など) に以下の行を追加すると、単語区切りが英語にある程度適したものになり、 [Unicode が [ と Unicode に区切られるようになります。
173+chasenrc ファイル(/usr/local/share/chasen/dic/ipadic/chasenrc など) に以下の行を追加すると、単語区切りが英語にある程度適したものになり、 [Unicode が [ と Unicode に区切られるようになります。
396174 </p>
397175 <pre>
398-(言語 "je")
176+(言語 "je")
399177 </pre>
400178 <p>
401-ただしこの場合、未知語の品詞が「未知語」ではなく「UNKNOWN」と出力されますのでご注意下さい。
179+ただしこの場合、未知語の品詞が「未知語」ではなく「UNKNOWN」と出力されますのでご注意下さい。
402180 </p>
403-<li>「茶筌」という名前の由来は?
181+<li>「茶筌」という名前の由来は?
404182 <p>
405-開発拠点である奈良先端科学技術大学院大学のある奈良県生駒市高山町が、日本有数の茶筌の産地であることから、この名前がつけられました。
183+開発拠点である奈良先端科学技術大学院大学のある奈良県生駒市高山町が、日本有数の茶筌の産地であることから、この名前がつけられました。
406184 </p>
407185 <p>
408-ちなみに、よく間違われますが漢字表記は「茶筅」ではなく「茶筌」です。 MS-IME などで「筌」の字が出なくてこまったときは、ローマ字表記の「ChaSen」でどうぞ。
186+ちなみに、よく間違われますが漢字表記は「茶筅」ではなく「茶筌」です。 MS-IME などで「筌」の字が出なくてこまったときは、ローマ字表記の「ChaSen」でどうぞ。
409187 </p>
410188 </ul>
411189 <hr>
412190 <h2>Mailing List</h2>
413191 <p>
414-ChaSen メイリングリストは形態素解析システム ChaSen について議論するメイリングリストです。
192+ChaSen メイリングリストは形態素解析システム ChaSen について議論するメイリングリストです。
415193 </p>
416194 <ul>
417195 <li>chasen-users@is.naist.jp
418196 <p>
419-ChaSen に関する質問を受けつけたり、ChaSen をよりよくするための議論を行うメイリングリストです。 chasen-users メイリングリストへ参加(登録)するには、本文に
197+ChaSen に関する質問を受けつけたり、ChaSen をよりよくするための議論を行うメイリングリストです。 chasen-users メイリングリストへ参加(登録)するには、本文に
420198 </p>
421199 <pre>
422-subscribe あなたの名前 (名前はローマ字で。例: Hanako Kondo)
200+subscribe あなたの名前 (名前はローマ字で。例: Hanako Kondo)
423201 </pre>
424202 <p>
425-と書いたメイルを chasen-users-ctl@is.naist.jp へ送ります。
203+と書いたメイルを chasen-users-ctl@is.naist.jp へ送ります。
426204 </p>
427205 <p>
428-退会するには本文の先頭に
206+退会するには本文の先頭に
429207 </p>
430208 <pre>
431209 # bye
432210 </pre>
433211 <p>
434-とだけ書いたメイルを chasen-users-ctl@is.naist.jp に送ります。その際、 From: は メイリングリストに登録しているアドレスに設定してください。
212+とだけ書いたメイルを chasen-users-ctl@is.naist.jp に送ります。その際、 From: は メイリングリストに登録しているアドレスに設定してください。
435213 </p>
436-<!-- [過去 log] [検索]-->
214+<!-- [過去 log] [検索]-->
437215 <li>chasen-announce@is.naist.jp
438216 <p>
439-ChaSen または ChaSen 用辞書のリリース連絡用メイリングリストです。 chasen-announce メイリングリストへ参加(登録)するには、本文に
217+ChaSen または ChaSen 用辞書のリリース連絡用メイリングリストです。 chasen-announce メイリングリストへ参加(登録)するには、本文に
440218 </p>
441219 <pre>
442-subscribe あなたの名前 (名前はローマ字で。例: Hanako Kondo)
220+subscribe あなたの名前 (名前はローマ字で。例: Hanako Kondo)
443221 </pre>
444222 <p>
445-と書いたメイルを chasen-announce-<b>ctl</b>@is.naist.jp へ送ります。
223+と書いたメイルを chasen-announce-<b>ctl</b>@is.naist.jp へ送ります。
446224 </p>
447225 <p>
448-退会するには本文の先頭に
226+退会するには本文の先頭に
449227 </p>
450228 <pre>
451229 # bye
452230 </pre>
453231 <p>
454-とだけ書いたメイルを chasen-announce-<b>ctl</b>@is.naist.jp に送ります。その際、 From: は メイリングリストに登録しているアドレスに設定してください。
232+とだけ書いたメイルを chasen-announce-<b>ctl</b>@is.naist.jp に送ります。その際、 From: は メイリングリストに登録しているアドレスに設定してください。
455233 </p>
456-<!-- [過去 log] [検索] -->
234+<!-- [過去 log] [検索] -->
457235 <li>chasen@is.naist.jp
458236 <p>
459-以前までのサポート用の ML です。システム/辞書の質問については、 今後 chasen-users ML に投稿してください。
237+以前までのサポート用の ML です。システム/辞書の質問については、 今後 chasen-users ML に投稿してください。
460238 </p>
461239 <p>
462-利用許諾などの権利関係の質問や、その他非公開としたい問い合わせなどについてはこちらの chasen ML まで御連絡 ください。
240+利用許諾などの権利関係の質問や、その他非公開としたい問い合わせなどについてはこちらの chasen ML まで御連絡 ください。
463241 </p>
464242 </ul>
465243 <hr>
@@ -472,16 +250,3 @@ subscribe あなたの名前 (名前はローマ字で。例: Hanako Kondo)
472250 </address>
473251 </body>
474252 </html>
475-
476-
477-
478-
479-
480-<!--
481- FILE ARCHIVED ON 23:40:48 Apr 25, 2007 AND RETRIEVED FROM THE
482- INTERNET ARCHIVE ON 7:47:20 Nov 25, 2011.
483- JAVASCRIPT APPENDED BY WAYBACK MACHINE, COPYRIGHT INTERNET ARCHIVE.
484-
485- ALL OTHER CONTENT MAY ALSO BE PROTECTED BY COPYRIGHT (17 U.S.C.
486- SECTION 108(a)(3)).
487--->
Show on old repository browser