Ticket #10370

Windows 版における複合語モジュール
Eröffnet am: 2007-05-10 11:12 Letztes Update: 2007-05-10 11:12

Auswertung:
Verantwortlicher:
Typ:
Status:
Offen [Owner assigned]
Komponente:
(Keine)
Meilenstein:
(Keine)
Priorität:
5 - Mittel
Schweregrad:
5 - Mittel
Lösung:
Keine
Datei:
Keine

Details

Windows 版 chasen-2.4.0 + unidic-1.3.0 で「何時」を解
析すると、以下の
ような結果になります。

------------------------------------------------------
----------------
<cha:W1 orth="" kana="ナン" pron="ナン"
pos="BOS/EOS" ...></cha:W1>
<cha:W1 orth="" kana="ジ" pron="ジ"
pos="BOS/EOS" ...></cha:W1>
------------------------------------------------------
----------------

orth と pos が変です。

「何時」は複合語として以下のように登録されており、

------------------------------------------------------
----------------
(POS (名詞 普通名詞 一般)) ((LEX (何時 1730))
(COMPOUND
((POS (名詞 数詞)) (LEX 何) (READING ナン) (PRON
ナン) (INFO ...))
((POS (接尾辞 名詞的 助数詞)) (LEX 時) (READING
ジ) (PRON ジ) (INFO ...))
))
------------------------------------------------------
----------------

正しくは以下のように解析されるべきです。

------------------------------------------------------
----------------
<cha:W1 orth="何" kana="ナン" pron="ナン" pos="名詞-数
詞" ...>何</cha:W1>
<cha:W1 orth="時" kana="ジ" pron="ジ" pos="接尾辞-名詞
的-助数詞" ...>時</cha:W1>
------------------------------------------------------
----------------

実際、同じソースから作られているはずの Unix 版 (gcc-
3.4.4 で make) で
は、正しく解析されます。

Unix 版で作成したシステム辞書を使っても同じ現象が生じ
るので、mkchadic
ではなく、chasen の問題です。

o Windows 版を作成したときの版が古かった。
o Windows 用に書かれたコード部分にバグがある。
o ソースコードにもともと潜在的な問題があり、Windows
版で使っているコ
ンパイラ (borland かなにかに変えたと言ってましたよ
ね) でそれが顕在
化した。

あたりだと思うのですが、心当たりはあるでしょうか。

Ticket-Verlauf (0/0 Historien)

Dateianhangliste

Keine Anhänge

Bearbeiten

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » Anmelden