山田です。
半角・大文字「Z」がPRONタグに置き換わるのが
なぜかはよくわからないのですが,それ以外は,
UniDicの出力に起因するもののようです。
UniDicの解析結果がそれぞれ,
z
<cha:W1 orth="z" kana="ゼット" pron="{ゼッド/ゼット}" pos="記号-文字"
lForm="ゼット" lemma="Z" orthBase="z" pronBase="{ゼッド/ゼット}"
kanaBase="ゼット" formBase="ゼット" goshu="記号" aType="1">z</cha:W1>
Z
<cha:W1 orth="Z" kana="{ゼット/ゼット/ズィー}" pron="{ゼッド/ゼット
/ズィー}" pos="記号-文字" lForm="ゼット" lemma="Z" orthBase="Z"
pronBase="{ゼッド/ゼット/ズィー}" kanaBase="{ゼット/ゼット/ズィー}"
formBase="{ゼット/ゼット/ズィー}" goshu="記号" aType="1">Z</cha:W1>
z
<cha:W1 orth="z" kana="ゼット" pron="{ゼット/ゼッド}" pos="記号-文字"
lForm="ゼット" lemma="Z" orthBase="z" pronBase="{ゼット/ゼッド}"
kanaBase="ゼット" formBase="ゼット" goshu="記号" aType="1">z</cha:W1>
Z
<cha:W1 orth="Z" kana="{ズィー/ゼット/ゼット}" pron="{ズィー/ゼット
/ゼッド}" pos="記号-文字" lForm="ゼット" lemma="Z" orthBase="Z"
pronBase="{ズィー/ゼット/ゼッド}" kanaBase="{ズィー/ゼット/ゼット}"
formBase="{ズィー/ゼット/ゼット}" goshu="記号" aType="1">Z</cha:W1>
のようになっており,デフォルトで先頭のものが
選ばれるとご指摘のような結果になります。
国語研の人に聞いてみないとわかりませんが,
「ゼッド」の代表形が「ゼット」になっています
ので,これは誤りではなく,実際にコーパスにこ
のような例があったのではないかと思われます。
解決方法としては,本来ならば,語形選択ルーチ
ンが存在して,適切な発音形を選択すべきなので
すが,少なくともゼッドのような特殊なものが先
頭にこないようにできないか,UniDicプロジェク
トに打診してみます。
マーチンです。
Zの読み上げ方が変です。
半角・小文字「z」は、「ゼット」ではなく「ゼッド」と読み上げる。
全角・小文字「z」は、「ゼット」ではなく「ゼッド」と読み上げる。
半角・大文字「Z」は、<PRON SYM="ゼ’ット">Z</PRON>に置き換えられ、「ゼット」と読み上げる。
全角・大文字「Z」は、読んでくれない。
* Unknown KANA ... ズィ と表示される
galatea4win-istc-2009-02.zip
+ chaone-win-1.3.2-091201.zip
+ DATE: NO TIME: NO
+ unidic-chasen1312_sjis
で確認しています。