[MUSASHI-users] データクリーニングについて

Zurück zum Archiv-Index

Yukinobu Hamuro hamur****@adm*****
2003年 8月 23日 (土) 15:50:19 JST


羽室です

ハイフンを省くということでしょうか?

もしそうならxtsedというコマンドの利用をお勧めします。
元データをXMLtableにコンバートした後で、
xtsed -f 項目リスト -c - -v '' -i indat -o outdat
で省けます。
ここで-fにはハイフンを省く対象となる項目名リストを指定します。
もし、ハイフンのみで構成される値があった場合は、NULL値(*)に置き換わります。

-cパラメータにはより複雑な正規表現の指定も可能(sedやgrepと同等)なので、データクリーニングには結構つかえると思います。


iida さんは書きました:
>恐れ入ります。
>
>お取組先様から頂く元データに 「-(ハイフン)」
>が含まれております。
>
>MUSASHIに取り込む際、
>ハイフンを上手にクリーニングする方法を教えていただけないでしょうか?
>
>
>□□□□□□□□□□□□□□□□□□
>   株式会社CMC FSP推進部
>        飯田洋
>〒143-0006 
> 東京都大田区平和島6-1-1
> (東京流通センタービル5F)
>〓(03)5767-8321  Fax(03)5767-8322
>   E*mail : iida****@ecoup*****
>      P*mail : cmc_iida0****@docom*****
>□□□□□□□□□□□□□□□□□□ 

----
Yukinobu Hamuro  hamur****@adm*****



MUSASHI-users メーリングリストの案内
Zurück zum Archiv-Index