WATANABE Hirofumi <eban@...> さん wrote.
> % echo '藤高' |od -tx1
> 0000000 c6 a3 b9 e2 0a
> 0000005
> % echo '9' |od -tx1
> 0000000 a3 b9 0a
> 0000003
ありがとうございます。私の EUC に対する認識が甘かったようです(^^;。
Windows 環境では SJIS で、日本語の場合は jperl, jgawk, jsed を使わせても
らっていた関係で問題意識がなく、EUC なら日本語部分も特別な処理なく、
perl, gawk, sed で Ok なんだよなあ、と漠然と思っていました。しかし、これ
はスクリプト内部に書いた場合にも Ok であるとか、かなり限定された局面にの
み言えることで、文字列の検索をやりだすと、もう日本語化されていないスクリ
プト言語では駄目なんですね……。
#!/usr/bin/perl
$str = "藤高";
if ($str =~ /9/) {
print "Ohh, bad!\n";
}
Perl がこんな状態では、日本語データを正しく扱うのはかなりしんどそうで……
皆さん、どうされているんでしょう?
--
本田博通(閑舎)
Hiromichi Honda <raku@...>