作者: 閑舎
日時: 2002/8/25(17:27)
WATANABE Hirofumi <eban@...> さん wrote.

> % echo '藤高' |od -tx1
> 0000000 c6 a3 b9 e2 0a
> 0000005
> % echo '9' |od -tx1
> 0000000 a3 b9 0a
> 0000003

ありがとうございます。私の EUC に対する認識が甘かったようです(^^;。
Windows 環境では SJIS で、日本語の場合は jperl, jgawk, jsed を使わせても
らっていた関係で問題意識がなく、EUC なら日本語部分も特別な処理なく、
perl, gawk, sed で Ok なんだよなあ、と漠然と思っていました。しかし、これ
はスクリプト内部に書いた場合にも Ok であるとか、かなり限定された局面にの
み言えることで、文字列の検索をやりだすと、もう日本語化されていないスクリ
プト言語では駄目なんですね……。

#!/usr/bin/perl
$str = "藤高";
if ($str =~ /9/) {
  print "Ohh, bad!\n";
}

Perl がこんな状態では、日本語データを正しく扱うのはかなりしんどそうで……
皆さん、どうされているんでしょう?

--
本田博通(閑舎)
Hiromichi Honda <raku@...>