極悪です。
いつも思うのですが、Ruby が使える人は Ruby 最強ってかんじなの
にどうして perl も使っちゃうんでしょ?
>Perl がこんな状態では、日本語データを正しく扱うのはかなりしん
>どそうで……
>皆さん、どうされているんでしょう?
jcode.pl を使う。
http://www.din.or.jp/~ohzaki/perl.htm#JP_Z2H
僕はなぜか使ったことないですが、今の perl には use utf8 とい
うプラグマがあります。これと Jcode.pm あるいは Filter::Jcode
を組み合わせると、建前上、日本語を自由に処理できるはず。
http://www1.accsnet.ne.jp/~freesemt/perl/filter-jcode.html
僕自身は UCS2 に変換して頭から2バイトずつ処理したり、SJIS
のままで文字境界に \x00 入れたりしてます。長さ4文字以上の文
字列しか操作しない、ということなら漢字と ASCII の間に \x00
を入れるだけでもほとんどOK(m// とかで \Q は使いますが)。
--
#ActiveState is evaluating Perl 5.8 for an upcoming
#version of ActivePerl.
だそうな。