作者: dune
日時: 2002/8/25(19:59)
極悪です。

いつも思うのですが、Ruby が使える人は Ruby 最強ってかんじなの
にどうして perl も使っちゃうんでしょ?

>Perl がこんな状態では、日本語データを正しく扱うのはかなりしん
>どそうで……
>皆さん、どうされているんでしょう?

jcode.pl を使う。
http://www.din.or.jp/~ohzaki/perl.htm#JP_Z2H

僕はなぜか使ったことないですが、今の perl には use utf8 とい
うプラグマがあります。これと Jcode.pm あるいは Filter::Jcode
を組み合わせると、建前上、日本語を自由に処理できるはず。
http://www1.accsnet.ne.jp/~freesemt/perl/filter-jcode.html

僕自身は UCS2 に変換して頭から2バイトずつ処理したり、SJIS 
のままで文字境界に \x00 入れたりしてます。長さ4文字以上の文
字列しか操作しない、ということなら漢字と ASCII の間に \x00 
を入れるだけでもほとんどOK(m// とかで \Q は使いますが)。

-- 

#ActiveState is evaluating Perl 5.8 for an upcoming 
#version of ActivePerl. 

だそうな。