作者: たむらけんいち
日時: 2002/8/26(01:28)
On Sun, 25 Aug 2002 21:47:47 +0900 (JST)
閑舎 <raku@...> wrote:

> WATANABE Hirofumi <eban@...> さん wrote.
> 
> > Perl 5.8.0を使えば
> > 
> > use encoding "euc-jp", Filter=>1;
> > use utf8;
> > 
> > でEUCを扱えます。

http://digit.que.ne.jp/work/index.cgi?Encode に Encode.pm の説明があります。
最新の BSD mag には、作者の小飼さんの記事があります。最近 ruby-talk の多言語に
関しての討論にも参加されてますね。

> がそのまま通ってくれれば、一応使えることは使えるけれど、やはり日本語デー
> タ処理には ruby を使いたくなりますね。ruby は一度 Unicode へコンバートし
> たりしてないですよね?

現在の Rubyは内部コードといったものはなく、スクリプトを書く人が指定しますね。
#/usr/bin/ruby -Ks でシフトJISとか。
2.0では、Unicodeではないですが、内部コードみたいな仕組みを持つとか。
utf-8 対応の nkf が発表されたりしてるので、ちょっと組込んだりしてますが。
http://tamura.tdiary.net/20020826.html#p01

# GNU Grep の 2.5 は、multi-byte対応のはずですが、どうでしょう ?
# http://www.ruby-lang.org/~eban/diary/200203b.html#200203161
# http://www.ruby-lang.org/~eban/diary/200203b.html#200203171

-- 

たむら (http://tamura.tdiary.net)