On Sun, 25 Aug 2002 21:47:47 +0900 (JST)
閑舎 <raku@...> wrote:
> WATANABE Hirofumi <eban@...> さん wrote.
>
> > Perl 5.8.0を使えば
> >
> > use encoding "euc-jp", Filter=>1;
> > use utf8;
> >
> > でEUCを扱えます。
http://digit.que.ne.jp/work/index.cgi?Encode に Encode.pm の説明があります。
最新の BSD mag には、作者の小飼さんの記事があります。最近 ruby-talk の多言語に
関しての討論にも参加されてますね。
> がそのまま通ってくれれば、一応使えることは使えるけれど、やはり日本語デー
> タ処理には ruby を使いたくなりますね。ruby は一度 Unicode へコンバートし
> たりしてないですよね?
現在の Rubyは内部コードといったものはなく、スクリプトを書く人が指定しますね。
#/usr/bin/ruby -Ks でシフトJISとか。
2.0では、Unicodeではないですが、内部コードみたいな仕組みを持つとか。
utf-8 対応の nkf が発表されたりしてるので、ちょっと組込んだりしてますが。
http://tamura.tdiary.net/20020826.html#p01
# GNU Grep の 2.5 は、multi-byte対応のはずですが、どうでしょう ?
# http://www.ruby-lang.org/~eban/diary/200203b.html#200203161
# http://www.ruby-lang.org/~eban/diary/200203b.html#200203171
--
たむら (http://tamura.tdiary.net)