作者: Bruce.
日時: 2006/5/07(23:27)
Bruce.です。

藤岡和夫 さんは書きました (2006/05/07 9:20):

> byte指向になって問題なのは、UTF-8関連の正規表現を活かせないというこ
> とぐらいですかね。それ以外に何か問題があるのでしょうか。UTF-8を使えば書
> くのは楽だし、問題がないならその方向で進みたいと思ったり・・・

「文字」として扱うのなら、どこかの時点で decodeして内部表現に
してやるのがよろしいかと。cp932(ShiftJIS)相手だと'〜'とか
悩ましい文字がいくつかありますけど。

バイト列として読み取っても、decodeするのは任意のタイミングで
できますし、Encode::Guess でコードの推測も可能ですしね。

-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk at kt.rim.or.jp
	web  www.kt.rim.or.jp/~kbk/index.html#zakkicho
	     homepage3.nifty.com/farstar/

-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk@...
	web  www.kt.rim.or.jp/~kbk/index.html#zakkicho
	     homepage3.nifty.com/farstar/