作者: 藤岡和夫
日時: 2006/5/08(00:10)
On Sun, 07 May 2006 23:27:54 +0900
"Bruce." <kbk@...> さんwrote:

> > byte指向になって問題なのは、UTF-8関連の正規表現を活かせないというこ
> > とぐらいですかね。それ以外に何か問題があるのでしょうか。UTF-8を使えば書
> > くのは楽だし、問題がないならその方向で進みたいと思ったり・・・
> 
> 「文字」として扱うのなら、どこかの時点で decodeして内部表現に
> してやるのがよろしいかと。cp932(ShiftJIS)相手だと'〜'とか
> 悩ましい文字がいくつかありますけど。
> 
> バイト列として読み取っても、decodeするのは任意のタイミングで
> できますし、Encode::Guess でコードの推測も可能ですしね。

 そうですねえ。自在に取り扱えるように次第になりつつあるので、なんとか、
Unicodeのメリットも活かせるようにしたいですね。

藤岡 和夫
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/