作者: 藤岡和夫 | |
日時: 2006/5/08(00:10) |
On Sun, 07 May 2006 23:27:54 +0900 "Bruce." <kbk@...> さんwrote: > > byte指向になって問題なのは、UTF-8関連の正規表現を活かせないというこ > > とぐらいですかね。それ以外に何か問題があるのでしょうか。UTF-8を使えば書 > > くのは楽だし、問題がないならその方向で進みたいと思ったり・・・ > > 「文字」として扱うのなら、どこかの時点で decodeして内部表現に > してやるのがよろしいかと。cp932(ShiftJIS)相手だと'〜'とか > 悩ましい文字がいくつかありますけど。 > > バイト列として読み取っても、decodeするのは任意のタイミングで > できますし、Encode::Guess でコードの推測も可能ですしね。 そうですねえ。自在に取り扱えるように次第になりつつあるので、なんとか、 Unicodeのメリットも活かせるようにしたいですね。 藤岡 和夫 kazuf@... TS Networkのために http://homepage1.nifty.com/kazuf/