作者: 藤岡和夫
日時: 2008/6/28(09:38)
On Sat, 28 Jun 2008 03:54:18 +0900
"davi" <davi-1984@...> さんwrote:

> >2バイト文字がうまく扱えなかったので、
> >> substr($0,i,1) substr($0,i+1,1)
> >超適当に1バイトずつ処理しました
> 
> の所をもう少し「1文字」を処理系の側でキチンと認識してくれる
> ような書き方ってできないもんかな、というような気持ちなんですが。
> 
> そうでないと、Ext.Bの処理も盛り込もうとすると、困るだろうなぁと。

 最初は、jperlで書いて試したのですけど、よく考えるとでびさんの要求は文
字コードがuft8という前提なので、utf8用に書き直しました。

 use utf8を使うと、splitの文字を区切る動作が変わるので、文字単位に切り
出すのが簡単になるということと、print出力でutf8フラグをencodeではずす必
要があるということが、このスクリプトのポイントですね。

 このようにutf8フラグの話が入ってくるとPerlは躓いてしまうことが多くなる
と思います。使いにくい。Rubyなら簡単なのかも。

 それはそうと、Ext.Bとはなにですか。

藤岡 和夫
kazuf@...
日曜プログラマのひとりごと http://homepage1.nifty.com/kazuf/renewal.html