作者: davi
日時: 2005/12/04(20:10)
MIZUHA Nobuoさん  <  こん??は でび です

On Sun, 04 Dec 2005 14:53:14 +0900
MIZUHA Nobuo <laoshu_1960@...> wrote:

> 1)スクリプトも対象ファイルもUTF8
>   → --ctype=UTF8を指定しても、しなくても問題無し
> 
> 2)スクリプトも対象ファイルもSJIS
>  → デフォルトで問題なく処理。

なるほど。わかりました。ありがとうございました。

> 【新たな疑問】
> daviさんのスクリプト

> の場合、うまく所期の動作をしません。

これをUTF8でやった場合、上手く行かないのは[TSfree:1346] 
でBruce.さんが

>> s/\([ぁ-ん]\)\([亜-腕弌-熙]\)/\1\
>
>これ漢字の方は期待通りのマッチングしません。
>以前も書きましたが、内部的にはUnicodeに変換していてそこでの値で
>判定しているのでJIS X208でそういう並びだからといっても話は通じ
>ません。

と仰っています。

でび  http://homepage1.nifty.com/davi/