647. Re: encodingと正規表現


番号順一覧Top スレッド順一覧Top
作者: Bruce.
日時: 2006/2/26(02:30)
Bruce.です。

Zazel さんは書きました (2006/02/26 1:35):
> 無責任に書きますが、もう数字内と英字内以外での範囲指定は
> 出来ないことにするしかないと思います。例えばUTF-EBCDIC を
> 考慮すると、たぶん [0-Z] でさえ意味なくなると予想できますし。
> 
> # 極端な話、aAbB... と並んでいるcharsetがあったような。

GNU/Linux の en_US.UTF-8なんかがそうです。> aAbB

grepやgawkのメーリングリストなどにときどきこれに起因する
バグ報告が流れています。

過去雑記帖に書いたのですが、Windows日本語版では locale上の
順序が aaAAbb... なので、私が配布しているWindows用
gawk/sed/grepのバイナリでは楽しいことになってます。

-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk@...
	web  www.kt.rim.or.jp/~kbk/index.html#zakkicho
	     homepage3.nifty.com/farstar/
前の発言: 646. Re: encodingと正規表現 [藤岡和夫] 2006/2/26(01:38)
後の発言: 648. Re: encodingと正規表現 [Bruce.] 2006/2/26(02:29)
親発言: 645. Re: encodingと正規表現 [Zazel] 2006/2/26(01:35)
子発言: