On Tue, 13 Jul 2004 00:28:36 +0900
"Bruce." <kbk@...> さんwrote:
> > \p{InBasicLatin}はUnicode属性なので、use encoding "sjis"で使って意味が
> > あるのかどうか問題がありそうな気がします。他のものもそうですね。Perl 5.6
> > では、use utf8下で有効になる設定だったらしいですから。
>
> でも、今現在は内部コードはUnicodeベースですよね。であれば、Unicodeの
> プロパティ、スクリプト、ブロックの類は常に使えてもいいんじゃないかと
> 思うのですが。逆に使えないなら使えないでエラーにしてほしいところです。
JIS第一水準漢字を全部通してみますと、それなりに意味があるようにマッチ
が変化しますね。例えば、
graph:?
print:?
punct:?
graph:^
print:^
graph:〇
print:〇
word:〇
alnum:6
digit:6
graph:6
print:6
word:6
alpha:A
alnum:A
graph:A
print:A
upper:A
word:A
alpha:a
alnum:a
graph:a
lower:a
print:a
word:a
alpha:あ
alnum:あ
graph:あ
print:あ
word:あ
alpha:ア
alnum:ア
graph:ア
print:ア
word:ア
alpha:Θ
alnum:Θ
graph:Θ
print:Θ
upper:Θ
word:Θ
alpha:θ
alnum:θ
graph:θ
lower:θ
print:θ
word:θ
graph:┬
print:┬
alpha:亜
alnum:亜
graph:亜
print:亜
word:亜
IsAlpha は[\p{IsLl}\p{IsLu}\p{IsLt}\p{IsLo}]と等価と定義されていて、文
字、Letterにはアルファベットだけでなく漢字も含むと理解するしかない。
藤岡 和夫
FGALTS@...
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/