作者: 藤岡和夫
日時: 2004/7/13(20:44)
On Tue, 13 Jul 2004 00:28:36 +0900
"Bruce." <kbk@...> さんwrote:

> >  \p{InBasicLatin}はUnicode属性なので、use encoding "sjis"で使って意味が
> > あるのかどうか問題がありそうな気がします。他のものもそうですね。Perl 5.6
> > では、use utf8下で有効になる設定だったらしいですから。
> 
> でも、今現在は内部コードはUnicodeベースですよね。であれば、Unicodeの
> プロパティ、スクリプト、ブロックの類は常に使えてもいいんじゃないかと
> 思うのですが。逆に使えないなら使えないでエラーにしてほしいところです。

 JIS第一水準漢字を全部通してみますと、それなりに意味があるようにマッチ
が変化しますね。例えば、

graph:?
print:?
punct:?

graph:^
print:^

graph:〇
print:〇
word:〇

alnum:6
digit:6
graph:6
print:6
word:6

alpha:A
alnum:A
graph:A
print:A
upper:A
word:A

alpha:a
alnum:a
graph:a
lower:a
print:a
word:a

alpha:あ
alnum:あ
graph:あ
print:あ
word:あ

alpha:ア
alnum:ア
graph:ア
print:ア
word:ア

alpha:Θ
alnum:Θ
graph:Θ
print:Θ
upper:Θ
word:Θ

alpha:θ
alnum:θ
graph:θ
lower:θ
print:θ
word:θ

graph:┬
print:┬

alpha:亜
alnum:亜
graph:亜
print:亜
word:亜

 IsAlpha は[\p{IsLl}\p{IsLu}\p{IsLt}\p{IsLo}]と等価と定義されていて、文
字、Letterにはアルファベットだけでなく漢字も含むと理解するしかない。

藤岡 和夫
FGALTS@...
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/