作者: kbk
日時: 2006/2/25(15:46)
Bruce.です。

どもです。

On Sat Feb 25 14:58:43 JST 2006
藤岡和夫 <kazuf@...> wrote:

> 「正規表現ハンドブック」ネタ。
> 
> SECTION 09.03 漢字・ひらがな・カタカナにマッチさせる(191ページ)
> 
> ここで、文字列がシフトJIS、あるいはEUCの場合、Unicodeプロパティが使えな
> いということになって、従来のjperlで使う正規表現が例示されているのですが、
> Perl5.8では、sjisエンコーディング下で、\p{Han}や\p{Hiragana}が使えるよう
> に思います。
> 
> また、Perl5.8のsjisエンコーディングでは、jperlの漢字の正規表現は同じ動作
> になりませんね。

今出先なんで確認できませんが(後で確認します)、多分間違いです。
use encoding しちゃえば中身はフラグつきのutf-8文字列ですからね。
その部分はわたしの書いた部分ではありませんが、監修ということで
事前に原稿をチェックしてますんでチェック漏れだと思います。

あうあう。

間違いだったとして、編集さんに連絡取ったほうがいいのかな。
会社名が変わっていたり(ソフトバンクパブリッシング→ソフトバンククリエイティブ)
するのだけどメールアドレス生きているだろうか?

Perl 5.8.xでの日本語処理は独特の問題(引っかかりやすい落とし穴とか)が
いろいろあるので、どっかにまとまっているとよいかもしれませんね。
検索エンジンで探せばそこかしこにありはするのですが。

-- 
木村浩一
 I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
 mail kbk at kt.rim.or.jp
 web  www.kt.rim.or.jp/~kbk/index.html#zakkicho