Bruce.です。
どもです。
On Sat Feb 25 14:58:43 JST 2006
藤岡和夫 <kazuf@...> wrote:
> 「正規表現ハンドブック」ネタ。
>
> SECTION 09.03 漢字・ひらがな・カタカナにマッチさせる(191ページ)
>
> ここで、文字列がシフトJIS、あるいはEUCの場合、Unicodeプロパティが使えな
> いということになって、従来のjperlで使う正規表現が例示されているのですが、
> Perl5.8では、sjisエンコーディング下で、\p{Han}や\p{Hiragana}が使えるよう
> に思います。
>
> また、Perl5.8のsjisエンコーディングでは、jperlの漢字の正規表現は同じ動作
> になりませんね。
今出先なんで確認できませんが(後で確認します)、多分間違いです。
use encoding しちゃえば中身はフラグつきのutf-8文字列ですからね。
その部分はわたしの書いた部分ではありませんが、監修ということで
事前に原稿をチェックしてますんでチェック漏れだと思います。
あうあう。
間違いだったとして、編集さんに連絡取ったほうがいいのかな。
会社名が変わっていたり(ソフトバンクパブリッシング→ソフトバンククリエイティブ)
するのだけどメールアドレス生きているだろうか?
Perl 5.8.xでの日本語処理は独特の問題(引っかかりやすい落とし穴とか)が
いろいろあるので、どっかにまとまっているとよいかもしれませんね。
検索エンジンで探せばそこかしこにありはするのですが。
--
木村浩一
I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
mail kbk at kt.rim.or.jp
web www.kt.rim.or.jp/~kbk/index.html#zakkicho