作者: Bruce.
日時: 2006/9/12(16:29)
自称Rubyistが TSPython や TSPerl にばっかり書いているのもなんなので、
枯れ木も山の賑わいということでネタ投下。
#ruby-devに投げようかとも思ったのですが

Matzにっきの9/9のエントリで、名前によるキャラクタ指定(Perlでいうところ
の \N{...} )をM17NしたRubyでも(Unicode使用時に限定して)導入するかもと
ありましたが個々の文字はともかくとしても、「漢字」(さらに細かく言えば
JIS第一水準、第二水準とか)を表すクラスとか、ひらがな、カタカナを
あらわすそれは他のコードでも(正規表現のクラス指定で)使えてもいいんじゃ
ないかあと思います。

ただ、エンコーディングごとに「漢字」の範囲が違うとかいやらしいところも
ありますがこういう意見もあるということで一つ。

あと、これは小迫さんに云うべきことかもしれませんが、Perl 5.8.5から
使えるようになった、ユーザー定義の文字クラス \p{...} (...の部分の
名前とそれが表す集合をユーザーが定義できる)が欲しいです。
鬼車単体では難しいと思うのでまつもとさんにも意見表明。

それから質問が一つ。

  s = "abc\p{HALFWIDTH KATAKANA KA}def"

というASCII文字列があり(\p{…}は半角カナ文字を指定していると考えてください)、
tounicode とかいうメソッド(があったとして)を送ると

   uni = s.unicode

その結果はどうなるのでしょうか?

Unicodeの名前によるキャラクタ指定(正式名称なんでしたっけ?)は有効に
なるのでしょうか?

いじょ。