自称Rubyistが TSPython や TSPerl にばっかり書いているのもなんなので、
枯れ木も山の賑わいということでネタ投下。
#ruby-devに投げようかとも思ったのですが
Matzにっきの9/9のエントリで、名前によるキャラクタ指定(Perlでいうところ
の \N{...} )をM17NしたRubyでも(Unicode使用時に限定して)導入するかもと
ありましたが個々の文字はともかくとしても、「漢字」(さらに細かく言えば
JIS第一水準、第二水準とか)を表すクラスとか、ひらがな、カタカナを
あらわすそれは他のコードでも(正規表現のクラス指定で)使えてもいいんじゃ
ないかあと思います。
ただ、エンコーディングごとに「漢字」の範囲が違うとかいやらしいところも
ありますがこういう意見もあるということで一つ。
あと、これは小迫さんに云うべきことかもしれませんが、Perl 5.8.5から
使えるようになった、ユーザー定義の文字クラス \p{...} (...の部分の
名前とそれが表す集合をユーザーが定義できる)が欲しいです。
鬼車単体では難しいと思うのでまつもとさんにも意見表明。
それから質問が一つ。
s = "abc\p{HALFWIDTH KATAKANA KA}def"
というASCII文字列があり(\p{…}は半角カナ文字を指定していると考えてください)、
tounicode とかいうメソッド(があったとして)を送ると
uni = s.unicode
その結果はどうなるのでしょうか?
Unicodeの名前によるキャラクタ指定(正式名称なんでしたっけ?)は有効に
なるのでしょうか?
いじょ。