ねこ丸です。
藤岡和夫 writes:
> http://www.rwds.net/kuroita/program/Perl_unicode.html
>
> が、うまくまとめてますね。
>
> これでほぼ自在に取り扱えそうです。
どういう結論になったのか分からないですが、自分としては
use open
binmode
でいいような気がします。TSabc ですしね :-)
ただ、なぜこれが必要なのかを説明するためには UTF8 フラグを理解しない
といけないわけですが。
正直この Perl のUTF-8周りは面倒なだけじゃんと自分も思いまし
た。という話は以下に書いてあります。
結局日本語周りをまとめた - あーありがち (2007-08-03)
http://aligach.net/diary/20070803.html#p02
たどりついてもらえなかったのが残念です :-)
以下余談。
正確に「内部エンコーディング」と呼べるものを持っていない PHP 5.x 以下
も藤岡さんの要望には合うかも。UTF-8 なら preg で処理できるし。ただ 6 だ
と「内部エンコーディング」ができちゃうとか? よく調べてませんけど。
※ 5.x までの PHP の mbstring.internal_encoding は様々な変換などの処理
でデフォルトのエンコーディングとして働くだけで、PHP の内部的に何か特
別な意味があるわけではありません。特別な意味があるように見えるのはこ
れをもとにいろんなフィルタが自動で働くからです。
--
ねこ丸