作者: dune
日時: 2003/10/19(09:22)
極悪です。

perl で日本語を扱う方法としては、byte モードのまま perl を騙
し騙し使うか、jcode.pl や JPerl を使うか、あまり好きではない
けど Jcode.pm を使うかで、v5.8 の Unicode や Encode モジュー
ルはまだ信頼できないと思ってました。

しかし morogram という utf8 専用のテキスト分析ツールで使って
いる Unicode モジュールを Encode モジュールで置き換えたとこ
ろ、日本語(sjis とか)だけでなく自然に Big5 などの大陸言語
にも対応できてしまいました。字が読めないので、実際に Big5 の
処理結果をチェックしたわけではありませんが、論文で紹介される
くらいのツールなのでそのうち実績が出ると期待してます。
  http://sourceforge.jp/projects/morogram/

DBI/DBD や AnyDBM も同じアーキテクチャなので何をいまさら、と
いうかんじではありますが、インターフェースとドライバ部分が分
離しているとこんなにもうれしいものなのですね。Encode モジュ
ールをやっと使う気になりました。
--