作者: 藤岡和夫
日時: 2003/10/20(00:34)
 ご無沙汰しています。

 Perl5.8の問題は、SJISでスクリプトを書く場合、パターンマッチの文字列に
SJISが使えないところだと思うのですが・・・

 5.8.0ではformatで一部SJIS文字列が化けて使えないようでしたが、5.8.1では
直っているかもしれません。

 それからライブラリ・モジュールで、Wide Characterがどうのこうのというエ
ラーが出てしまう場合があるということとか。

 SJISでスクリプトを書く場合にこう使えば間違いないというところになかなか
行き着かないです。

 EUCなら問題ないんでしょうけどね。

On Sun, 19 Oct 2003 09:22:57 +0900
dune <FZH01112@...> さんwrote:

> 極悪です。
> 
> perl で日本語を扱う方法としては、byte モードのまま perl を騙
> し騙し使うか、jcode.pl や JPerl を使うか、あまり好きではない
> けど Jcode.pm を使うかで、v5.8 の Unicode や Encode モジュー
> ルはまだ信頼できないと思ってました。
> 
> しかし morogram という utf8 専用のテキスト分析ツールで使って
> いる Unicode モジュールを Encode モジュールで置き換えたとこ
> ろ、日本語(sjis とか)だけでなく自然に Big5 などの大陸言語
> にも対応できてしまいました。字が読めないので、実際に Big5 の
> 処理結果をチェックしたわけではありませんが、論文で紹介される
> くらいのツールなのでそのうち実績が出ると期待してます。
>   http://sourceforge.jp/projects/morogram/
> 
> DBI/DBD や AnyDBM も同じアーキテクチャなので何をいまさら、と
> いうかんじではありますが、インターフェースとドライバ部分が分
> 離しているとこんなにもうれしいものなのですね。Encode モジュ
> ールをやっと使う気になりました。
> -- 

藤岡 和夫
FGALTS@...
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/