作者: Bruce.
日時: 2005/3/08(22:18)
Bruce.です。

第二特集 日本語環境は4つのポイントで制覇せよ の中で
GNU grep、gawk、GNU sedの日本語対応について述べている部分が
あるんですが、オペミスしてませんかね。

JISに対応していないとか、SJISでgrepが音引き(ー)を検索できな
かったとかあるんですが(77p)、UNIX環境でのマルチバイト対応は
環境変数LANG(かそれに類するもの)を適切に設定してやらなけれ
ばならいのにそれをしている形跡かありません。

音引きのSJISでの値は2バイト目が 0x5b ({) なんで、EUC-JPあた
りの設定のまま使っているような気がします。grep等のマルチバ
イト対応はワイド文字に変換してから処理することで行っている
ので、うまく検索できないというとライブラリのバグが疑われて
しまいます。

まつもとさんの連載今月からだったんですね。買ってから気がついた
#毎月買っているわけではないのです

-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk@...
	web  www.kt.rim.or.jp/~kbk/index.html#zakkicho
	     homepage3.nifty.com/farstar/