作者: Bunta
日時: 2004/11/19(02:33)
 Bruce.  さん、こんにちは。遅れました。色々とお教えいただき、ありがとうご
ざいます。ほんと、分からないのが口惜しいと感じていた部分をピンポイントに
教えてもらいました。多謝です。m(_B_)m

> >  作れますか! 作って下さい〜。
> へ? まだこの状態では日本語対応してませんよ?

 ああ、そうですね。ハードルは高く、いっぱいある…。

>>>いいたかったのは、gawkも GNU grep もオリジナルからマルチバイト文字対応に
>>>なってます。が、GNU sed に関しては y コマンドだけという現状です。

 以下の internationalization, localization についての説明で長いあいだよ
く分からなかったことが氷解しました。 なるほど、なるほど。 でも、何で sed
だけ特殊なんでしょうね…?

> 仕組みです。日本語固有の対応はlocalizationですね。それぞれi18n、l10nという
> 略され方をします。

 なるほど、なるほど。φ(.. )メモメモ コードネームまで教えていただいて。

> これは日本語(というかshift-jis)対応してるからです。

 そうそう、文字コードの壁もあるのか…。(僕には、壁なんです。
testsuitesの中身も、QKC してますし。)

> D:\home>perl -Mencoding=sjis -e "$_= q!あ!;y/あ/a/; print $_;"
> a

 例によって(実況中継ができてなかったですが、僕がコマンドラインで試験し
ていた様子は、Bruce.  さんには見てとるように分かっていたと思いますので、
例によって、です)、コマンドラインから「あ」を入れるつもりだったのですね。
でも、 きっと、$_= q!あ!; の部分で、すでに入力まで指定されてる形だった
んですよね。 お手数をおかけしまして m(__)m。a  と出力されました。うう、
perl は読めない…。

(正規表現対照表に関して)
> ygrepねえ。ソース公開してなかったが気に入らなかったので記載しませんでした。
> その点cgrepはソース公開でしたからね。しっかり一覧表にのっけてます。

 ええ、cgrep は立派です。頼もしい奴です。お世話になってます。ほんとに。
使い倒せてるとこまでいってなくて、不甲斐ない感じではありますが。cgrep は
32ビット版もあるし。

> ここ数年エディタ編も考えているのですが実現していません。候補は Emacs、xyzzy、
> Vim、Wz Editor、秀丸(後ろ二つはフリーソフトウェアではありませんが)といったあ
> たり。これはWz(Ver4)の正規表現のあまりの機能の低さに頭にきて、という感じです。
 QXというのが、割とVz卒業生にユーザの多いエディタだった思います。たし
か、マクロがlispライクだったので、僕は、見た瞬間、ご勘弁と思ったのですが。

 じつは、ここで滞りました。僕らユーザの場合は、そう易々FSWに文句をた
れてはいけない、というのが不文律でして、そして、つい先日、その禁を犯した
ばかりでして、そのことは身内のものにばれてたりしまして、そして、そのうえ、
あっちの皆様もここを見てたりして。(大々的に宣伝して、誘ったりもしてて
< mbsed です)

 Vzで正規表現を可能した人とWzでそれを担当している人は、同じ人だった
りします。で、確かに、今となっては不足を感じる場面も多いんですよね。でも、
少なくともVzの正規表現部分に関しては、不満を言ったりしていけなかったり
するのです。市販ソフトに同梱されてるとはいえ、FSWなので。祟られちゃう
んですよ、それこそ。
 でも、これは Bruce. さんには関係のないことです。どうぞ、頭に来てくださ
い。よかったら、VWXの(だいぶ変な)仕様、直していただけたら、10人くらい
死ぬほど感謝する人たちがおりますが…。アセンブラのはずです。あうあう。ソ
ースがなかったりします。

 因みに、Vz作者の c.mos さんは正規表現が嫌いで、そのために、ある意味、
合理的な検索システムをVz本体に全面的に導入しているところがあります。そ
の部分はその部分で、かなり便利だったりします。
 また、Vzでは置換にラインバッファを使わないので、s/\n/\n\n\n/みたいな
ことが平気でできて、すごく便利だったりするのです。でも、ここに正規表現を
絡められないので、僕はsedに助けてもらおうとしてるのですね。


 おそらくは興味のない話を長々しまして、失礼いたしました。
                              文太