作者: Bunta
日時: 2004/11/16(20:34)
Bruce.さん
 試していただいたようで、m(__)m

>日本語対応とWindows対応は and ですか or ですか?
>#多分 and でしょうね。

 and ですう。プラスαがあるようですが…。
 いえ、cygwin は、試したことがないのです。なにやら導入が大変そうなのと、
(いえあの、ものなのですが)command.com  と cmd.exe が、いちおう同居でき
るような、Dosプロンプトで使いたいものですから…。いえあの、Vzを使っ
ているのです。Vzから呼べないと、ほとんど、使えないのですよぉ…。(*_*)

>試してみたところssedはcygwinでconfigure & make一発でしたので、Windowsで
>動かすことについては問題ないと思います。ssedはソースを見た限りではpcre
>決め打ち(の割に#ifdefは切ってある)のようなので日本語対応はちょっと手間
>かも(pcreの日本語エンコーディング対応は誰もやってないとも思う)。

 そのうえ、 ssed の pcre って(何だかわかってないのですが、ちょっとだけ
ssed ソース同梱の pcre 用 ChangeLog を眺めたりしたことがあって)、かなり
特殊なんではなかったでしたっけ? あるいは、もうすぐ仕様変更になる? す
いません、そちらの世界は、もう天上界みたいなもので。m(__)m

>まあ、Perl5互換の正規表現が使えればいいというのであれば、鬼車に入れ替え
>ちゃうという技がなくもないですが。

 おお、「鬼車」をネットで検索しました。これ、相当強力な正規表現ですね。
greedy, non-greedy, lookahead, lookbehind なんてのもありますね! 入れ替
えあり! というのが個人的意見です。これ、すごい! し、知りませんでした。
不勉強ものです。m(__)m

>ただ、正規表現ルーチンのオリジナルからのマルチバイト文字対応が進んでいる
>(遅いかどうかということはさておき)にもかかわらず、grep、gawkと違い一部の
>コマンドを除いてGNU sed のマルチバイト文字対応が進んでいないということは
>何か問題があるのかもしれません。

 3回読んで、ようやく仰っていることが分かりました。(ほんと?(^^;)僕の
使っている(? 僕のところにある)マルチバイト版は、GNU 3.02+1.08 です。
けっこう古い感じですね。そして、移植した方の哲学もあったのだろうと思いま
すが(WILLs さんかな)、かなり頑固に sed で、なんか色々正統すぎて、あれ、
これも駄目? という経験をしました。 (serrow 版は、けっこう融通きくので
す。 )そうそう、このマルチバイト版、どうもオリジナルが 3.02.80 でないよ
うでした。3.02.80 というのが、ヴァージョン3での、最終的に落ち着いた版だ
ったと思うのですが。-r で、ERE(この分類も obsolete になりそうですが)が
使えはしましたが。

 cygwin 版でも、有益に使える方がいらっしゃると思います。 僕個人は、ちょ
っと…、という感じなのですが。それでももし、じゃ、鬼車でやってみよう、な
んてお考え頂けると、夢が広がります。m(__)m

                          文太