作者: Bruce.
日時: 2004/11/17(01:23)
Bruce. です。

<200411161507.AA00480@...-home.asahi-net.or.jp>

> >その後試してみたところmingwでもコンパイルに成功したので、cygwinのdllは
> >不要な環境は作れます。ところでVz EditorってXPで動かないって本当ですか?
> 
>  作れますか! 作って下さい〜。

へ? まだこの状態では日本語対応してませんよ?

>  たぶん、logos 版の sed のことでしょうか。s/\n\n/\n/ みたいに、置換文字
> 列にまで、 \n, \t なんかを許してたのが、僕にとっての大きな拡張だったと思
> います。あとほかにもあったのですが…。

ああ、そうですそうです。>logos版
環境変数参照してスクリプトの場所を指定できるとかありませんでした?

> 
>  でも、  jgawk  の形で移植してくださったのも、 serrow  さんでしたよね。
> jperl4 は、誰だっけ?

serow さんですよん。serowさんには頭が上がりません。
#以前pcsが健在だった時代に二、三回メイルのやり取りをしたことがあります
#今は何をしてらっしゃるのだろう?

> >で、いいたかったのは、gawkも GNU grep もオリジナルからマルチバイト文字対応に
> >なってます。が、GNU sed に関しては y コマンドだけという現状です。正規表現
> 
>  おお、grep もそうですか! ちょっと後ほど調べてみます。 あれの進化はも
> のすごく興味がありますので。m(__)m
> 
> C:\>egsed  y/ あ /a/ 2> 
> EGSED: -e expression #1, char 7: strings for y command are 
> different lengths
> 
> egsedとは、GNU sed, 4.0.7のことです。(英語しか通らないぞ、の意味の
> English GNU sedのつもりです。)
> 
>  えーと、これは求めすぎなんでしょうか? あのintenationalizationって
> いうのがどうもよく分かってなくて。

internationalizationってのは日本語にとどまらず、複数言語に対応しようという
仕組みです。日本語固有の対応はlocalizationですね。それぞれi18n、l10nという
略され方をします。

> C:\>sed y/あ/a/
> あ
> a
>  serrow版では、やっぱり通るようなのですが。
> 
> C:\>sed32 y/あ/a/
> あ
> a
>  WILLs版でも、やっぱ通るみたいですが???

これは日本語(というかshift-jis)対応してるからです。

>  ものすごく簡単な質問だと思うので、ついでに(すいません)お訊きさせてい
> ただきたいのですが、perl って、完全に internationalized されているんです
> よね。それで、jperl がなくなったのだと思っていたのですが。申し訳ありませ
> んが、 上の y コマンドと同じ処理・実験はどのような perl スクリプトで可能
> でしょうか? perl は、sed、awk をある程度知っておくと、使えるところがい
> っぱいあるはず、と見込みながら、まったく手つかずなのです。最近、ようやく
> 導入できたのですが。(perlは最新版、5.8.4ですので、ご心配なく。)

5.8.4でしたら問題ありません。ばりばり複数言語を使えます。日本語、中国語、
韓国語、etc...。で、perlにもyコマンドはありますよん。trの別名という感じ
ですが。

D:\home>perl -Mencoding=sjis -e "$_= q!あ!;y/あ/a/; print $_;"
a

無理やりコマンドラインでやるとこんな感じです。

> >ルーチンはマルチバイト対応になっているのだから s コマンドもマルチバイト対応
> >になっていても・・・とWILLsさんのパッチを見ると、そんなに手は入ってないのね。
> >ふみゅ。
> 
>  ううーん、分からないです…。すいません。

いやまあ、独り言みたいなもんですから。

>  そうそう、Bruce. さんの正規表現対照表、大変お世話になってます。手元では、
> ygrepが追加されていたりします。

ygrepねえ。ソース公開してなかったが気に入らなかったので記載しませんでした。
その点cgrepはソース公開でしたからね。しっかり一覧表にのっけてます。

ここ数年エディタ編も考えているのですが実現していません。候補は Emacs、xyzzy、
Vim、Wz Editor、秀丸(後ろ二つはフリーソフトウェアではありませんが)といったあ
たり。これはWz(Ver4)の正規表現のあまりの機能の低さに頭にきて、という感じです。

-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk@...
  web  www.kt.rim.or.jp/~kbk/