作者: davi
日時: 2005/12/12(02:16)
Bruce.さん  <  こん??は でび です

On Sat, 10 Dec 2005 01:26:24 +0900
davi <davi-1984@...> wrote:

> 意図通りに動きました。

上記はsedの方についてです。

--------------------
なお、gawk-mbcs-win32-20051208.zipですが、
grep代わりに使おうと、以下のようにするとエラーが出ます。

gawk --ctype=UTF8 -f awkgrep8.awk honbun.txt > kekka.txt

awkgrep8.awk、honbun.txt共にUTF8です。

awkgrep8.awkの内容は以下の1行のみ。

/走[らりれろ]/{ print NR,$0 }

エラーメッセージは以下の通り(延々続く)

UTF-8 Invalid trail byte
Illegal utf-8 lead byte.
Illegal utf-8 lead byte.

出力結果は、「走」の漢字が入っている部分が全部ヒット
してしまっており、「走つて来る。」など、正規表現に
マッチしない行も出力される。NR指定は正常に処理される。

でび  http://homepage1.nifty.com/davi/