作者: 閑舎
日時: 2003/11/30(16:50)
ねこ丸 <wtnabe@...> さん wrote.

> -gawk 3.0.4 + mb
> -スクリプト、データともに euc-jp
> 
>   で /[ぁ-ん]/ { print } はばっちり動きますよん。

それはマルチバイト対応 gawk だからね。私が言いたかったのは、マルチバイト
対応でないオリジナルの gawk や Perl でも、"" 内に書いた文字が UTF-8 ある
いは中国語 EUC(GB) なら、ある程度テキスト処理可能だろう、ということだっ
たんです。

--
本田博通(閑舎)
テキストとスクリプトの http://rakunet.org/TSNET/