作者: 閑舎 | |
日時: 2003/11/30(16:50) |
ねこ丸 <wtnabe@...> さん wrote. > -gawk 3.0.4 + mb > -スクリプト、データともに euc-jp > > で /[ぁ-ん]/ { print } はばっちり動きますよん。 それはマルチバイト対応 gawk だからね。私が言いたかったのは、マルチバイト 対応でないオリジナルの gawk や Perl でも、"" 内に書いた文字が UTF-8 ある いは中国語 EUC(GB) なら、ある程度テキスト処理可能だろう、ということだっ たんです。 -- 本田博通(閑舎) テキストとスクリプトの http://rakunet.org/TSNET/