作者: davi
日時: 2007/10/16(21:08)
Bruce.さん  <  こん??は でび です

On Tue, 16 Oct 2007 17:43:31 +0900 (JST)
kbk@... (Bruce.) wrote:

> 1→2→3→4 のパーセンテージの減り方はナニ?(笑)

住んでいる世界によっても違うみたいですよ。

『日本語学』(大修館書店)の9月号は「方言文法全国地図」の特集です。

国立国語研究所で8万件もの方言調査データが公開されたのですが、
その特集なわけです。

8万件だと、Excel2003まででは全部読み込めない。

そこでAWKですよ。

ってなことが書いてあります。

 # Excel2007なら100万件OKですけどね。

まぁ、その後でVBやAccessの話題もちょっと出てきますが、本文には
「筆者が愛用しているのはawkだが、これでかなり複雑なことができる。」
とあって、その後にワンライナーの例示が。

この著者の先生以外にも、国語学者でawk愛用者は結構いらっしゃいます。
まぁ、歴史的経緯ってことなんでしょうけど、Perlよりawk、って人は多い。

つーことで、当分、awkはメンテナンスされるべき、という結論。

yagrepやgawk-3.1へのリンクが "~kbk/index.html" に見あたらないのは
フェードアウトの予兆かと心配。

−−−−−−−−−−−−−−

ところで、AWKでagrepみたいな「x文字違い検索」ってできません?

「ハンカチ王子」で2文字違いまで許容、って指定だと、
「ハニカミ王子」は当然のこととして、

ハゲカケ王子
ハナカミ王子
ハミガキ王子
ハイカイ王子
ハダカノ王子
ハルカゼ王子
トンカツ王子

などにヒット、みたいな…。

オートマトンとか言われてもよくわからんのですけど。


でび  http://homepage1.nifty.com/davi/