作者: Bruce.
日時: 2007/10/17(17:38)
Bruce.です。

davi writes:

> Bruce.さん  <  こん??は でび です
> 
> On Tue, 16 Oct 2007 17:43:31 +0900 (JST)
> kbk@... (Bruce.) wrote:
> 
> > 1→2→3→4 のパーセンテージの減り方はナニ?(笑)
> 
> 住んでいる世界によっても違うみたいですよ。

まあそれはそうなんでしょうけど、一位のJavaScirptはさておくとしても、
四位までで十数パーセントまで落ちて、その先ではあまり変わってないんですよね。
まあそういう世界だといえばそうのかも。
JavaScriptとPHP(とデータベース)があればよいと。


> 『日本語学』(大修館書店)の9月号は「方言文法全国地図」の特集です。
> 
> 国立国語研究所で8万件もの方言調査データが公開されたのですが、
> その特集なわけです。

この本は大型書店なんかにいけば現物が拝めますか?

> 8万件だと、Excel2003まででは全部読み込めない。
> 
> そこでAWKですよ。
> 
> ってなことが書いてあります。
> 
>  # Excel2007なら100万件OKですけどね。
> 
> まぁ、その後でVBやAccessの話題もちょっと出てきますが、本文には
> 「筆者が愛用しているのはawkだが、これでかなり複雑なことができる。」
> とあって、その後にワンライナーの例示が。

んー、データを処理した最後にチャート(グラフ)と描画する必要があると
ちとナニですけどねえ。この点Excelはラク。
gnuplotやらは良くわかりませぬ。
#ほとんどチャート描画ソフトしてしか使ってないという :)

あとRは結構使い出があるんじゃないかと思います。一見さんがとっつき
やすいかどうかはちと…? ですが。
 
> この著者の先生以外にも、国語学者でawk愛用者は結構いらっしゃいます。
> まぁ、歴史的経緯ってことなんでしょうけど、Perlよりawk、って人は多い。
> 
> つーことで、当分、awkはメンテナンスされるべき、という結論。
> 
> yagrepやgawk-3.1へのリンクが "~kbk/index.html" に見あたらないのは
> フェードアウトの予兆かと心配。

あー、今まで気がつきませんでしたが、rimnetの例の騒動時の復旧で
ファイルを間違えていたようです。なまじ同じ名前だからw
別にそのような意図はありませんし、本家のアップデートもゆったりしたもの
ですので、メンテナンス作業なんて今でもほとんどやってないし。

ただまあ、GNU/Linuxとかで使う分にはオリジナルのものでほぼ十分に
日本語データも処理できますので、やることなんてほとんどないんですけどね。

> ところで、AWKでagrepみたいな「x文字違い検索」ってできません?
> 
> 「ハンカチ王子」で2文字違いまで許容、って指定だと、
> 「ハニカミ王子」は当然のこととして、
> 
> ハゲカケ王子
> ハナカミ王子
> ハミガキ王子
> ハイカイ王子
> ハダカノ王子
> ハルカゼ王子
> トンカツ王子
> 
> などにヒット、みたいな…。
> 
> オートマトンとか言われてもよくわからんのですけど。

あー、お手軽にってワケにはいきませんね。

agrepのアルゴリズムは前に一度調べたことがありますが、あれって
日本語にそのまま適用できましたっけ?
#あやふやな記憶

いじょ。