作者: 藤岡和夫
日時: 2008/2/02(17:28)
On Sat, 02 Feb 2008 15:41:47 +0900
davi <davi-1984@...> さんwrote:

> > 結局、結果の妥当性を判断するのは人間だったりして、もう結果を知っているみ
> > たいな話が多い。
> 
> >  ぼくはここで結論が出ていると思うのですね。検索結果を人間がチェックして
> > いく過程で本質的な仕事が終わってしまう。
> 
> 刃物研ぎしてその鋭利さを競う、というのが理工学系からのアプローチ
> の一つの典型であるとして、もう一方には、人文社会学系の者の下す
> 直感的な結論に、一定の基準値を与えるという役割もあると思うんですね。
> 
> もちろん、その数値をブラックボックス化して、盲従してはいけないの
> でしょうが…。

 おっしゃるとおりですね。なぜこのような結果が出てくるのかを辿れるような
仕組みが必要ですね。そうしないと一定の基準値とは言えないと思います。

> その意味で、両輪と考えるべきではないでしょうか。ですから、
> 
> >  機械にやらせるのは面倒だし、自分の脳にやらせたほうが早いと思ってしまい
> > ますね。機械にやらせて意味のあることをやることになるのか疑問に思うしね。
> 
> というのは、あまりにも身も蓋もないように思います。

 ここは何を想定するかで意見は変わってくるところだと思います。やはり、機
械に任せたいようなことも有り得るでしょう。

> >  おそらく、一人の人間が処理できないほどの大規模文献データベースを分類す
> > るとか、構造を調べるとかのような用途があるかもとは思うのですが・・・
> 
> 例えば、「こども語辞書」http://labs.baby.goo.ne.jp/なんかは
> 面白いと思うと同時に、おかしいということも感じます。
> 
> 女児の修得語の1位が13.8ヶ月で獲得する「立つ/たっち」
> ということになっているんですね。
> 
> これは大量データをいじらないと分からないでしょう。
> スクリプトの威力です。
> 
> しかし、発話は開口母音が最も簡単であるはずなのだから、
> 男子で1位の「あれ」には納得が行くけど、女児のデータは
> なんか変だ、と考えることになります。
> 人間の思考です。
> 
> で、案ずるに、このデータは子供の成長日記から単語を抽出し、
> それを日齢換算した一覧なんでしょう。
> 「匍えば立て、立てば歩め」式の記録者側の思い入れがバイアス
> としてかかっている、と言える(かも)。
> 
> すると、「女児の親は子供が早く立つことを願う気持ちが、
> 男児の親よりも強い可能性がある?」なとど考える楽しみが
> 出てきます。
> 
> そこで必要になるのが、統計的有意性を判定するための計算、
> ということになるでしょう。これもスクリプトの仕事。
> 
> 両輪で繋がって行くんじゃないかなぁ。
> そこを、(例えば)「何やってんだ、NTTレゾナンド、
> バカじゃねーの?」でお終いにしてはダメなんであって・・・。

 見せていただきましたが、そんなことは思いませんでした。データの収集方法
を含めて、素晴らしいアイデアですね。データの解釈は単純なものですが、わか
りやすいですね。

 このような研究はデータの収集がポイントになるので、テキストを対象とした
研究であっても意外と著作権の問題などがあって簡単にはいかない。例えば、新
聞記事などですが、フリーというわけにはいかない。Web上のテキストは使える
でしょうけどね。解析して意味のあるデータをまず収集するところで挫折したり
する可能性はあると思うのです。そういう意味で、こども語辞書のアイデアには
脱帽しました。

> > むしろ、人間の思考を支援するような仕組みを作る方向に向か
> > っているわけです。
> 
> 既にあるものを、どうにか整理・納得したいという方向性なのか、
> まだ何もない何かを作り出したいという方向性なのか。
> そこが違うのかも知れない、という予感はしますが、仰っている
> 意味(というかイメージ)がやはりよくわかりません。

 それほど、きちんと考えているわけではありません。過去を調べて理解すると
いうことと、そこから現在何を考えることができるのかを表現すること、どちら
もありますね。それをスクリプティングが支援するということになると思います。

 「日曜プログラマのひとりごと」は何をしたいのかを考える作業も含めた、テ
キスト処理とコンピューティングの実験場という位置づけですね。

> 小林秀雄関連記事を読んで、あぁ、スキゾ・パラノ流行以前の
> 思考回路でやっている人なんだな、と、藤岡さんにちょっと興味
> を持っています。私は浅田彰流行よりも、更に後の世代ですので、
> 正直なところ、団塊とバブルの間にある世代は、今ひとつピンと
> 来ないんです。

 浅田彰が「構造と力」を書いたのが1983年です。意外とでびさんは若いからね
え。最近、その若さがわかってきて、思わず調べてしまったけど。僕は浅田彰ご
自身よりも古いから。

藤岡 和夫
kazuf@...
日曜プログラマのひとりごと http://homepage1.nifty.com/kazuf/renewal.html