作者: 藤岡和夫
日時: 2002/6/20(20:19)
On Thu, 20 Jun 2002 01:24:28 +0900
dune <FZH01112@...> さんwrote:

> N-gram とクラスタ分析をどう組み合わせると何ができるのかは、 
> nifty でもときどき発言されている師(もろ)さんのサイト
>         
> http://www.ya.sakura.ne.jp/~moro/profile/papers.html
> 
> にある
> 
> http://www.ya.sakura.ne.jp/~moro/resources/20020322moro.pdf
> 
> の解説がおもしろくわかりやすいです。文系の学校ってのは、こう
> いうこともするんだなぁ、ってかんじ。スクリプト言語が大活躍で
> きそうな場所です(でもパソコンの使い方、マウスの扱い方すら知
> らない学生もいるらしい)。

 ご紹介ありがとうございます。極悪さんのページからすべて探索しました。大
変参考になりました。N-gramは日本語の解析に適していると思われますね。

 今日、本屋で見ていると計量言語学入門という本があって眺めていますと、ク
ラスター分析までは書いてありました。ここはテキスト処理が活躍する分野です
ね。

> SOM を前面に出したビジネスがあるようです。
> 
> http://www.mindware-jp.com/
> 
> http://www.mindware-jp.com/basic/faq.html
> 
> ここには基板設計に SOM を導入する研究の記事もあります。
> 推測ですが、グラフィクスカードくらいになれば基板上に電子部品
> をどう配置するか大まかな信号の流れと細かな配線の都合でなかな
> か決められない場合や不本意な修正が出てくる、そういった問題も
> パターンの長さをクラスタ間の距離だと思えば、クラスタ分析(と
> いうかクラスタの最適化かな)の問題として解けて、みんなが幸せ
> になれる・・・みたいなことを言ってるんじゃないかと思います。 

 ビジネスモデル特許戦略(2000)という本があるのですが、この本にはSOMを使っ
た特許分析のソフトウェアが出ています。Themescapeと呼んでいますが、テーマ
の抽出・分類に使っていますね。

http://www.aurigin.com/aureka.html#themescape

 実際には補助的なツールでしかないでしょうけど、ビジュアルなのでおもしろ
い。

 Kohonenの本にも当然のことながらSOMチップの話は出ています。大変興味深い
話ですね。SOMは様々な研究分野で使われていて、裾野は大変広いです。元々と
いうか、1980年代には会話の音声を解析するのに使われて進歩してきた経緯があ
るようです。

 今後、このような人工知能的(weak AI)解析技術についての話題が様々な分野
で登場するようになると思いますね。ブルーバックスでもこういう統計学の手法
を推測に使うとかそのようなノウハウ本が大変多くなっているのに最近気がつき
ました(^^;)

藤岡 和夫
FGALTS@...
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/