作者: 藤岡和夫
日時: 2005/4/18(22:57)
On Mon, 18 Apr 2005 00:05:50 +0900
dune <FZH01112@...> さんwrote:

> リンクの線は一本だけにして、線の太さや濃さで共起頻度を表してほしい
> です。現状はリンクの数が増えるとそれを無理して全部描こうとするため、
> レイアウトが崩れたり線が込み入って見難くなってしまう。リンクの線を
> 一本にするだけなら、dot ファイルの中身を sort & uniq して重複した行
> (重複したグラフ)を削除するだけで ok でしたけど。

 GraphVizに線の太さを制御する機能はなさそうですね。リンクを一本にして、
数字を入れることは可能でしょうけど。

> 頻度は --minfrequency と --maxfrequency オプションでフィルターもで
> きました。このときに指定するのは生の頻度値かと思っていたら、最大値
> 1に正規化した値。これはこれでいいけど、頻度2以上といった指定もで
> きたら良かった。

 これもGraphVizの機能っぽい。

> 構造を記述するだけでレンダリングしてみせてくれる DOT と Viewer の関
> 係は HTML と ブラウザの関係みたいで便利。今は 2D だけど、奥行き方向
> も使って表示するとか、編集もできる Viewer があるとおもしろいかな。

 svg表示については、いずれはWebブラウザに機能として取り込まれるべきもの
だと思います。3次元表示に関しては、X3D/VRMLというのがあるけど、3Dはまだ
これからでしょうね。SVG、FlashやProcessingも候補でしょう。

> しかし残念なことに、グラフにしたからといって何かが見えてくる、といっ
> た予感はしませんでした。グラフをたどるという作業が直感的ではないのが
> 原因でしょう。語と語のつながりをグラフで表すのは意外にも役に立たない
> (視覚に訴えない)と思いました。

 どのようなデータを入れるかによって、見方は変わるかもしれませんが、私が
試したところでは関連のある要素は近い場所に集まる傾向はあるようですね。人
間の言語はスモールワールドと言われているので、まずは日本語を入れてみてど
んな風になるのだろうという興味で動かしています。種類を変えたり、サイズを
変えたりしてしばらく試したいと思っています。まだ、GraphVizのこともよくわ
かっているわけではないので、グラフ理論のほうからのアプローチがいるかなと
思ったり。

 実用的には、txt2graph.plは今のところどう役に立つのかは不明ですね。
GraphVizそのものはテキストデータからスクリプトで図を書くのに便利ですから、
様々な応用が可能ですし、調べる価値のあるものだと思います。txt2graph.plは
応用の一つに過ぎない。

> 語と語の間には反発力が働いていて、リンクの数が引力の強さを表す、みた
> いなことを決めて図にするとどうなるか、なんてのがおもしろいか思います
> (って、それはただのクラスタ分析か)。ひょっとしたら今のレンダリング
> 方法はこの逆になってるかもしれません。リンクの数が多いほど、対応する
> 矢印を描くために場所をとるので、他の語からの距離は大きくなってそうで
> す。

 リンクが集中する語というのはあまり重要でないのです。例えば助詞だったり
しますね。リンクが少ない結び付きに逆に意味がある。弱い絆が重要というのが
スモールワールドの特徴だそうです。だからといってどう役に立つんだというと
ころで、まだよくわからない(^^;)

藤岡 和夫
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/