作者: dune
日時: 2005/4/18(00:05)
極悪です。

藤岡和夫さんの[TSperl:528] Re: txt2graph.plから

>このグラフでは共起頻度は語間のリンクの数が表すことになりますね。

リンクの線は一本だけにして、線の太さや濃さで共起頻度を表してほしい
です。現状はリンクの数が増えるとそれを無理して全部描こうとするため、
レイアウトが崩れたり線が込み入って見難くなってしまう。リンクの線を
一本にするだけなら、dot ファイルの中身を sort & uniq して重複した行
(重複したグラフ)を削除するだけで ok でしたけど。

頻度は --minfrequency と --maxfrequency オプションでフィルターもで
きました。このときに指定するのは生の頻度値かと思っていたら、最大値
1に正規化した値。これはこれでいいけど、頻度2以上といった指定もで
きたら良かった。

構造を記述するだけでレンダリングしてみせてくれる DOT と Viewer の関
係は HTML と ブラウザの関係みたいで便利。今は 2D だけど、奥行き方向
も使って表示するとか、編集もできる Viewer があるとおもしろいかな。

しかし残念なことに、グラフにしたからといって何かが見えてくる、といっ
た予感はしませんでした。グラフをたどるという作業が直感的ではないのが
原因でしょう。語と語のつながりをグラフで表すのは意外にも役に立たない
(視覚に訴えない)と思いました。

語と語の間には反発力が働いていて、リンクの数が引力の強さを表す、みた
いなことを決めて図にするとどうなるか、なんてのがおもしろいか思います
(って、それはただのクラスタ分析か)。ひょっとしたら今のレンダリング
方法はこの逆になってるかもしれません。リンクの数が多いほど、対応する
矢印を描くために場所をとるので、他の語からの距離は大きくなってそうで
す。
-- 
極悪, mailto:FZH01112@...