作者: ねこ丸
日時: 2007/5/21(19:59)
  ねこ丸です。

Bruce. writes:

> 検索に使う単語はほぼ限定される(そんなに種類はない)ので、頑張って
> なにか自作するかなあ。
> # suffix arrayとかはよく知らんのですが :-)

  背伸びしました(^^;
  suffix array とは 1つの巨大なファイルに対してインデックスを貼って高速
に検索できるものだそうです。

  ただ検索が速くても結果を個々のメールにバインドするのが面倒くさいでしょ
うから、実際にはメールごとに分離したうえで検索するというアプローチにな
るんじゃないですかね。

  1フォルダ : 1ファイル方式のままいくんだとすると tDiary grep が参考にな
るかも。tDiary は月ごとに日記ファイルが生成されて、中身は mbox 形式風な
ので。あれが suffix array 対応になったらお手軽に高速検索できるような。

  どっちみち送受信が Becky ! に縛られちゃうと工夫するにしてもちょっとト
リッキーだなという感じはします。

--
    ねこ丸