作者: ねこ丸 | |
日時: 2007/5/21(19:59) |
ねこ丸です。 Bruce. writes: > 検索に使う単語はほぼ限定される(そんなに種類はない)ので、頑張って > なにか自作するかなあ。 > # suffix arrayとかはよく知らんのですが :-) 背伸びしました(^^; suffix array とは 1つの巨大なファイルに対してインデックスを貼って高速 に検索できるものだそうです。 ただ検索が速くても結果を個々のメールにバインドするのが面倒くさいでしょ うから、実際にはメールごとに分離したうえで検索するというアプローチにな るんじゃないですかね。 1フォルダ : 1ファイル方式のままいくんだとすると tDiary grep が参考にな るかも。tDiary は月ごとに日記ファイルが生成されて、中身は mbox 形式風な ので。あれが suffix array 対応になったらお手軽に高速検索できるような。 どっちみち送受信が Becky ! に縛られちゃうと工夫するにしてもちょっとト リッキーだなという感じはします。 -- ねこ丸