作者: dune
日時: 2002/8/30(01:33)
極悪です。

閑舎 さんの [TSfree:295] txtsearch Ver.0.5 アップロード から
>   検案の修正が大雑把に完了した。49MB のデータから単一語の検索に 2.4 秒、
>  2 語の AND 検索に 2.6 秒という結果である(劇的!)。インデックスの作成
>  は約 3 分だった。結果は、1 行でなく、前後 1 行をくわえた 3 行表示となっ
>  た。html 出力可能。

参考書の sample code やネット上の perl の資料をとにかく突っ
込んでる 76MB のフォルダ(ただし中身は .pl や WinHelp も含
む)で

>D:%du -c D:\DATA\perl | grep "total"
>80074   total
>
>D:%timer "perl txtindex"
>37.750000 sec
>D:%timer "perl txtsearch OLE -w >hoge.html"
>3.140000 sec
>D:%

というかんじでした。僕自身は http://osaka.cool.ne.jp/parasa/
の pgrep というのを愛用してますが、これで同じことをさせると 
13 秒なので速さでは txtsearch ですね。不安を感じるくらいの速
さ。Google のキャッシュみたく検索した語に色がつくとカッコいい
かも。
#速さと言えば mg.pl も爆速だったなぁ。

これの pdf 対応を作っていただけるとすごく助かります。ほとんど
仕事に使わない、家の PC でさえ pdf のデータシートが 2.5GB あ
るので…
-- 
FZH01112@..., http://homepage1.nifty.com/dune/