皆さん、こんにちは。
先日来書いてきたテキストファイル群から文字列を高速検索するツールですが、
一応 Windows に対応し、次のような変更を加えました。
57MB 程度のデータから、190 箇所程度存在する文字列を探すのに 2.5 秒か
かる。2 個の文字列の AND 検索をやると 36-7 秒かかり、長すぎる。インデッ
クスファイルの作成も 180 秒かかる。
というような状態から、
検案の修正が大雑把に完了した。49MB のデータから単一語の検索に 2.4 秒、
2 語の AND 検索に 2.6 秒という結果である(劇的!)。インデックスの作成
は約 3 分だった。結果は、1 行でなく、前後 1 行をくわえた 3 行表示となっ
た。html 出力可能。
というような状態になりました。これにともない、Vector にアップロードした
ので、じき登録されるでしょう。多少テキスト & スクリプトの宣伝を書いたの
で、TSNET に入る人も出てくるかもしれません。
ほぼ同じものを、
http://rakunet.org/usernet/tips/
に置きましたので、興味があればどうぞ。Perl & Jcode.pm です。
--
本田博通(閑舎)