作者: 藤岡和夫
日時: 2002/7/07(12:51)
On Sun, 7 Jul 2002 08:40:06 +0900
"KAWAI,Takanori" <GCD00051@...> さんwrote:

> Ctrl-Zで止まるってことはWindowsでってことですよね?
> 単純にbinmodeかましてやればいいんじゃないかってことはないですか?

 どうもありがとうございます。

 テキスト処理なので行単位での読み込みをするようにスクリプトを書いていま
す。binmodeだとそういうわけにもいきませんから。最終的には単語を抽出して
カウントするのですけど、前処理としてパターンマッチでメールのヘッダ部分を
削除するスクリプトでそういうトラブルに・・・\nを検出して読み込み量を制御
しながらできないわけではないでしょうけど・・・楽をしたいだけなんです、も
しかして他の言語でもよいのでオプションかなにか付けてできないかなあーと(^^;)
ctrl-Zを無視してくれればいいだけなんで(^^;;;一括して読むにはサイズが大き
過ぎる(100MB程度)ので何が起こるかわからないということもあります。

 しかし処理はできても山ほどバイナリデータが見つかって(なぜ他のバイナリ
は問題ないのにいまだにctrl-Zで終了しちゃうんだろ)、そのままではテキスト
データとみなされないために、Excelに読み込めなかったですね(^^;)単語と100
メール単位での発現数のリストをタブ区切りのテキストデータとして読み込もう
としたのですが。もっともテキストで30MB以上あるので、読み込み時に大きすぎ
て読み込みができないとか仮想メモリが少なくなったとかいろいろとエラーメッ
セージが出て、こりゃだめだと思ったけどハング気味、ほっておいたら1時間ぐ
らいしてなぜか読み込みが終了、こりゃラッキーと拡張子を変えて保存すること
に・・・すると2時間経ってもまだ動いている。やめときゃよかった(^^;)十分予
想できた事態・・・

 OpenOfficeのCalcでも読み込めるはずなんですが、表名が不正ということで読
み込めない(シート名も日本語を使うと変更できない。なぜか表名に日本語名が
使われているにも関わらずなんですが)。仕方なくExcelをインストールしてある
旧我が愛機を使ったのが、それはそれで問題を起こす。マシンは早いに越したこ
とはない。だれだ、Officeを使うのにそんな早いマシンは必要ないなんて言うの
は(^^;)いろいろしゃべりたいことが・・・・・あっ、そうそうOpenOfficeの
CalcにExcelのファイルはそのまま読み込めるんだけど、Writerにはなぜかdocファ
イルをそのまま読み込むとエラーになる・・・・・もっとしゃべりたいことはい
ろいろあるんだけど、これぐらいにしとこう(^^)

藤岡 和夫
FGALTS@...
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/