151. Re: pdfsearch.pl


番号順一覧Top スレッド順一覧Top
作者: 閑舎
日時: 2002/9/01(17:45)
dune <FZH01112@...> さん wrote.

> pdf からテキストへの変換は http://www.foolabs.com/xpdf/ にあ
> る pdftotext というプログラムを使っています。解説を見ると   
> EUC とか Shift-JIS にも対応できるようなのですが、やり方がわ
> からなくて今回は化け化けのままほっといてます。

よく見ると、私が使っている xpdf じゃないの、というわけで調べてみました。
日本語のパッチが当たったものだと、

  $ pdftotext -enc EUC-JP hoge.pdf

でいけます。あるいは Shift-JIS です。

--
本田博通(閑舎)
テキストとスクリプトの http://rakunet.org/TSNET/
前の発言: 150. Re: txtsearch Ver.0.6アップロード [閑舎] 2002/9/01(16:53)
後の発言: 152. Re: pdfsearch.pl [dune] 2002/9/02(00:27)
親発言: 146. pdfsearch.pl [dune] 2002/9/01(04:05)
子発言: 152. Re: pdfsearch.pl [dune] 2002/9/02(00:27)