作者: 閑舎
日時: 2002/9/01(17:45)
dune <FZH01112@...> さん wrote.

> pdf からテキストへの変換は http://www.foolabs.com/xpdf/ にあ
> る pdftotext というプログラムを使っています。解説を見ると   
> EUC とか Shift-JIS にも対応できるようなのですが、やり方がわ
> からなくて今回は化け化けのままほっといてます。

よく見ると、私が使っている xpdf じゃないの、というわけで調べてみました。
日本語のパッチが当たったものだと、

  $ pdftotext -enc EUC-JP hoge.pdf

でいけます。あるいは Shift-JIS です。

--
本田博通(閑舎)
テキストとスクリプトの http://rakunet.org/TSNET/