作者: dune
日時: 2002/9/02(00:27)
極悪です。

閑舎 さんの [TSperl:151] Re: pdfsearch.pl から

>  $ pdftotext -enc EUC-JP hoge.pdf
>
>でいけます。あるいは Shift-JIS です。

-enc EUC-JP と -enc Shift-JIS、enc ISO-2022-JP、-eucjp と総
当たり試したのですが読めないようです。
もしやと思い、PDFJ で作られた文書(元データが SJIS で書かれ
ていて、pdf に変換するときも文字コード 'SJIS' が指定されてい
る)を混ぜて試したら、その文書だけは読めるようになりました。
pdf をどうやって作ったのかで違ってくるようです。pdf を作ると
きは PDFJ でお願いします>みなさん(笑)

D:%perl pdfsearch.pl -f
ok   : d:\data\perl/Kansai.pm/Seminar/20000319_1st/fukuhara/fukuhara.pdf
ok   : d:\data\perl/Kansai.pm/Seminar/20000319_1st/kiyoka/kiyoka.pdf
ok   : d:\data\perl/Kansai.pm/Seminar/20000319_1st/yamatomo/yamamoto.pdf
ok   : d:\data\perl/Kansai.pm/Seminar/20000520_2nd/funaki/funaki.pdf
ok   : d:\data\perl/Kansai.pm/Seminar/20000520_2nd/ivanov/perltalk.pdf
ok   : d:\data\perl/Kansai.pm/Seminar/20000520_2nd/moriwaka/moriwaka.pdf
ok   : d:\data\perl/Kansai.pm/Seminar/20001202_3rd/hozumi/hozumi.pdf
ok   : d:\data\perl/Kansai.pm/Seminar/20001202_3rd/hozumi/hozumi_appendix.pdf
ok   : d:\data\perl/Kansai.pm/Seminar/20001202_3rd/kiyoka/kiyoka_jcode.pdf
ok   : d:\data\perl/Kansai.pm/ご案内.pdf
ok   : d:\data\perl/mkweb/makeweb.pdf
ok   : d:\data\perl/PDFJ/demo.pdf
ok   : d:\data\perl/PDFJ/PDFJ.jp.pdf
pattern not specifed

D:%perl pdfsearch.pl 日本語対応
"d:\data\perl/PDFJ/demo.pdf"    PDFLib *日本語対応の細かなところまでは無理
"d:\data\perl/PDFJ/demo.pdf"    *日本語対応に難があるらしい…(よく知ら
        ない、ごめんなさい)
"d:\data\perl/PDFJ/demo.pdf"    注記 (2002 年 7 月 ) 本文書は 2002 年 5
        月のイベントでの発表用スライドです。 FOP
        について「日本語対応に難があるらしい」という記述があり
        ますが、これは私が最近の動向をフォローしていなかったため
        の誤りで、実際は問題なく日本語を扱えます。

D:%
-- 
FZH01112@..., http://homepage1.nifty.com/dune/