極悪です。
閑舎 さんの [TSperl:151] Re: pdfsearch.pl から
> $ pdftotext -enc EUC-JP hoge.pdf
>
>でいけます。あるいは Shift-JIS です。
-enc EUC-JP と -enc Shift-JIS、enc ISO-2022-JP、-eucjp と総
当たり試したのですが読めないようです。
もしやと思い、PDFJ で作られた文書(元データが SJIS で書かれ
ていて、pdf に変換するときも文字コード 'SJIS' が指定されてい
る)を混ぜて試したら、その文書だけは読めるようになりました。
pdf をどうやって作ったのかで違ってくるようです。pdf を作ると
きは PDFJ でお願いします>みなさん(笑)
D:%perl pdfsearch.pl -f
ok : d:\data\perl/Kansai.pm/Seminar/20000319_1st/fukuhara/fukuhara.pdf
ok : d:\data\perl/Kansai.pm/Seminar/20000319_1st/kiyoka/kiyoka.pdf
ok : d:\data\perl/Kansai.pm/Seminar/20000319_1st/yamatomo/yamamoto.pdf
ok : d:\data\perl/Kansai.pm/Seminar/20000520_2nd/funaki/funaki.pdf
ok : d:\data\perl/Kansai.pm/Seminar/20000520_2nd/ivanov/perltalk.pdf
ok : d:\data\perl/Kansai.pm/Seminar/20000520_2nd/moriwaka/moriwaka.pdf
ok : d:\data\perl/Kansai.pm/Seminar/20001202_3rd/hozumi/hozumi.pdf
ok : d:\data\perl/Kansai.pm/Seminar/20001202_3rd/hozumi/hozumi_appendix.pdf
ok : d:\data\perl/Kansai.pm/Seminar/20001202_3rd/kiyoka/kiyoka_jcode.pdf
ok : d:\data\perl/Kansai.pm/ご案内.pdf
ok : d:\data\perl/mkweb/makeweb.pdf
ok : d:\data\perl/PDFJ/demo.pdf
ok : d:\data\perl/PDFJ/PDFJ.jp.pdf
pattern not specifed
D:%perl pdfsearch.pl 日本語対応
"d:\data\perl/PDFJ/demo.pdf" PDFLib *日本語対応の細かなところまでは無理
"d:\data\perl/PDFJ/demo.pdf" *日本語対応に難があるらしい…(よく知ら
ない、ごめんなさい)
"d:\data\perl/PDFJ/demo.pdf" 注記 (2002 年 7 月 ) 本文書は 2002 年 5
月のイベントでの発表用スライドです。 FOP
について「日本語対応に難があるらしい」という記述があり
ますが、これは私が最近の動向をフォローしていなかったため
の誤りで、実際は問題なく日本語を扱えます。
D:%
--
FZH01112@..., http://homepage1.nifty.com/dune/