広告
広告
https://www.7key.jp/software/xpdf.html#a_01
Xpdf は Linux X ウィンドウ上で動作する PDF ビューアです(Dos/Win32、Solaris版もあります)。シンプルな操作性で軽快に動作するようです。 更に特筆すべきは pdftotext というPDFファイルをテキストファイルに変換するツールが附属していることです。 今回はこいつをWeb サーバ上に組み込んでアップロードされたPDFファイルをテキストファイルに変換する仕組みのための覚え書きです。
https://www.7key.jp/software/xpdf.html#a_02
Xpdfのダウンロードサイト(http://www.foolabs.com/xpdf/download.html)から
x86, Linux (glibc 2.2, staticly linked to Motif, t1lib, and FreeType 2):xpdf-3.00-linux.tar.gz (4544077 bytes)
をダウンロードする。日本語対応にするために、同じページの中ほどにある
Japanese: xpdf-japanese.tar.gz (494624 bytes)
も併せてダウンロードしておく。
https://www.7key.jp/software/xpdf.html#a_03
「/usr/local/src」辺りに両ファイルをあらかじめコピーしておく。
$ su # cd /usr/local/src # tar xzf xpdf-3.00.tar.gz # cd xpdf-3.00 # ./configure # make # cp ./xpdf/pdftotext /usr/bin # cd ../ # tar xzf xpdf-japanese.tar.gz # cd xpdf-japanese # mkdir /usr/local/share/xpdf/ # mkdir /usr/local/share/xpdf/japanese # cp -R * /usr/local/share/xpdf/japanese
https://www.7key.jp/software/xpdf.html#a_04
下記コマンドにて「up0023.txt」が出来上がれば無事作業終了。
# pdftotext -enc EUC-JP up0023.pdf
[system("pdftotext -enc EUC-JP piyo.pdf piyopiyo.txt");]などなど色々できるかも。
広告