pdftotext
オープンソースのpdfファイルからtextファイルを生成してくれるソフトウェア。
Xpdfというソフトウェアに含まれているため、Xpdfをインストールする必要があるが、単体のコマンドラインのソフトウェアのため、単体で使うこともできる。
日本語を使うこともできるが、その場合は、同じ場所に置いてあるLanguage Support PackagesのJapaneseをダウンロードしてきて、下記の手順で設定作業をする必要がある。
- XpdfのホームページからPrecompiled binariesのWin32版とLanguage Support PackagesのJapaneseをダウンロードする。
- xpdf-3.01pl2-win32.zipを解凍し、適当な場所に置く。
- xpdf-japanese.tar.gzを解凍し、適当な場所に置く。
- xpdf-japanese.tar.gzを解凍したフォルダにあるadd-to-xpdfrcをxpdf-3.01pl2-win32.zipを解凍したフォルダに置く。
- add-to-xpdfrcをxpdfrcにリネームする。
- xpdfrcをエディタで開く。
- /usr/local/share/xpdf/japanese/の部分をxpdf-japanese.tar.gzを解凍したフォルダの場所に書き直す。