Pdfbox-extracting-image
提供:Dev Guides
PDFBox-画像の抽出
前の章では、複数のPDF文書をマージする方法を見てきました。 この章では、PDFドキュメントのページから画像を抽出する方法を理解します。
PDFドキュメントから画像を生成する
PDFBoxライブラリは、PDFドキュメントをAWT BufferedImageにレンダリングする PDFRenderer という名前のクラスを提供します。
以下は、PDFドキュメントから画像を生成する手順です。
ステップ1:既存のPDFドキュメントの読み込み
ステップ2:PDFRendererクラスのインスタンス化
ステップ3:PDFドキュメントから画像をレンダリングする
Rendererクラスの* renderImage()*メソッドを使用して特定のページに画像をレンダリングできます。このメソッドに、レンダリングする画像があるページのインデックスを渡す必要があります。
ステップ4:イメージをファイルに書き込む
- write()*メソッドを使用して、前のステップでレンダリングされたイメージをファイルに書き込むことができます。 この方法に、あなたは3つのパラメータを渡す必要があります-
- レンダリングされた画像オブジェクト。
- 画像のタイプ(jpgまたはpng)を表す文字列。
- 抽出した画像を保存する必要があるファイルオブジェクト。
ステップ5:ドキュメントを閉じる
最後に、以下に示すようにPDDocumentクラスの* close()*メソッドを使用してドキュメントを閉じます。
例
パス C:\ PdfBox_Examples \ に sample.pdf のPDFドキュメントがあり、最初のページに次のように画像が含まれているとします。
この例では、上記のPDFドキュメントを画像ファイルに変換する方法を示します。 ここでは、PDFドキュメントの1ページ目の画像を取得し、 myimage.jpg として保存します。 このコードを PdfToImage.java として保存します
次のコマンドを使用して、コマンドプロンプトから保存したJavaファイルをコンパイルして実行します。
実行時に、上記のプログラムは、指定されたPDFドキュメント内の画像を取得し、次のメッセージを表示します。
指定されたパスを検証すると、以下に示すように、画像が myimage.jpg として生成および保存されていることがわかります。