Python-text-processing-python-process-pdf
提供:Dev Guides
Python-プロセスPDF
Pythonは、PDFファイルを読み取り、そこからテキストを抽出した後にコンテンツを印刷できます。 そのためには、最初に PyPDF2 である必要なモジュールをインストールする必要があります。 以下は、モジュールをインストールするコマンドです。 Python環境にpipが既にインストールされている必要があります。
このモジュールが正常にインストールされると、モジュールで使用可能なメソッドを使用してPDFファイルを読み取ることができます。
上記のプログラムを実行すると、次の出力が得られます-
複数のページを読む
複数のページでpdfを読み取り、ページ番号で各ページを印刷するには、getPageNumber()関数でループを使用します。 以下の例では、2ページのPDFファイルを作成します。 内容は2つの個別のページ見出しの下に印刷されます。
上記のプログラムを実行すると、次の出力が得られます-