Python-text-processing-python-process-word-document
提供:Dev Guides
Python-プロセスWord文書
Wordドキュメントを読むには、docxというモジュールを利用します。 以下に示すように、まずdocxをインストールします。 次に、docxモジュールのさまざまな関数を使用して、ファイル全体を段落ごとに読み取るプログラムを作成します。
以下のコマンドを使用して、docxモジュールを環境に取り込みます。
以下の例では、各行を段落に追加し、最後にすべての段落テキストを印刷することにより、単語文書の内容を読み取ります。
上記のプログラムを実行すると、次の出力が得られます-
個々の段落を読む
パラグラフ属性を使用して、ワード文書から特定のパラグラフを読み取ることができます。 以下の例では、単語文書から2番目の段落のみを読み取ります。
上記のプログラムを実行すると、次の出力が得られます-