Python-web-scraping-getting-started-with-python

提供:Dev Guides
移動先:案内検索

Python入門

最初の章では、Webスクレイピングとは何かを学びました。 この章では、Pythonを使用してWebスクレイピングを実装する方法を見てみましょう。

WebスクレイピングにPythonを使用する理由

Pythonは、Webスクレイピングを実装するための一般的なツールです。 Pythonプログラミング言語は、サイバーセキュリティ、侵入テスト、デジタルフォレンジックアプリケーションに関連する他の有用なプロジェクトにも使用されます。 Pythonの基本プログラミングを使用すると、他のサードパーティツールを使用せずにWebスクレイピングを実行できます。

Pythonプログラミング言語は非常に人気が高まっており、PythonがWebスクレイピングプロジェクトに適している理由は以下のとおりです-

構文のシンプルさ

Pythonは、他のプログラミング言語に比べて最も単純な構造を持っています。 Pythonのこの機能により、テストが容易になり、開発者はプログラミングに集中できます。

組み込みモジュール

PythonをWebスクレイピングに使用するもう1つの理由は、Pythonが備えている組み込みの有用な外部ライブラリです。 Pythonをプログラミングのベースとして使用することで、Webスクレイピングに関連する多くの実装を実行できます。

オープンソースプログラミング言語

Pythonはオープンソースのプログラミング言語であるため、コミュニティから大きな支持を得ています。

幅広いアプリケーション

Pythonは、小さなシェルスクリプトからエンタープライズWebアプリケーションまで、さまざまなプログラミングタスクに使用できます。

Pythonのインストール

Pythonディストリビューションは、Windows、MAC、Unix/Linuxなどのプラットフォームで利用できます。 Pythonをインストールするには、プラットフォームに適用可能なバイナリコードのみをダウンロードする必要があります。 ただし、プラットフォームのバイナリコードが利用できない場合は、ソースコードを手動でコンパイルできるようにCコンパイラが必要です。

次のように、さまざまなプラットフォームにPythonをインストールできます-

UnixおよびLinuxにPythonをインストールする

Unix/LinuxマシンにPythonをインストールするには、以下の手順に従う必要があります-

  • ステップ1 *-リンクhttps://www.python.org/downloads/に移動します
  • ステップ2 *-上記のリンクから、Unix/Linuxで利用可能なzip形式のソースコードをダウンロードします。
  • ステップ3 *-ファイルをコンピューターに抽出します。
  • ステップ4 *-次のコマンドを使用してインストールを完了します-
run ./configure script
make
make install

インストールされているPythonは、標準の場所 /usr/local/bin にあり、そのライブラリは /usr/local/lib/pythonXX にあります(XXはPythonのバージョンです)。

WindowsにPythonをインストールする

PythonをWindowsマシンにインストールするには、以下の手順に従う必要があります-

  • ステップ1 *-リンクhttps://www.python.org/downloads/に移動します

ステップ2 *-Windowsインストーラー *python-XYZ.msi ファイルをダウンロードします。XYZはインストールする必要のあるバージョンです。

  • ステップ3 *-ここで、インストーラファイルをローカルマシンに保存し、MSIファイルを実行します。
  • ステップ4 *-最後に、ダウンロードしたファイルを実行してPythonインストールウィザードを起動します。

MacintoshにPythonをインストールする

Mac OS XにPython 3をインストールするには、 Homebrew を使用する必要があります。 Homebrewは簡単にインストールでき、優れたパッケージインストーラーです。

Homebrewは、次のコマンドを使用してインストールすることもできます-

$ ruby -e "$(curl -fsSL
https://raw.githubusercontent.com/Homebrew/install/master/install)"

パッケージマネージャーを更新するには、次のコマンドを使用できます-

$ brew update

次のコマンドの助けを借りて、MACマシンにPython3をインストールできます-

$ brew install python3

PATHのセットアップ

次の手順を使用して、さまざまな環境でパスを設定できます-

Unix/Linuxでのパスのセットアップ

さまざまなコマンドシェルを使用してパスを設定するには、次のコマンドを使用します-

cshシェルの場合

setenv PATH "$PATH:/usr/local/bin/python".

bashシェルの場合(Linux)

ATH="$PATH:/usr/local/bin/python".

shまたはkshシェルの場合

PATH="$PATH:/usr/local/bin/python".

Windowsでのパスのセットアップ

Windowsでパスを設定するには、コマンドプロンプトでパス*%path%; C:\ Python *を使用し、Enterキーを押します。

Pythonを実行する

次の3つの方法のいずれかを使用してPythonを起動できます-

インタラクティブ通訳

コマンドラインインタープリターまたはシェルを提供しているUNIXやDOSなどのオペレーティングシステムは、Pythonの起動に使用できます。

次のようにインタラクティブなインタプリタでコーディングを開始できます-

ステップ1 *-コマンドラインで *python と入力します。

  • ステップ2 *-その後、インタラクティブインタープリターですぐにコーディングを開始できます。
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

コマンドラインからのスクリプト

インタプリタを呼び出すことにより、コマンドラインでPythonスクリプトを実行できます。 それは次のように理解することができます-

$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS

統合開発環境

システムがPythonをサポートしているGUIアプリケーションを持っている場合、GUI環境からPythonを実行することもできます。 さまざまなプラットフォームでPythonをサポートするいくつかのIDEを以下に示します-

*IDE for UNIX* -PythonのUNIXにはIDLE IDEがあります。
*IDE for Windows* -WindowsにはGUIもあるPythonWin IDEがあります。
*Macintosh用IDE* -Macintoshには、メインWebサイトからMacBinaryまたはBinHex'dファイルとしてダウンロード可能なIDLE IDEがあります。