Python-data-science-environment-setup

提供:Dev Guides
移動先:案内検索

Python-データサイエンス環境のセットアップ

このチュートリアルのサンプルコードを正常に作成して実行するには、汎用pythonとデータサイエンスに必要な特別なパッケージの両方を備えた環境をセットアップする必要があります。 まず、python 2またはpython 3である汎用pythonをインストールするようにします。 しかし、主にその成熟度と外部パッケージの幅広いサポートのため、このチュートリアルではpython 2をお勧めします。

Pythonを入手する

最新のソースコード、バイナリ、ドキュメント、ニュースなどは、Python [[1]]

Pythonドキュメントはhttps://www.python.org/doc/からダウンロードできます。 ドキュメントは、HTML、PDF、およびPostScript形式で入手できます。

Pythonをインストールする

Pythonディストリビューションは、さまざまなプラットフォームで利用できます。 プラットフォームに適用可能なバイナリコードのみをダウンロードし、Pythonをインストールする必要があります。

プラットフォームのバイナリコードが利用できない場合は、ソースコードを手動でコンパイルするCコンパイラが必要です。 ソースコードをコンパイルすると、インストールに必要な機能の選択に関して柔軟性が高まります。

Pythonをさまざまなプラットフォームにインストールする簡単な概要を次に示します-

UnixおよびLinuxのインストール

Unix/LinuxマシンにPythonをインストールする簡単な手順を以下に示します。

  • Webブラウザーを開き、https://www.python.org/downloads/にアクセスします。
  • リンクに従って、Unix/Linuxで利用可能なzip形式のソースコードをダウンロードします。
  • ファイルをダウンロードして抽出します。
  • 一部のオプションをカスタマイズする場合は、_Modules/Setup_ファイルを編集します。
  • ./configureスクリプトを実行します
  • make
  • インストールする

これにより、Pythonは標準の場所_/usr/local/bin_にインストールされ、そのライブラリは_/usr/local/lib/pythonXX_にインストールされます(XXはPythonのバージョンです)。

Windowsインストール

PythonをWindowsマシンにインストールする手順は次のとおりです。

  • Webブラウザーを開き、https://www.python.org/downloads/にアクセスします。
  • Windowsインストーラーの_python-XYZ.msi_ファイルのリンクをたどります。ここで、XYZはインストールする必要のあるバージョンです。
  • このインストーラー_python-XYZ.msi_を使用するには、WindowsシステムがMicrosoft Installer 2.0をサポートしている必要があります。 インストーラファイルをローカルマシンに保存し、実行して、マシンがMSIをサポートしているかどうかを確認します。
  • ダウンロードしたファイルを実行します。 これにより、非常に使いやすいPythonインストールウィザードが表示されます。 デフォルト設定をそのまま使用し、インストールが完了するまで待ちます。完了です。

Macintoshインストール

最近のMacにはPythonがインストールされていますが、数年前のものである可能性があります。 Macでの開発をサポートする追加のツールとともに現在のバージョンを取得する手順については、https://www.python.org/download/mac/[http://www.python.org/download/mac/]を参照してください。 Mac OS X 10.3(2003年にリリース)より前の古いMac OSの場合、MacPythonが利用可能です。

Jack Jansenがそれを管理しており、彼のWebサイト(http://www.cwi.nl/~jack/macpythonl)でドキュメント全体に完全にアクセスできます。 Mac OSインストールの完全なインストール詳細を見つけることができます。

PATHのセットアップ

プログラムやその他の実行可能ファイルは多くのディレクトリにある可能性があるため、オペレーティングシステムは、OSが実行可能ファイルを検索するディレクトリをリストする検索パスを提供します。

パスは環境変数に保存されます。環境変数は、オペレーティングシステムによって管理される名前付き文字列です。 この変数には、コマンドシェルおよび他のプログラムで利用可能な情報が含まれています。

*path* 変数の名前は、UnixではPATH、WindowsではPathです(Unixでは大文字と小文字が区別されますが、Windowsでは区別されません)。

Mac OSでは、インストーラーがパスの詳細を処理します。 特定のディレクトリからPythonインタープリターを起動するには、Pythonディレクトリをパスに追加する必要があります。

Unix/Linuxでのパスの設定

Unixで特定のセッションのパスにPythonディレクトリを追加するには-

  • * cshシェル*-setenv PATH "$ PATH:/usr/local/bin/python"と入力してEnterを押します。
  • * bashシェル(Linux)*で-export ATH = "$ PATH:/usr/local/bin/python"と入力し、Enterを押します。
  • * shシェルまたはkshシェル*-PATH = "$ PATH:/usr/local/bin/python"と入力し、Enterを押します。
  • 注意-/usr/local/bin/pythonはPythonディレクトリのパスです

Windowsでのパスの設定

PythonディレクトリをWindowsの特定のセッションのパスに追加するには-

コマンドプロンプト-path%path%; C:\ Pythonと入力し、Enterキーを押します。

注意-C:\ PythonはPythonディレクトリのパスです

Python環境変数

Pythonで認識できる重要な環境変数を次に示します-

Sr.No. Variable & Description
1

PYTHONPATH

PATHに似た役割を持っています。 この変数は、プログラムにインポートされたモジュールファイルの場所をPythonインタープリターに指示します。 PythonソースライブラリディレクトリとPythonソースコードを含むディレクトリを含める必要があります。 PYTHONPATHは、Pythonインストーラーによって事前設定される場合があります。

2

PYTHONSTARTUP

Pythonソースコードを含む初期化ファイルのパスが含まれています。 インタプリタを起動するたびに実行されます。 Unixでは.pythonrc.pyという名前で、ユーティリティをロードしたり、PYTHONPATHを変更したりするコマンドが含まれています。

3

PYTHONCASEOK

Windowsでは、importステートメントで大文字と小文字を区別しない最初の一致を見つけるようPythonに指示するために使用されます。 この変数を任意の値に設定して、アクティブにします。

4

PYTHONHOME

これは、代替モジュール検索パスです。 通常、モジュールライブラリの切り替えを容易にするために、PYTHONSTARTUPまたはPYTHONPATHディレクトリに埋め込まれます。

Pythonを実行する

Pythonを起動するには3つの異なる方法があります-

インタラクティブ通訳

Pythonは、Unix、DOS、またはコマンドラインインタープリターまたはシェルウィンドウを提供する他のシステムから起動できます。

コマンドラインに python と入力します。

インタラクティブなインタープリターですぐにコーディングを開始します。

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

ここに利用可能なすべてのコマンドラインオプションのリストがあります-

Sr.No. Option & Description
1

-d

デバッグ出力を提供します。

2

-O

最適化されたバイトコードを生成します(.pyoファイルが生成されます)。

3

-S

起動時にPythonのパスを探すためにインポートサイトを実行しないでください。

4

-v

詳細出力(インポートステートメントの詳細なトレース)。

5

-X

クラスベースの組み込み例外を無効にします(文字列のみを使用)。バージョン1.6以降では廃止されました。

6

-c cmd

cmd文字列として送信されたPythonスクリプトを実行します

7

file

指定されたファイルからPythonスクリプトを実行します

コマンドラインからのスクリプト

Pythonスクリプトは、次のように、アプリケーションでインタープリターを呼び出すことにより、コマンドラインで実行できます-

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or

C: >python script.py # Windows/DOS

注意-ファイル許可モードで実行が許可されていることを確認してください。

統合開発環境

PythonをサポートするGUIアプリケーションがシステムにある場合、グラフィカルユーザーインターフェイス(GUI)環境からPythonを実行することもできます。

  • Unix -IDLEはPython用の最初のUnix IDEです。
  • Windows -PythonWinはPythonの最初のWindowsインターフェイスであり、GUIを備えたIDEです。
  • Macintosh -MacintoshバージョンのPythonとIDLE IDEは、メインWebサイトから入手でき、MacBinaryまたはBinHex’dファイルとしてダウンロードできます。

SciPy Packのインストール

必要なパックを有効にする最良の方法は、オペレーティングシステムに固有のインストール可能なバイナリパッケージを使用することです。 これらのバイナリには、完全なSciPyスタック(NumPy、SciPy、matplotlib、IPython、SymPy、およびnoseパッケージとコアPythonを含む)が含まれています。

Windows

Anaconda(https://www.continuum.io [www.continuum.io]から)は、SciPyスタック用の無料のPythonディストリビューションです。 LinuxおよびMacでも利用可能です。

Canopy(https://www.enthought.com/products/canopy/[www.enthought.com/products/canopy/])は、Windows、Linux、およびMac向けの完全なSciPyスタックを備えた無料配布および商用配布として利用できます。

Python(x、y):Windows OS用のSciPyスタックとSpyder IDEを備えた無料のPythonディストリビューションです。 (https://python-xy.github.io/[www.python-xy.github.io/]からダウンロード可能)

Linux

各Linuxディストリビューションのパッケージマネージャーを使用して、1つ以上のパッケージをSciPyスタックにインストールします。

Ubuntuの場合

sudo apt-get install python-numpy
python-scipy python-matplotlibipythonipythonnotebook python-pandas
python-sympy python-nose

Fedoraの場合

sudo yum install numpyscipy python-matplotlibipython
python-pandas sympy python-nose atlas-devel

ソースからの構築

コアPython(2.6.x、2.7.x、および3.2.x以降)をdistutilsとともにインストールし、zlibモジュールを有効にする必要があります。

GNU gcc(4.2以降)Cコンパイラが利用可能でなければなりません。

NumPyをインストールするには、次のコマンドを実行します。

Python setup.py install

NumPyモジュールが正しくインストールされているかどうかをテストして、Pythonプロンプトからインポートしてみてください。

インストールされていない場合は、次のエラーメッセージが表示されます。

Traceback (most recent call last):
   File "<pyshell#0>", line 1, in <module>
      import numpy
ImportError: No module named 'numpy'

同様に、次の章に示す必要なすべてのデータサイエンスパッケージのインストールを確認できます。