Machine-learning-with-python-ecosystem

提供:Dev Guides
移動先:案内検索

Pythonによる機械学習-エコシステム

Pythonの概要

Pythonは、高レベルのプログラミング言語の機能を備えた一般的なオブジェクト指向プログラミング言語です。 構文と移植性の習得が容易なため、最近では人気があります。 次の事実は私たちにPythonの紹介を与えます-

  • Pythonは、オランダのStichting Mathematisch CentrumのGuido van Rossumによって開発されました。
  • 「ABC」という名前のプログラミング言語の後継として書かれました。
  • 1991年に最初のバージョンがリリースされました。
  • Pythonという名前は、Guido van RossumがMonty Python’s Flying Circusという名前のテレビ番組から選んだものです。
  • これはオープンソースのプログラミング言語であるため、自由にダウンロードしてプログラムの開発に使用できます。 https://www.python.org [www.python.org。]からダウンロードできます。
  • Pythonプログラミング言語は、JavaとCの両方の機能を備えています。 エレガントな「C」コードを使用している一方で、オブジェクト指向プログラミング用のJavaのようなクラスとオブジェクトを使用しています。
  • これはインタープリター言語です。つまり、Pythonプログラムのソースコードは最初にバイトコードに変換され、次にPython仮想マシンによって実行されます。

Pythonの長所と短所

すべてのプログラミング言語には長所と短所があり、Pythonも同様です。

強み

調査と調査によると、Pythonは5番目に重要な言語であり、機械学習とデータサイエンスで最も人気のある言語です。 Pythonには次の長所があるためです-

学びやすく、理解しやすい-Pythonの構文はより単純です。したがって、初心者でも言語を習得して理解することは比較的簡単です。

多目的言語-Pythonは、構造化プログラミング、オブジェクト指向プログラミング、および関数型プログラミングをサポートしているため、多目的プログラミング言語です。

膨大な数のモジュール-Pythonにはプログラミングのあらゆる側面をカバーする膨大な数のモジュールがあります。 これらのモジュールは簡単に使用できるため、Pythonを拡張可能な言語にします。

オープンソースコミュニティのサポート-オープンソースプログラミング言語であるため、Pythonは非常に大きな開発者コミュニティによってサポートされています。 このため、バグはPythonコミュニティによって簡単に修正されます。 この特性により、Pythonは非常に堅牢で適応性があります。

スケーラビリティ-Pythonは、シェルスクリプトよりも大きなプログラムをサポートするための改善された構造を提供するため、スケーラブルなプログラミング言語です。

弱さ

Pythonは人気のある強力なプログラミング言語ですが、実行速度が遅いという弱点があります。

Pythonはインタプリタ言語であるため、Pythonの実行速度はコンパイルされた言語と比較して遅くなります。 これは、Pythonコミュニティの改善の主要な領域になる可能性があります。

Pythonをインストールする

Pythonで作業するには、まずインストールする必要があります。 次の2つの方法のいずれかでPythonのインストールを実行できます-

  • Pythonを個別にインストールする
  • 事前にパッケージ化されたPythonディストリビューションの使用:Anaconda

これらについて詳しく説明しましょう。

Pythonを個別にインストールする

Pythonをコンピューターにインストールする場合は、プラットフォームに該当するバイナリコードのみをダウンロードする必要があります。 Pythonディストリビューションは、Windows、Linux、およびMacプラットフォームで利用できます。

以下は、上記のプラットフォームにPythonをインストールする簡単な概要です-

  • UnixおよびLinuxプラットフォーム*

次の手順の助けを借りて、UnixおよびLinuxプラットフォームにPythonをインストールできます-

  • まず、https://www.python.org/downloads/[www.python.org/downloads/]にアクセスします。
  • 次に、リンクをクリックして、Unix/Linuxで利用可能なzip形式のソースコードをダウンロードします。
  • 次に、ファイルをダウンロードして抽出します。
  • 次に、オプションをカスタマイズする場合は、_Modules/Setup_ファイルを編集できます。
  • 次に、コマンド run ./configure script を記述します
  • make
  • インストールする
  • Windowsプラットフォーム*

次の手順の助けを借りて、WindowsプラットフォームにPythonをインストールできます-

  • まず、https://www.python.org/downloads/にアクセスします。
  • 次に、Windowsインストーラーのpython-XYZ.msiファイルのリンクをクリックします。 ここで、XYZはインストールするバージョンです。
  • 次に、ダウンロードしたファイルを実行する必要があります。 簡単に使用できるPythonインストールウィザードが表示されます。 ここで、デフォルト設定を受け入れて、インストールが完了するまで待ちます。
  • Macintoshプラットフォーム*

Mac OS X、Homebrewの場合、Python 3をインストールするための優れた使いやすいパッケージインストーラーをお勧めします。 あなたがHomebrewを持っていない場合は、次のコマンドの助けを借りてそれをインストールすることができます-

$ ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

以下のコマンドで更新できます-

$ brew update

さて、システムにPython3をインストールするには、次のコマンドを実行する必要があります-

$ brew install python3

事前にパッケージ化されたPythonディストリビューションの使用:Anaconda

Anacondaは、データサイエンスで広く使用されているすべてのライブラリを備えたPythonのパッケージコンパイルです。 Anacondaを使用してPython環境をセットアップするには、次の手順に従います-

  • *ステップ1 *-まず、必要なインストールパッケージをAnacondaディストリビューションからダウンロードする必要があります。 同じリンクはhttps://www.anaconda.com/distribution/[www.anaconda.com/distribution/。]です。要件に応じて、Windows、Mac、Linux OSから選択できます。
  • *ステップ2 *-次に、マシンにインストールするPythonバージョンを選択します。 最新のPythonバージョンは3.7です。 そこには、64ビットおよび32ビットの両方のグラフィカルインストーラーのオプションがあります。
  • *ステップ3 *-OSとPythonバージョンを選択すると、コンピューターにAnacondaインストーラーがダウンロードされます。 ここで、ファイルをダブルクリックすると、インストーラーがAnacondaパッケージをインストールします。
  • *ステップ4 *-インストールされているかどうかを確認するには、コマンドプロンプトを開き、次のようにPythonを入力します。

Pythonディストリビューション

また、リンク:/python_essentials_online_training/getting_started_with_anaconda.asp [[[1]]]の詳細なビデオ講義でこれを確認することもできます。

データサイエンスにPythonを使用する理由

Pythonは、機械学習とデータサイエンスで5番目に重要な言語であり、最も一般的な言語です。 以下は、データサイエンスに適した言語の選択となるPythonの機能です-

豊富なパッケージセット

Pythonには、さまざまなドメインですぐに使用できる広範かつ強力なパッケージセットがあります。 numpy、scipy、pandas、scikit-learn などのパッケージもあります。 機械学習とデータサイエンスに必要です。

簡単なプロトタイピング

Pythonのもう1つの重要な機能は、Pythonをデータサイエンスの言語として選択できることです。これは、簡単で高速なプロトタイピングです。 この機能は、新しいアルゴリズムの開発に役立ちます。

コラボレーション機能

データサイエンスの分野では基本的に優れたコラボレーションが必要であり、Pythonにはこれを実現する便利なツールが数多く用意されています。

多くのドメインのための1つの言語

典型的なデータサイエンスプロジェクトには、データ抽出、データ操作、データ分析、特徴抽出、モデリング、評価、展開、ソリューションの更新などのさまざまなドメインが含まれます。 Pythonは多目的言語であるため、データサイエンティストは共通プラットフォームからこれらすべてのドメインに対処できます。

Python MLエコシステムのコンポーネント

このセクションでは、Python Machine Learningエコシステムのコンポーネントを形成するいくつかのコアデータサイエンスライブラリについて説明します。 これらの便利なコンポーネントにより、Pythonはデータサイエンスにとって重要な言語になります。 そのようなコンポーネントは多数ありますが、ここでPythonエコシステムの重要なコンポーネントのいくつかについて説明しましょう-

  • link:/machine_learning_with_python/machine_learning_with_python_jupyter_notebook [Jupyter Notebook]-Jupyter Notebookは基本的に、Pythonベースのデータサイエンスアプリケーションを開発するためのインタラクティブな計算環境を提供します。