Seaborn-importing-datasets-and-libraries

提供:Dev Guides
移動先:案内検索

Seaborn-データセットとライブラリのインポート

この章では、データセットとライブラリをインポートする方法について説明します。 ライブラリをインポートする方法を理解することから始めましょう。

ライブラリのインポート

まず、Pandasをインポートします。Pandasは、リレーショナル(テーブル形式)データセットを管理するための優れたライブラリです。 Seabornは、データ分析に最も広く使用されているデータ構造であるDataFrameを扱うときに便利です。

次のコマンドは、パンダをインポートするのに役立ちます-

# Pandas for managing datasets
import pandas as pd

次に、プロットのカスタマイズに役立つMatplotlibライブラリをインポートします。

# Matplotlib for additional customization
from matplotlib import pyplot as plt

私たちは次のコマンドでSeabornライブラリをインポートします-

# Seaborn for plotting and styling
import seaborn as sb

データセットのインポート

必要なライブラリをインポートしました。 このセクションでは、必要なデータセットをインポートする方法を理解します。

Seabornには、ライブラリにいくつかの重要なデータセットが付属しています。 Seabornがインストールされると、データセットが自動的にダウンロードされます。

これらのデータセットのいずれかを学習に使用できます。 次の機能を使用すると、必要なデータセットをロードできます

load_dataset()

Pandas DataFrameとしてのデータのインポート

このセクションでは、データセットをインポートします。 このデータセットは、デフォルトでPandas DataFrameとしてロードされます。 Pandas DataFrameに機能がある場合、このDataFrameで機能します。

次のコード行は、データセットのインポートに役立ちます-

# Seaborn for plotting and styling
import seaborn as sb
df = sb.load_dataset('tips')
print df.head()

上記のコード行は、次の出力を生成します-

   total_bill  tip   sex    smoker day  time   size
0    16.99    1.01   Female  No    Sun  Dinner  2
1    10.34    1.66   Male    No    Sun  Dinner  3
2    21.01    3.50   Male    No    Sun  Dinner  3
3    23.68    3.31   Male    No    Sun  Dinner  2
4    24.59    3.61   Female  No    Sun  Dinner  4

Seabornライブラリで利用可能なすべてのデータセットを表示するには、以下に示すように、* get_dataset_names()*関数を使用して次のコマンドを使用できます-

import seaborn as sb
print sb.get_dataset_names()

上記のコード行は、次の出力として利用可能なデータセットのリストを返します

[u'anscombe', u'attention', u'brain_networks', u'car_crashes', u'dots',
u'exercise', u'flights', u'fmri', u'gammas', u'iris', u'planets', u'tips',
u'titanic']
*DataFrames* は、データを簡単にオーバービューできる長方形のグリッドの形式でデータを保存します。 長方形のグリッドの各行にはインスタンスの値が含まれ、グリッドの各列は特定の変数のデータを保持するベクトルです。 これは、DataFrameの行に同じデータ型の値を含める必要はなく、数値、文字、論理などであることを意味します。 DataFrames for PythonにはPandasライブラリが付属しており、潜在的に異なるタイプの列を持つ2次元のラベル付きデータ構造として定義されています。

DataFramesの詳細については、pandasのリンク:/python_pandas/index [tutorial]にアクセスしてください。