Seaborn-importing-datasets-and-libraries
Seaborn-データセットとライブラリのインポート
この章では、データセットとライブラリをインポートする方法について説明します。 ライブラリをインポートする方法を理解することから始めましょう。
ライブラリのインポート
まず、Pandasをインポートします。Pandasは、リレーショナル(テーブル形式)データセットを管理するための優れたライブラリです。 Seabornは、データ分析に最も広く使用されているデータ構造であるDataFrameを扱うときに便利です。
次のコマンドは、パンダをインポートするのに役立ちます-
# Pandas for managing datasets
import pandas as pd
次に、プロットのカスタマイズに役立つMatplotlibライブラリをインポートします。
# Matplotlib for additional customization
from matplotlib import pyplot as plt
私たちは次のコマンドでSeabornライブラリをインポートします-
# Seaborn for plotting and styling
import seaborn as sb
データセットのインポート
必要なライブラリをインポートしました。 このセクションでは、必要なデータセットをインポートする方法を理解します。
Seabornには、ライブラリにいくつかの重要なデータセットが付属しています。 Seabornがインストールされると、データセットが自動的にダウンロードされます。
これらのデータセットのいずれかを学習に使用できます。 次の機能を使用すると、必要なデータセットをロードできます
load_dataset()
Pandas DataFrameとしてのデータのインポート
このセクションでは、データセットをインポートします。 このデータセットは、デフォルトでPandas DataFrameとしてロードされます。 Pandas DataFrameに機能がある場合、このDataFrameで機能します。
次のコード行は、データセットのインポートに役立ちます-
# Seaborn for plotting and styling
import seaborn as sb
df = sb.load_dataset('tips')
print df.head()
上記のコード行は、次の出力を生成します-
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
Seabornライブラリで利用可能なすべてのデータセットを表示するには、以下に示すように、* get_dataset_names()*関数を使用して次のコマンドを使用できます-
import seaborn as sb
print sb.get_dataset_names()
上記のコード行は、次の出力として利用可能なデータセットのリストを返します
[u'anscombe', u'attention', u'brain_networks', u'car_crashes', u'dots',
u'exercise', u'flights', u'fmri', u'gammas', u'iris', u'planets', u'tips',
u'titanic']
*DataFrames* は、データを簡単にオーバービューできる長方形のグリッドの形式でデータを保存します。 長方形のグリッドの各行にはインスタンスの値が含まれ、グリッドの各列は特定の変数のデータを保持するベクトルです。 これは、DataFrameの行に同じデータ型の値を含める必要はなく、数値、文字、論理などであることを意味します。 DataFrames for PythonにはPandasライブラリが付属しており、潜在的に異なるタイプの列を持つ2次元のラベル付きデータ構造として定義されています。
DataFramesの詳細については、pandasのリンク:/python_pandas/index [tutorial]にアクセスしてください。