回帰モデルの構築

ロジスティック回帰とは、カテゴリー従属変数の確率を予測するために使用される機械学習アルゴリズムを指します。ロジスティック回帰では、従属変数はバイナリ変数であり、1（trueおよびfalseのブール値）としてコード化されたデータで構成されます。

この章では、連続変数を使用してPythonで回帰モデルを開発することに焦点を当てます。線形回帰モデルの例では、CSVファイルからのデータ探索に焦点を当てます。

分類の目標は、クライアントが定期預金にサブスクライブする（1/0）かどうかを予測することです。

import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt

plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split

import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))

次の手順に従って、「Jupyter Notebook」を使用してAnaconda Navigatorに上記のコードを実装します-

ステップ1 *-Anaconda NavigatorでJupyterノートブックを起動します。

Jupyter Notebook First

Jupyter Notebook Second

ステップ2 *-csvファイルをアップロードして、回帰モデルの出力を体系的に取得します。

Jupyter Notebook Third

ステップ3 *-新しいファイルを作成し、上記のコード行を実行して目的の出力を取得します。

Jupyter Notebook Fourth

Jupyter Notebook Fifth

Agile-data-science-building-a-regression-model

回帰モデルの構築