R-decision-tree
提供:Dev Guides
R-決定木
デシジョンツリーは、選択肢とその結果をツリー形式で表すグラフです。 グラフのノードはイベントまたは選択を表し、グラフのエッジは決定ルールまたは条件を表します。 Rを使用した機械学習およびデータマイニングアプリケーションで主に使用されます。
意思決定要素の使用例は、電子メールをスパムまたはスパムではないと予測する、腫瘍の癌を予測する、またはこれらのそれぞれの要因に基づいて融資を良いまたは悪い信用リスクとして予測するなどです。 一般に、モデルはトレーニングデータとも呼ばれる観測データで作成されます。 次に、検証データのセットを使用して、モデルを検証および改善します。 Rには、決定木の作成と視覚化に使用されるパッケージがあります。 新しい予測変数のセットでは、このモデルを使用して、データのカテゴリ(yes/no、spam/not spam)の決定に到達します。
Rパッケージ "party" は、決定木を作成するために使用されます。
Rパッケージをインストールする
Rコンソールで以下のコマンドを使用して、パッケージをインストールします。 また、依存パッケージがある場合はインストールする必要があります。
パッケージ「party」には、決定ツリーの作成と分析に使用される関数* ctree()*が含まれています。
構文
Rで決定木を作成するための基本的な構文は次のとおりです-
以下は、使用されるパラメータの説明です-
- *式*は、予測変数と応答変数を記述する式です。
- data は、使用されるデータセットの名前です。
入力データ
これがサンプルデータです。
上記のコードを実行すると、次の結果とグラフが生成されます-
例
- ctree()*関数を使用して決定木を作成し、グラフを表示します。
上記のコードを実行すると、次の結果が生成されます-
結論
上記の決定ツリーから、readingSkillsスコアが38.3未満で、年齢が6歳を超える人はネイティブスピーカーではないと結論付けることができます。