Machine-learning-with-python-unsupervised-learning

提供:Dev Guides
移動先:案内検索

機械学習-教師なし学習

教師なし学習

名前が示すように、教師ありMLメソッドまたはアルゴリズムとは反対です。つまり、教師なし機械学習アルゴリズムでは、いかなる種類のガイダンスも提供するスーパーバイザーはいません。 教師なし学習アルゴリズムは、教師あり学習アルゴリズムのように、事前にラベル付けされたトレーニングデータを持つ自由がなく、入力データから有用なパターンを抽出したいシナリオで便利です。

たとえば、それは次のように理解することができます-

我々が持っていると仮定します-

  • * x-入力変数*、対応する出力変数は存在せず、アルゴリズムは学習のためにデータの興味深いパターンを発見する必要があります。

教師なし機械学習アルゴリズムの例には、* K平均クラスタリング、K最近傍*などがあります。

MLタスクに基づいて、教師なし学習アルゴリズムは、次の広範なクラスに分けることができます-

  • クラスタリング
  • 協会
  • 次元削減

クラスタリング

クラスタリング手法は、最も有用な教師なしML手法の1つです。 これらのアルゴリズムは、データサンプル間の類似性および関係パターンを検出し、それらのサンプルを特徴に基づいて類似性を持つグループにクラスター化するために使用されていました。 クラスタリングの実際の例は、購入行動によって顧客をグループ化することです。

協会

別の有用な教師なしMLメソッドは Association で、これは大きなデータセットを分析してさまざまなアイテム間の興味深い関係をさらに表すパターンを見つけるために使用されます。 また、*アソシエーションルールマイニング*または*マーケットバスケット分析*と呼ばれ、主に顧客のショッピングパターンの分析に使用されます。

次元削減

この教師なしMLメソッドは、主要または代表的な特徴のセットを選択することにより、各データサンプルの特徴変数の数を減らすために使用されます。 ここで疑問が生じるのは、なぜ次元を減らす必要があるのか​​ということです。 背後にある理由は、データサンプルから何百万もの特徴の分析と抽出を開始するときに生じる特徴空間の複雑さの問題です。 この問題は、一般に「次元の呪い」を指します。 PCA(主成分分析)、K最近傍および判別分析は、この目的のための一般的なアルゴリズムの一部です。

異常検出

この監視なしMLメソッドは、通常は発生しないまれなイベントまたは観測の発生を見つけるために使用されます。 学習した知識を使用することで、異常検出方法は異常なデータポイントと通常のデータポイントを区別できます。 クラスタリングなどの監視なしアルゴリズムの一部であるKNNは、データとその機能に基づいて異常を検出できます。