Big-data-analytics-machine-learning-data-analysis

提供:Dev Guides
移動先:案内検索

データ分析のための機械学習

機械学習は、パターン認識、コンピュータービジョン、音声認識、テキスト分析などのタスクを扱うコンピューターサイエンスのサブフィールドであり、統計や数学的最適化との強いつながりがあります。 アプリケーションには、検索エンジンの開発、スパムフィルタリング、光学文字認識(OCR)などが含まれます。 データマイニング、パターン認識、統計学習の分野の境界は明確ではなく、基本的にはすべて同様の問題に言及しています。

機械学習は、2種類のタスクに分けることができます-

  • 教師あり学習
  • 教師なし学習

教師あり学習

教師あり学習とは、行列_X_として定義された入力データがあり、応答_y_を予測することに関心があるタイプの問題を指します。 ここで、_X = \ {x〜1〜、x〜2〜、…、x〜n〜} _には_n_予測子があり、2つの値_y = \ {c〜1〜、c〜2〜} _があります。

アプリケーションの例としては、人口統計学的特徴を予測子として使用して、Webユーザーが広告をクリックする確率を予測することが挙げられます。 これは、クリック率(CTR)を予測するためによく呼び出されます。 次に、_y = \ {クリック、しない-クリック} _し、予測子は、使用可能なIPアドレス、サイトに入った日、ユーザーの市、国などです。

教師なし学習

教師なし学習では、学習するクラスがなくても、互いに類似したグループを見つける問題を扱います。 予測子からマッピングを学習し、各グループで類似したインスタンスを共有し、互いに異なるグループを見つけるタスクには、いくつかのアプローチがあります。

教師なし学習のアプリケーションの例は、顧客のセグメンテーションです。 たとえば、電気通信業界の一般的なタスクは、ユーザーが電話に与える使用量に応じてユーザーをセグメント化することです。 これにより、マーケティング部門は各グループを異なる製品でターゲットにできます。