Data-mining-dm-terminologies
データマイニング-用語
データマイニング
データマイニングとは、膨大なデータセットから情報を抽出することです。 つまり、データマイニングはデータから知識をマイニングしていると言えます。 この情報は、次のアプリケーションのいずれかに使用することができます-
- 市場分析
- 不正検出
- 顧客維持
- 生産管理
- 科学探査
データマイニングエンジン
データマイニングエンジンは、データマイニングシステムにとって非常に重要です。 それは、次の機能を実行する機能モジュールのセットで構成されています-
- 特徴づけ
- 関連付けと相関分析
- 分類
- 予測
- クラスター分析
- 外れ値分析
- 進化分析
知識ベース
これがドメインの知識です。 この知識は、検索をガイドしたり、結果のパターンの面白さを評価するために使用されます。
知識発見
データマイニングを知識発見と同じように扱う人もいれば、データマイニングを知識発見のプロセスの重要なステップと見なす人もいます。 ここに知識発見プロセスに含まれるステップのリストがあります-
- データクリーニング
- データ統合
- データ選択
- データ変換
- データマイニング
- パターン評価
- ナレッジプレゼンテーション
ユーザーインターフェース
ユーザーインターフェイスは、ユーザーとデータマイニングシステム間の通信を支援するデータマイニングシステムのモジュールです。 ユーザーインターフェイスは、次の機能を可能にします-
- データマイニングクエリタスクを指定して、システムと対話します。
- 検索に焦点を当てるのに役立つ情報を提供します。
- 中間データマイニング結果に基づくマイニング。
- データベースおよびデータウェアハウスのスキーマまたはデータ構造を参照します。
- マイニングパターンを評価します。
- さまざまな形式でパターンを視覚化します。
データ統合
データ統合は、複数の異種データソースからのデータをコヒーレントデータストアにマージするデータ前処理技術です。 データ統合には一貫性のないデータが含まれる場合があるため、データのクリーニングが必要です。
データクリーニング
データクリーニングは、ノイズの多いデータを削除し、データの不整合を修正するために適用される手法です。 データクリーニングには、間違ったデータを修正する変換が含まれます。 データクリーニングは、データウェアハウスのデータを準備する際のデータ前処理ステップとして実行されます。
データ選択
データ選択は、分析タスクに関連するデータがデータベースから取得されるプロセスです。 データ選択プロセスの前に、データの変換と統合が実行される場合があります。
クラスター
クラスタは、類似した種類のオブジェクトのグループを指します。 クラスター分析とは、互いに非常に類似しているが、他のクラスター内のオブジェクトとは大きく異なるオブジェクトのグループを形成することです。
データ変換
このステップでは、サマリーまたは集計操作を実行して、データをマイニングに適した形式に変換または統合します。