Data-mining-dm-themes

提供:Dev Guides
移動先:案内検索

データマイニング-テーマ

データマイニングの理論的基盤

データマイニングの理論的基礎には、次の概念が含まれています-

  • データ削減-この理論の基本的な考え方は、非常に大規模なデータベースでのクエリに対する迅速な近似回答を取得する必要性に応じて、精度と速度を犠牲にしてデータ表現を削減することです。 データ削減技術のいくつかは次のとおりです-
  • 特異値分解
  • ウェーブレット
  • 回帰
  • 対数線形モデル
  • ヒストグラム
  • クラスタリング
  • サンプリング
  • インデックスツリーの構築
  • データ圧縮-この理論の基本的な考え方は、次の点でエンコードすることにより、指定されたデータを圧縮することです-
  • Bits
  • アソシエーションルール
  • 決定木
  • クラスター
  • パターン発見-この理論の基本的な考え方は、データベースで発生するパターンを発見することです。 以下は、この理論に貢献する分野です-
  • 機械学習
  • 神経網
  • 協会マイニング
  • シーケンシャルパターンマッチング
  • クラスタリング
  • 確率理論-この理論は統計理論に基づいています。 この理論の背後にある基本的な考え方は、ランダム変数の同時確率分布を発見することです。
  • 確率理論-この理論によると、データマイニングは、一部の企業の意思決定プロセスで使用できる範囲でのみ興味深いパターンを見つけます。
  • ミクロ経済学-この理論によると、データベーススキーマは、データベースに格納されているデータとパターンで構成されています。 したがって、データマイニングは、データベースで誘導を実行するタスクです。
  • 帰納的データベース-データベース指向のテクニックとは別に、データ分析に利用可能な統計的テクニックがあります。 これらの手法は、科学データや経済および社会科学のデータにも適用できます。

統計データマイニング

統計データマイニング技術のいくつかは次のとおりです-

  • 回帰-回帰法は、変数が数値である1つ以上の予測変数から応答変数の値を予測するために使用されます。 以下にリストされているのは回帰の形式です-
  • リニア
  • 複数
  • 加重
  • 多項式
  • ノンパラメトリック
  • 丈夫
  • 一般化線形モデル-一般化線形モデルに含まれるもの-
  • ロジスティック回帰
  • ポアソン回帰 +モデルの一般化により、線形回帰を使用した数値応答変数のモデリングと同様の方法で、カテゴリカル応答変数を一連の予測変数に関連付けることができます。
  • 分散の分析-この手法は分析します-
  • 数値応答変数で記述された2つ以上の母集団の実験データ。
  • 1つ以上のカテゴリ変数(因子)。
  • 混合効果モデル-これらのモデルは、グループ化されたデータの分析に使用されます。 これらのモデルは、応答変数と、1つ以上の要因に従ってグループ化されたデータ内のいくつかの共変量との関係を記述します。
  • 因子分析-因子分析は、カテゴリー応答変数を予測するために使用されます。 この方法は、独立変数が多変量正規分布に従うことを前提としています。
  • 時系列分析-以下は、時系列データを分析する方法です-
  • 自動回帰メソッド。
  • 一変量ARIMA(自己回帰統合移動平均)モデリング。
  • 長いメモリの時系列モデリング。

ビジュアルデータマイニング

Visual Data Miningは、データや知識の視覚化技術を使用して、大規模なデータセットから暗黙的な知識を発見します。 ビジュアルデータマイニングは、次の分野の統合として見ることができます-

  • データの可視化
  • データマイニング

視覚データマイニングは、次のことに密接に関連しています-

  • コンピューターグラフィックス
  • マルチメディアシステム
  • ヒューマンコンピューターインタラクション
  • パターン認識
  • 高性能コンピューティング

一般的に、データの視覚化とデータマイニングは、次の方法で統合することができます-

  • データの可視化-データベースまたはデータウェアハウスのデータは、以下に示すいくつかの視覚的な形式で表示できます-
  • ボックスプロット
  • 3Dキューブ
  • データ分布図
  • 曲線
  • 表面
  • リンクグラフなど
  • データマイニング結果の可視化-データマイニング結果の可視化は、データマイニングの結果を視覚的な形式で表示することです。 これらの視覚的なフォームは、散布図、箱ひげ図などです。
  • データマイニングプロセスの可視化-データマイニングプロセスの可視化は、データマイニングのいくつかのプロセスを提示します。 これにより、ユーザーはデータの抽出方法を確認できます。 また、ユーザーは、どのデータベースまたはデータウェアハウスからデータがクリーンアップ、統合、前処理、およびマイニングされたかを確認できます。

オーディオデータマイニング

オーディオデータマイニングは、オーディオシグナルを使用して、データのパターンまたはデータマイニング結果の機能を示します。 パターンを音に変換して黙想することで、写真を見る代わりにピッチや曲を聞いて、面白いものを特定できます。

データマイニングと共同フィルタリング

今日の消費者は、買い物中にさまざまな商品やサービスに出くわします。 顧客との実際の取引中に、Recommender Systemは製品の推奨を行うことで消費者を支援します。 通常、協調フィルタリングアプローチは、顧客に製品を推奨するために使用されます。 これらの推奨事項は、他の顧客の意見に基づいています。