Data-mining-dm-applications-trends
データマイニング-アプリケーションとトレンド
データマイニングは、さまざまな分野で広く使用されています。 現在利用可能な商用データマイニングシステムは数多くありますが、この分野には多くの課題があります。 このチュートリアルでは、アプリケーションとデータマイニングの傾向について説明します。
データマイニングアプリケーション
これは、データマイニングが広く使用されている分野のリストです-
- 財務データ分析
- 小売業
- 通信産業
- 生物学的データ分析
- その他の科学的応用
- 侵入検知
財務データ分析
銀行および金融業界の金融データは、一般に信頼性が高く、高品質であり、体系的なデータ分析とデータマイニングを促進します。 典型的なケースのいくつかは次のとおりです-
- 多次元データ分析およびデータマイニングのためのデータウェアハウスの設計と構築。
- ローン支払い予測と顧客信用ポリシー分析。
- ターゲットマーケティングのための顧客の分類とクラスタリング。
- マネーロンダリングおよびその他の金融犯罪の検出。
小売業
データマイニングは、販売、顧客の購入履歴、商品の輸送、消費、サービスに関する大量のデータを収集するため、小売業界での優れたアプリケーションを備えています。 Webの使いやすさ、可用性、人気の高まりにより、収集されるデータの量が急速に拡大し続けることは当然です。
小売業界のデータマイニングは、顧客サービスの品質の向上と優れた顧客維持と満足につながる顧客の購入パターンと傾向の特定に役立ちます。 これが小売業界のデータマイニングの例のリストです-
- データマイニングの利点に基づいたデータウェアハウスの設計と構築。
- 販売、顧客、製品、時間、地域の多次元分析。
- 販売キャンペーンの有効性の分析。
- 顧客維持。
- 製品の推奨事項とアイテムの相互参照。
通信産業
今日、電気通信業界は、ファックス、ポケットベル、携帯電話、インターネットメッセンジャー、画像、電子メール、ウェブデータ送信などのさまざまなサービスを提供する最も新しい産業の1つです。 新しいコンピューターおよび通信技術の開発により、電気通信業界は急速に拡大しています。 これが、ビジネスを支援および理解するためにデータマイニングが非常に重要になる理由です。
電気通信業界のデータマイニングは、電気通信パターンの識別、不正行為の発見、リソースのより有効な活用、およびサービス品質の向上に役立ちます。 これは、データマイニングが通信サービスを改善する例のリストです-
- 通信データの多次元分析。
- 不正パターン分析。
- 異常なパターンの識別。
- 多次元の関連付けと順次パターン分析。
- 移動体通信サービス。
- 通信データ分析における視覚化ツールの使用。
生物学的データ分析
最近では、ゲノミクス、プロテオミクス、機能ゲノミクス、生物医学研究などの生物学の分野で驚異的な成長を遂げています。 生物学的データマイニングは、バイオインフォマティクスの非常に重要な部分です。 以下は、データマイニングが生物学的データ分析に寄与する側面です-
- 異種の分散ゲノムおよびプロテオミクスデータベースのセマンティック統合。
- アライメント、インデックス作成、類似性検索、比較分析、複数のヌクレオチド配列。
- 構造パターンの発見と、遺伝子ネットワークとタンパク質経路の分析。
- 関連付けとパス分析。
- 遺伝データ分析の視覚化ツール。
その他の科学的応用
上記のアプリケーションは、統計的手法が適切な、比較的小さく同種のデータセットを処理する傾向があります。 地球科学、天文学などの科学分野から大量のデータが収集されています。 気候および生態系モデリング、化学工学、流体力学などのさまざまな分野での高速数値シミュレーションのため、大量のデータセットが生成されています。 以下は、科学アプリケーションの分野におけるデータマイニングのアプリケーションです-
- データウェアハウスとデータ前処理。
- グラフベースのマイニング。
- 視覚化とドメイン固有の知識。
侵入検知
侵入とは、ネットワークリソースの整合性、機密性、または可用性を脅かすあらゆる種類のアクションを指します。 この接続の世界では、セキュリティが大きな問題になっています。 インターネットの使用が増え、ネットワークの侵入と攻撃のためのツールとコツが利用できるようになったことで、侵入検知はネットワーク管理の重要なコンポーネントになりました。 これは、データマイニングテクノロジーが侵入検知に適用される可能性のある領域のリストです-
- 侵入検知のためのデータマイニングアルゴリズムの開発。
- 識別および属性の選択および構築を支援するための関連付けおよび相関分析、集約。
- ストリームデータの分析。
- 分散データマイニング。
- 視覚化およびクエリツール。
データマイニングシステム製品
多くのデータマイニングシステム製品とドメイン固有のデータマイニングアプリケーションがあります。 新しいデータマイニングシステムとアプリケーションは、以前のシステムに追加されています。 また、データマイニング言語を標準化する努力がなされています。
データマイニングシステムの選択
データマイニングシステムの選択は、次の機能に依存します-
- データタイプ-データマイニングシステムは、フォーマットされたテキスト、レコードベースのデータ、およびリレーショナルデータを処理する場合があります。 データは、ASCIIテキスト、リレーショナルデータベースデータ、またはデータウェアハウスデータにすることもできます。 したがって、データマイニングシステムが処理できる正確な形式を確認する必要があります。
- システムの問題-データマイニングシステムと異なるオペレーティングシステムとの互換性を考慮する必要があります。 1つのデータマイニングシステムは、1つのオペレーティングシステムのみで実行することも、複数のオペレーティングシステムで実行することもできます。 Webベースのユーザーインターフェイスを提供し、入力としてXMLデータを許可するデータマイニングシステムもあります。
- データソース-データソースは、データマイニングシステムが動作するデータ形式を指します。 一部のデータマイニングシステムはASCIIテキストファイルのみで動作し、他のデータマイニングシステムは複数のリレーショナルソースで動作します。 データマイニングシステムは、ODBC接続またはOLE DB for ODBC接続もサポートする必要があります。
- データマイニング機能および方法論-分類などの1つのデータマイニング機能のみを提供するデータマイニングシステムがありますが、コンセプトの説明、ディスカバリ駆動型OLAP分析、関連付けマイニング、リンケージ分析、統計分析などの複数のデータマイニング機能を提供するものもあります、分類、予測、クラスタリング、外れ値分析、類似性検索など。
- データマイニングとデータベースまたはデータウェアハウスシステムの結合-データマイニングシステムは、データベースまたはデータウェアハウスシステムと結合する必要があります。 結合されたコンポーネントは、統一された情報処理環境に統合されます。 以下にリストされているカップリングのタイプがあります-
- カップリングなし
- ルーズカップリング
- セミタイトカップリング
- 密結合
- スケーラビリティ-データマイニングには2つのスケーラビリティの問題があります-
- 行(データベースサイズ)のスケーラビリティ-データマイニングシステムは、1つまたは複数の行が10倍に拡大された場合、行スケーラブルと見なされます。 クエリを実行するのに10回もかかりません。
- 列(ディメンション)のスケーラビリティ-マイニングクエリの実行時間が列の数に比例して増加する場合、データマイニングシステムは列のスケーラブルと見なされます。
- 視覚化ツール-データマイニングの視覚化は、次のように分類できます-
- データの可視化
- マイニング結果の視覚化
- マイニングプロセスの視覚化
- ビジュアルデータマイニング
- データマイニングクエリ言語とグラフィカルユーザーインターフェイス-使いやすいグラフィカルユーザーインターフェイスは、ユーザーがガイドするインタラクティブなデータマイニングを促進するために重要です。 リレーショナルデータベースシステムとは異なり、データマイニングシステムは、基になるデータマイニングクエリ言語を共有しません。
データマイニングの動向
データマイニングの概念はまだ進化しており、この分野で見られる最新のトレンドは次のとおりです-
- アプリケーションの調査。
- スケーラブルでインタラクティブなデータマイニング方法。
- データマイニングとデータベースシステム、データウェアハウスシステム、およびWebデータベースシステムとの統合。
- データマイニングクエリ言語の標準化。
- ビジュアルデータマイニング。
- 複雑なタイプのデータをマイニングするための新しい方法。
- 生物学的データマイニング。
- データマイニングとソフトウェアエンジニアリング。
- Webマイニング。
- 分散データマイニング。
- リアルタイムデータマイニング。
- マルチデータベースデータマイニング。
- データマイニングにおけるプライバシー保護と情報セキュリティ。