Sap-hana-sql-data-profiling

提供:Dev Guides
移動先:案内検索

SAP HANA-SQLデータプロファイリング

SQL Data Profilingタスクは、複数のデータソースからのデータを理解および分析するために使用されます。 誤った不完全なデータを削除し、データウェアハウスにロードされる前にデータ品質の問題を防ぐために使用されます。

ここにSQLデータプロファイリングタスクの利点があります-

  • ソースデータをより効果的に分析するのに役立ちます。
  • ソースデータをよりよく理解するのに役立ちます。
  • 不正確で不完全なデータを削除し、データウェアハウスにロードする前にデータ品質を向上させます。
  • 抽出、変換、および読み込みタスクで使用されます。

データプロファイリングタスクは、データソースを理解し、修正が必要なデータの問題を特定するのに役立つプロファイルをチェックします。

Integration Servicesパッケージ内のデータプロファイリングタスクを使用して、SQL Serverに格納されているデータのプロファイルを作成し、データ品質に関する潜在的な問題を特定できます。

-データプロファイリングタスクはSQL Serverデータソースでのみ機能し、他のファイルベースまたはサードパーティのデータソースをサポートしません。

アクセス要件

データプロファイリングタスクを含むパッケージを実行するには、ユーザーアカウントにtempdbデータベースに対するCREATE TABLE権限を持つ読み取り/書き込み権限が必要です。

データプロファイラービューアー

Data Profile Viewerは、プロファイラーの出力を確認するために使用されます。 データプロファイルビューアは、プロファイル出力で特定されたデータ品質の問題を理解するのに役立つドリルダウン機能もサポートしています。 このドリルダウン機能は、元のデータソースにライブクエリを送信します。

データプロファイリングタスクのセットアップと確認

データプロファイリングタスクのセットアップ

これには、プロファイルを計算するためのデータプロファイリングタスクを含むパッケージの実行が含まれます。 タスクは、出力をXML形式でファイルまたはパッケージ変数に保存します。

プロファイルの確認

データプロファイルを表示するには、出力をファイルに送信してから、データプロファイルビューアーを使用します。 このビューアは、オプションのドリルダウン機能を備えた概要および詳細形式の両方でプロファイル出力を表示するスタンドアロンユーティリティです。

データプロファイリング-構成オプション

データプロファイリングタスクには、これらの便利な構成オプションがあります-

ワイルドカード列

プロファイルリクエストの設定中、タスクは列名の代わりに「*」ワイルドカードを受け入れます。 これにより、構成が簡素化され、見慣れないデータの特性を見つけやすくなります。 タスクが実行されると、タスクは適切なデータ型を持つすべての列のプロファイルを作成します。

クイックプロファイル

[クイックプロファイル]を選択して、タスクをすばやく構成できます。 クイックプロファイルは、すべてのデフォルトのプロファイルと設定を使用して、テーブルまたはビューのプロファイルを作成します。

データプロファイリングタスクは、8つの異なるデータプロファイルを計算できます。 これらのプロファイルのうち5つは個々の列をチェックし、残りの3つは複数列または列間の関係を分析します。

データプロファイリング-タスク出力

データプロファイリングタスクは、選択したプロファイルをDataProfile.xsdスキーマのような構造のXML形式に出力します。

スキーマのローカルコピーを保存し、Microsoft Visual Studioまたは別のスキーマエディター、XMLエディター、またはメモ帳などのテキストエディターでスキーマのローカルコピーを表示できます。