Sap-bods-query-transform
SAP BODS-クエリ変換
これは、Data Servicesで使用される最も一般的な変換であり、次の機能を実行できます-
- ソースからのデータフィルタリング
- 複数のソースからのデータを結合する
- データに対して関数と変換を実行する
- 入力スキーマから出力スキーマへの列マッピング
- 主キーの割り当て
- 結果のスキーマに新しい列、スキーマ、および関数を追加します
クエリ変換は最も一般的に使用される変換なので、ツールパレットでこのクエリのショートカットが提供されます。
クエリ変換を追加するには、以下の手順に従ってください-
- ステップ1 *-クエリ変換ツールパレットをクリックします。 データフローワークスペースの任意の場所をクリックします。 これを入力および出力に接続します。
Queryトランスフォームアイコンをダブルクリックすると、クエリ操作の実行に使用されるクエリエディタが開きます。
Queryトランスフォームには次の領域があります-
- 入力スキーマ
- 出力スキーマ
- パラメーター
入力および出力スキーマには、列、ネストされたスキーマおよび関数が含まれます。 スキーマインとスキーマアウトは、現在選択されている変換中のスキーマを示します。
出力スキーマを変更するには、リストでスキーマを選択し、右クリックして[現在にする]を選択します。
データ品質変換
データ品質変換は、ネストされたテーブルを含むアップストリーム変換に直接接続できません。 これらの変換を接続するには、ネストされたテーブルからの変換とデータ品質変換の間にクエリ変換またはXMLパイプライン変換を追加する必要があります。
データ品質変換の使用方法
- ステップ1 *-[オブジェクトライブラリ]→[変換]タブに移動します
- ステップ2 *-Data Qualityトランスフォームを展開し、データフローに追加するトランスフォームまたはトランスフォーム構成を追加します。
- ステップ3 *-データフロー接続を描画します。 変換の名前をダブルクリックすると、変換エディターが開きます。 入力スキーマで、マップする入力フィールドを選択します。
注意-変換の関連付けを使用するには、ユーザー定義フィールドを入力タブに追加できます。
テキストデータ処理変換
テキストデータ処理変換を使用すると、大量のテキストから特定の情報を抽出できます。 組織に固有のファクトおよび顧客、製品、財務ファクトなどのエンティティを検索できます。
この変換は、エンティティ間の関係もチェックし、抽出を許可します。 テキストデータ処理を使用して抽出されたデータは、ビジネスインテリジェンス、レポート、クエリ、および分析で使用できます。
エンティティ抽出変換
Data Servicesでは、非構造化データからエンティティとファクトを抽出するエンティティ抽出を使用してテキストデータ処理が行われます。
これには、大量のテキストデータの分析と処理、エンティティの検索、適切なタイプへのエンティティの割り当て、標準形式でのメタデータの提示が含まれます。
Entity Extractionトランスフォームは、テキスト、HTML、XML、または特定のバイナリ形式(PDFなど)のコンテンツから情報を抽出し、構造化された出力を生成できます。 ワークフローに基づいて、いくつかの方法で出力を使用できます。 別の変換への入力として使用したり、データベーステーブルやフラットファイルなどの複数の出力ソースに書き込むことができます。 出力はUTF-16エンコードで生成されます。
エンティティ抽出変換は、次のシナリオで使用できます-
- 大量のテキストボリュームから特定の情報を見つける。
- 既存の情報を含む非構造化テキストから構造化情報を検索して、新しい接続を作成します。
- 製品品質のレポートと分析。
TDPとデータクレンジングの違い
テキストデータ処理は、非構造化テキストデータから関連情報を見つけるために使用されます。 ただし、データクレンジングは、構造化データの標準化とクレンジングに使用されます。
Parameters | Text Data Processing | Data Cleansing |
---|---|---|
Input Type | Unstructured Data | Structured Data |
Input Size | More than 5KB | Less than 5KB |
Input Scope | Broad domain with many variations | Limited variations |
Potential Usage | Potential meaningful information from unstructured data | Quality of data for storing in to Repository |
Output | Create annotations in form of entities, type, etc. Input is not changed | Create standardized fields, Input is changed |