Amazon-web-services-data-pipeline

提供:Dev Guides
移動先:案内検索

アマゾンウェブサービス-データパイプライン

*AWS Data Pipeline* は、ユーザーが複数のAWSサービスに分散したデータを簡単に統合し、単一の場所から分析できるように設計されたWebサービスです。

AWS Data Pipelineを使用すると、ソースからデータにアクセスして処理した後、結果をそれぞれのAWSサービスに効率的に転送できます。

データパイプラインのセットアップ方法

以下は、データパイプラインを設定する手順です-

  • ステップ1 *-次のステップを使用してパイプラインを作成します。
  • AWSアカウントにサインインします。
  • このリンクを使用して、AWS Data Pipelineコンソールを開きます-https://console.aws.amazon.com/datapipeline/
  • ナビゲーションバーで地域を選択します。
  • [新しいパイプラインの作成]ボタンをクリックします。
  • 各フィールドに必要な詳細を入力します。
  • [ソース]フィールドで、[テンプレートを使用してビルド]を選択し、このテンプレートを選択します-ShellCommandActivityを使用して開始します。

パイプラインの作成

  • [パラメーター]セクションは、テンプレートが選択されている場合にのみ開きます。 S3入力フォルダーとシェルコマンドをそのままにして、デフォルト値で実行します。 S3出力フォルダーの横にあるフォルダーアイコンをクリックし、バケットを選択します。
  • [スケジュール]で、値をデフォルトのままにします。
  • [パイプライン構成]で、ログを有効のままにします。 ログのS3ロケーションの下にあるフォルダーアイコンをクリックし、バケットを選択します。
  • [セキュリティ/アクセス]で、IAMロールの値をデフォルトのままにします。
  • [アクティブ化]ボタンをクリックします。

パイプラインを削除する方法は?

パイプラインを削除すると、関連するすべてのオブジェクトも削除されます。

  • ステップ1 *-パイプラインリストからパイプラインを選択します。
  • ステップ2 *-[アクション]ボタンをクリックし、[削除]を選択します。

新しいパイプラインの作成

  • ステップ3 *-確認プロンプトウィンドウが開きます。 削除をクリックします。

AWS Data Pipelineの機能

シンプルで費用対効果の高い-ドラッグアンドドロップ機能により、コンソールでパイプラインを簡単に作成できます。 ビジュアルパイプラインクリエーターは、パイプラインテンプレートのライブラリを提供します。 これらのテンプレートにより、ログファイルの処理、Amazon S3へのデータのアーカイブなどのタスクのパイプラインを簡単に作成できます。

信頼性-インフラストラクチャは、フォールトトレラントな実行アクティビティ向けに設計されています。 アクティビティロジックまたはデータソースで障害が発生した場合、AWS Data Pipelineはアクティビティを自動的に再試行します。 失敗が続く場合、失敗通知を送信します。 実行の成功、失敗、アクティビティの遅延などの状況に対して、これらの通知アラートを設定することもできます。

柔軟-AWS Data Pipelineは、スケジューリング、追跡、エラー処理などのさまざまな機能を提供します。 Amazon EMRジョブの実行、データベースに対するSQLクエリの直接実行、Amazon EC2で実行されているカスタムアプリケーションの実行などのアクションを実行するように構成できます。