アジャイルデータサイエンス-はじめに

アジャイルデータサイエンスは、Webアプリケーション開発のためにデータサイエンスとアジャイル手法を使用するアプローチです。組織に変化をもたらすのに適したデータサイエンスプロセスの出力に焦点を当てています。データサイエンスには、分析、インタラクティブな視覚化、および現在適用されている機械学習による研究プロセスを記述するアプリケーションの構築が含まれます。

アジャイルデータサイエンスの主な目標は次のとおりです-

'_説得力のある製品へのクリティカルパスを発見して追跡するために、説明的なデータ分析を文書化およびガイドします。_

アジャイルデータサイエンスは、次の一連の原則で構成されています-

連続反復

このプロセスには、作成テーブル、チャート、レポート、および予測による継続的な反復が含まれます。予測モデルの構築には、洞察の抽出と生成を伴うフィーチャエンジニアリングの多くの反復が必要になります。

中間出力

これは、生成された出力のトラックリストです。失敗した実験にも出力があるとさえ言われています。すべての反復の出力を追跡すると、次の反復でより良い出力を作成するのに役立ちます。

プロトタイプ実験

プロトタイプ実験では、実験に従ってタスクを割り当て、出力を生成します。特定のタスクでは、洞察を得るために反復する必要があり、これらの反復は実験として最もよく説明できます。

データの統合

ソフトウェア開発ライフサイクルには、さまざまなフェーズが含まれており、データは以下に不可欠です-

顧客
開発者、および
ビジネス

データの統合は、より良い見通しとアウトプットへの道を開きます。

ピラミッドデータ値

上記のピラミッド値は、「アジャイルデータサイエンス」開発に必要なレイヤーを示しています。それは、要件に基づいたレコードのコレクションと個々のレコードの配管から始まります。チャートは、データのクリーニングと集計後に作成されます。集約されたデータは、データの視覚化に使用できます。レポートは、データの適切な構造、メタデータ、タグで生成されます。上から2番目のピラミッド層には、予測分析が含まれます。予測レイヤーは、より多くの価値が生み出される場所ですが、フィーチャエンジニアリングに焦点を当てた適切な予測の作成に役立ちます。

最上位層には、データの価値が効果的に駆動されるアクションが含まれます。この実装の最良の例は「人工知能」です。

Agile-data-science-introduction

目次