アジャイルデータサイエンス-予測の役割

この章では、アジャイルデータサイエンスにおける予測の役割について説明します。対話型レポートは、データのさまざまな側面を公開します。予測は、アジャイルスプリントの4番目のレイヤーを形成します。

予測を行う際には、常に過去のデータを参照し、将来の反復の推論として使用します。この完全なプロセスでは、データを履歴データのバッチ処理から将来に関するリアルタイムデータに移行します。

予測の役割には次のものが含まれます-

予測分析

予測分析には、予測モデリング、機械学習、データマイニングなど、現在および過去の事実を分析して将来および未知のイベントに関する予測を行うさまざまな統計手法が含まれます。

予測分析にはトレーニングデータが必要です。トレーニングされたデータには、独立した機能と依存する機能が含まれます。依存機能は、ユーザーが予測しようとしている値です。独立機能とは、依存機能に基づいて予測したいことを記述する機能です。

フィーチャの研究は、フィーチャエンジニアリングと呼ばれます。これは予測を行うために重要です。データの視覚化と探索的データ分析は、機能エンジニアリングの一部です。これらは*アジャイルデータサイエンス*の中核を形成します。

アジャイルデータサイエンスで予測を行う方法は2つあります-

回帰または分類の構築は、ビジネス要件とその分析に完全に依存します。連続変数の予測は回帰モデルにつながり、カテゴリ変数の予測は分類モデルにつながります。

回帰は、特徴を含む例を考慮し、それにより数値出力を生成します。

分類は入力を受け取り、カテゴリー分類を生成します。

注-統計的予測への入力を定義し、マシンが学習できるようにするデータセットの例は、「トレーニングデータ」と呼ばれます。