Big-data-analytics-data-scientist

提供:Dev Guides
移動先:案内検索

ビッグデータ分析-データサイエンティスト

データサイエンティストの役割は、通常、予測モデリング、セグメンテーションアルゴリズムの開発、レコメンダーシステム、A/Bテストフレームワークなどのタスクに関連付けられており、多くの場合、生の非構造化データの処理に使用されます。

彼らの仕事の性質は、数学、応用統計、プログラミングの深い理解を必要とします。 データアナリストとデータサイエンティストの間で共通のスキルがいくつかあります。たとえば、データベースにクエリを実行する能力などです。 どちらもデータを分析しますが、データサイエンティストの決定が組織に大きな影響を与える可能性があります。

これは、データサイエンティストが通常持つ必要があるスキルのセットです-

  • R、Python、SAS、SPSS、Juliaなどの統計パッケージでのプログラミング
  • さまざまなソースからデータをクリーンアップ、抽出、および探索できる
  • 統計モデルの研究、設計、および実装
  • 統計、数学、コンピューターサイエンスに関する深い知識

ビッグデータ分析では、人々は通常、データサイエンティストの役割とデータアーキテクトの役割を混同します。 実際には、違いは非常に単純です。 データアーキテクトは、データが保存されるツールとアーキテクチャを定義しますが、データサイエンティストはこのアーキテクチャを使用します。 もちろん、データサイエンティストは、アドホックプロジェクトに必要な場合、新しいツールをセットアップできるはずですが、インフラストラクチャの定義と設計は彼のタスクの一部であってはなりません。