Software-quality-management-analyzing-measurement-data

提供:Dev Guides
移動先:案内検索

ソフトウェア測定データの分析

関連データを収集した後、適切な方法で分析する必要があります。 分析手法を選択する際に考慮すべき3つの主要な項目があります。

  • データの性質
  • 実験の目的
  • 設計上の考慮事項

データの性質

データを分析するには、データによって表されるより大きな母集団とそのデータの分布も調べる必要があります。

サンプリング、母集団、およびデータ分布

サンプリングは、大規模な母集団からデータのセットを選択するプロセスです。 サンプル統計は、実験被験者のグループから得られた測定値を説明し、要約します。

母集団パラメーターは、可能なすべての被験者を測定した場合に得られる値を表します。

母集団または標本は、平均、中央値、最頻値などの中心傾向の尺度と、分散や標準偏差などの分散の尺度で説明できます。 次のグラフに示すように、多くのデータセットが正規分布しています。

人口

上に示したように、データは平均について均等に分散されます。 これは正規分布の重要な特性です。

データが歪んでいる他の分布も存在するため、平均の片側に他より多くのデータポイントがあります。 たとえば、データのほとんどが平均の左側にある場合、分布は左に傾いていると言えます。

実験の目的

通常、実験が行われます-

  • 理論を確認するには
  • 関係を探索するには

これらのそれぞれを達成するために、目的は仮説に関して形式的に表現されるべきであり、分析は仮説に直接対処しなければなりません。

理論を確認するには

調査は、理論の真実を探求するように設計されなければなりません。 理論は通常、特定の方法、ツール、またはテクニックの使用が被験者に特定の影響を与え、他の方法よりも何らかの形でそれを改善すると述べています。

考慮すべきデータには、*通常のデータ*と*非通常のデータ*の2つのケースがあります。

データが正規分布からのもので、比較するグループが2つある場合、スチューデントのt検定を分析に使用できます。 比較するグループが3つ以上ある場合は、F統計と呼ばれる分散分析の一般的な分析を使用できます。

データが非正規である場合、データをランク付けすることによりクラスカル・ワリス検定を使用して分析できます。

関係を探索するには

調査は、1つの変数または複数の変数を記述するデータポイント間の関係を決定するように設計されています。

関係に関する質問に答えるには、箱ひげ図、散布図、相関分析の3つの手法があります。

  • *箱ひげ図*は、一連のデータの範囲の概要を表すことができます。
  • *散布図*は、2つの変数間の関係を表します。
  • *相関分析*では、統計的手法を使用して、2つの属性間に真の関係があるかどうかを確認します。
  • 正規分布値の場合、 Pearson Correlation Coefficient を使用して、2つの変数が高度に相関しているかどうかを確認します。
  • 非正規データの場合、データをランク付けし、スピアマンランク相関係数*を関連性の尺度として使用します。 非正規データの別の尺度は Kendallのロバストな相関係数*で、データポイントのペア間の関係を調査し、偏相関を特定できます。

ランキングに多数のタイ値が含まれている場合、分割表の*カイ2乗検定*を使用して、変数間の関連性をテストできます。 同様に、*線形回帰*を使用して、変数間の関係を記述する方程式を生成できます。

3つ以上の変数の場合、*多変量回帰*を使用できます。

設計上の考慮事項

分析手法を選択する際には、調査の設計を考慮する必要があります。 同時に、分析の複雑さが選択した設計に影響を与える可能性があります。 複数のグループは、2つのグループでの学生のT検定ではなくF統計を使用します。

3つ以上の要因を持つ複雑な要因計画では、関連性と有意性のより洗練されたテストが必要です。

統計的手法を使用して、ある変数セットが他の変数セットに与える影響を説明したり、タイミングや学習効果を補正したりできます。