Advanced-excel-functions-advanced-excel-statistical-linest-function
高度なExcel統計-LINEST関数
説明
LINEST関数は、「最小二乗」法を使用してデータの最適な直線を計算することにより、ラインの統計を計算し、ラインを記述する配列を返します。
LINESTを他の関数と組み合わせて、多項式、対数、指数、べき級数などの未知のパラメーターで線形である他のタイプのモデルの統計を計算することもできます。
この関数は値の配列を返すため、配列式として入力する必要があります。
構文
LINEST (known_y's, [known_x's], [const], [stats])
引数
Argument | Description | Required/Optional |
---|---|---|
known_y’s |
The set of y-values that you already know in the relationship y = mx + b. known_yの範囲が単一の列にある場合、known_xの各列は個別の変数として解釈されます。 known_yの範囲が単一の行に含まれている場合、known_xの各行は個別の変数として解釈されます。 |
Required |
known_x’s |
A set of x-values that you may already know in the relationship y = mx + b. known_xの範囲には、1つ以上の変数セットを含めることができます。 1つの変数のみを使用する場合、既知のyと既知のxは、同じ次元を持つ限り、任意の形状の範囲になります。 複数の変数を使用する場合、known_yはベクトル(つまり、1行の高さまたは1列の幅の範囲)でなければなりません。 known_xを省略すると、known_yと同じサイズの配列\ {1,2,3、…}であると想定されます。 |
Optional |
const |
A logical value specifying whether to force the constant b to equal 0. constがTRUEであるか省略されている場合、bは正常に計算されます。 constがFALSEの場合、bは0に設定され、m値はy = mxに合うように調整されます。 |
Optional |
stats |
A logical value specifying whether to return additional regression statistics. statsがTRUEの場合、LINESTは追加の回帰統計を返します。 結果として、返される配列は\ {mn、mn-1、…、m1、b;です。 sen、sen-1、…、se1、seb; r2、セイ; F、df; ssreg、ssresid}。 statsがFALSEまたは省略されている場合、LINESTはmcoefficientsと定数bのみを返します。 追加の回帰統計は、次の表に示すとおりです。 |
Optional |
追加の回帰統計
Sr.No | Statistic & Description |
---|---|
1 |
se1,se2,…,sen 係数m1、m2、…、mnの標準誤差値。 |
2 |
seb 定数bの標準エラー値(constがFALSEの場合、seb =#N/A)。 |
3 |
r2 決定係数。 推定y値と実際のy値を比較し、値の範囲は0〜1です。 1の場合、サンプルには完全な相関関係があります。推定されたy値と実際のy値の間に違いはありません。 逆に、決定係数が0の場合、回帰式はy値の予測に役立ちません。 r2の計算方法については、以下の注を参照してください。 |
4 |
sey y推定の標準誤差。 |
5 |
F F統計、またはF観測値。 F統計を使用して、従属変数と独立変数の間の観察された関係が偶然に発生するかどうかを判断します。 |
6 |
df 自由度。 自由度を使用して、統計テーブルでFクリティカルな値を見つけやすくします。 テーブルで見つかった値をLINESTによって返されたF統計と比較して、モデルの信頼レベルを決定します。 dfの計算方法については、以下の注を参照してください。 |
7 |
ssreg 回帰平方和。 |
8 |
ssreg 残差平方和。 ssregおよびssresidの計算方法については、以下の注意を参照してください。 |
ノート
- 線の方程式は- + y = mx + b または y = m1x1 + m2x2 + … + b
- 依存するY値が独立したX値の関数であるX値の範囲が複数ある場合、-
- m値は各x値に対応する係数であり、bは定数値です。
- y、x、およびmはベクトルにできることに注意してください。
- LINEST関数が返す配列は\ {mn、mn-1…m1、b}です。
- LINESTは追加の回帰統計を返すこともできます
- あなたは勾配とy切片で任意の直線を記述することができます-
- 勾配(m)- しばしばmと書かれた線の勾配を見つけるには、線上の2つの点(x1、y1)と(x2、y2)を取ります。 勾配は(–2-y1)/(– 2-x1)に等しくなります。
- * Y切片(b)*- +線のy切片(多くの場合bと表記)は、線がy軸と交差する点でのyの値です。
- 直線の方程式は、y = mx + bです。 mとbの値がわかれば、yまたはxの値をその方程式にプラグインすることにより、線上の任意の点を計算できます。 TREND関数を使用することもできます。
- あなたが唯一の独立したX変数を持っているとき、あなたは次の式を使用して直接勾配とyintercept値を取得できます-
- 勾配-
INDEX(LINEST(known_y’s、known_x’s)、1)
- * Y切片*-
INDEX(LINEST(known_y’s、known_x’s)、2)
- LINEST関数によって計算される線の精度は、データの散布度に依存します。 データが線形であるほど、LINESTモデルはより正確になります。
- LINESTは、最小二乗法を使用して、データに最適なフィットを決定します。 あなたが唯一の独立したx変数を持っている場合、mとbの計算は次の式に基づいています- + m = \ frac \ {\ sum \ left(x- \ bar \ {x} \ right)\ left(y- \ bar \ {y} \ right)} \ {\ sum \ left(x- \ bar \ {x} \ right)^ 2} ここで、xとyはサンプル平均です。 i.e. + x =平均(既知のx) y =平均(既知のy)
- LINESTおよびLOGFIT関数LINESTおよびLOGESTは、データに適合する最適な直線または指数曲線を計算できます。 ただし、2つの結果のどちらがデータに最も適しているかを判断する必要があります。 直線の場合はTREND(既知のy、既知のx)、または指数曲線の場合はGROWTH(既知のy、既知のx)を計算できます。 これらの関数は、known_xの引数を省略せずに、実際のデータポイントでその直線または曲線に沿って予測されたy値の配列を返します。 その後、予測値を実際の値と比較できます。 視覚的な比較のために、両方をグラフ化することもできます。
- 回帰分析では、Excelは各ポイントについて、そのポイントに対して推定されたy値と実際のy値の差の2乗を計算します。 これらの平方差の合計は、残差平方和ssresidと呼ばれます。 次に、Excelは総平方和sstotalを計算します。 const引数がTRUEの場合、または省略された場合、総平方和は、実際のy値とy値の平均値との差の平方の合計になります。
- const引数= FALSEの場合、総平方和は実際のy値の平方和です(個々のy値から平均y値を差し引くことはありません)。 回帰二乗和ssregは、ssreg = sstotal-ssresidから見つけることができます。 総二乗和と比較して、残差二乗和が小さいほど、決定係数r2の値が大きくなります。これは、回帰分析から得られる方程式が変数間の関係をどの程度うまく説明するかを示す指標です。 r2の値はssreg/sstotalに等しくなります。
- 場合によっては、1つ以上のX列(YとXが列にあると仮定)に、他のX列が存在する場合、追加の予測値がない場合があります。 つまり、1つまたは複数のX列を削除すると、Y値の予測値が等しく正確になる可能性があります。 その場合、これらの冗長なX列は回帰モデルから除外する必要があります。 この現象は、冗長X列は非冗長X列の倍数の合計として表現できるため、「共線性」と呼ばれます。
- LINEST関数は、共線性をチェックし、回帰モデルから冗長なX列を識別したときに削除します。 削除されたX列は、LINEST出力で、0 se値に加えて0係数を持つものとして認識できます。 1つ以上の列が冗長として削除された場合、dfは、予測目的で実際に使用されるX列の数に依存するため、dfに影響します。
- 冗長なX列が削除されたためにdfが変更された場合、seyとFの値も影響を受けます。 共線性は実際には比較的まれです。 ただし、発生する可能性が高いケースの1つは、実験の被験者が特定のグループのメンバーであるかどうかの指標として0と1の値のみを含むX列がある場合です。 const = TRUEまたは省略された場合、LINEST関数は、すべて1の値の追加のX列を挿入して、切片をモデル化します
- dfの値は、known_xの列がk列あり、共線性のためにモデルからX列が削除されない場合、次のように計算されます-
- const = TRUEまたは省略された場合、df = n – k – 1
- const = FALSEの場合、df = n – k +どちらの場合も、共線性のために削除された各X列は、dfの値を1増やします。
- 配列定数(known_xなど)を引数として入力する場合、コンマを使用して同じ行に含まれる値を区切り、セミコロンを使用して行を区切ります。 区切り文字は、地域の設定によって異なる場合があります。
- 回帰式で予測されたy値は、式を決定するために使用したy値の範囲外にある場合、有効でない可能性があることに注意してください。
- LINEST関数で使用される基礎となるアルゴリズムは、SLOPEおよびINTERCEPT関数で使用される基礎となるアルゴリズムとは異なります。 これらのアルゴリズムの違いは、データが未定で同一直線上にある場合に異なる結果につながる可能性があります。 *LOGESTを使用して他の回帰タイプの統計を計算することに加えて、LINESTを使用して、xおよびy変数の関数をLINESTのxおよびyシリーズとして入力することにより、他の回帰タイプの範囲を計算できます。 たとえば、次の式-
LINEST(yvalues、xvalues ^ COLUMN($ A:$ C))
+ y値の単一列とx値の単一列がある場合に機能し、-+ y = m1* x + m2 x ^ 2 + m3 xの3次(3次の多項式)近似を計算します。 * 3 + b +この式を調整して他のタイプの回帰を計算できますが、場合によっては、出力値およびその他の統計の調整が必要になります。 * LINEST関数によって返されるFテスト値は、FTEST関数によって返されるFテスト値とは異なります。 LINESTはF統計を返し、FTESTは確率を返します。 * known_xの配列がknown_yの配列と同じ長さでない場合、LINESTは#REF!を返します。 エラー値 * 指定されたknown_xまたはknown_yの配列のいずれかの値が数値でない場合(LINEST関数はこれらを数値として認識しないため、数値のテキスト表現が含まれる場合があります)、LINESTは#VALUE!を返します。 エラー値 * constまたはstats引数のいずれかをTRUEまたはFALSEに評価できない場合、LINESTは#VALUE!を返します。 エラー値
適用範囲
Excel 2007、Excel 2010、Excel 2013、Excel 2016