【QM】重回帰分析（Multiple Regression）について｜CFA学習/勉強法 (米国証券アナリスト)

Contents

重回帰分析：Multiple Regression

重回帰分析：Multiple Regression

重回帰分析(Multiple regression)はLevel IIのQuantitative Methodsの中心になります。EquityやPortfolio Managementの項目でもその概念が利用されていて、ここで正しく重回帰分析を学んでおくと理解が進みます。

t検定やF検定、ANOVA Tableの考え方は単回帰分析と同様です。HeteroskedasticityやSerial correlation、Multicollinearityなど、重回帰分析がうまく行かないケースについてちゃんと見ておきましょう！

重回帰分析（Multiple Regression）の導入

単回帰分析は二つの事象の当てはまりが良い一次関数の直線（変数が一つ）を探しましたが、重回帰分析では変数が複数の数式で表現することになります。具体的な数式例は以下をご覧ください。

\(Y_i = b_0 + b_1X_{1i} + b_2X_{2i} + … + b_kX_{ki} + ε_i\)

\(Y_i\)は従属変数(i=1〜n: nは標本数)
\(X_1〜X_{ki}\)は独立変数(\(k\)は独立変数の数)
\(b_0\)はIntercept
\(b_j\)は独立変数のslope
\(ε\)は誤差項(独立した変数であり、平均ゼロの正規分布に従う)

単回帰分析とは違って若干複雑な式になっていますが、単純に変数が増えただけですので焦る必要は全くありません。t値の出し方も検定の仕方も単回帰分析の場合と特に変わりは無いです。ANOVA Tableも単回帰分析で見たものと同様になります。

サイト運営者

単回帰分析について理解していればここまでは問題無いと思います！

ダミー変数（Dummy Variables）

重回帰式のうち、変数が0か1を取るものをダミー変数を用いた回帰分析と言います。
例えば、以下のような四半期毎にとある数値を求める数式です。

\(Y = b_0 + b_1Q_1 + b_2Q_2 + b_3Q_3 + ε\)

この場合、第一四半期の時は\(Q_1=1\)、第二四半期の時は\(Q_2=1\)、第三四半期の時は\(Q_3=1\)として、それ以外の時は0の値をとります。こうして四半期毎の数値を表現する数式にしているわけですね。こういったものをダミー変数を用いた数式と言います。

サイト運営者

この概念は練習問題を解いて理解しておきましょう！

ここからは、重回帰分析がうまく行かないケースについて眺めておきましょう！
ポイントは、うまくいかないケースの名称と意味の確認。どのようにそれら事象を発見するか。発見したらどのように修正するか。になります。それでは見て行きましょう！

不均一分散(Heteroskedasticity）

不均一分散とは

標本データの誤差項の分散が均一で無い状態を指します。回帰分析では誤差項εは期待値がゼロで分散が一定という前提を置いているため、誤差項の分散が均一で無いと問題になります。

不均一分散には、独立変数の数値に関係無く誤差項がバラバラに散布するUnconditional heteroskeasticityと、独立変数の数値が増加するに連れて誤差項が大きくなる、Conditional heteroskedasticityがありますが、後者については正しいモデル結果を算出するためには直す必要があると言われています。

以下のグラフは問題となるConditional heteroskedasticityの例です。Xが大きくなるほど誤差項が大きくなっているのが分かるかと思います。