Pythonによる経済経営分析のデータサイエンス

5章 Pythonによる多変量解析ロスセクション・パネルデータ

5.1 回帰分析の考え方 最小二乗法

 省略

5.2 データの種類 クロスセクション・時系列データ・パネルデータ

 省略

5.3 回帰分析(1) 単回帰分析

データ読み込み(26カラム、205レコード)
f:id:bitop:20210306070930p:plain

単回帰分析をstatsmodelsパッケージで行ってみる
f:id:bitop:20210306071345p:plain

5.4 回帰分析(2)ダミー変数と重回帰分析

x_listが5章でいきなり出てくるがこれは4章の113ページに出てくるやつ。
重回帰分析の結果、enginsize,wheerbase,horsepower(馬力のこと)が正の相関を示している
f:id:bitop:20210306072212p:plain

ダミ変数ーを導入した結果カラム数が26から201カラムに増えた
f:id:bitop:20210306073540p:plain  

5.5 回帰分析(3) 分析結果の解釈の方法

多重共線性の有無、本の結果とは違ったが各項目とも10は超えていない。
f:id:bitop:20210306073831p:plain