Pythonではじめる数理最適化

2.1 連立方程式Pythonの数理最適化ライブラリで解く

【問題】 1個120円のりんごと1個150円のなしを合わせて10個買ったら代金の合計が1440円でした、りんごとなしはそれぞれ何個買ったでしょうか。
f:id:bitop:20220108105902p:plain

2.2 線形計画問題Pythonの数理最適化ライブラリで解く

【問題】 ある工場で製品p,qを作っている。製品p,qを作るには原料m,nが必要
p[kg]=1m[kg]+2n[kg]
q[kg]=3m[kg]+1n[kg]
mの在庫30[kg],nの在庫40[kg]
pは1万円、qは2万円で売れる。
f:id:bitop:20220108111343p:plain

Pythonによる経済経営分析のデータサイエンス

5.7 パネルデータ分析(1) データ構築

https://bashtage.github.io/linearmodels/doc/panel/examples/examples.html
組合は誰の賃金を上げるのか?若い男性のユニオニズムと賃金率決定の動的モデルの例題
f:id:bitop:20210312083308p:plain

5.8 パネルデータ分析(2) Pooled OLS

f:id:bitop:20210312083438p:plain

5.9 パネルデータ分析(3) 固定効果モデル

f:id:bitop:20210312083551p:plain

5.10パネルデータ分析(4) 変動効果モデル

f:id:bitop:20210312083851p:plain

5.11 パネルデータ分析(5) モデルの比較

f:id:bitop:20210312083951p:plain

Pythonによる経済経営分析のデータサイエンス

5.6 回帰分析(4) 操作変数法

linearmodelsをinstallする
pip install linearmodels (Relesed Mar 8,2021) 操作変数法(隠れた要因をあぶりだすための方法?)
データセットは教育歴の既婚女性の給与への効果に関するデータ
f:id:bitop:20210311060226p:plain

データセットの変数の意味  
nlf        1 if in labor force, 1975
hours      労働時間
kidslt6    6歳未満の子供
kidsge6    6歳以上から18歳までの子供
age        女性の年齢
educ       教育年数
wage       賃金からの推定賃金
repwage    1976年のインタビューでrepwageが賃金を報告した
hushrs     夫が働いた時間
husage     夫の年齢
huseduc    夫の学校教育の年
huswage    夫の時給
faminc     家族の収入
mtr        女性が直面している限界税率
motheduc   母親の学校教育の年
fatheduc   父の学校教育の年
unem       unem. rate in county of resid.
city       =1 if live in SMSA
exper      actual labor mkt exper
nwifeinc   (faminc - wage*hours)/1000
lwage      log(wage)
expersq    exper^2

通常の線形回帰
f:id:bitop:20210311061011p:plain  

父親が教育を受けた年数を操作変数として分析をする
f:id:bitop:20210311061305p:plain

通常の回帰分析と操作変数による分析を比較巣r
f:id:bitop:20210311063339p:plain

Pythonによる経済経営分析のデータサイエンス

Airbnbの価格分析 空間情報の活用

データはkaggleの www.kaggle.com
から取得。本とは違いcsvファイルであったが一部カラムがないがほぼ同じと思われる。
f:id:bitop:20210307083026p:plain
f:id:bitop:20210307082856p:plain
単回帰分析と散布図を描画
f:id:bitop:20210307083056p:plain
f:id:bitop:20210307083143p:plain
f:id:bitop:20210307083258p:plain 重回帰分析をする、各変数の相関係数をヒートマップで表現、number_of_reviewとreviews_per_monthが近すぎるので
reviews_per_monthは除くことにする
f:id:bitop:20210310050432p:plain
このモデルのR自乗値を求める
f:id:bitop:20210310050614p:plain
VIF値を求める
f:id:bitop:20210310050707p:plain
どの変数も10は超えてないので問題はない
Seabornを使ってpairplotを描画してみる
f:id:bitop:20210310050851p:plain
ランドマークとAirbnbホストとの距離を測ってみる
自由の女神との距離が近いと価格が高くなる傾向が若干見て取れる
f:id:bitop:20210310051045p:plain
ホストの位置をマップ上にプロット f:id:bitop:20210310051424p:plain  

f:id:bitop:20210310051607p:plain

Pythonによる経済経営分析のデータサイエンス

5章 Pythonによる多変量解析ロスセクション・パネルデータ

5.1 回帰分析の考え方 最小二乗法

 省略

5.2 データの種類 クロスセクション・時系列データ・パネルデータ

 省略

5.3 回帰分析(1) 単回帰分析

データ読み込み(26カラム、205レコード)
f:id:bitop:20210306070930p:plain

単回帰分析をstatsmodelsパッケージで行ってみる
f:id:bitop:20210306071345p:plain

5.4 回帰分析(2)ダミー変数と重回帰分析

x_listが5章でいきなり出てくるがこれは4章の113ページに出てくるやつ。
重回帰分析の結果、enginsize,wheerbase,horsepower(馬力のこと)が正の相関を示している
f:id:bitop:20210306072212p:plain

ダミ変数ーを導入した結果カラム数が26から201カラムに増えた
f:id:bitop:20210306073540p:plain  

5.5 回帰分析(3) 分析結果の解釈の方法

多重共線性の有無、本の結果とは違ったが各項目とも10は超えていない。
f:id:bitop:20210306073831p:plain

Pythonによる経済経営分析のデータサイエンス

4章 Pythonによる基礎的な統計分析

4.1 Pythonによる基礎的な統計分析

f:id:bitop:20210304070147p:plain

4.2 データを把握する (1) 型や特性を把握する

f:id:bitop:20210304070229p:plain

4.3 データを把握する(2) 平均、分散、標準偏差を求める

f:id:bitop:20210304070315p:plain

f:id:bitop:20210304070342p:plain

4.4 データを把握する (3) ヒストグラムを描く

f:id:bitop:20210304070415p:plain

f:id:bitop:20210304070441p:plain

4.5 データを把握する (4) 変数間の関係性

f:id:bitop:20210304070514p:plain

f:id:bitop:20210304070540p:plain

f:id:bitop:20210304070607p:plain

f:id:bitop:20210304070656p:plain