Airbnbの価格分析 空間情報の活用
データはkaggleの
www.kaggle.com
から取得。本とは違いcsvファイルであったが一部カラムがないがほぼ同じと思われる。
単回帰分析と散布図を描画
重回帰分析をする、各変数の相関係数をヒートマップで表現、number_of_reviewとreviews_per_monthが近すぎるので
reviews_per_monthは除くことにする
このモデルのR自乗値を求める
VIF値を求める
どの変数も10は超えてないので問題はない
Seabornを使ってpairplotを描画してみる
ランドマークとAirbnbホストとの距離を測ってみる
自由の女神との距離が近いと価格が高くなる傾向が若干見て取れる
ホストの位置をマップ上にプロット