Google Cloud Platformではじめる機械学習と深層学習を読む

2-4 Datalabで様々なグラフ描画

!bq load --autodetect testdataset.tips ../datasets/tips.csv
import pandas as pd

query = """
SELECT * FROM testdataset.tips
"""

df=pd.read_gbq(project_id='my-project-test-189202',query=query)
df.head()

f:id:bitop:20171225043348p:plain

df.plot()

f:id:bitop:20171225043440p:plain

df.plot(kind="scatter",x="total_bill",y="tip")

f:id:bitop:20171225043523p:plain

#散布図+回帰直線
import seaborn as sns

sns.lmplot(data=df,x='total_bill',y='tip')

f:id:bitop:20171225043613p:plain

#カーネル密度推定
sns.kdeplot(df.total_bill,df.tip)

f:id:bitop:20171225043701p:plain

#total_billの分布
#やや左より
sns.distplot(df.total_bill)

f:id:bitop:20171225043821p:plain

#tipの分布
#あまりきれいではない
sns.distplot(df.tip)

f:id:bitop:20171225043920p:plain

corr = df.corr()
sns.heatmap(corr)

f:id:bitop:20171225044015p:plain

sns.pairplot(df,hue="time")

f:id:bitop:20171225044114p:plain