10年戦えるデータ分析入門

4章 すべての分析は集計から始まる

集約関数は便利

- count(col) or count(distinct col)  
- sum(col)  
- avg(col)  
- min(col)  
- max(col)    
- var_pop(col) 母分散  
- var_samp(col) 標本分散  
- stddev_pop(col) 母標準偏差  
- stddev_samp(col) 標本標準偏差

GROUP BY句

月ごととかユーザーごとに分ける

SELECT文で記入する順番

SELECT
FROM
WHERE
GROUP BY
HAVING
ORDER BY
LIMIT

SELECT文で実行される順番

FROM
WHERE
GROUP BY
SELECT + 集約関数
HAVING
ORDER BY
LIMIT

集約表はできるが面倒他のツールとの併用を推奨  

UNION演算子

表を連結できる