2016-03-01から1ヶ月間の記事一覧

Pythonデータサイエンスクックブック

(2順目) レシピ8.4 ここからデータをdownloadしてくる。 https://github.com/ipython-books/cookbook-data (3項) 全ての列を列挙 for c in df: print (c) print(df.shape) Insult Date Comment (3947, 3) 一部を表示 Insult Date Comment 0 1 20120618192…

Pythonデータサイエンスクックブック

(2順目) レシピ8.3 3項 こういったデータはスキャンでとるのだろうか。 4項 print(X_train.shape) print(y_train.shape) (1347, 64) (1347,) (6項) 「1」の変わりに手製の「2」を入れてみた two = np.array( [[ 0, 0, 0, 0, 0, 0, 0, 0], [ 0, 0, 0, 0, 1…

Pythonデータサイエンスクックブック

(2順目) レシピ8.2 タイタニックのデータ https://github.com/ipython-books/cookbook-data dataフォルダ内にはtitanic_train.csvとtitanic_test.csvファイルが含まれている。 891行12列のテーブルになっている。列名を列挙する。 for c in train.columns: …

Pythonデータサイエンスクックブック

(2順目) レシピ8.1 scikitライブラリはすでにinstallされていた。 (7項) フットしているとはいいずらい。 多項式でフットさせてみる、2,3,4,5次とやってみる 2,3,4次式がフットしているがx値が大きくなってくるに従って 徐々に逸れ始めている。 2次…

Pythonデータサイエンスクックブック

(2順目) レシピ7.7 (準備) PyMC2のinstall ファイル http://www.lfd.uci.edu/~gohlke/pythonlibs/ 選んだファイル(python ver3.5 windows機が64bitなので)がDownLoadフォルダに落ちたのを確認。 pymc-2.3.6-cp35-none-win_amd64.whl DawonLoadフォル…

Pythonデータサイエンスクックブック

(2順目) レシピ7.6 ライブラリーの準備 basemapは1順目でinstallした。 データの準備 https://github.com/ipython-books/cookbook-dataからstorm.zipをdownload(Rawボタン押下)。展開して出てきたdataフォルダーごとcookbookのchapter07_statsフォルダー…

Pythonデータサイエンスクックブック

(2順目) レシピ7.5 statsmodels(http://statsmodels.sourceforge.net/)はすでにAnacondにinstallしてあった。 dataの内容はsurvivalが心臓移植後の生存期間(単位は日)censorsは観察打ち切り時点での生存の有無(0=生存,1=死亡)age=手術時の年齢? inde…

Pythonデータサイエンスクックブック

(2順目) レシピ7.3 4項 st.binom(n,q).pmf(h) は2項分布で、確率qのベルヌーイ試行をn回のうちh回起こる確率密度を計算してくれる。 stbinom(h,n,q)とも書ける。 レシピ7.4 4項 得点とエースの相関図 本では正相関があるようなことになっているが 相関な…

Pythonデータサイエンスクックブック

(2順目) レシピ7.2 hを50にすると(ゆがみないとすると)p値は1.0になる。 h=55 pval=0.3173105078629137 h=56 pval=0.230139340443416 h=57 pval=0.16151331846754235 h=58 pval=0.10959858339911621 h=59 pval=0.071860638225851758 h=60 pval=0.045500263…

Pythonデータサイエンスクックブック

(2順目) レシピ7.1 ここからデータを取得 https://github.com/ipython-books/cookbook-data data/Roger-Federer.csvを読み込んでみると 列が70,行が1179ありかなりでかい表。 単にdfとしただけでは列の要素が省略され全部出てこないので、 for col in df.co…

Pythonデータサイエンスクックブック

(2順目) レシピ6.5 anacondにはmpkld3がinstallされていなかったのでpip install mpld3でいれた。versionは3.0.2。 3項 作画されたグラフを拡大できる。またマウスでグラフ要素を動かすことが可能。 拡大 4項 9個のグラフが表示されるが連動して動く 1つの…

Pythonデータサイエンスクックブック

(2順目) レシピ6.4 3項でファイルに書き出したテキストの内容 graph.json { "links": [ { "source": 0, "target": 1 }, { "source": 0, "target": 2 }, この後70個ぐらいつづく、たぶんノード同士を結んでいるリンクを表現 ], "graph": { "name": "Zachary's…

Pythonデータサイエンスクックブック

(2順目) レシピ6.3 ライブラリBokehはAnacondにすでにinstallされていたようですんなり動作 3項 描画させたあとでズーム、画像保存(コンテキストメニューからPNG形式をサポート)などができる。 5項目 scatterメソッドは散布図を描画してくれる、パラメー…

Pythonデータサイエンスクックブック

(2順目) レシピ6.1 2項(matplotlibで描画) 3項(prettyplotlibで描画) 4項(matplotlibで描画) 5項(prettyplotlibで描画) レシピ6.2 3項 ワーニングがでて3つの内1しか描画されなかった こうしてみたが本のようにはならない? sns.violinplot(da…

Pythonデータサイエンスクックブック

(2順目) レシピ5.12 (レシピ5.6~5.11まではCコンパイラが必要なので断念) ここを参考にjuliaをinstall http://d.hatena.ne.jp/isobe1978/20131128/1385646377 ver 0.4.3(51.3MByte) installした場所に移動 C:\Users\User-name\AppData\Local\Julia-0.4.…