2019-01-01から1年間の記事一覧

ASHRAE

EDA for ASHRAEをやってみる square_feet fig, axes = plt.subplots(2, 2, figsize=(14, 12)) # kdeplot カーネル密度 sns.kdeplot(train['square_feet'], ax=axes[0][0], label='Train'); sns.kdeplot(test['square_feet'], ax=axes[0][0], label='Test'); …

ASHRAE

EDA for ASHRAEをやってみる import numpy as np import pandas as pd import matplotlib import matplotlib.pyplot as plt import seaborn as sns import warnings import gc warnings.simplefilter('ignore') #ワーニングを無視する設定 matplotlib.rcPara…

ASHRAE

kaggleのASHRAE -Start Here: A GENTLE Introductionをやってみる plt.hist(weather_train_df['cloud_coverage'],bins=60,color='#f46d43') plt.hist(weather_test_df['cloud_coverage'],bins=60,color='#66bd63') plt.hist(weather_train_df['dew_temperatu…

ASHRAE

kaggleのASHRAE -Start Here: A GENTLE Introductionをやってみる リンク www.kaggle.com データーはtrain.csvとtest.csv、sample_submission.csv、building_metadata.csv、weather_test.csv、weather_train.csvになる。 インポート import numpy as np # li…

Plotlyを使ってみた

Version 4 Migration Guide in Python import plotly.graph_objects as go from plotly.subplots import make_subplots import pandas as pd # Make figure with subplots fig = make_subplots(rows=1, cols=2, specs=[[{"type": "bar"}, {"type": "surface"…

Plotlyを使ってみた

Displaying-Figures-in-Python import plotly import plotly.graph_objects as go fig = go.Figure( data=[go.Bar(y=[2, 1, 3])], layout_title_text="A Figure Displayed with fig.show()" ) fig.show() import plotly import plotly.graph_objects as go d…

Python実践データ分析100本ノックを読む

ノック92 不要な文字を除去してみよう 括弧とその中身を除去 全角の括弧も除去 ノック93 文字数をカウント ノック94 形態素解析で文書を分割してみよう ノック95 形態素解析で文書から「動詞、名詞」を抽出してみよう ノック96 形態素解析で抽出した頻出する…

Python実践データ分析100本ノックを読む

ノック91 データを読み込んで把握しよう

Python実践データ分析100本ノックを読む

ノック84 画像のどこに人がいるのか検出してみよう ノック85 画像の人の課を検出してみよう ノック86 画像内の人がどこに顔を向けているか検出しよう dlibがinstallできなかったのでpass ノック87 検出した情報を統合し、タイムプラスを作ってみよう 早い、…

Python実践データ分析100本ノックを読む

ノック81 画像データを読み込んでみよう ノック81 画像データを読み込んでみよう

Python実践データ分析100本ノックを読む

ノック76 実データを読み込んでみよう ノック77 リンク数の分布を可視化しよう ノック78 シミュレーションのため実データからパラメータを推定しよう

Python実践データ分析100本ノックを読む

ノック74 会員数の時系列変化をジュミレーションをシミュレーションしてみよう 100回 1000回 percent_percolactionを0.1->0.2に変更,会員数が安定 ノック75 パラメータの全体像を「相図」を見ながら把握しよう

Python実践データ分析100本ノックを読む

ノック73 口コミ数の時系列変化をグラフ化してみよう

Iot開発スタートブック ESP32でクラウドにつなげる電子工作をはじめよう!

電池駆動で温度・湿度をを1分周期で測定。DeepSleephaを使用した動作を検証 単三アルカリ電池4個で電圧は約1.63V(平均値)。設置後30日ほどで停止 停止後の乾電池の電圧は0.973V(平均値)全体の電圧は0.973*4=3.892V。 4Vを切ると停止の様子。 温度、湿…

Python実践データ分析100本ノックを読む

ノック71 人間関係のネットワークを可視化してみよう ノック72 口コミによる情報伝播の様子を可視化してみよう

Python実践データ分析100本ノックを読む

ノック69 最適ネットワークにおける輸送コストとその内訳を計算しよう ノック70 最適ネットワークにおける生産コストとその内訳を計算しよう

Iot開発スタートブック ESP32でクラウドにつなげる電子工作をはじめよう!

電池駆動で温度・湿度をを1分周期で測定。DeepSleepha使わない単純間欠動作を検証 単三アルカリ電池4個で電圧は約1.63V(平均値)。設置後12日ほどで停止 停止後の乾電池の電圧は0.983V(平均値)全体の電圧は0.983*4=3.932V。 4Vを切ると停止の様子。 温…

Python実践データ分析100本ノックを読む

ノック67 最適生産計画が制約条件内に収まっているかどうかを確認しよう ノック68 ロジスティクスネットワーク設計問題を解いてみよう

Python実践データ分析100本ノックを読む

ノック61 輸送最適化問題を解いてみよう ノック62 最適輸送ルートをネットワークで確認してみよう df_trをread_csvで読み込むようになっているがこれではノック61で 行った結果が反映されない。図7-3に書かれているように ノック61をおこなったあとdf_tr_sol…

Python実践データ分析100本ノックを読む

ノック52 現状の輸送量、コストを確認しよう ノック53 ネットワークを可視化してみよう ノック54 ネットワークにノードを追加してみよう ノック55 ルートの重み付けを実施してみよう ノック56 輸送ルート情報を読み込んでみよう ノック57 輸送ルート情報から…

Python実践データ分析100本ノックを読む

物流の最適ルートをコンサルティングする ノック51 物流に関するデータを読み込んでみよう 輸送実績を主体にコストデータを結合する FC00001 -> WH00003 間のコストが1.5なのか確認する 工場データを結合 倉庫データを結合 関東支社のみ抽出 東北支社のみ抽出

Python実践データ分析100本ノックを読む

ノック42 退会前月の退会顧客データを作成しよう ノック43 継続顧客のデータを作成しよう ノック44 予測する月の在籍期間を作成しよう ノック45 欠損値を除去しよう ノック46 文字型の変数を処理できるように ノック47 決定木を用いて退会予測モデルを作成し…

Python実践データ分析100本ノックを読む

ノック50 顧客の退会を予測しよう count_1が6と5の間ぐらいが退会するボーダラインのよう

Python実践データ分析100本ノックを読む

ノック41 退会前日の退会顧客データを作成使用

Kaggleで勝つデータ分析の技術

2.1.1 回帰タスク 真の値と予測を一致させると 予測値との偏差に基づく指標なので完全に 一致すると0になる。 2.1.2 分類タスク 二値分類 多クラス分類

Python実践データ分析100本ノックを読む

ノック31 データを読み込んで確認しよう customertのhead(10) ノック32 クラスタリングで顧客をグループ化しよう ノック33 クラスタリング結果を分析しよう ノック34 クラスタリング結果を可視化しよう ノック35 クラスタリング結果をもとに退会顧客の傾向を…

Python実践データ分析100本ノックを読む

ノック25 利用履歴データを集計しよう groupby()でas_indexをFalseにしているのはグループラベル (ここでは「年月」、「customer_id」) がindexになるのを抑制している as_indexをTrueにした場合 顧客ごとの統計値(平均、中央、最大、最小) ノック26 利用…

Python実践データ分析100本ノックを読む

ノック21 データを読み込み把握しよう ノック22 顧客データを整形しよう ノック23 顧客データの基礎集計をしよう ノック24 s最新顧客データの基礎集計をしてみよう

Python実践データ分析100本ノックを読む

ノック16 顧客名の揺れを補正しよう 現状 補正後 ノック17 日付の揺れを補正しよう 本のとおりやってみると2日ほどずれがある scriptで変換した結果 WindowS Excelのシリアル値について記述されている http://www.excel.studio-kazu.jp/mwiki/ep_01_serial.…

Kaggleで勝つデータ分析の技術

1.5.3 モデルの作成 ch01-01-titanic.pyのバリデーション前まで実行してsubmission_first.csvを保存させ Kaggleで評価させた結果 1.5.4 モデルの評価 1.5.5 モデルのチューニング 学習するモデルのパラメータをグリットサーチで評価し もっとも高い精度を出…