はじめに
省略
1章 株取引の基礎知識
省略
2章 データ収集と管理
2.3 銘柄情報の取得
PyQueryのinstall (PyQueryは「Pythonクローリング&スクレイピング」本にも紹介されていた
ライブラリでjQueryと同じような使い方でHTMLからスクレイピングのできるライブラリです。
22ページのソースを入力・実行するとエラーがでて予想どおりの結果とならなかった。
そこで株探のトヨタ自動車のページに行き、ホームページ上で右クリックで「検証」メニューを
選択し、Chrome Developer Toolsを表示させ、Ellementsタグの上部にある「Select an elementin the page to inspect」
アイコンを押しておき、次にページ内の「輸送用機器」文字をクリックするとそれに対応するHTML要素が「検証」ページ
内で反転表示されどの要素をスクレイピングしたらよいかわかる。
該当するHTMLの要素を選択させたまま右クリックでメニューを出し Copy>Copy Selectorを実行し
「株とPython-自作プログラムでお金儲けを目指す」の22ページにあるソースコードを変更する
sector = q.find('table.kobetsu_data_table2 a')[0].text
上記table.kobetsu_data_table2 aを削除して、そこに先ほどのコピーをペーストする
sector = q.find('#kobetsu_right > div.company_block > table > tbody > tr:nth-child(4) > td')[0].text
これを実行すると「輸送用機器」が表示された。
(あとで気がついたが著者のGitページに修正例が載っていた)
2.3.4 全銘柄をSQLiteに格納する
http://sqlitebrowser.org/
にいってDownLoadページに移動してWindows版(64bit)をDownLoadする
installが終わったらDB Browser for SQLiteを起動する。ツールバーに
NewDataBaseボタンがある。
ボタンを押すとファイル名を入力するダイヤログが出てくるのでデータベース名
を入力すると「Edit table definition」ダイヤログがでてくるのでテーブル名、フィールド名
を入力してテーブルを作成する
26ページに該当する著者のGitのソースをjupyter notebook上で実行
insert_brands_to_db('brands.db',range(1301,1320)) #'brands.db'は作成したデータベース名
できたデータベースをDB Browser for SQLiteで確認すると10レコード取得できていた。