2016-05-21から1日間の記事一覧

「JS+Node.jsによるWebクローラーネットエージェント」をpythonで実装

(2章 HTML ファイルをダウンロードしてみよう) from bs4 import BeautifulSoup import requests url = "http://www.aozora.gr.jp/index_pages/person81.html" r = requests.get(url) soup = BeautifulSoup(r.text.encode(r.encoding)) print(soup.find("b…