2016-05-22から1日間の記事一覧

「JS+Node.jsによるWebクローラーネットエージェント」をpythonで実装

(2章 HTML ファイルのリンクを抽出してみよう) from bs4 import BeautifulSoup import requests r = requests.get(url) soup = BeautifulSoup(r.text.encode(r.encoding)) aref = soup.find_all('a') for a in aref: print(str(a.string) + " : " + str(a…