HaneCa

独り立ちへ向けた長い道

Pythonでスクレイピング

投稿日: 2011年8月3日 最終更新日: 2020年4月12日

PythonでスクレイピングするライブラリとしてBeautifulSoupを利用

HTMLを取得して、それを表示する簡単なサンプル

import urllib2
from BeautifulSoup import BeautifulSoup

if __name__ == '__main__':
web = urllib2.urlopen('http://www.google.co.jp/')
html = BeautifulSoup(web)
print html.prettify()

これで、指定したWebサイトのHTMLを取得/表示することができる

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください