『入る学科間違えた高専生』の日記

プログラミングのコードを書いたりする予定です。あとは日記等。あといつまで高専生やねん

BeautifulSoupでちょっとしたスクレイピングをしてみた

はじめに

結構前に日経平均株価をヤフーファイナンスから持ってきてなんてらって記事を多分PyCon mini Hiroshima参加記に書いたと思うんですけど,wgetしてソース読み込んでなんとか〜ってやってるのやっぱり効率悪いしいちいちHTMLファイルをローカルに落とさないといけないし,そこまでリアルタイム性がない!っていうことで卒論の休憩がてら5分ぐらいでスクレイピングの勉強がてらそれらしいスクレイピングをしてみました!

nnsnodnb.hatenablog.jp

環境

  • Python 3.5.1(VirtualEnvで仮想環境作成済)
  • BeautifulSoup4
  • IPython notebook

ライブラリインストール

$ pip install beatifulsoup4 ipython[notebook]

コーディング

gist3d6782d1a5d9a141f21c

お詫び

先輩方にわざわざ説明するまでもないのでお詫びをさせて頂きます.

f:id:nanashinodonbee:20160222105124p:plain

本当は完全にリアルタイムに更新されている左側の日経平均株価を取得したかったのですが,どうやらヤフーファイナンスと同様の理由で取得できなかったので1分更新の右側から取得をしました.

一応説明だけすると,URLからHTMLを取得してソースをパースして
soup.find('div' , class_ = 'if_cur')日経平均株価の値を取得するというもの

最後に

この間のクソプログラムをこっちに移行して実装だけはしてみようかな?って思っています.

この間のクソプログラムは以下

卒論大変です.それとなんというかあと2週間で誕生日です.

もしよかったらウィッシュリストからプレゼント買ってもらえると嬉しいです.
4月から社会人になるので,学生最後のわがままといいますでしょうかwまずは卒業できるかどうかなんですけどね

www.amazon.co.jp