はじめに
結構前に日経平均株価をヤフーファイナンスから持ってきてなんてらって記事を多分PyCon mini Hiroshima参加記に書いたと思うんですけど,wgetしてソース読み込んでなんとか〜ってやってるのやっぱり効率悪いしいちいちHTMLファイルをローカルに落とさないといけないし,そこまでリアルタイム性がない!っていうことで卒論の休憩がてら5分ぐらいでスクレイピングの勉強がてらそれらしいスクレイピングをしてみました!
環境
- Python 3.5.1(VirtualEnvで仮想環境作成済)
- BeautifulSoup4
- IPython notebook
ライブラリインストール
$ pip install beatifulsoup4 ipython[notebook]
コーディング
お詫び
先輩方にわざわざ説明するまでもないのでお詫びをさせて頂きます.
本当は完全にリアルタイムに更新されている左側の日経平均株価を取得したかったのですが,どうやらヤフーファイナンスと同様の理由で取得できなかったので1分更新の右側から取得をしました.
一応説明だけすると,URLからHTMLを取得してソースをパースして
soup.find('div' , class_ = 'if_cur')
で日経平均株価の値を取得するというもの
最後に
この間のクソプログラムをこっちに移行して実装だけはしてみようかな?って思っています.
この間のクソプログラムは以下
卒論大変です.それとなんというかあと2週間で誕生日です.
もしよかったらウィッシュリストからプレゼント買ってもらえると嬉しいです.
4月から社会人になるので,学生最後のわがままといいますでしょうかwまずは卒業できるかどうかなんですけどね