こんにちは、エンジニアのオオバです。

前回記事からの続きです。

最低限の機械学習の知識を手に入れるため勉強中。

本書の2章辺りのPythonを使ったブラウザ画面キャプチャをやってみます。
本書ではUbuntu環境をローカルに立てて実行していますが、本記事ではローカル環境(Mac)から実行しています。

Webブラウザを遠隔操作ツールSeleniumと、WebKitベースのコマンドラインから利用できるWebブラウザの`PhantomJSを使用します。

→11万文字で徹底解説した「DOTweenの教科書」Unityアニメーションの超効率化ツールはこちら

PhantomJSのインストール

npm install -g phantomjs  

PhantomJSをインストールしようとして失敗した話はコチラ
またはbrew install phantomjsでもOK。

Seleniumのインストール

pipコマンドでseleniumをインストールします。

pip install selenium  

実行

実行する前に、今回のソースはコチラ。

webcapture.py · GitHub

引数にキャプチャしたいサイトのURLと保存するファイル名を指定して実行します。

python webcapture.py https://google.com hoge  

するとスクリーンキャプチャがhoge.pngとしてローカルに保存されます。

簡単PythonとPhantomJSとSeleniumを使ったWebサイト画面キャプチャ_0

オススメ記事
検証環境