渋谷ほととぎす通信

完全趣味でやってるUnityメモ。説明できないところを説明できるようにするための個人ブログ。昨日の自分より少しでも大きくなれるように。。。 ※所属団体とは一切関係がありません

簡単PythonとPhantomJSとSeleniumを使ったWebサイト画面キャプチャ


前回記事からの続きです。
最低限の機械学習の知識を手に入れるため勉強中。

本書の2章辺りのPythonを使ったブラウザ画面キャプチャをやってみます。
本書ではUbuntu環境をローカルに立てて実行していますが、本記事ではローカル環境(Mac)から実行しています。

Webブラウザを遠隔操作ツールSeleniumと、WebKitベースのコマンドラインから利用できるWebブラウザの`PhantomJSを使用します。

PhantomJSのインストール

npm install -g phantomjs

PhantomJSをインストールしようとして失敗した話はコチラ。 またはbrew install phantomjsでもOK。

Seleniumのインストール

pipコマンドでseleniumをインストールします。

pip install selenium

実行

実行する前に、今回のソースはコチラ。

引数にキャプチャしたいサイトのURLと保存するファイル名を指定して実行します。

python webcapture.py http://google.com hoge

するとスクリーンキャプチャがhoge.pngとしてローカルに保存されます。

f:id:esakun:20171111165637p:plain
※保存されたキャプチャ画像

今日はここまで。

環境

  • macOS 10.12.6
  • Selenium 3.7.0
  • PhantomJS 2.1.1
  • Python 3.6.3
  • Node.js 9.0.0