python + selenium でWEBスクレイピングを試す

python + selenium でWEBスクレイピングを試す

python インストール

こちらの手順でインストール

https://www.javadrive.jp/python/install/index1.html

selenium インストール

ライブラリのインストール

pipを使ってopenpyxlをインストール

pip install selenium

ドライバーのインストール

操作するブラウザのドライバが必要で、今回はEdgeドライバーインストールする

Edgeのバージョンを確認して、対応するドライバーをインストールする

https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/

対応するバージョンのx64リンクをクリックするとedgedriver_win64.zipがダウンロード。

zipを解凍して、以下のフォルダに配置

C:\work\lesson\python\edgedriver_win64\msedgedriver.exe

環境設定は以上。

WEBサイトの表示サンプル

import time
from selenium import webdriver
from selenium.webdriver.edge.service import Service # 1) Serviceのインポート
driver_path = "C:\work\lesson\python\edgedriver_win64\msedgedriver.exe"
service = Service(executable_path=driver_path) # 2) executable_pathを指定
driver = webdriver.Edge(service=service) # 3) serviceを渡す
driver.get("https://www.yahoo.co.jp/")
time.sleep(5)
driver.quit()
python websc1.py

するとEdgeが起動します。サイト表示OK