Jupyter notebookでPlaywrightを使うときのメモ

インストール

condaを使っていてもpipでインストール

pip install pytest-playwright

上記インストール後に、自動化で利用するブラウザのインストールを実行

playwright install

chromiumや、firefoxやらが入るみたい(ざっとコンソール上での表示を確認した限りだと)

Jupyterでの実行

Jupyter notebookでPlaywrightを動かすには、どうやら非同期での実行をしなければいけないらしい。

www.tenohira.xyz

文字化けするときの対処方法

実行環境: WSLのUbuntu

日本語環境をインストールする。

sudo apt-get install fonts-ipafont-gothic fonts-ipafont-mincho

qiita.com

User-Agentを出力

Jupyter上で実行するので、awaitをつけている。

actual_user_agent = await page.evaluate("navigator.userAgent")
print("User-Agent:", actual_user_agent)

EdgeでUser-Agentを確認する

アドレスバーにedge://version/を入力する。そうすると、ユーザーエージェントという欄が見えるので、そこをコピーすればok

上記を実行して得られたUser-Agent→Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36 Edg/131.0.0.0

User-Agentを設定する

    browser = await p.chromium.launch()
    context = await browser.new_context(
        user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36 Edg/131.0.0.0"
    )

スクリーンショットを取得する

await page.screenshot(path="screenshot.png", full_page=True)

full_page=Trueで全画面を取得できる。