首页 » 排名链接 » 高效下载:利用Playwright和Python完成文件下载(下载文件穆勒操作路径)

高效下载:利用Playwright和Python完成文件下载(下载文件穆勒操作路径)

南宫静远 2024-07-24 16:36:24 0

扫一扫用手机浏览

文章目录 [+]

playwright提供了expect_download()操作来实现文件的下载操作,当浏览器上下文关闭时,所有属于浏览器上下文的下载文件都会被删除。
下载开始后会发出下载事件。
下载完成后,下载路径可用:

pythonwith page.expect_download() as download_info: page.get_by_text("Download file").click()download = download_info.value# wait for download to completepath = download.path()相关操作取消下载

如果下载已经完成或取消,则不会失败。
成功取消后,download.failure()将解析为'canceled'

pythondownload.cancel().删除下载的文件

pythondownload.delete()返回下载错误(如果有)

pythondownload.failure()获取下载所属的页面

pythondownload.page下载路径

下载成功,则返回下载文件的路径。
如有必要,该方法将等待下载完成。
该方法在远程连接时抛出。

高效下载:利用Playwright和Python完成文件下载(下载文件穆勒操作路径) 排名链接
(图片来自网络侵删)

pythondownload.path()

注:下载的文件名是随机 GUID,使用download.suggested_filename获取建议的文件名

将下载复制到用户指定的路径。
在下载仍在进行时调用此方法是安全的。
如有必要,将等待下载完成。

pythondownload.save_as(path)返回此下载的建议文件名

pythondownload.suggested_filename

注:通常由浏览器根据Content-Disposition响应标头或download属性计算得出

返回下载的 url

pythondownload.url实例

我们以下载我们常用的Python单元测试框架pytest为例,使用playwright的代码如下:

pythonfrom playwright.sync_api import sync_playwrightdef run(playwright): browser = playwright.chromium.launch(headless=False) context = browser.new_context(accept_downloads=True) # Open new page page = context.new_page() page.goto("https://pypi.org/project/pytest/#files") # 点击要下载的文件按钮 with page.expect_download() as download_info: page.click("text=pytest-7.3.1.tar.gz") download = download_info.value path = download.path() download.save_as(path) # 打印保存路径 print(path) # --------------------- context.close() browser.close()with sync_playwright() as playwright: run(playwright)

运行脚本,结果如下,我们可以看到,我们正在下载pytest的压缩文件。

总结

使用 Playwright 和 Python,我们可以轻松实现文件下载功能,这对于需要大量下载文件的应用程序来说非常实用。

相关文章