使用它可以开发一些自动化程序,来模仿人在浏览器上的操作,比如点击网页上的按钮、在文本框中输入文字等。
在开发程序之前,先要准备开发环境、熟悉相关工具。
创建Conda虚拟环境Conda是一个开源的包管理系统和环境管理器,我们使用它来创建一个完全独立的环境,安装Selenium第三方库用于相关的开发,以避免和其他程序的开发环境发生冲突。

命令行创建env_selenium环境(注意:因为我使用win7,所以指定了python版本):
conda create -n env_selenium python=3.8.18 -y
通过“conda env list”命令查看env_selenium环境创建是否成功。
然后通过“conda activate env_selenium”命令激活环境即可。
关于Conda环境创建的更多细节可以参考文章《好用的环境和包管理器-Conda》。
安装Selenium库Selenium在线安装比较简单,但国外源常常比较卡,经常会因为超时安装失败,所以命令行中直接指定国内源。
pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple
如果无法联网在线安装,可以参考文章《Python第三方库的离线安装》
下载和安装浏览器驱动程序Selenium的使用需要安装浏览器驱动。
浏览器驱动是一个独立的程序,是由浏览器厂商提供的,不同的浏览器需要不同的浏览器驱动。 比如 Chrome浏览器和火狐浏览器有各自不同的驱动程序。
若是使用Chrome浏览器,可以到下面的地址去下载最新版本的驱动程序:https://googlechromelabs.github.io/chrome-for-testing/
历史版本则可以访问地址:https://chromedriver.storage.googleapis.com/index.html
注意:浏览器驱动的版本和浏览器的版本 尽可能保持一致!
浏览器安装比较简单,下载的Zip文件解压即可。这个路径要记住,后续写代码会用到。
我是把python开发用到的库和相关的文件都放到统一的目录下,然后再细分类目。
另外还要注意2点:
若是win7操作系统,支持Chrome浏览器和浏览器驱动的最高版本是109。Chrome浏览器建议安装完整版,不要精简版,以免后续运行出现问题。熟悉浏览器开发者工具Selenium开发中,可以通过浏览器开发者工具来确定网页上各种元素的定位。每种浏览器都有自己的开发者工具。
以Chrome浏览器为例,通过F12键可以调出开发者工具。
开发者工具的简单操作可以参见文章《浏览器开发者工具简单操作》。
在代码区,热键Ctrl+F调出搜索栏,可以按字符串、选择器或者XPath来查找检索元素。
熟悉掌握XPath
XPath 表示 XML 路径语言。XPath表达式,是一种灵活、强大的选择元素的方式。
XPath中有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。
XPath中最核心的路径表达式主要有这几种:
XPath常用路径表达式及其作用:
Selenium中使用Xpath的举例:
#找到属于bookstore子元素的第一个book元素element = wd.find_element(By.XPath, "/bookstore/book[1]") #在第一个book元素处鼠标单击element.click()