selenium用法详解【从入门到实战】【Python爬虫】【4万字】

跳转文末获取实战源码与作者联系方式,共同学习进步

文章目录

    • 简介
    • selenium安装
    • 安装浏览器驱动
      • 确定浏览器版本
      • 下载驱动
    • 定位页面元素
      • 打开指定页面
      • id 定位
      • name 定位
      • class 定位
      • tag 定位
      • xpath 定位
      • css 定位
      • link 定位
      • partial_link 定位
    • 浏览器控制
      • 修改浏览器窗口大小
      • 浏览器前进&后退
      • 浏览器刷新
      • 浏览器窗口切换
      • 常见操作
    • 鼠标控制
      • 单击左键
      • 单击右键
      • 双击
      • 拖动
      • 鼠标悬停
    • 键盘控制
    • 设置元素等待
      • 显式等待
      • 隐式等待
      • 强制等待
    • 定位一组元素
    • 切换操作
      • 窗口切换
      • 表单切换
    • 弹窗处理
    • 上传 & 下载文件
      • 上传文件
      • 下载文件
        • Chrome浏览器
        • Firefox浏览器
    • cookies操作
    • 调用JavaScript
      • 滑动滚动条
        • 通过 x ,y 坐标滑动
      • 通过参照标签滑动
    • 其他操作
      • 关闭所有页面
      • 关闭当前页面
      • 对当前页面进行截图
      • 常用方法总结
    • selenium进阶
      • selenium隐藏指纹特征
    • 实战:selenium模拟登录B站
      • 登录验证码处理
      • 分析登录界面结构
      • 获取页面当前验证码图片
        • 方法一、页面截图,将验证码区域进行裁剪保存
        • 方法二、通过网页获取图片地址,并保存
      • 使用超级鹰识别验证码
      • 提取坐标数据,动作链点击
      • 运行效果
    • 源码获取

selenium用法详解【从入门到实战】【Python爬虫】【4万字】

下载驱动

打开 Chrome驱动 。单击对应的版本。

selenium用法详解【从入门到实战】【Python爬虫】【4万字】
下载完成后,压缩包内只有一个 文件。
selenium用法详解【从入门到实战】【Python爬虫】【4万字】
想要定位并获取页面中的信息,首先要使用 打开指定页面,再去定位。

执行上面语句后会发现,浏览器打开 CSDN 主页后会马上关闭,想要防止浏览器自动关闭,可以添加下面代码。

这样将上面的代码组合再打开浏览器就不会自动关闭了。

下面我们再来看看几种常见的页面元素定位方式。

id 定位

标签的 具有唯一性,就像人的身份证,假设有个 标签如下。

我们可以通过 定位到它,由于 的唯一性,我们可以不用管其他的标签的内容。

name 定位

指定标签的名称,在页面中可以不唯一。假设有个 标签如下

我们可以使用 定位到 标签。

class 定位

指定标签的类名,在页面中可以不唯一。假设有个 标签如下

我们可以使用 定位到 标签。

tag 定位

每个 往往用来定义一类功能,所以通过 来识别某个元素的成功率很低,每个页面一般都用很多相同的 ,比如:、 等。这里还是用上面的 作为例子。

我们可以使用 定位到 标签。

xpath 定位

是一种在 文档中定位元素的语言,它拥有多种定位方式,下面通过实例我们看一下它的几种使用方式。

根据上面的标签需要定位 最后一行 标签,以下列出了四种方式, 定位的方式多样并不唯一,使用时根据情况进行解析即可。

css 定位

使用选择器来为页面元素绑定属性,它可以较为灵活的选择控件的任意属性,一般定位速度比 要快,但使用起来略有难度。
选择器常见语法:

方法 例子 描述
.class 选择 的所有元素
#id 选择 的元素
* 选择所有元素
element 选择所有 元素
el

来源:Dream丶Killer

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年2月11日
下一篇 2022年2月11日

相关推荐