python爬虫常用模块!python控制浏览器的三种方法

第一种:selenium导入浏览器驱动,用get方法打开浏览器


写爬虫大家可能会用到selenium,它是一个web的自动化测试工具可以让浏览器自动去加载或者运行一些操作,而chromedriver是一个能够被selenium驱动的浏览器(是有界面的,PhantomJS是无界面的浏览器),所以大家在结合selenium和chromedriver的使用,特别是做一些验证码和自动登陆获取cookie这类的操作很方便。

python爬虫常用模块!python控制浏览器的三种方法


第二种:通过导入python的标准库webbrowser打开浏览器


webbrowser 是 Python 自带的包,可以自动打开浏览器。

其中,get() 函数中是浏览器的名字,可以是 chrome 也可以是 safari。

python爬虫常用模块!python控制浏览器的三种方法


第三种:使用Splinter模块


Splinter的使用必修依靠Cython、lxml、selenium这三个软件


splinter是基于selenium的上层应用API,它可以模拟浏览器的操作,比如说填充、选择、点击等,使用时甚至可以像看电影一般看到浏览器一步一步的自动操作。当时,速度较慢,毕竟是模拟鼠标键盘操作。

python爬虫常用模块!python控制浏览器的三种方法

来源:Python教程初学详解

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年9月1日
下一篇 2021年9月1日

相关推荐