文章目录
-
- selenium简介
- 反爬虫
- 反反爬虫
-
- 配置 Selenium 选项
- 控制已打开的浏览器
- mitmproxy中间人
- 待续…
selenium简介
此时解决方法通常有两种:
- 深挖 Ajax 的逻辑,把接口地址和其加密参数构造逻辑完全找出来,再用 Python 复现,构造 Ajax请求
- 通过模拟浏览器的方式,绕过这个过程。
这里我们主要介绍下第二种方式,模拟浏览器爬取。
Selenium 是一个自动化测试工具,利用它可以驱动浏览器执行特定的操作。比如点击,下拉等操作,同时还可以获取浏览器当前呈现的页面源代码,做到 所见即所得。对于一些使用 Javascript 动态渲染的页面来说,此种抓取方式非常有效!
当然,这些例子并不是为了打击各位的自信,仅仅是希望大家不要学会了部分技术就开始沾沾自喜,时刻保持一颗赤子之心,怀着对技术的热情继续前进。爬虫与反爬虫这场没有硝烟的战争,还在继续 …
文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树 络爬虫Selenium211383 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!