python写一个简单的爬虫程序(爬取快手)(附源码)

快手是一个有意思的视频应用,但是它有一些视频不让下载,我们今天就用爬虫来实现爬取不让下载的视频:

首先右键点击检查,我们可以看见找到了视频的src,访问这个src就可以得到视频的下载 址,如下:

右键就可以下载了,但是我们怎么用python爬虫代码来实现呢/p>

首先引入需要的库

我已经写好注释了,有些入门小白可能要问time模块来干嘛呀/p>

这也是为什么要用selenium库而不全用requests的原因,因为快手 站使用懒加载,何为懒加载/p>

就是等到用户需要看到视频时才向服务器发出视频src的请求,这样对谁都好,但就是对爬虫十分的不友好

所以不用requests来请求src,因为它是连接服务器的第一时间就把代码下载下来,还没有向服务器发出src的请求,因为用requests我们看不见src,所以我们用selenium来获取src,因为它调用本地的浏览器,我们先用selenium访问 站,再用time库等待2秒(为了让 站加载完毕,加载出src):

我们就取到了视频的下载地址,接下来就是保存了:

然后就可以在d盘video目录下看见视频了

简易源码分享

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树首页概览211549 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年6月8日
下一篇 2021年6月8日

相关推荐