Python爬虫实战:爬取任意你想看的视频

大家好,今天小编就以B站为例,带大家爬取视频,学会之后你也能爬取你想要的视频!或不多说,上正文

爬虫用的好,牢饭吃的早!

下载仓库

git@github.com:inspurer/PythonSpider.git
或者直接下载:https://github.com/inspurer/PythonSpider/tree/master/bilibili

替换

随便打开一个b站的界面,比如

将url复制到代码中去,运行代码,稍等一会儿,上述图中的视频就被下载下来了。

How to Code

分析 页源码

按f12浏览器开发者工具 ,通过一番审查,我们定位到视频的url在 页源代码的位置如下:


最后的url就是我们想要的结果。
如果在浏览器中查找不方便的话,我们可以把通过代码把 页源码输出到本地


为了伪装成浏览器,我们需要在reqests添加Headers
这个Headers需要我们去浏览器中手动获取
切换到NetWork标签下,再选择Headers,


这里只选择了几个关键的

解析得到视频地址

根据上一步分析,我们得到了 页的源码,并在源码中定位到了视频地址,接下来,我们就用代码自动获取这个地址了


顺便获取下视频的名字:


然后组合返回下:


下载视频

通过在开发者工具中搜索关键词,比如上面得到的视频url,我们可以定位到在浏览器中真正下载视频的请求在哪

然后把它的Headers添加到reqests中,就可以下载视频了


你下载的视频在本地播放不了,请不要试图修改源代码中保存文件的格式由.flv改成.mp4,因为b站的视频本来就是flv格式的,需要用特殊的视频播放器播放,这里推荐一个无毒无害的KMPlayer,链接:
https://pan.baidu.com/s/1O4-Uia04Vm-jbUjyrVWfkw 提取码:4l11

结尾

最后多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编,并在后台私信小编:“01”即可领取。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年9月10日
下一篇 2020年9月10日

相关推荐