Python新手爬虫训练小项目《爬取彼岸图 》(超详细讲解版)

Python新手爬虫训练小项目《爬取彼岸图 》(超详细讲解版)

这是我的第一篇文章,作为一名新手爬虫,这个算是我这几天来的努力成果,虽然代码寥寥几行但花费了大半天,新手上路还是不能只看视频,真正做项目时,真的有点束手无策,所以谨以此篇做个小总结,也希望能和新学python爬虫的小可爱们都能继续坚持学习下去。

可知这是get方法

第三步 实例化对象

BeautifulSoup有两个参数,详细了解请看https://www.cnblogs.com/Romantic-Chopin/p/12451039.html。
简单点来说就是第一个是从 页获取得源码标签,第二个是解析器的选择。
在这里补充说明,获取 页信息之后就应该将它表示出来,一个是content方法(将 站信息转化为二进制的源码数据),之后因为是二进制的对于我们新手来说不能看懂所以需要进行解码。要用到decode方法,在这里需要注意的是,将数据解码成什么样的编码,我们需要查看 页源代码,右键单击鼠标会出现这样的界面,附图:

第四步 保存文件

详情见:with open语句用法

BeautifulSoup的数据解析

实例化对象好了之后,我们就可以用BeautifulSoup的解析方法了
格式:”实例化好的对象“+”.标签名”,如代码中的soup.h1。
在这里推荐一个视频,我自己也在看,适合刚接触爬虫的我们这些新手上路:
bs4具体使用详解

好啦,这就是本篇文章的全部内容,如果小可爱们喜欢就请点个小赞鼓励一下吧!!!

文章 | 戴眼镜的it小孩纸

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树首页概览211392 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年6月16日
下一篇 2021年6月16日

相关推荐