Python爬虫实现isbn查询豆瓣书籍详细信息

如有错误,请疯狂打脸没关系,希望能够指出来。

0. 开始的开始

一直想做一个图书漂流软件,最近入手(入坑)了微信小程序,添加图书时需要用到isbn查询书籍信息的API(不用也可以,但用户会非常麻烦,强迫症晚期的我又跳入了isbn查询API的坑),但发现别人的API都很贵,豆瓣也收回了API的使用权,估计是要收费了。
所以,与其在坑里苦苦挣扎,不如。。。。再挖一个更大的坑,自己做一个。。。

1. 开始

首先打算用python写个爬虫(能力与知识有限,现在只能想到这个办法,如前辈们有更好的办法,请砸过来)。
搜索了几个可以用isbn查书籍信息的 站,最后还是选择了豆瓣。
豆瓣isbn查书籍信息的流程为:

    2.1 获取书籍信息页面的链接地址

    思路:
    打开豆瓣读书首页,模拟浏览器填写isbn码,进行搜索,跳转到搜索结果页面,读取a标签href链接,即书籍信息页面的链接地址。
    代码如下:

    2.2 爬取书籍详细信息

    思路:
    打开2.1获取的页面,找到书籍信息块代码,爬回并清洗,得到需要的信息。
    代码如下:

    3. 效果

    4. 完整代码下载

    isbn查询书籍详细信息
    上一个版本由于某种原因,已不能使用,请下载 v2.0 版本。
    isbn查询书籍详细信息2.0
    由于csdn下载积分随下载次数不断增加,如积分不够,可私聊我,如果有积分还是希望赞助一下。

    仅供学习,勿作商用,如有违反,后果自负。
    不知道豆瓣有一天会不会把这个方法给ban掉。

    文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树 络爬虫urllib211379 人正在系统学习中

    声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年9月10日
下一篇 2019年9月10日

相关推荐