爬虫|菜鸟的学习之路——爬取一本小说

前言:本次爬取的是全书 的某一本小说并以.TXT格式下载到本地。

工具:python3 和 pycharm

Python库:urllib.request 和 re

注意:python是用3以上的版本,库可以在Windows命令提示符里输入pip install+库名

第一步:分析 页

1.首先我们要了解要爬取 站的页面,查看 页源代码。

2.其次要想好代码的步骤和思路。

#获取主页面源代码

#获取章节超链接

#获取小说内容

#下载小说


(pycharm运行)

爬虫|菜鸟的学习之路——爬取一本小说


结束语:第一次写博客,写的很糙,望包含,我是初学者,菜鸟一枚,多多学习。


——sum


声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年6月9日
下一篇 2018年6月9日

相关推荐