爬虫|菜鸟的学习之路——爬取一本小说

2018年6月9日上午11:57 • 软件开发

前言：本次爬取的是全书的某一本小说并以.TXT格式下载到本地。

工具：python3 和 pycharm

Python库：urllib.request 和 re

注意：python是用3以上的版本，库可以在Windows命令提示符里输入pip install+库名

第一步：分析页

1.首先我们要了解要爬取站的页面，查看页源代码。

2.其次要想好代码的步骤和思路。

#获取主页面源代码

#获取章节超链接

#获取小说内容

#下载小说

（pycharm运行）

结束语：第一次写博客，写的很糙，望包含，我是初学者，菜鸟一枚，多多学习。

——sum

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！