利用python实现爬虫

  1. 准备一个安装好python2.7以上的环境。
  2. 编译软件准备PyCharm                                           注:以上环境是必备的。

我们就以爬取糗事百科的文字段子和用户名称为例:

  1. 得到目标官 的地址:https://www.qiushibaike.com/8hr/page/1/     由他们 站地址我们可以得出page是页的属性1是当前我在第几页,要注意一下这个属性因为他们是我们爬取页面的重要条件属性。

5.得到以上了我们的准备工作也就算了完成了,不啰嗦了直接上代码

运行结果:

看完代码就应该知道准备工作多重要了吧。。。

如果有问题可以在下方评论,讨论

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树 络爬虫urllib211379 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年7月10日
下一篇 2018年7月10日

相关推荐