爬虫入门实践 | 利用python爬取彩票中奖信息

系统环境:mac
python版本:3.6.2(anaconda)
库:requests、BeautifulSoup


爬取一些简单的静态 站,一般采取的策略为:选中目标,也就是需要爬取的 站url;观察结构,查看 页结构,联接结构;构思动手,选择Html下载器和解析器,最后存储数据。

今天我们爬取对象是中彩 中3D彩票中奖信息。对应的URL为:http://kaijiang.zhcw.com/zhcw/html/3d/list_1.html。
我们可以发现,其后缀list_()代表的正是第几页,比如list_3就是第三页。

这里写图片描述
代码如下:

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树首页概览211383 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年6月15日
下一篇 2018年6月15日

相关推荐