Python爬虫可以应用在哪些地方
发布时间:2020-06-19 14:46:48
阅读:118
络爬虫(又称为 页蜘蛛, 络机器人,在FOAF 区中间,更经常的称为 页追逐者),是一种按照一定的规则,自动地抓取万维 信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
一、爬取数据
第一个库挺不错的,现在在获取 页源代码时,我都用这个库,大家如果有不懂的可以看看那个 站。第二个库由于我是用3.4版本的Python,折腾了很久没折腾进去,于是我发现了另一个不错的库BeautifulSoup,详细教程参考: Python爬虫入门八之Beautiful Soup的用法
有了requests和Beautifulsoup,基本上可以实现我想要的很多功能了。我便做了一一个抓取分级基金数据的爬虫:
二、分析并推送
其实在此分析其实还谈不上,顶多算是筛选。(不过我相信随着 我数学能力提升会能有进一步的分析的,美好的祝愿。。。)筛选很简单,就是涨幅或收益率等等满足一定条件就保留下来,保留下来干嘛啊! ! !
将保存下来的数据通过邮件发送到自己的邮箱,手机上下载个软件,一切就大功告成了!
至此当时学习Python的目的就达到了,当时激动地要炸了
不过….那么好玩的东西,怎么能这么快就结束了腾吧!
三、简单的界面
。Python好像不能直接弄成exe可执行文件,不能每次运行都开Python的窗口啊!强迫症怎么能忍! 1上 搜搜发现有诸如py2exe的包可以转换,可是老子是3.4版本啊! 折腾半天没搞定,算了!我不是会点VB吗,用那个吧。于是连界面都有了
文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树 络爬虫urllib211387 人正在系统学习中 相关资源:开源的爬虫软件Heritrix3.1.0_开源爬虫-Java工具类资源-CSDN文库
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!