简介
八爪鱼采集器是一款全 通用的互联 数据采集器,模拟人浏览 页的行为,通过简单的页面点选,生成自动化的采集流程,从而将 页数据转化为结构化数据,存储于EXCEL或数据库等多种形式。并提供基于云计算的大数据云采集解决方案,实现数据采集。是数据一键采集平台。很适合新手使用。采集原理类似火车头采集器,用户设定抓取规则,软件执行。八爪鱼的优点是提供了常见抓取 站的模板,如果不会写规则, 就直接用套用模板就好了。
它是基于浏览器内核实现可视化抓取数据,所以存在卡顿、采集数据慢的现象。不过整体来说还是不错的,毕竟能基本满足新手在短时间抓取数据的场景,比如翻页查询,Ajax 动态加载数据等。
优点分析
开源,免费,操作极为简单,我们可以把他理解成一个简单的爬虫,即使你不会爬虫,也可以通过它轻松爬取到想要的数据
缺点分析
因为我们是白嫖的,所以爬取速度比较慢
下载安装
站:https://www.bazhuayu.com/
进入 站 点击免费下载
这个就是登录页面
我们可以自己选择采集数据都模板,也可以使用它推荐的热门模板,这里我就直接使用推荐的模板了,注意,有的模板是收费的!
2 选择简易采集中选择模板,有的模板收费!
3 进入到百度版块后可以进行具体规则模板的选择,选择百度资讯-百家 搜索采集
4 点击立即使用进入到信息设置页面,根据个人需要设置相关关键词,例如此处我们输入的关键字为“河南暴雨”,并设置分页(搜索页)为10页的数据,如图:
导出数据

导出到数据库我还没试过,后面我会试下补充上,这样就省去了我从excel导入到mysql的操作
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!