共有11款PHP 络爬虫开源软件

  • PHP的Web爬虫和搜索引擎 PhpDig

    PhpDig是一个采用PHP开发的Web爬虫和搜索引擎。通过对动态和静态页面进行索引建立一个词汇表。当搜索查询时,它将按一定的排序规则显示包含关 键字的搜索结果页面。PhpDig包含一个模板系统并能够索引PDF,Word,Excel,和PowerPoint文档。PHPdig适用于专业化更… 更多PhpDig信息

  • 站内容采集器 Snoopy

    Snoopy是一个强大的 站内容采集器(爬虫)。提供获取 页内容,提交表单等功能。 更多Snoopy信息

  • OpenWebSpider

    OpenWebSpider是一个开源多线程Web Spider(robot:机器人,crawler:爬虫)和包含许多有趣功能的搜索引擎。

  • 易得 络数据采集系统

  • PHP 爬虫库 Goutte

    Goutte 是一个抓取 站数据的 PHP 库。它提供了一个优雅的 API,这使得从远程页面上选择特定元素变得简单。 示例代码: require_once ‘/path/to/goutte.phar’;use GoutteClient;//发送请求$client = new Client();$crawler = $client->requ… 更多Goutte信息

  • 多线程页面抓取服务器

    此服务器是使用mongoose web服务器改写的并发抓取多个页面的服务器, 使用可以查看test.php 更多多线程页面抓取服务器信息

  • 美容新闻采集

    美容新闻淘客免维护全自动采集 1.采集瑞丽女性美容频道文章,免维护全自动采集 2.可自定义 站标题,关键字,描述等 3.可选择是否应用新浪SAE平台 支持 新浪SAE环境 与普通环境自由切换 4.自定义推广产品 5.自定义广告链接 6.自定义文章替换规则方便推广 7.自… 更多美容新闻采集信息

  • PHP爬虫库 PHPCrawl

    phpcrawl是一个爬虫/蜘蛛功能的基于php开发的框架,所以我们称它为 站或爬虫的PHP库。 更多PHPCrawl信息

  • 会媒体视角引擎 ThinkUp

    ThinkUp 是一个可以采集推特,facebook等 交 络数据的 会媒体视角引擎。通过采集个人的 交 络账 中的数据,对其存档以及处理的交互分析工具,并将数据图形化以便更直观的查看。  

  • PHP-spider

    一个可扩展的PHP WEB 蜘蛛,示例代码: use VDBSpiderSpider;use VDBSpiderDiscovererXPathExpressionDiscoverer;$spider = new Spider(‘http://www.oschina.net’); 特性: supports two traversal algorithms: breadth-first and depth-f… 更多PHP-spider信息

  • PHP爬虫工具包 spider-utils-for-php

    spider-utils-for-php: 原则: 简单、易用、灵活、任性任性任性就是任性! 特色: php 界内最简单易用的 http-utils,自动识别支持 curl、socket、file_get_contents 三种方式。 http 请求支持 gzip,加速请求,节约请求成本。 跟踪 301、302 跳转(可设置… 更多spider-utils-for-php信息

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2015年3月26日
下一篇 2015年3月27日

相关推荐