Apache Lucene信息检索工具库(三)

Apache Lucene介绍

Aoache Lucene是一款高性能的、可扩展的信息检索工具库,由Java语言开发、自由开源的搜索类库,基于Apache协议授权。Lucene只是一个软件类库,如果要发挥Lucene的功能,还需要开发一个调用Lucene类库的应用程序。

Apache Lucene的组件

Apache Lucene由以下三个组件组成

Lucene Core

是Apache下的一款非常出色的项目,提供基于Java的索引和搜索技术,以及拼写检查,命中突出显示和高级分析/标记化功能。
Apache Lucene是一个完全用Java编写的高性能,功能齐全的文本搜索引擎库。它是一种适用于几乎所有需要全文搜索的应用程序的技术,尤其是跨平台搜索。

Solr

是一个使用Lucene Core构建的高性能搜索服务器,具有XML/HTTP/JSON/Python/Ruby API,高亮显示、分页搜索、缓存、复制及Web管理界面。
Solr是基于Apache Lucene构建的流行、快速、开源的企业搜索平台;具有高可靠性、可扩展性和容错性、可提供分布式索引、复制和复制均衡查询、自动故障转移和恢复、集中配置等。Solr为世界上许多的互联 站点的搜索和导航功能提供支持。

Pylucene

Apache Lucene功能特性:

可扩展的高性能索引功能

  • 每小时可以索引150G的数据
  • 增量索引和批量索引一样快
  • 索引大小约为索引文本大小的20%-30%

强大高效的搜索算法

  • 排序搜索,首先返回最佳结果
  • 许多强大的查询类型如:短语查询、通配符查询、精确查询、范围查询等
  • 按任务字段排序
  • 合并结果的多索引搜索
  • 支持更新的同时搜索

相关资源:virtualbow:设计和模拟弓箭的软件-其它代码类资源-CSDN文

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年5月2日
下一篇 2019年5月3日

相关推荐