“Lucene”的版本间的差异
来自Wiki.Citydatum
(创建页面,内容为“{{提示|该页面仍需进一步完善,欢迎加入我们}} 192px|缩略图|Lucene标识 Apache Lucene 是一个免费、开…”) |
小 |
||
第5行: | 第5行: | ||
== 概述 == | == 概述 == | ||
− | + | 相关概念:[[自然语言处理]]、[[中文分词]] | |
− | |||
== 应用 == | == 应用 == |
2018年8月22日 (三) 17:58的最新版本
Apache Lucene 是一个免费、开源的全文检索引擎工具包,是Apache软件基金会的一个子项目。
概述
应用
Lucene不仅被用来构建具体的全文检索应用,也被集成到各种系统软件、构建Web应用,甚至被某些商业软件采用。
- Apache软件基金会:使用Lucene作为全文检索引擎;
- 开源软件:Eclipse(版本2.1+,IBM),使用Lucene作为帮助子系统的全文索引引擎;
- 商业软件:Web Sphere(IBM);
上手
Lucene实现全文检索的流程:
- 创建索引:获得原始文档、创建文档对象、分析文档、创建索引;
- 查询索引:用户查询接口、创建查询、执行查询;
- 索引库的修改:删除、添加;