Lucene

来自Wiki.Citydatum
跳转至: 导航搜索
TODO
提示:该页面仍需进一步完善,欢迎加入我们


Lucene标识

Apache Lucene 是一个免费、开源的全文检索引擎工具包,是Apache软件基金会的一个子项目。

概述

相关概念:自然语言处理中文分词

应用

Lucene不仅被用来构建具体的全文检索应用,也被集成到各种系统软件、构建Web应用,甚至被某些商业软件采用。

  • Apache软件基金会:使用Lucene作为全文检索引擎;
  • 开源软件:Eclipse(版本2.1+,IBM),使用Lucene作为帮助子系统的全文索引引擎;
  • 商业软件:Web Sphere(IBM);

上手

Lucene实现全文检索的流程:

  • 创建索引:获得原始文档、创建文档对象、分析文档、创建索引;
  • 查询索引:用户查询接口、创建查询、执行查询;
  • 索引库的修改:删除、添加;

参考链接