Elasticsearch(简称ES) 是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎。
通过 Lucene 的倒排索引技术实现比关系型数据库更快的过滤。特别是它对多条件的过滤支持非常好,比如年龄在 18 和 30 之间,性别为女性这样的组合查询。作为一个准实时的搜索引擎,基于Lucene构建,它的主要强项还是在全文检索方面,具有以下特点。
全文检索的概念
首先介绍全文检索的概念,就是对一篇文章进行索引,可以根据关键字搜索,类似于mysql里的like语句。 全文索引就是把内容根据词的意义进行分词,然后分别创建索引,例如“魔众系统提供高标准交付服务” 可能会被分词成:“魔众“,”系统“,“提供“,“高标准”,“交付服务”等token,这样当搜索“魔众” 或者 “高标准” 都会把这句搜出来。
内置分词器
ElasticSearch实现全文索引,首先要确定分词器,ElasticSearch默认有很多分词器,具体设置可以参考ElasticSearch的官方文档。
目前魔众系统在题库系统率先支持ElasticSearch的配置,后续在全文搜索的地方会陆续支持。
魔众,只为更好的技术。
这比较好,点个赞