简介
Elasticsearch 是一个开源的搜索引擎,建立在一个
全文搜索
引擎库 Apache Lucene™ 基础之上。Lucene本身就可以被认为迄今为止性能最好的一款开源搜索引擎工具包,但是lucene的API相对复杂,需要深厚的搜索理论。很难集成到实际的应用中去。ES采用Java语言编写,提供了简单的RestFul API。
索 :建立索引文本—>切分—>词 文章出现过 出现多少次
检索:查询 关键词—> 索引中—>符合条件文章 相关度排序
全文检索(Full- Text Retrieval)以文本作为检索对象,找出含有指定词汇的文本。全面、准确和快速是衡量全文检索系统的关键指标。
- 只处理文本、不处理语义(你吃了吗?——我吃了。今天是几号?返回一个日历)
- 搜素时英文不区分大小写
- 结果列表有相关度排序
数据库选用
- 如果你对数据的读写要求极高,并且你的数据规模不大,也不需要长期存储,选redis;
- 如果你的数据规模较大,对数据的读性能要求很高,数据表的结构需要经常变,有时还需要做一些聚合查询,选MongoDB;
- 如果你需要构造一个搜索引擎或者你想搞一个看着高大上的数据可视化平台,并且你的数据有一定的分析价值或者你的老板是土豪,选ElasticSearch;
- 如果你需要存储海量数据,连你自己都不知道你的数据规模将来会增长多么大,那么选HBase。
后端数据
Kafka + Flink + ElasticSearch
2.Cloud
elastic yHsqOAZcpiPiaezgKDMvm3dN