news 2026/4/3 4:53:47

Java_ElasticSearch(ES)——分布式搜索引擎

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Java_ElasticSearch(ES)——分布式搜索引擎

介绍:

Elasticsearch是一个开源的分布式搜索和分析引擎,最初由Elastic公司开发。它构建在Apache Lucene搜索引擎库之上,提供了一个强大的全文搜索和分析引擎,它结合kibana、Logstash、Beats,是一整套技术栈,被叫做ELK,适用于各种用例,包括文本搜索、日志分析、实时数据分析、监控和报警等。

官网:

官网地址:Elastic — The Search AI Company | Elastic,目前最新的版本是8.x.x,国内大多使用6.x.x和7.x.x。

优势:

elasticsearch具备以下优势:

**·**支持分布式。可水平拓展

**·**提供Restful接口,可被任何语言调用

es在处理海量数据搜索时,速度非常的快,是因为它底层采用倒排索引。

★倒排索引:

首先介绍一下正向索引

倒排索引

总结:

IK分词器:

上述配置文件即表示添加扩展词典ext.dic,它就会在当前配置文件所在的目录中找这个文件。

总结:

基础概念:

与MySQL对比:

索引库操作

Mapping映射属性:

索引库操作:

总结:

文档处理:

CRUD:

新增:

查找、删除:

修改:
全量修改:

这种方式在文档id不存在时,就会相当于一个新增操作。

增量修改:

批量处理:

JavaRestClient:

客户端初始化:

商品表Mapping映射:

以商品表举例:

在kibana中写出即为:

PUT /items { "mappings": { "properties": { "id": { "type":"keyword" }, "name":{ "type": "text", "analyzer": "ik_smart" }, "price":{ "type": "integer" }, "image":{ "type": "keyword", "index": false }, "category":{ "type": "keyword" }, "brand":{ "type": "keyword" }, "sold":{ "type": "integer" }, "comment_count":{ "type": "integer", "index": false }, "isAD":{ "type": "boolean" }, "update_time":{ "type": "date" } }

索引库操作:

创建索引库的JavaAPI与Restful接口API对比:

操作步骤:

代码演示:
class ItemTest { private RestHighLevelClient client; @BeforeEach void setUp() { // 初始化 RestHighLevelClient 对象 client = new RestHighLevelClient(RestClient.builder( HttpHost.create("http://192.168.178.130:9200") )); } @AfterEach void tearDown() throws IOException { client.close(); } @Test void testCreateIndex() throws IOException { //1.准备Request对象 CreateIndexRequest request = new CreateIndexRequest("items"); //2.准备请求参数 request.source(MAPPING_TEMPLATE, XContentType.JSON); //3.发送请求 client.indices().create(request, RequestOptions.DEFAULT); } @Test void testGetIndex() throws IOException { //1.准备Request对象 GetIndexRequest request = new GetIndexRequest("items"); //2.发送请求 boolean exists = client.indices().exists(request, RequestOptions.DEFAULT); System.out.println("exists: " + exists); } @Test void testDeleteIndex() throws IOException { //1.准备Request对象 DeleteIndexRequest request = new DeleteIndexRequest("items"); //2.发送请求 client.indices().delete(request, RequestOptions.DEFAULT); } private static final String MAPPING_TEMPLATE = "{ " + " "mappings": { " + " "properties": { " + " "id": { " + " "type":"keyword" " + " }, " + " "name":{ " + " "type": "text", " + " "analyzer": "ik_smart" " + " }, " + " "price":{ " + " "type": "integer" " + " }, " + " "image":{ " + " "type": "keyword", " + " "index": false " + " }, " + " "category":{ " + " "type": "keyword" " + " }, " + " "brand":{ " + " "type": "keyword" " + " }, " + " "sold":{ " + " "type": "integer" " + " }, " + " "comment_count":{ " + " "type": "integer", " + " "index": false " + " }, " + " "isAD":{ " + " "type": "boolean" " + " }, " + " "update_time":{ " + " "type": "date" " + " } " + "} " + "} " + "}"; }

文档操作:

新增文档:

运行代码:
@SpringBootTest(properties = "spring.profiles.active=local") class ESDocTest { private RestHighLevelClient client; @Autowired private IItemService itemService; @BeforeEach void setUp() { // 初始化 RestHighLevelClient 对象 client = new RestHighLevelClient(RestClient.builder( HttpHost.create("http://192.168.178.130:9200") )); } @AfterEach void tearDown() throws IOException { client.close(); } @Test void testIndexDoc() throws IOException { //获取数据 Item item = itemService.getById(317578L); ItemDoc itemDoc = BeanUtil.copyProperties(item, ItemDoc.class); //创建request对象 IndexRequest request = new IndexRequest("item").id(itemDoc.getId()); //准备JSON文档 request.source(JSONUtil.toJsonStr(itemDoc), XContentType.JSON); //发送请求 client.index(request, RequestOptions.DEFAULT); } }
删除文档:

查询文档:

修改文档:

全量更新:可以使用新增文档的代码,在得到ItemDoc后修改它的属性值在新增即可。

局部更新:

文档操作基本步骤:

批处理:

代码示例:

DSL查询:

快速入门:

注意:单次查询默认最大数据数为10000,最多返回10条数据

叶子查询:

全文检索:

FIELD为要搜索的字段,TEXT为要搜索的内容

精确查询:

term查询一般用来搜不分词的字段,比如品牌等。如果搜分词的字段,VALUE只能写分好的词条,比如“脱脂”、“牛奶”等,才能搜到

range查询中gte和lte也可以写成gt和lt这样就是大于和小于。

ids查询:(批量查询id)

总结:

复合查询:

布尔查询:

示例:

搜索“智能手机”,但品牌必须是华为,价格必须是900~1599

排序和分页:

排序:

示例:

搜索商品,按照销量排序,销量一样则按照价格排序。

分页:

示例:

搜索商品,查询出销量排名前10的商品,销量一样时按照价格升序。

深度分页问题:

解决方案:

高亮显示:

(↑标签默认就为em)

搜索完整语法:

JavaRestClient查询:

快速入门:

构建查询条件:

全文检索查询:

精确查询:

布尔查询:

排序和分页:

高亮显示:

聚合:

聚合的分类:

DSL实现聚合:

Java客户端实现聚合:

构造请求参数:

解析结果:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/2 13:48:32

Ubuntu预测故障、实时质检…边缘智能正在重塑工厂车间

过去十年,“机器换人”是中国制造业转型升级的主旋律。自动化生产线、机械臂、AGV小车大量涌入工厂,显著提升了生产效率和一致性,缓解了劳动力成本上升的压力。然而,当“机器”普及到一定程度,一个新的瓶颈出现了&…

作者头像 李华
网站建设 2026/3/27 5:16:14

03-Matplotlib

Matplotlib 一、Matplotlib快速入门 学习目标 了解什么是matplotlib为什么要学习matplotlibmatplotlib简单图形的绘制 1、什么是Matplotlib 是专门用于开发2D图表(包括3D图表) 以渐进、交互式方式实现数据可视化 2、为什么要学习Matplotlib 可视化是在整个数据挖掘的关…

作者头像 李华
网站建设 2026/3/30 3:50:26

AngularJS 模块详解

AngularJS 模块详解 引言 AngularJS 是一个强大的JavaScript框架,用于构建单页应用程序(SPA)。它提供了一套丰富的特性,其中包括模块化。模块化是现代软件开发的一个重要概念,它有助于提高代码的可维护性和可扩展性。本文将详细解析 AngularJS 模块的概念、创建和使用方…

作者头像 李华
网站建设 2026/4/2 10:08:20

文档解析API哪个好用

在构建企业知识库或RAG系统时,文档解析质量直接决定了大模型理解的上限。市面上文档解析API众多,但真正能应对复杂场景的却屈指可数。从跨页表格到手写公式,从多栏布局到扫描件识别,每一个技术难点都可能成为项目的拦路虎。本文将…

作者头像 李华
网站建设 2026/4/1 1:21:44

云平台一键部署【FunAudioLLM/Fun-ASR-Nano】音乐背景下歌词识别

Fun-ASR 是通义实验室推出的端到端语音识别大模型,是基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性,支持低延迟实时听写, 并且覆盖 31 个语种。 在教育、金融等垂直领域表现出色,能准确识…

作者头像 李华