news 2026/4/3 3:14:32

Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅

背景

我们的知识库问答系统使用 Azure Container Apps + Azure AI Search + Azure OpenAI 构建,架构如下:

用户请求 → Container App → AI Search (向量搜索) → OpenAI (生成回答)

系统上线后,性能表现不佳:

  • P50 响应时间:18 秒
  • P99 响应时间:41 秒
  • 最慢请求:40.9 秒

用户体验极差,需要紧急优化。

问题分析过程

第一次分析:应用层串行执行(部分正确)

查看应用日志,发现单个请求内部执行流程:

00:00:00.000 - 请求开始 00:00:02.000 - get_search_results took 7.053s 00:00:07.000 - get_search_results took 10.068s (5秒后才开始) 00:00:26.000 - get_search_results took 23.689s (19秒后才开始) 00:00:32.000 - get_search_results took 27.646s (6秒后才开始) 00:00:34.000 - combine_content took 40.618s

初步结论:应用层串行执行多次 AI

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/11 20:54:45

牛客周赛122 Digital Deletion

https://ac.nowcoder.com/acm/contest/125083/D 题目分析: 通过了解题意,我们会想到,就是求出一个集合的所有子集合的和,放入到一个新的集合里面,然后求最多删除多少个数,不会影响整体的 MEX MEX的介绍&a…

作者头像 李华
网站建设 2026/3/24 3:55:00

从“十五五”规划建议看智慧医疗重点发展方向

随着十五五”规划建议的发布,我国医疗卫生事业迎来了新的发展机遇。“十五五”规划建议不仅明确了未来五年我国经济社会发展的总体思路和主要目标,还为智慧医疗的发展指明了方向。本文将从“十五五”规划建议出发,探讨智慧医疗的重点发展方向…

作者头像 李华
网站建设 2026/4/3 1:45:32

永磁同步电机模型预测电流控制Simulink仿真:单矢量控制探索

永磁同步电机模型预测电流控制Simulink仿真,单矢量控制,带一份报告介绍在电机控制领域,永磁同步电机(PMSM)因其高效、节能等优点,应用越来越广泛。今天咱们就唠唠永磁同步电机模型预测电流控制在Simulink中…

作者头像 李华
网站建设 2026/3/16 23:52:42

当亚马逊AI开始替你运营,卖家终于找回自己的“第一身份”

亚马逊平台规则的重磅升级,正在引发一场静默而深刻的变革,四项核心新规的推出,并非简单的功能迭代,而是系统性地将“规模化运营”这一传统壁垒,转化为所有卖家触手可及的基础设施,当AI开始主动思考、数据工…

作者头像 李华
网站建设 2026/3/28 4:45:49

12.17学习例题(1)

#include <stdio.h>int main(){int a , b;scanf("%d %d", &a, &b);int yu a / b;int shang a % b;printf("%d %d", yu , shang);return 0;}

作者头像 李华