news 2026/4/3 6:24:42

关于工程实践的面试问题

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
关于工程实践的面试问题

文章目录

      • 1. 为什么要设计新的数据库Schema?
      • 2. 怎么保证新的Schema不污染老的,及项目上线注意事项?
        • (1)避免新Schema污染老Schema的核心原则:**隔离性 + 兼容性**
        • (2)上线注意事项:**灰度发布 + 回滚预案**
      • 3. 怎么保证backfill(数据回填)时不丢数据?
      • 4. Cache的一致性怎么保证(写回/写穿)?
        • (1)写穿(Write-Through):同步更新缓存
        • (2)写回(Write-Back):异步更新缓存
        • (3)关键优化:避免缓存不一致的细节
      • 5. 有没有监控来保证Cache的数据没有问题?
        • (1)数据一致性监控
        • (2)缓存服务可用性监控
        • (3)异常行为监控
        • (4)工具实现

1. 为什么要设计新的数据库Schema?

数据库Schema变更(新增/修改表结构)的核心驱动力是业务需求迭代,具体场景包括:

  • 功能新增:比如用户系统需要新增“会员等级”字段,需在user表中添加member_level列;
  • 性能优化:原表字段冗余导致查询缓慢,需拆分表(如将order表的物流信息拆到order_logistics表);
  • 数据规范调整:原字段类型不符合业务发展(如phone字段从varchar(10)扩容到varchar(20)支持国际号码);
  • 兼容性适配:支持新业务模式(如从单币种支付升级为多币种,需新增currency_type字段)。

本质是让数据存储结构与业务逻辑匹配,避免因Schema僵化导致业务迭代受阻或性能瓶颈。

2. 怎么保证新的Schema不污染老的,及项目上线注意事项?

(1)避免新Schema污染老Schema的核心原则:隔离性 + 兼容性
  • 物理隔离:新业务逻辑优先使用新表(如user_v2),而非直接修改老表;若需扩展老表,通过新增字段实现(禁止删除/修改老字段,避免影响依赖老字段的代码)。
  • 逻辑隔离:用“字段标识”区分新老数据(如schema_version字段,1代表老结构,2代表新结构),代码层面按版本处理逻辑。
  • 兼容性设计:新Schema需兼容老数据(如新增字段设置默认值,避免NULL导致老代码报错)。
(2)上线注意事项:灰度发布 + 回滚预案
  • 分阶段上线
    1. 先发布“仅读取新Schema”的代码(不写入),验证新结构可用性;
    2. 再发布“读写新Schema”的代码,同时保留老Schema的读写能力(双写);
    3. 待新数据稳定后,逐步下线老Schema的依赖。
  • 禁止大事务变更:如ALTER TABLE加字段时,用“Online DDL”工具(如pt-online-schema-change)避免锁表,尤其在核心表(如订单表)上。
  • 回滚预案:提前准备回滚SQL(如删除新增字段、恢复老表结构),上线失败时10分钟内可回滚。
  • 监控校验:上线后监控新表的读写QPS、错误率,对比老表数据确认一致性。

3. 怎么保证backfill(数据回填)时不丢数据?

数据回填(将老数据同步到新Schema)需保证完整性、幂等性、可追溯性,关键措施:

  • 全量扫描 + 增量同步
    1. 全量:按主键范围分批扫描老表(如id BETWEEN 1 AND 10000),避免一次性扫描导致内存溢出;
    2. 增量:记录全量同步的“时间戳”,之后通过binlog监听老表变更,实时同步到新表(避免全量期间的新数据丢失)。
  • 幂等性处理:回填逻辑必须支持重复执行(如用INSERT IGNOREON DUPLICATE KEY UPDATE),防止因重试导致数据重复。
  • 校验机制
    • 数量校验:回填后对比新表与老表的记录数(允许少量延迟,需在阈值内);
    • 抽样校验:随机抽取1%的记录,对比新老表字段值是否一致;
    • 校验失败时,自动记录异常ID到错误表,人工介入修复。
  • 限流与监控:回填时限制QPS(如每秒1000条),避免压垮数据库;监控回填进度、失败率,设置告警(如失败率>0.1%触发告警)。

4. Cache的一致性怎么保证(写回/写穿)?

缓存与数据库的一致性需根据业务场景选择策略,核心是避免“缓存脏数据”(缓存与数据库数据不一致):

(1)写穿(Write-Through):同步更新缓存
  • 流程:更新数据库时,同步更新缓存(若缓存不存在则插入,存在则覆盖)。
  • 优点:缓存与数据库实时一致,适用于读多写少、一致性要求高的场景(如用户余额)。
  • 缺点:写操作耗时增加(需同时更新DB和Cache),可能因Cache故障阻塞DB更新。
(2)写回(Write-Back):异步更新缓存
  • 流程:更新数据库后,不立即更新缓存,而是标记缓存失效(删除缓存),下次读请求时从DB加载最新数据并更新缓存。
  • 优点:写操作性能高(仅需更新DB),适用于写频繁、一致性要求不严格的场景(如商品浏览量)。
  • 缺点:删除缓存后、下次读之前存在“缓存空窗期”,可能导致短暂的DB压力上升。
(3)关键优化:避免缓存不一致的细节
  • 先更新DB,再删除缓存(而非先删缓存再更DB,避免并发场景下的脏数据);
  • 缓存设置合理的TTL(过期时间),即使出现脏数据,也能在TTL后自动失效;
  • 对核心业务(如支付),用“双删+重试”机制:更新DB后删缓存,延迟1秒再删一次(避免删除缓存时DB事务未提交导致的不一致)。

5. 有没有监控来保证Cache的数据没有问题?

需通过多维度监控验证缓存数据的准确性、可用性和性能,关键监控项:

(1)数据一致性监控
  • 缓存命中率:若命中率骤降(如从90%降到50%),可能是缓存失效策略异常或脏数据导致;
  • 缓存与DB对比校验:定时抽样(如每小时)对比缓存与DB的关键字段(如用户余额、商品库存),记录不一致率(阈值通常<0.1%);
  • 缓存空值监控:若缓存中大量存在NULL值,可能是查询不存在的key导致,需优化缓存穿透防护。
(2)缓存服务可用性监控
  • 缓存节点状态:监控Redis集群的主从切换、节点存活数(如集群应有3主3从,若主节点<2则告警);
  • 响应时间:缓存读写响应时间(P99应<10ms),超时可能是网络或内存碎片问题;
  • 内存使用率:若接近maxmemory阈值(如>90%),需警惕缓存淘汰策略导致的关键数据被删除。
(3)异常行为监控
  • 缓存穿透:监控“不存在的key”的查询频率,若某类key高频命中不存在(如恶意攻击),需用布隆过滤器拦截;
  • 缓存雪崩:监控某一时刻大量key同时失效的情况(如QPS突降后骤升),需通过TTL加随机偏移量避免;
  • 大key监控:缓存中单个key体积过大(如>10MB)会导致读写延迟,需拆分或压缩。
(4)工具实现
  • 用Prometheus+Grafana采集缓存指标(如Redis的redis_exporter);
  • 自定义监控脚本(如Python脚本定时校验缓存与DB一致性),通过AlertManager发送告警到钉钉/邮件。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/3 0:38:06

政务热线智能化:Kotaemon实现政策文件精准引用

政务热线智能化&#xff1a;Kotaemon实现政策文件精准引用 在政务服务日益追求“高效、透明、可追溯”的今天&#xff0c;一个看似简单的市民来电——“我失业了&#xff0c;能领多少补助&#xff1f;”——背后却牵动着整套政策体系的运转。传统的政务热线依赖人工坐席翻查文件…

作者头像 李华
网站建设 2026/4/2 3:26:25

30.从下往上从右往左设置搜索区域

1.请使用合适的工具和脚本完成对图片 1的操作,要求有如下 1使用lmage 中的图片,穴位中的形状共有两种: 半个圆饼,箭头,使用脚本计算所有的图形的个数,打印显示在图片左上角位置,要求显示 HalfCirc个数,Arrow 个数,图形总数个数; (20 分) 模板计数、显示。 2使用 ima…

作者头像 李华
网站建设 2026/4/3 3:57:08

Kotaemon RSS订阅集成:实时获取最新资讯

Kotaemon RSS订阅集成&#xff1a;实时获取最新资讯 在智能客服、虚拟助手和企业知识系统日益普及的今天&#xff0c;一个常被忽视但至关重要的问题浮出水面&#xff1a;如何让AI说“新话”&#xff1f; 我们见过太多这样的场景——用户问&#xff1a;“最近有没有关于数据安全…

作者头像 李华
网站建设 2026/3/20 1:46:36

Kotaemon能否防止敏感信息泄露?权限控制机制详解

Kotaemon能否防止敏感信息泄露&#xff1f;权限控制机制详解 在企业级AI系统日益普及的今天&#xff0c;一个智能对话代理不仅能回答问题&#xff0c;更必须确保不会“说错话”——尤其是当它连接着成千上万条内部文档、客户数据和敏感政策时。检索增强生成&#xff08;RAG&…

作者头像 李华
网站建设 2026/3/25 10:01:10

Kotaemon支持LDAP目录服务集成吗?组织架构同步

Kotaemon支持LDAP目录服务集成吗&#xff1f;组织架构同步 在企业级智能对话系统日益普及的今天&#xff0c;一个常被忽视但至关重要的问题浮出水面&#xff1a;AI代理如何理解“你是谁”以及“你属于哪个部门”&#xff1f; 这个问题看似简单&#xff0c;实则牵动整个系统的安…

作者头像 李华