news 2026/4/3 4:57:10

Buddy分配器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Buddy分配器

Buddy分配器

1. 内核在基本的伙伴分配器基础改进扩展

支持内存节点和区域,称为分区的伙伴分配器(zoned buddy allocator)。
为了预防内存碎片,把物理页框通过移动性分组。
针对分配单页做了性能优化,为了减少处理器锁的竞争,在内存区域增加了1个每处理器页集合。

2. 分区的伙伴分配器源码分析

2.1 数据结构

#defineMAX_ORDER11// MAX_ORDER是最大阶数,实际上最大可分配的是最大阶数加1,默认值是11,意味着伙伴分配器一次最多可以分配2^10页。structfree_area{structlist_headfree_list[MIGRATE_TYPES];// 不同类型的空闲区域unsignedlongnr_free;};structzone{/* ... */structfree_areafree_area[MAX_ORDER];/* ... */};

2.2 根据分配标志获取首选区域类型

内核使用GFP_ZONE_TABLE定义了标志组合到区域类型的映射表。其中GFP_ZONES_SHIFT是区域类型占用的位数。GFP_ZONE_TABLE把每种标志组合映射到32位整数的某个位置,偏移是(标志组合 * 区域类型位数),从这个偏移开始的GFP_ZONES_SHIFT个二进制位存放区域类型。

3. 备用区域列表 (Zonelist)

借用必须遵守规则:
一个内存节点的某个区域类型可以从另一个内存节点的相同区域类型借用物理页,比如节点0的普通区域可以从节点1的普通区域借用物理页。
高区域类型可以从低区域类型借用物理页,比如普通区域可以从DMA区域借用物理页。
低区域类型不能从高区域类型借用物理页,比如DMA区域不能从普通区域借用物理页。

包含所有内存节点的备用区域列表有两种排序方法:

  1. 节点优先顺序:先根据节点距离从小到大排序,然后在每个节点里面根据区域类型从高到低排序。优点是优先选择距离近的内存,缺点是在高区域耗尽以后使用低区域。
  2. 区域优先顺序:先根据区域类型从高到低排序,然后在每个区域类型里面根据节点距离从小到大排序。优点是减少低区域耗尽的几率,缺点是不能保证优先选择距离近的内存。

默认的排序方法就是自动选择最优的排序方法:比如是64位系统,因为需要DMA和DMA32区域的备用相对少,所以选择节点优先顺序;如果是32位系统,选择区域优先顺序。

4. 区域水位 (Watermarks)

数据结构如下:

enumzone_watermarks{WMARK_MIN,WMARK_LOW,WMARK_HIGH,NR_WMARK};structzone{/* ... */unsignedlongwatermark[NR_WMARK];// 该区域各种水线/* ... */};

最低水位以下的内存称为紧急保留内存,在内存严重不足的紧急情况下,给承诺“分给我们少量的紧急保留内存使用,我可以释放更多的内存”的进程使用。

Watermark水位控制内核选用了几个重要参数:

  • managed_pages: 伙伴分配器管理的物理页的数量
  • spanned_pages: 当前区域跨越的总页数,包括空洞
  • present_pages: 当前区域可用的所有物理页的数量,包括空洞

它们三者之间的关系:spanned_pages > present_pages > managed_pages

min_free_kbytes的计算:
min_free_kbytes代表的是系统保留空闲内存的最低限度。watermark[WMARK_MIN]的值是通过min_free_kbytes计算出来的。

5. 分区的伙伴分配器核心函数

入口函数:__alloc_pages_nodemask

参数说明:

  • gfp_mask: 分配标志(掩码)
  • order: 阶数
  • zonelist: 首选内存节点的备用区域列表
  • nodemask: 允许从哪些节点分配。如果是NULL,表示允许从所有节点分配。

5.1 快速路径分配页框

函数get_page_from_freelist用于尝试从备用区域列表的区域中分配页框。

它会遍历zonelist,对于每个zone,检查是否满足水位要求(zone_watermark_ok)。如果满足,则尝试从该zone分配。

5.2 慢速路径调用和遇到内存紧缺时的分析

如果在快速路径中分配失败,则会进入慢速路径(__alloc_pages_slowpath)。
慢速路径包含了更复杂的逻辑,例如:

  • 唤醒页回收线程(kswapd)。
  • 忽略水位限制进行分配(如果是紧急分配)。
  • 直接内存回收(Direct Reclaim)。
  • 调用 OOM Killer(如果配置允许)。
  • 重试分配等。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/23 10:42:25

提示工程的认知架构设计:架构师的深度思考

提示工程的认知架构设计:架构师的深度思考 引言:AI时代的认知革命 在人工智能技术迅猛发展的今天,提示工程(Prompt Engineering)已经从一项简单的交互技巧演变为一门系统的工程学科。作为架构师,我们需要超越表面的指令编写,深入思考提示工程背后的认知架构设计。这不仅…

作者头像 李华
网站建设 2026/3/28 6:51:28

系列教程十三 | 探索阿里云 Wan 2.1:零基础入门文本生成视频教程

一.背景介绍近年来,人工智能内容生成(AIGC)在视频创作领域取得了突破性进展,其中文本到视频(Text-to-Video)生成技术因其在内容创作、广告营销和教育可视化等方面的巨大潜力而备受关注。Wan 2.1作为阿里云推…

作者头像 李华
网站建设 2026/3/21 8:43:22

MCU+AT架构的演进:向OpenCPU转型的必然性(完结篇)

上一篇在充分理解了OpenCPU的技术优势与架构潜力后,一个现实而关键的问题摆在工程师及企业面前:如何在实际工程中,将现有的MCUAT模组架构,安全、平滑地演进至OpenCPU平台?第六章:迁移与融合策略——从MCUAT…

作者头像 李华
网站建设 2026/4/1 10:58:14

串口通信学习

串口道信抗干扰能力低——>RS232(提升了电平大小增加抗干扰能力)——>RS485(差分线形式增加抗干扰能力)

作者头像 李华
网站建设 2026/3/22 1:51:51

3.6-Web后端基础(java操作数据库)

目录 前言 JDBC 介绍 查询数据 需求 准备工作 代码实现 代码剖析 ResultSet 预编译SQL SQL注入 SQL注入解决 性能更高 增删改数据 需求 代码实现 Mybatis 介绍 快速入门 辅助配置 配置SQL提示 配置Mybatis日志输出 JDBC VS Mybatis 数据库连接池 介绍…

作者头像 李华