news 2026/4/3 5:03:06

JVET-AI0084

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
JVET-AI0084

一、ALF 的原有问题(ECM-13.0 中存在的问题)

1. APS-ALF 系数跨帧复用但缺乏自适应能力

在 ECM-13.0 中:

  • 非固定 APS-ALF 的滤波系数:

    • 由编码器针对某一帧优化
    • 可被后续多帧复用
  • 解码端对所有使用该 APS 的帧:

    • 以相同强度应用 ALF 校正

👉 问题在于:

不同帧在内容特性、QP、噪声水平上存在显著差异,而滤波强度保持不变


2. 滤波强度不匹配导致 RD 性能受限

具体表现为:

  • 对某些帧:

    • ALF 校正偏弱,去噪不足
  • 对另一些帧:

    • ALF 校正偏强,产生过平滑
  • 这种失配:

    • 无法通过 CTU 级 ALF on/off 完全解决
    • 影响整体 RD 性能

📌 本质问题:

ALF 只能“开或关”,但“强度不可调”


3. 重新估计 APS 系数代价高

  • 若为每帧重新生成 APS-ALF:

    • 增加编码复杂度
    • 增加 APS signaling 开销
  • ECM-13.0 中缺乏:

    • 轻量级的帧级强度调节机制

二、AI0084 提出的解决方法(ALF residuals scaling)

1. 核心思想:缩放 ALF 残差而非修改滤波器

AI0084 不改变:

  • ALF 滤波结构
  • APS-ALF 系数本身

而是对ALF 产生的校正残差引入缩放因子

rec′(s)=rec(s)+corr(s)⋅scale23 rec'(s) = rec(s) + \frac{corr(s) \cdot scale}{2^3}rec(s)=rec(s)+23corr(s)scale

其中:

  • (corr(s)):ALF 计算得到的校正残差
  • (scale):缩放因子

👉 实现“滤波强度可调”


2. 缩放因子的信令方式(轻量级)

(1)按 Slice 信令

  • 缩放因子在slice header中传输
  • 不引入 CTU 级额外信令

(2)Luma 支持按 class 分组缩放

  • luma 的 25 个 ALF class index:

    • 按组划分
    • 每组共享一个 scaling factor
  • 通过:

    • idxGroup决定组数
    • idxScale[n]指定每组缩放因子

📌 允许:

  • 不同纹理 / 活动度区域
  • 使用不同 ALF 强度

(3)Chroma 使用单一缩放因子

  • 每个 chroma 分量:

    • 仅信令一个 scaling factor
  • 控制复杂度和比特开销


3. 缩放因子查表实现,复杂度极低

  • 缩放因子值来自SPS 预定义表

  • 实现为:

    • 整数乘法 + 移位
  • 不引入额外浮点或复杂运算


4. 带来的效果

  • 不改变 APS-ALF 系数的前提下:

    • 适配不同帧特性
    • 改善 RD 性能
  • 实验结果表明:

    • RA / LDB / LDP 下均有稳定 BD-rate 降低
    • 编码与解码复杂度几乎不变

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/11 13:26:49

AI人脸隐私卫士能否用于社交App?用户头像自动处理

AI人脸隐私卫士能否用于社交App?用户头像自动处理 1. 引言:社交场景下的隐私痛点与技术破局 随着社交媒体的普及,用户在分享生活瞬间的同时,也面临着日益严峻的人脸信息泄露风险。一张合照中可能包含多位用户的面部特征&#xf…

作者头像 李华
网站建设 2026/3/30 16:28:33

MySQL如何批量更新数据:高效方法与最佳实践

在数据库操作中,批量更新数据是常见的需求场景。无论是数据迁移、数据修正还是批量处理业务逻辑,掌握高效的批量更新方法都能显著提升开发效率和系统性能。本文将深入探讨MySQL中批量更新数据的多种方法及其适用场景。 一、为什么需要批量更新&#xff1…

作者头像 李华
网站建设 2026/4/1 19:06:40

地图导航测试用例,一篇文章梳理!

地图导航是我们经常使用的工具,能帮助我们指引前进的方向。 这一篇文章,从功能测试、UI测试、兼容测试、安全测试、网络测试、性能测试、易用性测试、文档和国际化语言测试8个方面来编写地图导航测试用例。 一 功能测试 1. 输入起点和终点&#xff0c…

作者头像 李华
网站建设 2026/4/3 4:59:15

从零开始学AI对话:Qwen2.5极速版手把手教学

从零开始学AI对话:Qwen2.5极速版手把手教学 1. 学习目标与前置知识 本教程将带你从零开始,快速上手使用 Qwen/Qwen2.5-0.5B-Instruct 极速对话机器人 镜像,实现一个支持中文问答与代码生成的本地化AI聊天应用。无论你是AI初学者还是希望在边…

作者头像 李华
网站建设 2026/3/27 17:12:55

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够…

作者头像 李华
网站建设 2026/3/31 11:46:01

MediaPipe实战指南:AI人脸隐私卫士系统部署

MediaPipe实战指南:AI人脸隐私卫士系统部署 1. 引言 1.1 AI 人脸隐私卫士 - 智能自动打码 在社交媒体、公共传播和数据共享日益频繁的今天,个人面部信息的泄露风险急剧上升。一张未经处理的合照可能无意中暴露多位当事人的生物特征,带来潜…

作者头像 李华