免费网站浏览器,江苏城乡建设官网,国外网站建设平台,粉色做网站背景图片一、提案主要内容总结
提案标题#xff1a;EE2-1.14: An extrapolation filter-based intra prediction mode (EIP)
基于外推滤波的帧内预测模式提出单位与作者#xff1a;
单位#xff1a;OPPO作者#xff1a;Luhang Xu, Yue Yu, Haoping Yu, Jonathan Gan, Dong Wang联系…一、提案主要内容总结提案标题EE2-1.14: An extrapolation filter-based intra prediction mode (EIP)基于外推滤波的帧内预测模式提出单位与作者单位OPPO作者Luhang Xu, Yue Yu, Haoping Yu, Jonathan Gan, Dong Wang联系方式xuluhangoppo.com目标与背景本提案旨在引入一种新的帧内预测方法——外推滤波预测模式Extrapolation Filter-based Intra Prediction, EIP用于提升视频编码效率。该方法通过利用邻近已重建像素或继承历史块中的滤波器系数来生成当前块的预测信号。核心思想EIP 模式包含三个主要步骤获取外推滤波器系数从邻域区域计算或从前序块继承按对角线顺序生成预测值根据预测块梯度推导预测角度并用于后续变换核选择MTS/NSST/LFNST应用限制仅适用于亮度分量luma only块大小不超过 32×321.1 外推滤波器EIP Filter设计三种预定义滤波器形状共15个输入1个输出形状输入分布描述Shape A十字交叉型十字中心为当前预测点上方和左侧采样Shape B倾斜型沿主对角线方向排列Shape C分散型覆盖更广邻域图见原文 Figure-1每个滤波器有 15 个输入位置1 个输出即当前预测点获取滤波器系数的方式方法一本地推导Local Derivation使用当前块周围的已重建像素构造训练样本。定义两种重构区域类型上方区域above region左侧区域left region区域尺寸取决于min(blockWidth, blockHeight)和所选滤波器形状。示例8×16 块 4×4 滤波器 → aboveSize leftSize min(8,16)4−1 11利用滑动窗口在区域内移动滤波器构建自相关矩阵 $ R $互相关向量 $ r $解线性方程组 $ R \cdot c r $ 得到滤波器系数 $ c $类似 CCCM 方法。方法二继承机制Merge Mode引入EIP Merge 模式允许复用先前编码块的滤波器参数形状 系数。解码器先解码一个标志位eip_merge_flag若为真则进一步解码merge_indexMerge 候选列表最多支持 12 个候选经重排序后保留最多 6 个。候选来源包括空间相邻Spatial adjacent非相邻空间Non-adjacent时间参考Temporal移位时间Shifted temporal历史缓存History-based排序依据使用 1 行 1 列模板区域的 SAD 成本进行评估关键优化SAD 计算中可并行应用各候选滤波器无需串行依赖1.2 当前块预测过程预测顺序从左上到右下按对角线扫描diagonal raster order如 Figure-3 所示预测公式pred(x,y)∑i014ci×t(x−offsetXi,y−offsetYi) \text{pred}(x, y) \sum_{i0}^{14} c_i \times t(x - \text{offsetX}_i, y - \text{offsetY}_i)pred(x,y)i0∑14ci×t(x−offsetXi,y−offsetYi)其中$ c_i $第 i 个滤波器系数$ t(\cdot) $邻域或已预测位置的重建样本值$ (\text{offsetX}_i, \text{offsetY}_i) $对应滤波器形状的相对坐标偏移注意由于是逐像素对角推进所有输入样本均已重建或已预测保证无数据依赖问题1.3 后续变换控制Transformation Guidance对生成的完整预测块分析其内部梯度方向推导出一个等效“预测角度”将此角度映射到标准帧内模式如 Planar、DC、Angular modes利用该模式决定是否启用MTSMultiple Transform SelectionNSSTNon-Separable Secondary TransformLFNSTLow-Frequency Non-Separable Transform实现预测与变换之间的协同优化编码性能测试结果ECM-11.0 平台测试配置AIAll Intra配置RARandom Access未提供结果空表结果对比测试项Y (%)U (%)V (%)EncT (%)DecT (%)EE2-TEST-1.14a (EIP only)-0.12-0.09-0.07101.6100.9EE2-TEST-1.14b (EIP Merge)-0.20-0.14-0.18102.1101.3注负值表示码率节省BD-rate reductionEncT/DecT 表示编码/解码时间开销相对于 anchor 的百分比✅结论EIP 在 AI 场景下有效尤其加入 merge 模式后增益翻倍但带来约 2% 编码复杂度上升。二、改进建议与未来方向尽管 EIP 显示出一定潜力但仍存在以下可改进之处✅ 改进方向一降低复杂度问题每 CU 都需求解最小二乘问题矩阵求逆计算代价高建议引入查表法LUT-based coefficient approximation或采用固定基函数组合 权重学习类似神经网络轻量化可限定只在特定纹理区域启用 EIP如边缘检测触发✅ 改进方向二扩展至色度分量当前仅限亮度但色度也可能受益于结构外推可探索共享亮度端获得的滤波器参数用于色度预测跨分量复用✅ 改进方向三增强 Merge 候选管理当前最多 6 个候选可考虑动态去重或基于上下文的概率预测减少索引比特引入“skip merge list construction”标志以跳过无效区域候选✅ 改进方向四结合 AI 方法进行初始化可训练轻量 CNN 或 MLP 快速估计初始滤波器系数作为迭代起点减少传统 LSM 的迭代次数✅ 改进方向五支持更大块32×32的分层预测当前提案限制 ≤32×32不利于大帧场景可将大块划分为子块统一使用同一滤波器参数共享提升一致性✅ 改进方向六显式传输高收益滤波器模板统计发现某些滤波器形状频繁出现可定义若干“公共滤波器模板”放入码流头中支持直接索引调用节省语法开销三、总结项目内容提案名称EE2-1.14: 基于外推滤波的帧内预测模式EIP核心技术外推滤波器 本地学习/继承机制 对角预测 变换引导优势AI 场景下 BD-rate 最多节省 -0.20%Y劣势编码时间增加 ~2%仅支持亮度和小块未来方向降复杂度、拓展至 Chroma、引入模板库、AI 加速实现可行性高已有类似 CCCM 技术基础易于集成至 VVC/JEM 架构