论文学习 技术核心 / Core-Tech 系列: 图像复原论文阅读

图优化与深度图超分辨率:DGOSR 读书笔记

Paper

Deep Graph Optimization for Depth Super-Resolution

Venue
论文阅读
Task
深度图超分辨率

问题背景

深度图(Depth Map)天然具有 大范围平滑区域 + 清晰物体边缘 的特性,非常适合用图信号建模:像素为顶点,像素间关系为边。

传统图优化方法需要构建 HW×HWHW \times HW 的全局相似度/拉普拉斯矩阵,计算与内存开销巨大。GraphSR 作为深度学习+图优化的先驱,直接学习全局拉普拉斯矩阵,参数量仍然非常高。

核心矛盾:如何在保持甚至提升重建质量的前提下,极大降低计算量和参数规模?

DGOSR 的三步创新

1. Kronecker 分解

将大相似度矩阵 SRHW×HWS \in \mathbb{R}^{HW \times HW} 分解为:

SSHSWS \approx S_H \otimes S_W

其中 SHRH×HS_H \in \mathbb{R}^{H \times H}(行方向)、SWRW×WS_W \in \mathbb{R}^{W \times W}(列方向)。

复杂度从 O(H2W2)O(H^2W^2) 降至 O(H2+W2)O(H^2 + W^2)

2. 统一一步优化模型

传统流程:先构建相似度 → 再固定相似度做图优化,两步之间存在信息割裂。

DGOSR 将相似度矩阵学习、拉普拉斯正则化、图优化求解整合到同一个目标函数中:

  • 深度估计反馈相似度学习
  • 相似度约束深度解的平滑/边缘
  • 减少模块间信息损失

3. ADMM 展开为深度网络

对统一优化模型设计 ADMM 求解算法,每步迭代有闭式解。将 TT 次迭代展开为网络的 TT 层:

  • 更新深度变量 / 辅助变量 / 拉格朗日乘子 / 相似度矩阵
  • 正则权重、步长等参数变为可学习参数
  • 端到端训练,兼具可解释性与表达能力

实验结果

在 Middlebury / NYU v2 / Lu / RGBDD 四个数据集上,×4,×8,×16\times 4, \times 8, \times 16 放大倍数:

对比项GraphSRDGOSR
参数量基准约 1/56
RMSE基准全面更优

消融实验验证了 Kronecker 分解、统一一步模型、ADMM 展开三个模块各自的必要性。

小结

DGOSR 的核心思路是 「分解 + 统一 + 展开」

  1. 分解:Kronecker 积降低矩阵规模
  2. 统一:一步优化减少信息损失
  3. 展开:ADMM 迭代转为可训练网络

未来方向包括推广到去噪、去模糊等任务,以及更大规模场景下的扩展性研究。

相关阅读