论文学习 技术核心 / Core-Tech 系列: 图像复原论文阅读
图优化与深度图超分辨率:DGOSR 读书笔记
Paper
Deep Graph Optimization for Depth Super-Resolution
- Venue
- 论文阅读
- Task
- 深度图超分辨率
问题背景
深度图(Depth Map)天然具有 大范围平滑区域 + 清晰物体边缘 的特性,非常适合用图信号建模:像素为顶点,像素间关系为边。
传统图优化方法需要构建 的全局相似度/拉普拉斯矩阵,计算与内存开销巨大。GraphSR 作为深度学习+图优化的先驱,直接学习全局拉普拉斯矩阵,参数量仍然非常高。
核心矛盾:如何在保持甚至提升重建质量的前提下,极大降低计算量和参数规模?
DGOSR 的三步创新
1. Kronecker 分解
将大相似度矩阵 分解为:
其中 (行方向)、(列方向)。
复杂度从 降至 。
2. 统一一步优化模型
传统流程:先构建相似度 → 再固定相似度做图优化,两步之间存在信息割裂。
DGOSR 将相似度矩阵学习、拉普拉斯正则化、图优化求解整合到同一个目标函数中:
- 深度估计反馈相似度学习
- 相似度约束深度解的平滑/边缘
- 减少模块间信息损失
3. ADMM 展开为深度网络
对统一优化模型设计 ADMM 求解算法,每步迭代有闭式解。将 次迭代展开为网络的 层:
- 更新深度变量 / 辅助变量 / 拉格朗日乘子 / 相似度矩阵
- 正则权重、步长等参数变为可学习参数
- 端到端训练,兼具可解释性与表达能力
实验结果
在 Middlebury / NYU v2 / Lu / RGBDD 四个数据集上, 放大倍数:
| 对比项 | GraphSR | DGOSR |
|---|---|---|
| 参数量 | 基准 | 约 1/56 |
| RMSE | 基准 | 全面更优 |
消融实验验证了 Kronecker 分解、统一一步模型、ADMM 展开三个模块各自的必要性。
小结
DGOSR 的核心思路是 「分解 + 统一 + 展开」:
- 分解:Kronecker 积降低矩阵规模
- 统一:一步优化减少信息损失
- 展开:ADMM 迭代转为可训练网络
未来方向包括推广到去噪、去模糊等任务,以及更大规模场景下的扩展性研究。
相关阅读
Tech图像复原论文阅读
LGCNet 解读:从像素一致性到梯度一致性LGCNet 发现闪光/非闪光图像的梯度差服从拉普拉斯分布,将跨模态一致性从像素域提升到梯度域,并通过 ADMM 展开实现可解释的去噪网络。
Tech博客建设
从这里开始:这个博客会写什么一篇给第一次来的读者看的入口,记录这个博客现在会写什么,以及我接下来想开始学什么。
Tech算法竞赛基础
C++ 竞赛常用技巧速查字符串转数字、环形处理、快速幂、坐标变换、vector 去重等竞赛常用代码片段。