论文学习 技术核心 / Core-Tech 系列: 图像复原论文阅读
LGCNet 解读:从像素一致性到梯度一致性
Paper
Laplacian Gradient Consistency Prior for Flash Guided Non-Flash Image Denoising
- Task
- 闪光引导非闪光图像去噪
- Paper
- 阅读原文
问题
闪光灯引导的非闪光图像去噪:利用成对闪光/非闪光图像实现跨模态引导去噪。
现有方法的局限:
- 像素级建模一致性 → 边缘模糊、伪影
- 闪光/非闪光图像间存在阴影、反射、亮度差异,像素差 不服从高斯分布
关键发现
在 1800+ 对图像上实验发现:
像素差 在不同图像间变化显著,而梯度差 分布规律,与拉普拉斯分布曲线高度吻合。
这意味着在梯度域建模跨模态一致性,远优于像素域。
方法:LGC 模型
将带噪非闪光图像 、干净闪光图像 、目标干净非闪光图像 的关系建模为:
其中 为梯度算子, 服从拉普拉斯分布, 为噪声。
转化为优化问题后,使用 ADMM(交替方向乘子法) 求解:
- 引入辅助变量 (将去噪惩罚 与模态约束解耦)
- 引入辅助变量 (将 约束解耦)
LGCNet:ADMM 展开网络
将 LGC 模型的 ADMM 迭代求解过程展开为可训练网络:
| 模块 | 对应 ADMM 步骤 |
|---|---|
| INM(初始化模块) | 初始估计 |
| GDM(引导去噪模块 ×J) | 迭代更新深度变量 |
| RPP(正则化参数预测单元) | 更新拉格朗日乘子 |
| NFR(非闪光恢复单元) | 恢复非闪光图像 |
| AVU(辅助变量更新单元) | 更新 |
| DPU(去噪惩罚更新单元) | 更新 |
每个组件都有明确的数学意义,对应 LGC 求解的特定步骤,赋予网络可解释性。
实验结果
定量
在 FAID、MID、DPD 三个数据集上, 噪声水平下,LGCNet 在所有配置上取得了 最佳 PSNR 和 SSIM。
对比方法包括:BM3D、WNNM、DnCNN、FFDNet、CU-Net、MN、RIDFnF。
定性
相比其他方法,LGCNet 保留了更多的文本、颜色和纹理细节。
中间特征可视化
随着迭代次数增加,梯度模态差 逐渐逼近真实梯度差 ,验证了方法有效性。
消融实验
分析了三个关键设计选择:
- GDM 模块数量:更多迭代 → 更好性能,但收益递减
- 拉普拉斯算子:梯度算子选择对结果有影响
- 损失函数:验证当前损失设计的合理性
总结
LGCNet 的核心贡献是将「跨模态一致性」从 像素层 提升到 梯度统计层:
- 发现梯度差服从拉普拉斯分布
- 建立拉普拉斯梯度一致性(LGC)模型
- ADMM 展开为可解释网络 LGCNet
未来方向:探索未配对/未对齐图像间的一致性,以及跨帧跨模态的引导视频去噪。
相关阅读
Tech图像复原论文阅读
图优化与深度图超分辨率:DGOSR 读书笔记DGOSR 通过 Kronecker 分解与 ADMM 展开网络,在降低 56 倍参数量的同时实现 SOTA 深度图超分辨率。
Tech博客建设
从这里开始:这个博客会写什么一篇给第一次来的读者看的入口,记录这个博客现在会写什么,以及我接下来想开始学什么。
Tech算法竞赛基础
C++ 竞赛常用技巧速查字符串转数字、环形处理、快速幂、坐标变换、vector 去重等竞赛常用代码片段。