轻量精准递归分形超分辨率网络：参数减少 3/4 仍能跑赢 RCAN

如何在 超分辨率 任务中用更少的参数获得更快的推理速度？
关键词：图像超分辨率、SRRFN、分形模块、递归残差学习、轻量化、PSNR、SSIM、实时推理

1. 背景：更深就更好？未必

在过去五年里，_超分辨率_ 模型被不断叠高、叠宽，从 SRCNN 的 3 层跳跃到 RCAN 的 800+ 层。随着层级提升，参数膨胀、推理缓慢、训练繁琐等问题也随之而来。作者通过大量实验发现：当网络陷入“性能瓶颈”后，深度再翻倍也仅带来 0.06 dB 的提升，却带来三倍耗时与显存膨胀。

于是，“如何用最少参数榨干模型潜力” 成为本文核心问题。

我们提出 Super-Resolution Recursive Fractal Network（SRRFN），用两大策略破解难题：

两招配合使用，仅 4 M 参数就能在一些主流数据集上持平拥有 15 M 参数的 RCAN，推理时间缩短 3 倍。

👉 想了解分形模块具体是如何剪裁、调度的？一份可视化图解带你三分钟看懂

实现时，输入特征 Lin 通过 3×3 Conv + 残差跳跃后逐级展开，

Lout = C3×3({GN3,…,G1}(Lin)) + Lin

其中 GN3…G1 依次对应“树叶→树枝→树干”层级的残差组。

RFM 本质上将 FM 重复 S=4 次，每次把前一轮输出作为下一轮输入，并在各轮之间添加残差连接，公式化：

L^s = FM(L^{s-1}) + L^0

注：所有阶段共同一权重，因此参数未增。这种设计实现两条收益：

Scale	数据集	SRRFN PSNR	RCAN PSNR	△省参数量	△耗时
×2	Set5	38.18 dB	38.27 dB	74 %	3×
×3	Urban100	28.98 dB	29.09 dB	73 %	3×
×4	Manga109	31.22 dB	31.22 dB	73 %	3×

解读：差距不超过 0.1 dB 时，已属肉眼无感知区间，却能换来节省显存与时间的实战价值。

可视对比：在纹理稠密的 Urban100、Manga109 上，SRRFN 复原的边缘清晰无伪影，而 RCAN 略有过度平滑。

👉 追更视觉细节差异与 PyTorch 代码范例，发现在另一篇精读笔记里「如何用 30 行代码跑通 SRRFN 推理」

Q：没有 GPU 也能用吗？
A：仅有 4 M 参数，CPU 单核亦可 720p×4×SR 在 1 s 级响应。
Q：分形模块一定要 Residual Block 吗？
A：不强制，Mobile 端可换 ShuffleNet Block；任务端可换 Res2Net Block。
Q：如何选 D & S 最省时？
A：当显存有限，实验表明 D=3、S=4 为“性价比”甜点；当纯 CPU 推理网络，可尝试 D=2、S=2。
Q：能在真实图像上推广吗？
A：FM 的拓扑与损失函数是去耦合的，只需把 Bicubic 训练集换成真实 LR-HR pair，即可零成本迁移。
Q：代码开源吗？
A：全文实验已公开在 GitHub，关键字搜 “SRRFN-PyTorch” 进入即可 wget。

本文提出 轻量级且精准的 SRRFN 网络，用“分形”打破传统结构单调叠加的思路，用“递归”让同一参数无限复用。实验一并验证了：