北京下雪了,我先来拍两张。——咔嚓!
图像是最为普及的一种信息载体。而对于如何改善图像质量,提高图像的清晰度,就变成了一个图像处理领域的难题,图像超分辨率技术因此而生,并成功应用到了计算机图像视觉、医学等领域。
近日,小米雷军发微博表示,“来自小米最新出炉的论文,基于弹性搜索在图像超分辨率问题上取得了令人震惊的结果,该模型已开源。”随后与网友评论互动中,雷军还指出“现在相机技术高度依赖人工智能图像技术的进步!”可以看出,这项成果可能在不久的将来会在小米的硬件产品中得到应用。
论文的全称为《Fast, Accurate and Lightweight Super-Resolution with Neural Architecture Search》(论文下载链接:https://www.paperweekly.site/papers/2786),论文基于弹性搜索(宏观+微观)在超分辨率问题上取得了令人震惊的结果。在相当的 FLOPS 下生成了多个模型,结果完胜 ECCV 2018 明星模型 CARNM(乘加数参数数量少,PNSR/SSIM 指标高,文中称 dominate),这应该是截止至 2018 年可比 FLOPS 约束下的 SOTA(涵盖 ICCV 2017 和 CVPR 2018)。而达到这样的效果,论文基于一台 V100 用了不到 3 天时间。
此外,论文还给出了几个前向模型。要知道上一篇论文中他们初步结果是击败 CVPR 2016,才半个月时间就提升这么大,这也进一步验证了 AutoML NAS 技术的强大和可怕。需要指出的是,该项技术具有一定的普适性,理论上可以应用于任何监督学习,值得关注和学习。
好文章,需要你的鼓励
卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。
这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。
腾讯混元团队联合北京大学提出MixGRPO技术,通过混合ODE-SDE采样策略和滑动窗口机制,将AI图像生成训练效率提升50%-71%,同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略,专注于图像生成早期阶段的重点优化,并引入高阶求解器进一步加速训练过程,为AI图像生成的产业化应用提供了更高效可行的解决方案。