7月13日,在深圳华为总部G区旗舰店,华为举办2023创新与知识产权(IPR)论坛。对于此次创新与知识产权保护论坛,华为以开放、合作、共赢的理念,促进专利和技术的合理保护和共享,从而推动产业的创新和发展。活动现场,华为官方对于自己的技术创新进行了一次总结,并归纳为五大代表,它们分别为:5.5G、音视频双Vivid、智能汽车GOD网络、智能手机十档可变光圈&非牛顿流体屏、运筹优化技术。
此次华为公布的五大创新技术代表中,“智能手机十档可变光圈”可能是大家最为熟悉的技术之一,此前,在这项技术刚刚出现在华为手机上时,曾经引发了影像爱好者的广泛关注。据悉,这项技术基于华为此前申请的“一种可变光圈结构、摄像模组及电子设备”专利延伸而来,并于2022年下半年开始在华为Mate 50系列上量产。这是业界首次在手机上采用类似设计,也是华为在手机上的又一次突破性创新。
目前,市面上已经使用了可变光圈技术的产品,主要是华为的各系列旗舰机型,其中,华为P60系列就发布于今年上半年,是华为在移动影像领域探索的最新结晶之一。
十档可变光圈:手机摄影的光圈革命,领势影像超越想象
传统相机搭载有较大体积的镜头,人们可以通过手动或者自动方式调节光圈大小,如果要获得像单反镜头一般的自然景深效果,就要厂商在手机上安装可变光圈。虽然此前一些手机厂商曾经推出过搭载可变光圈的手机产品,但两档可变光圈的适用场景非常有限,要在手机上真正实现媲美单反的多档可变光圈,无论硬件还是软件都存在多项技术难点。
华为在影像领域深耕多年,率先商用多档可变光圈,是其研发实力和技术积累最直观的体现。以华为P60 Pro这款手机为例,其支持十档可变光圈,最大光圈可达F1.4,最小光圈为F4.0。在拍摄人像照片的时候,用户可以选择开启F1.4的大光圈,这能够为手机本身带来媲美单反的景深和自然虚化效果,而这又能够并进一步塑造良好的照片氛围,突出人物主体。最终所呈现的,就是一张观感极佳的人像照片。
而在拍摄夜景画面时,大光圈则又可以带来更大的进光量,有效降低手机拍摄夜景照片时会产生的噪点,提供极佳的画面纯净度,同时保留丰富的暗部细节。通过华为P60 Pro,用户永远可以记录下这个世界最为真实的一面。
而F4.0小光圈,适合光线充足下的多人拍摄,让景深再次扩展,确保前后人物都清晰。在拍摄花朵时,也可以更好地看到花朵之外的背景。
华为P60 Pro人像样张
超聚光夜视长焦:远近皆清晰,手机长焦不再有禁区
当然,可变光圈不是华为P60 Pro这款机型在影像上唯一的创新。这项技术搭载在华为P60 Pro的主摄上,同时,华为P60 Pro还有一颗超聚光夜视长焦摄像头。这颗镜头在长焦暗光摄影上实现了堪称革命性的突破,无论远近,无论曝光时间长短,这颗镜头都能够实现相当清晰的成像效果。远到天边明月,近到萌宠,清晰、锐利、独特都是这颗镜头所能呈现的效果。
以下图为例,用户想要得到“超级月色”,只需聚焦构图,按下快门,即可将夜间美景与月色同时清楚呈现,遥远的月亮与近处的美景相互映衬,构成氛围感满满的画面,也展现了摄影师更多的艺术创作表达。
华为P60 Pro夜景样张
华为P60 Pro宠物样张
不过,为华为影像能力带来大进步的“十档可变光圈”技术,其实只是华为众多创新中的冰山一角,毕竟它也只是此次论坛五大创新代表的其中之一。而从很早以前,坚持科技创新,坚持研发投入,就是华为一直恪守的信条。
数十年如一日的投入,已然使得华为积土成山、积水成渊。据悉,华为是中国国家知识产权局和欧洲专利局2021/2022年度专利授权量排名第一的公司,也是2022年中国PCT国际专利申请量全球第一的公司。而这种耀眼成绩,与华为庞大的研发投入密不可分——2022年研发支出破1600亿,近十年研发支持超9700亿。十年内,近万亿的研发投入,堪称是“高强度”,而这种投入也带来了丰厚的回报。
将目光落到产品上,最近这一年来,不断有新技术在华为手机上实现了落地商用,除了上面提到的可变光圈技术以外,还包括昆仑玻璃、北斗卫星消息等。在有效改善用户体验的同时,和这些技术相关的专利,也成为了华为的知识产权,从而形成“投入——回报——再投入”的创新正循环。
目前,华为已经达成了这个目标,其它公司获得了先进的技术,华为也收获了应得的回报,行业更是在这种交流中实现了进步。专利收费是华为创新的结果而不是目的,合理的收费也反哺和有利于创新,有利于推动技术在业界的广泛应用。这些成果,势必会如之前提到的“可变光圈”一样,成为华为手机迈向未来的基石。在技术研发、产业合作的征途上,华为也将秉持开放、合作、共赢的理念,不断突破手机技术创新瓶颈,驱动产业升级。
好文章,需要你的鼓励
博通宣布对VMware Cloud Foundation平台进行重大升级,将私有AI服务集成到核心订阅中,并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟达合作的VMware Private AI Foundation服务、支持AMD GPU、Amazon S3兼容对象存储、与Canonical合作的Ubuntu容器镜像,以及新的四阶段自动化安全流程。博通还推出了面向高监管行业的VCF网络合规高级服务。
清华大学等多家机构研究团队完成了语音分离技术的全面调研,系统梳理了从传统方法到深度学习的技术演进。研究揭示了"鸡尾酒会问题"的核心挑战,分析了各种学习范式和网络架构的优劣,并通过统一实验框架提供了公平的性能基准。调研涵盖了实时处理、轻量化设计、多模态融合等关键技术方向,为学术界和产业界的技术选型提供了重要参考,推动语音分离从实验室走向实际应用。
Google正式发布Gemini 2.5 Flash Image模型,该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择,能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性方面表现出色,支持多轮编辑、照片融合等功能,并已集成到Gemini应用中供付费和免费用户使用。
浙江大学和腾讯微信视觉团队发现AI图片生成训练中"时机胜过强度"的重要规律,开发出TempFlow-GRPO新方法。通过轨迹分支技术精确评估中间步骤,结合噪声感知权重调整优化不同阶段的学习强度,将训练效率提升三倍,在复杂场景理解方面准确率从63%提升至97%,为AI训练方法论带来重要突破。