作者:Imint首席执行官Andreas Lifvendahl
据工业和信息化部统计显示,目前中国累计建成并开通5G基站142.5万个,基站总数今年有望突破200万个。自5G正式商用以来,凭借其高带宽、广连接、低延时等优势,5G应用的实践逐渐从最初的单一化业务触及至更广泛的行业应用场景中。其中,扩展现实(XR)与5G的技术融合在工业、教育、医疗、旅游等领域内获得了广泛关注。
XR 是指由计算机技术和可穿戴设备生成的真实与虚拟结合、可实现人机交互的环境,它包含了VR(虚拟现实)、AR(增强现实)、MR(混合现实)、HR(全息现实)和其他多种视频呈现形式和交互方法。
包括中国在内的全球市场一直以来都非常重视以虚拟现实为代表的XR的发展。根据Counterpoint Global XR(VR/AR) 最新的预测,XR头显设备出货量预计将从2021年的1100万台增长到 2025年的 1.05亿台。未来,XR生态系统的进一步改善必然要更加依赖于5G网络通信,其高带宽、高可靠性、低延迟的特点将满足下一代XR体验的需求。
5G+XR渗透工业领域 视频增强创造更多可能
5G+XR技术现已逐渐渗透到工业领域的应用场景中。未来,更多的工人可以通过佩戴XR设备高效地进行远程工作。例如,汽车经销商的技术人员通过佩戴AR智能眼镜,即可与汽车技术支持中心进行远程视频连线,从而立即获得经验丰富的工程师的实时支持和建议。
通过以上用例,我们可以看到高效的远程实时协作离不开5G低延迟传输和高度防抖AR智能眼镜的结合。制造业和外勤服务领域的现场工作人员经常需要远程专家通过观看AR智能眼镜输出的视频,为他们提供实时技术指导。然而,在佩戴者需要经常走动的复杂环境中,如果设备无法输出有效的视频,那么双方很难进行实时协作。因此,越来越多的企业表示,对于在工作中采用AR眼镜作为实时协作的主要应用设备来说,稳定的视频体验至关重要。
XR设备在使用5G网络进行实时连接时会产生大量功耗。与智能手机或其他可以输出防抖视频或直播的运动相机相比,AR智能眼镜对于高功耗的产生更加敏感。AR智能眼镜中无法搭载大体积的电池,在其连接5G进行Zoom或者腾讯会议等实时视频会议的场景下,也会对设备的电池造成损失。因此,灵活的视频防抖解决方案对于功耗优化起到了重要作用,它可以根据特定行业用例场景进行视频防抖功耗的适当调节。
使用多传感器融合技术的XR设备必须依靠5G的高速传输,并根据生产和工作要求在动态变化中实现快速的SLAM(同步定位与地图构建)响应。高质量、防抖的视频可以让SLAM算法更加容易并且准确地映射佩戴者的周围环境,特别是在光线较暗的环境中。为了给SLAM算法提供尽可能准确的数据输入,并使基于SLAM的应用程序更加有效,多摄像头解决方案是行业中正在流行的一个有趣趋势。
Vidhance赋能XR设备 促进行业共同发展
随着5G+XR应用的加速落地,XR设备的视频功能需求将逐渐增加。作为视频制作产业链中的关键一环,Imint的Vidhance视频增强平台已经搭载至多个设备开发商(如RealWear和Rokid)研发的头戴式显示设备和工业可穿戴设备中。
ROKID X-CRAFT 5G工业防爆AR头盔
如今,Imint开创性的Vidhance视频防抖软件已经集成到全新的Rokid X-Craft 5G工业防爆AR智能头盔中,可对摄像头的移动进行智能补偿,以提供尽可能稳定的视频,帮助工业场景中的现场工作人员获取高质量的视觉信息。
未来,下一代扩展现实设备将借助5G进一步提升用户在虚拟环境下体验的真实感。Imint将继续开发5G+XR生态系统中所需的视频增强软件功能,为所有配备摄像头的设备提供最佳的视频质量。
好文章,需要你的鼓励
NOVER是一种创新的无验证器强化学习框架,解决了传统激励训练依赖外部验证器的限制。由伦敦国王学院研究团队开发,它通过计算"推理困惑度"作为奖励代理,使语言模型能在任何文本任务中自主发展推理能力。实验表明,NOVER在一般推理、创意写作、社会智能和多语言能力等多种任务上均优于基线方法,甚至使3B模型接近从671B模型蒸馏版本的性能。此外,其灵活性还支持"反向激励训练"等创新应用,为语言模型训练开辟了新方向。
韩国中央大学研究团队开发了名为CoPriva的基准测试,评估大语言模型遵守上下文安全策略的能力。研究发现,虽然多数模型能成功拒绝直接违反安全政策的查询,但在面对间接攻击时存在严重漏洞,泄露率平均增加40%以上。即使是推理能力强的模型也未显示出明显优势,且高忠实度的回答往往伴随更多信息泄露。研究团队评估了10种先进模型,发现政策存在与否对防止泄露影响有限,而修订功能仅能部分提升合规性。这揭示了当前AI安全对齐的重大缺陷,强调了开发更强健安全机制的紧迫性。
这项研究分析了混合专家模型(MoE)的"局部路由一致性"特性,即连续词元激活相似专家的程度,这对内存受限设备上的模型部署至关重要。研究者提出了两种测量指标:段路由最佳性能(SRP)和段缓存最佳命中率(SCH),分析了20个不同MoE模型。结果表明,在每层都使用MoE且不含共享专家的模型局部路由一致性最高,领域专业化的专家比词汇专业化的专家对一致性贡献更大。研究还发现,缓存大小为激活专家数量2倍时能取得最佳平衡,为MoE模型设计和部署提供了重要指导。
清华大学研究团队开发的"思维增强型策略优化"(TAPO)通过将外部高级思维模式整合到强化学习中,显著提升了大语言模型的推理能力。这种方法从仅500个样本中抽象出思维模板,在AIME、AMC和Minerva Math等基准测试中分别比传统方法提高了99%、41%和17%的性能,同时增强了模型的可解释性、稳定性和泛化能力,为AI推理研究开辟了新方向。