2016年被称为“AR/VR元年”, 这一年,VR领域头戴设备拳头产品HTC Vive、Oculus Rift、索尼PS VR均面向消费者发售。同年,AR手游《Pokémon Go》风靡全球。AR/VR不再只是“技术名词”,而是能够看得见、体验得到的“产品”。
经历了2016年的火爆,2017年,由于上市的产品在内容质量和体验方面远不及预期,行业进入大浪淘沙阶段。究其原因,还是“技术”不过关,进入市场的 VR/AR 产品暴露出很明显的体验短板,传输与显示是阻挠VR/AR产业发展的两大难题。
传输方面,AR/VR普遍具有内容高带宽、低时延的特点,受网络的影响较大,随着5G的到来,将给AR/VR行业带来巨大助力;显示方面,AR/VR显示在亮度、清晰度上存在诸多问题,发展滞缓,目前还没有特别好的解决方案。
挑战与机遇是并存的,据IDC预测,2020年,全球AR/VR市场相关支出规模将达到106.7亿美元,较2019年同比增长35.3%。企业要想迅速打开AR/VR这片蓝海市场,就需要解决目前所面临的问题,突破性的显示技术变得尤为重要。
近日,三星携手斯坦福研制出一种新的OLED显示屏,其分辨高达10,000PPI,这是什么概念?华为最新发布的Mate 40 Pro显示屏像素密度为456 PPI;iPhone 12显示屏像素密度为460ppi。
新显示屏利用OLED薄膜在两个反射层之间发射白光,其中一个反射层由银膜制成,另一层则是由纳米波纹的反射金属制成。这种“光学元面”改变了反射特性,并允许特定的颜色产生像素共振。这样可以实现比手机上的RGB OLED高得多的像素密度,同时又不会损失亮度。
这种超高分辨率的显示屏可作为理想的AR/VR显示设备,能创造几乎完美无瑕的图像,困扰多时的AR/VR显示设备亮度、清晰度等问题也可以迎刃而解。
据了解,三星已经在使用10,000 PPI技术开发“全尺寸”显示屏,可能再过几年我们就能看到搭载这种新显示屏的AR/VR产品问世。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数据集VideoRefer-700K,并设计了全面的评估体系VideoRefer-Bench。实验显示该技术在专业视频理解任务中显著超越现有方法,在安防监控、自动驾驶、视频编辑等领域具有广阔应用前景。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。