北京时间6月6日凌晨1点,苹果MR产品正式面世,官方称之为Apple Vision Pro。
就这款产品目前官宣的信息来看,至少在以下几个方面有着阶跃式进步:
1、屏幕分辨率单眼高达4K。
此前VR一体机屏幕分辨率普遍在单眼2K,而单眼2K已经能够满足人们日常基本视觉体验,苹果这款采用Micro OLED屏、单眼分辨率做到了4K的MR眼镜,意味着更极致的视觉体验。
2、手势+眼动,开启无手柄交互模式。
手柄是VR产品的一个核心配件,这一配件的存在,究其原因是因为定位、追踪精度不够高,导致暂时难以实现裸手交互。苹果这次直接摒弃了手柄,选择用手势+眼动为主要交互方式,可见在定位、追踪精度上有了不小的精进,而这样的交互模式,也是更符合未来的自然交互模式。
3、M2+R1,自研超强算力。
Apple Vision Pro除了用上了Mac级的M2处理器外,还单独加入一颗管理设备中多达23个传感器的R1协处理器来配合工作,从而进一步缩小时延,官方数据显示,这款设备图传延时控制在了21ms以内。
4、MR新系统,visionOS。
visionOS是苹果专为苹果MR设备研发的新系统,也是继iOS、iPadOS、MacOS、watchOS之后的第六大系统,这些系统底层相通,因而在应用生态上也更容易互通。
5、自带3D建模能力。
Apple Vision Pro加入了12个摄像头、5个传感器、6个麦克风,各类传感器一共23个,这其中内部的LED和红外摄像头组成了眼部追踪系统,可以实时捕捉眼动情况,外部的LiDAR雷达和深度相机可以实时构建环境3D地图,用户也可以借此创建数字人、拍摄3D视频。
总之,这就是一个行走的全景相机。
从现在官方已经公布出来的硬件信息来看,Apple Vision Pro在屏幕分辨率、处理器性能、交互能力、感知能力等方面都已经有了远高于同类产品的表现,不过,这款产品也并非完美。
从发布会上展示的产品,我们能够看出,这款产品采用了分体式设计,将电源模块设计为外置配件,这样虽然一定程度上减小了整机重量,规避了散热问题,但分体式设计毕竟不是终极形态。
此外,苹果官方并没有给出这款产品的整体体积和重量参数,实际上,仅就视觉效果而言,这仍是一款重量不会有什么惊喜的产品。
如果说还有什么值得我们关注的点的话,那应该就是内容生态了。
苹果很早就开始涉足AR领域,早在2017年就对外发布了ARKit,布局软件生态,然而,时至今日,我们并没有看到库克有在发布会上展示出什么惊艳的VR游戏内容或其他什么应用。
我们能看到的,只是苹果在系统层面将visionOS与iPadOS、iOS等打通,因而此前成千上万计的移动应用生态就得以适配到如今的苹果MR产品中来。
这是苹果MR产品第一波主要应用,没有什么惊喜,更多的只是规模。
总结一下,Apple Vision Pro的正式发布,大抵会给AR/VR产业带来如下一些变化:
首先,在产品性能上,更高性能的Apple Vision Pro的出现,将整个行业标准又抬升了一个高度,接下来大家都明确MR产品的极致性能可能做到怎样的程度了;
其次,在产品迭代上,VR产品或将逐渐消失,MR产品和AR产品将会是大势所趋;
第三,在产业发展上,苹果的正式入局,也就正式形成了苹果、Meta两大阵营,接下来必然会有更多企业涌入,对整个行业带来一定刺激作用;
最后,计算产业也将再次提速,苹果针对这次发布的MR产品,提出了空间计算概念,这是一个相对于Mac代表的个人计算和iPhone代表的移动计算之后的第三个计算时代,其中精髓正是我们现在所讲的数实融合。
显然,不仅仅是消费领域,Apple Vision Pro的后续演进很可能会对数字经济所涵盖的全产业带来一波蝴蝶效应。
不过,关于Apple Vision Pro,关于苹果入局MR,同样值得注意的是:
苹果将Apple Vision Pro这款重磅产品放到了最后one more thing中发布,与此同时,这还是一款售价3499美元(约合人民币2.5万元)、预计明年年初才会在美国正式上市的产品。
而就是在这款产品发售后,苹果股价也应声下跌,显然,市场并不看好这样一款高性能、低性价比、颠覆性不足的MR产品。
好文章,需要你的鼓励
YouTube开始推出肖像检测工具,帮助创作者识别和举报使用其面部特征的AI生成视频。该系统类似于版权检测机制,目前处于测试阶段,仅向部分创作者开放。用户需要提供政府身份证件照片和面部视频来验证身份。系统会标记疑似包含用户肖像的视频,但无法保证100%准确识别AI内容。YouTube将根据多项因素决定是否移除举报的视频。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。
谷歌宣布在AI Studio平台中引入"氛围编程"体验,让编程和非编程用户都能更轻松地开发应用程序。用户可通过简单提示生成可运行的应用,新功能包括应用画廊、模型选择器、安全变量存储等。平台还添加了模块化"超能力"功能和"手气不错"按钮来激发创意。完成的原型应用可一键部署到谷歌云运行平台。此次更新正值业界期待谷歌即将发布Gemini 3.0大语言模型。
中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。