相信很多朋友和我一样,都期待着苹果能够像之前在众多功能和应用中那样,在AI领域交出一份令人眼前一亮的答卷——观察、等待、学习,然后颠覆一切。可尽管苹果已经解决了这项备受争议的技术所带来的一系列棘手问题,但此番似乎并没能跨出长久困扰其他公司的同一片泥潭:与其他AI产品类似,Apple Intelligence同样缺乏真正从0到1的功能性。
要说辅助层面的功能,那确实是有的,甚至还完成得不错。但跟大部分其他AI工具一样,这只是在用高昂的算力资源换取对某些普通任务的效率提升。这也有其价值,特别是当推理运算(即执行实际文本分析、生成等)变得足够高效,且能够转移到设备本身直接处理时,也算是项值得称道的进步。
但眼下端出的一切,还完全配不上当初猛烈的宣传攻势。库克自己曾在“Glowtime”活动开始时告诉我们,Apple Intelligence那“突破性的能力”将产生“令人难以置信的影响”。苹果软件工程高级副总裁克雷格·费德里吉也提到,它将“改变我们在iPhone处理诸多事务的方式”。
而实际落地的功能包括:
• 改写文本片段;
• 总结电子邮件和消息内容;
• 生成自定义表情符号和剪贴画;
• 查找图片中的人物、地点和事件;
• 查找事物。
说真的,这些东西有什么突破性可言吗?市面上的写作助手已经不胜枚举,而文本总结能力也几乎成为一切大语言模型的必备基本功。图像生成早就成为不思进取的代名词,同样的底层原理也让众多服务能够轻松帮助我们通过提示词找到需要的照片。至于早在生成式AI还没诞生的十年之前,傻了吧唧 的语音助手也已经学会了如何为用户查找维基百科条目。
没错,改进是客观存在的。在本地设备和个人场景下完成这些任务,肯定是更好的选择。对于那些无法操作常规触摸屏界面的用户来说,便利性自然也会有所增加。
但是,重要在但是之后,这些功能既不新鲜、也没啥意思。自从WWDC大会之后发布相应的功能测试版以来,除了预料之中的bug修复之外,苹果就再没拿出过任何有实际意义的变化。
人们原本希望“苹果首款为Apple Intelligence量身打造的手机”能够提供更多功能。但事实证明,iPhone 16甚至就连前面提到的这些功能都没法第一时间搭载——它们将通过单独的更新陆续发布。
这到底是想象力的失败,还是技术上的疲软?AI厂商正逐渐将自己的大模型定位为又一种企业SaaS工具,而拿不出我们经常听到的“变革性”用例(事实证明,这些用例大多只是在重复你本来就能在网上查到的东西)。AI模型在正确的场景下确实很有价值,但这些场景似乎跟个人用户很难搭得上关系。
也就是说,厂商实际拿出的AI功能太过平庸,但对它们的描述却一个比一个夸张,于是在二者之间形成了一种诡异的错位。苹果曾经那种以极度克制的态度展示颠覆性创新的特色正在消失,取而代之的是声嘶力竭般的大声吆喝。可以负责任地讲,本周一的苹果发布会是近年来最让人昏昏欲睡的活动,而苹果在其中使用的字眼跟证据却比以往更加夸张和疯癫。
总而言之,跟其他AI提供商一样,苹果也参与到了这场耗资数十亿美元的淘金游戏当中,假装这些模型具有变革性和开创性——但你都知道,根本就是没影儿的事情。所以如果说实际功能早在五年前就已经能够实现,那么到底要怎么证明这帮企业砸进去的这么多资金有其合理性呢?
AI模型可能在某些科学研究领域真正改变了游戏规则,包括一部分编码任务,也许还有材料和结构设计,或者说是在传媒领域(虽然不一定是好事)。
但如果我们还能继续信任自己的眼睛和手指,而不是库克跟弗德里吉那想要扭曲现实般的粗暴宣传,那这批在苹果看来应该能掀起热潮的AI功能其实根本就没有什么新意、更不要说变革性了。而且更为讽刺的是,苹果的声明显然没能给AI领域带来新的“iPhone时刻”。
好文章,需要你的鼓励
这项研究提出了R1-Searcher++框架,通过两阶段训练策略使大语言模型能像人类一样灵活利用内部知识和外部信息。该方法创新性地采用强化学习激励模型优先使用内部知识,并引入记忆机制将检索到的信息转化为内部知识,实现动态知识获取。实验表明,R1-Searcher++不仅在多步问答任务上表现优异,还大幅减少了检索次数,显著提高了推理效率。
这项研究提出了AutoRefine,一种革新性的强化学习框架,为大语言模型引入了"边思考边搜索和完善"的全新范式。与传统方法不同,AutoRefine在连续搜索调用之间添加知识完善步骤,让模型能够有效过滤和组织信息。通过结合答案正确性和检索质量双重奖励,该方法在七项问答基准测试中平均提升6.9%的准确率,特别在复杂多跳推理场景中表现突出,解决了现有检索增强推理的核心局限性。
这项研究揭示了一种新型网络安全威胁:利用普通网络广告攻击AI网页代理。中科院研究团队开发的AdInject攻击无需特殊权限,仅通过精心设计的广告内容就能误导AI代理点击恶意链接,成功率高达90%以上。研究使用严格的黑盒模型,更符合现实场景,暴露了当前AI代理面临的实际安全漏洞。实验还表明,即使添加专门的防御提示,这类攻击仍能成功率超过50%,凸显了设计更强大防御机制的紧迫性。
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。