本周一,苹果在iPhone 16发布会上反复提到了AI话题。然而,基于生成式AI的“Apple智能”(Apple Intelligence)却未能赶在9月17日,连同iOS 18,第一时间推送给iPhone用户。
苹果的首批AI功能计划于10月在全球大部分地区公开发布,并作为面向iPhone 15 Pro、iPhone 16全系列以及配备有M1或更高版本苹果芯片的Mac及iPad的beta测试项目。但在发布之初,这批新功能将仅提供美式英语版本。
下面来看看Apple智能将在10月带来的新惊喜:
写作工具
• 文本重写:文本重写功能可以对邮件草稿进行加工润色,用户则可通过设定将语气调整得更加友好或者简洁。
• 校对:与现实生活中一样,这项校对功能可以纠正用户的语法和句子结构,并在过程当中提供更多用词建议。
• 文本总结:类似于让AI生成内容摘要。文本总结将把写作内容提炼成更简短的形式,或者创建出按标号划分的清单或表格。
• 智能回复:我们已经多次看到这项AI功能的演示。智能回复将为用户提供符合上下文的建议,帮助大家在邮件或其他场景下快速编辑回复信息。
全新Siri
• 新外观:在iPhone、iPad乃至CarPlay上,新Siri将以环绕屏幕的彩虹动画形式出现,而在Mac上则可浮动并被旋转在桌面上的任意位置。
• 苹果的新语言模型:得益于苹果的机载语言模型,Siri在解析自然语言方面也将变得更加智能和顺畅。与此同时,较为复杂的问题则会被发送至苹果的“私有云计算”服务器端,苹果宣称该服务器属于个人设备的计算扩展,不会保留任何客户数据。
• 支持手动输入:现在用户可以随时入Siri助手输入问题,而无需出声表达。
照片
• 清理:与谷歌的Magic Eraser类似,清理功能可以删除掉照片中不需要的对象。
• 搜索:用户可以使用自然语言搜索照片,以找到在滚动浏览图库后一时没有发现的特定主题图像。
• 回忆:用户可以通过编写提示词来使用照片库中的媒体制作影片,由此创建一段分章节且由叙事驱动的音画素材。
转录
• 手机通话录音与转录:用户可以录制通话内容并获取完整通话的转录文本。若激活此功能,则正在录制通话的各方均将收到提示。
• 备忘录中的语音录制:用户可以在备忘录应用中录制音频,由软件将语音转录为文本。大家还可以使用苹果的其他写作工具来帮助总结整个会话。
更多Apple智能功能稍后
苹果方面表示,其他AI功能将“在今年晚些时候和接下来的几个月内陆续推出”。也就是说,这些功能可能最早在10月与广大用户见面,最晚则可能在明年夏季甚至秋季推出。遗憾的是,Apple智能中最引人注目的功能也正包含在这一部分当中。
• 视觉智能:苹果在iPhone 16演示中公布的全新视觉智能,可以在拍照画面中直接搜索事物。例如,我们可以拍摄咖啡厅店面的照片并获取与之相关的信息,例如营业时间和菜单内容,或者拍摄音乐会海报的照片并将日程添加到日历当中。视觉智能功能推出后,可使用iPhone 16和16 Pro机型上的相机控制侧按钮激活。
• 生成表情符号:用户可以通过输入文本提示词来创建自己的表情符号。苹果的图像生成器将为您制作一个可以发送给朋友的全新表情符号。
• Image Platground图像乐园:除了制作自定义表情符号之外,Apple智能最终还将支持生成自定义图像。只要输入您想要的任意图像文本提示词(可能会有一定限制),苹果的模型即可为您制作出相应图片。
• Siri个人场景:Siri的实用性将随时间推移而不断发展,通过情境化方式帮助用户处理iPhone、iPad或者Mac上的屏幕显示信息。
• 接入OpenAI:配合Apple智能写作工具,用户还可以选择使用ChatGPT来获取更多生成式AI选项。ChatGPT应该还能够处理我们发出的Siri请求,为问题获取更先进的智能答案。
• 通过Siri接入第三方应用:苹果还承诺未来的Siri将可处理跨应用请求,例如在图像编辑应用当中对照片内保存的图像进行编辑。
好文章,需要你的鼓励
华盛顿大学Pedro Domingos教授提出的张量逻辑是一种革命性的AI编程语言,它通过将逻辑推理与张量代数在数学层面统一,实现了符号AI和神经网络的深度融合。该语言仅使用张量方程这一种构造,就能优雅地实现从Transformer到形式推理、从核机器到图模型等多种AI范式,更重要的是开辟了在嵌入空间中进行可靠推理的新方向,有望解决大型语言模型的幻觉和不透明性问题,成为推理、数学和编码模型的理想语言。
中科院研究团队发现AI模型存在严重的跨语言推理缺陷:英语训练优秀的模型在其他语言上表现平平。研究揭示了三个重要规律:首次平行跃迁现象、平行扩展法则和单语言泛化差距,证明当前AI过度依赖英语特有模式而非通用推理能力。通过"并行训练"策略,仅增加一种平行语言就能将跨语言能力提升115%,为构建真正全球化AI系统指明方向。
科技巨头IBM今日宣布推出新的区块链数字资产平台,专为金融机构和受监管企业设计。该平台名为"数字资产避风港",将为银行、企业和政府提供比特币、以太坊、稳定币和代币化资产的安全管理服务。平台由IBM与数字钱包基础设施提供商Dfns合作开发,支持超过40个公链和私链的全生命周期管理,并集成第三方身份验证和反洗钱合规工具。
卡内基梅隆大学和斯坦福大学研究团队提出RLAD方法,让AI学会像人类一样先从解题过程中总结经验,再运用这些"推理抽象"指导解题。该方法使用双AI协作训练,在AIME 2025等数学竞赛中比传统方法提升44%准确率,甚至实现了弱AI指导强AI的现象,为构建更智能的AI系统提供了新思路。