本周一,苹果在iPhone 16发布会上反复提到了AI话题。然而,基于生成式AI的“Apple智能”(Apple Intelligence)却未能赶在9月17日,连同iOS 18,第一时间推送给iPhone用户。
苹果的首批AI功能计划于10月在全球大部分地区公开发布,并作为面向iPhone 15 Pro、iPhone 16全系列以及配备有M1或更高版本苹果芯片的Mac及iPad的beta测试项目。但在发布之初,这批新功能将仅提供美式英语版本。
下面来看看Apple智能将在10月带来的新惊喜:
写作工具
• 文本重写:文本重写功能可以对邮件草稿进行加工润色,用户则可通过设定将语气调整得更加友好或者简洁。
• 校对:与现实生活中一样,这项校对功能可以纠正用户的语法和句子结构,并在过程当中提供更多用词建议。
• 文本总结:类似于让AI生成内容摘要。文本总结将把写作内容提炼成更简短的形式,或者创建出按标号划分的清单或表格。
• 智能回复:我们已经多次看到这项AI功能的演示。智能回复将为用户提供符合上下文的建议,帮助大家在邮件或其他场景下快速编辑回复信息。
全新Siri
• 新外观:在iPhone、iPad乃至CarPlay上,新Siri将以环绕屏幕的彩虹动画形式出现,而在Mac上则可浮动并被旋转在桌面上的任意位置。
• 苹果的新语言模型:得益于苹果的机载语言模型,Siri在解析自然语言方面也将变得更加智能和顺畅。与此同时,较为复杂的问题则会被发送至苹果的“私有云计算”服务器端,苹果宣称该服务器属于个人设备的计算扩展,不会保留任何客户数据。
• 支持手动输入:现在用户可以随时入Siri助手输入问题,而无需出声表达。
照片
• 清理:与谷歌的Magic Eraser类似,清理功能可以删除掉照片中不需要的对象。
• 搜索:用户可以使用自然语言搜索照片,以找到在滚动浏览图库后一时没有发现的特定主题图像。
• 回忆:用户可以通过编写提示词来使用照片库中的媒体制作影片,由此创建一段分章节且由叙事驱动的音画素材。
转录
• 手机通话录音与转录:用户可以录制通话内容并获取完整通话的转录文本。若激活此功能,则正在录制通话的各方均将收到提示。
• 备忘录中的语音录制:用户可以在备忘录应用中录制音频,由软件将语音转录为文本。大家还可以使用苹果的其他写作工具来帮助总结整个会话。
更多Apple智能功能稍后
苹果方面表示,其他AI功能将“在今年晚些时候和接下来的几个月内陆续推出”。也就是说,这些功能可能最早在10月与广大用户见面,最晚则可能在明年夏季甚至秋季推出。遗憾的是,Apple智能中最引人注目的功能也正包含在这一部分当中。
• 视觉智能:苹果在iPhone 16演示中公布的全新视觉智能,可以在拍照画面中直接搜索事物。例如,我们可以拍摄咖啡厅店面的照片并获取与之相关的信息,例如营业时间和菜单内容,或者拍摄音乐会海报的照片并将日程添加到日历当中。视觉智能功能推出后,可使用iPhone 16和16 Pro机型上的相机控制侧按钮激活。
• 生成表情符号:用户可以通过输入文本提示词来创建自己的表情符号。苹果的图像生成器将为您制作一个可以发送给朋友的全新表情符号。
• Image Platground图像乐园:除了制作自定义表情符号之外,Apple智能最终还将支持生成自定义图像。只要输入您想要的任意图像文本提示词(可能会有一定限制),苹果的模型即可为您制作出相应图片。
• Siri个人场景:Siri的实用性将随时间推移而不断发展,通过情境化方式帮助用户处理iPhone、iPad或者Mac上的屏幕显示信息。
• 接入OpenAI:配合Apple智能写作工具,用户还可以选择使用ChatGPT来获取更多生成式AI选项。ChatGPT应该还能够处理我们发出的Siri请求,为问题获取更先进的智能答案。
• 通过Siri接入第三方应用:苹果还承诺未来的Siri将可处理跨应用请求,例如在图像编辑应用当中对照片内保存的图像进行编辑。
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。