三星本周发布新款手机,据称是有史以来AI渗透度最高的手机产品。请注意,这不是猜测——千万别误以为这是CES 2024大会上那种屡见不鲜的“把ChatGPT塞进去”的操作。三星正在以振聋发聩的声量向全世界宣布,这次的新品真的有份量、有来头。而且根据本周Galaxy Unpacked活动上的展示情况来看,跟在洗衣机上装ChatGPT那种胡闹行为不同,AI加持下的三星手机确实大有潜力。
AI技术的浪潮全面兴起于2023年,但对于我们日常生活中最重要的组成部分——手机,目前似乎还没有理想的结合方案。这也是AI技术的一大现实难题:用于支持ChatGPT等聊天机器人的大语言模型还无法运行在我们的手机上。虽然用户可以下载ChatGPT应用来调用云端查询资源,但此类服务却无法提醒我们刚刚收到一封重要邮件。好在情况正慢慢发生变化 :去年10月上市的Pixel 8 Pro已经能够在本机上运行谷歌基础模型,并承诺后续会进一步提供AI驱动更新。不过总体来讲,当前能够本机支持AI的设备还很有限,功能表现也平平无奇。
12月的软件更新添加了用AI总结Recorder记录的功能——我立刻体验了一下,因为自己平时也正好在使用Pixel Recorder应用。结果证明,其无法处理大段录音,一切超过10分钟的素材都不受支持。换言之,我的大部分录音都被排除在了适用范围之外。Video Boost也在此次更新中获得增强,新功能名为Night Sight夜视。视频的处理效果不错,但在静态照片上的表现相对差些,而且用户往往需要等待一、两个小时才能看到云端处理完成的视频。
尽管好消息不多,但也有不少前景光明的探索仍在继续。在去年年底的Pixel发布会上,谷歌宣布推出Assistant with Bard——这是一款ChatGPT风格的AI聊天机器人。Bard在当前的AI领域虽然不算绝顶高手,但至少一直在稳步发展并充实更多有用功能,相信它的介入能让AI助手在以往的设置闹钟和日历之外,给用户带来更多便利性体验。而且在三星Unpacked活动上的预告片当中,似乎也出现了Bard的身影。
那么,Galaxy S24系列手机会不会搭载某种定制版Bard?如果真是如此,那Bixby的命运又将如何?你可能还记得Bixby,我们实在很难想象谷歌会愿意在竞争对手的手机上搭载自家AI成果。但话又说回来,三星的Android手机销量远超谷歌,AI时代的降临很可能会让这些亦敌亦友的巨头成为更亲密的合作伙伴。
这款橙色AI小装置之所以引发人们的广泛关注,靠的就是把用户从手机上解放出来的承诺。
AI显然还能在我们的手机上做得更多,而迄今为止在未来愿景上思路最清晰的并不 谷歌或者三星。具体来讲,这个更接近正确答案的选项压根不是一款手机,而是Rabbit R1——CES 2024上最具突破性的热门产品。作为一款由Teenage Engineering设计的小装置,它负责充当手机的AI助手。用户需要授予它访问自己应用和账户的权限,之后就能要求它执行航班查询、外卖预订之类的日常操作。据称,它根本不需要开启应用或者点击菜单,就能帮助用户完成种种繁琐的操作。干得漂亮!
哪怕未来可能被并入手机之内,仍然无法掩盖这款产品的光辉。至于人们是否真的愿意用AI来管理自己的数字生活?每周数万的R1订单量也许已经给出了答案。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。