相信很多朋友都在“麦当劳得来速”体验过快速点餐,但在驾车离开后却发现自己花了钱的薯条“不翼而飞”、或者汉堡上涂满了自己反复说过不要的酱汁。员工难免会犯错,而人工智能(AI)则有望让整个点单过程更轻松、更便捷、也更准确。
而且就在不久之后,得来速订单就将全面由AI技术接管。麦当劳旗下快餐品牌Checkers & Rally’s正在自己的得来速窗口中测试语音订购机器人。通过与Presto合作,该品牌计划在267家餐厅中安装基于AI的语音助手。目前Presto的这项技术暂时只面向商业餐厅客户。
Presto的AI语音助手能够自动实现餐厅场景下的语音识别功能,同时也可适应得来速、自助服务亭、堂食点单等实际需求。Presto公司解释道,其准确率可以超过95%,同时将员工的生产效率提高三倍。这种「对话式AI」技术还能执行客户接待、订单接收、将订单移交至销售点(POS)系统等多种其他功能。
在去年的试点项目中,Checkers & Rally’s发现AI语音助手在接收得来速订单时的准确率已达98%,而且无需餐厅员工的干预。该系统甚至可以很好地理解不同客户表达中的口音与方言。
Checkers & Rally's当然不是第一家在得来速服务中测试或者实际应用AI技术的公司。麦当劳很早之前就通过Dynamic Yield借机器学习与AI之力个性化得来速服务体验。去年,麦当劳还成功在芝加哥测试了语音点餐技术。
当下,一系列现实因素的推动使得AI语音助手快速成为得来速服务中的新宠。一方面是新冠疫情的爆发,由于担心接触病毒,越来越多的顾客倾向于使用得来速通道、而非亲身进入餐厅。毕竟相较于长时间共处一室,还是坐在车上点餐、出餐后立即离开更安全。
目前得来速服务在所有餐厅外带订单中占比达41%,但受到用量增长、劳动力短缺等现实条件的制约,顾客们发现现在的得来速越来越“不速”、处理订单的准确率也让人头痛。
美国国家餐馆协会的一项调查发现,78%的餐厅经营者招不到足够的员工,61%的快餐店甚至由于人手不足而被迫关闭。
随着等待时长、错误率与劳动力短缺难题的日益严重,餐厅开始尝试利用AI技术解决问题。但即使只是从得来速试水,也有不少人对这种以机器人取代人工的趋势表达了不满。好在相当一部分餐厅只是把AI视为人机协作的新途径,而非全部取代人类的完整解决方案。只能说在招不到充足人手的现实难题之下,AI至少给经营者和消费者们指出了一条效果还不错的明路。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。