趁着上下班、徒步旅行或者懒在沙发的工夫,很多人都喜欢收听有趣的播客节目。但如果播客的语种跟我们的母语不同,那听起来就会比较费劲、甚至根本理解不了。
现在,Spotify团队正努力解决这个问题,并得到一大批明星播客的帮助,其中包括Armchair Expert 的 Dax Shepard 和 Monica Padman、The Diary of a CEO 的 Lex Fridman 和 Steven Bartlett, 以及 The Ringer的Bill Simmons。
作为一款面向全球各国用户的平台,Spotify正在测试AI语音翻译工具,以便为非英语听众开放各种流行的英语播客节目。是不是听起来就让人兴奋?该公司的初步计划,是为部分精选节目提供由AI转换的西班牙语、法语和德语版本。
这种语言屏障无疑对潜在听众构成了重大挑战。目前虽有一些工具能够转录播客,再将其翻译成不同的语种并转换为音频文件,但Spotify的官方新工具让整个过程变得更加简单。Spotify表示,此次新增的节目翻译功能不止是语音到文本转换技术,同时也会让AI模仿知名播客主持人的声音,提供更有温度的表达效果。
Spotify个性化副总裁Ziad Sultan在声明中表示:“通过匹配创作者自己的声音,这项Voice Translation服务能够让世界各地的听众享受到更真实的体验。我们相信,精心设计的AI方案能够帮助听众和创作者间建立起更深层次的联系,这也再次凸显出Spotify释放人类创造力的重要使命和愿景。”
Spotify试点计划中的精选节目目前已经在提供西班牙语版本,法语和德语版本翻译也将在未来几周内逐步登陆该平台。但该公司没有透露未来会在多大范围内应用这项基于AI的播客节目翻译技术。
好文章,需要你的鼓励
阿里巴巴集团正在马来西亚和菲律宾新增数据中心以推动AI驱动增长。该公司云计算部门本周在马来西亚启用第三个数据中心,并计划10月在菲律宾开设第二个数据中心。阿里云还在新加坡设立全球能力中心,帮助超过5000家企业和10万名开发者使用先进AI模型。未来三年内,阿里巴巴将在全球多个地区加速云网络建设,承诺在AI基础设施上投资超过530亿美元。
Unbabel团队开发的TOWER+模型系列实现了翻译专业性与通用AI能力的完美平衡。通过创新的四步训练方法,即使2B参数的小模型也能在翻译质量上匹敌70B大模型,同时具备出色的对话和指令跟随能力。研究还创建了IF-MT基准来评估复杂翻译场景下的综合能力,为AI模型的专业化发展提供了重要参考。
在人工智能与神经科学交叉领域的研究中,科学家正在探索自然发育的生物大脑与人工神经网络之间的异同。如今,实验室培养的生物类器官大脑为这一领域带来了新的复杂性。科学家使用干细胞培养出梨形大脑类器官,这些类器官甚至能够自主生长出眼睛。研究人员通过探索视觉与智能的关系,以及大脑-眼部缩放关系,为人工智能研究提供启发。
莫斯科科学家开发出"听众机制"训练方法,解决AI视觉偏好判断中推理不一致问题。通过让两个AI模型相互"对话"验证推理过程,新方法在ImageReward基准上达到67.4%准确率,并在现代图像数据集上显著提升泛化能力,为开发更可靠可解释的AI系统提供新思路。