趁着上下班、徒步旅行或者懒在沙发的工夫,很多人都喜欢收听有趣的播客节目。但如果播客的语种跟我们的母语不同,那听起来就会比较费劲、甚至根本理解不了。
现在,Spotify团队正努力解决这个问题,并得到一大批明星播客的帮助,其中包括Armchair Expert 的 Dax Shepard 和 Monica Padman、The Diary of a CEO 的 Lex Fridman 和 Steven Bartlett, 以及 The Ringer的Bill Simmons。
作为一款面向全球各国用户的平台,Spotify正在测试AI语音翻译工具,以便为非英语听众开放各种流行的英语播客节目。是不是听起来就让人兴奋?该公司的初步计划,是为部分精选节目提供由AI转换的西班牙语、法语和德语版本。
这种语言屏障无疑对潜在听众构成了重大挑战。目前虽有一些工具能够转录播客,再将其翻译成不同的语种并转换为音频文件,但Spotify的官方新工具让整个过程变得更加简单。Spotify表示,此次新增的节目翻译功能不止是语音到文本转换技术,同时也会让AI模仿知名播客主持人的声音,提供更有温度的表达效果。
Spotify个性化副总裁Ziad Sultan在声明中表示:“通过匹配创作者自己的声音,这项Voice Translation服务能够让世界各地的听众享受到更真实的体验。我们相信,精心设计的AI方案能够帮助听众和创作者间建立起更深层次的联系,这也再次凸显出Spotify释放人类创造力的重要使命和愿景。”
Spotify试点计划中的精选节目目前已经在提供西班牙语版本,法语和德语版本翻译也将在未来几周内逐步登陆该平台。但该公司没有透露未来会在多大范围内应用这项基于AI的播客节目翻译技术。
好文章,需要你的鼓励
英特尔第三季度财报超华尔街预期,净收入达41亿美元。公司通过裁员等成本削减措施及软银、英伟达和美国政府的大额投资实现复苏。第三季度资产负债表增加200亿美元,营收增长至137亿美元。尽管财务表现强劲,但代工业务的未来发展策略仍不明朗,该业务一直表现不佳且面临政府投资条件限制。
美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。
微软发布新版Copilot人工智能助手,支持最多32人同时参与聊天会话的Groups功能,并新增连接器可访问OneDrive、Outlook、Gmail等多项服务。助手记忆功能得到增强,可保存用户信息供未来使用。界面新增名为Mico的AI角色,并提供"真实对话"模式生成更机智回应。医疗研究功能也得到改进,可基于哈佛健康等可靠来源提供答案。同时推出内置于Edge浏览器的Copilot Actions功能,可自动执行退订邮件、预订餐厅等任务。
纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。