趁着上下班、徒步旅行或者懒在沙发的工夫,很多人都喜欢收听有趣的播客节目。但如果播客的语种跟我们的母语不同,那听起来就会比较费劲、甚至根本理解不了。
现在,Spotify团队正努力解决这个问题,并得到一大批明星播客的帮助,其中包括Armchair Expert 的 Dax Shepard 和 Monica Padman、The Diary of a CEO 的 Lex Fridman 和 Steven Bartlett, 以及 The Ringer的Bill Simmons。
作为一款面向全球各国用户的平台,Spotify正在测试AI语音翻译工具,以便为非英语听众开放各种流行的英语播客节目。是不是听起来就让人兴奋?该公司的初步计划,是为部分精选节目提供由AI转换的西班牙语、法语和德语版本。
这种语言屏障无疑对潜在听众构成了重大挑战。目前虽有一些工具能够转录播客,再将其翻译成不同的语种并转换为音频文件,但Spotify的官方新工具让整个过程变得更加简单。Spotify表示,此次新增的节目翻译功能不止是语音到文本转换技术,同时也会让AI模仿知名播客主持人的声音,提供更有温度的表达效果。
Spotify个性化副总裁Ziad Sultan在声明中表示:“通过匹配创作者自己的声音,这项Voice Translation服务能够让世界各地的听众享受到更真实的体验。我们相信,精心设计的AI方案能够帮助听众和创作者间建立起更深层次的联系,这也再次凸显出Spotify释放人类创造力的重要使命和愿景。”
Spotify试点计划中的精选节目目前已经在提供西班牙语版本,法语和德语版本翻译也将在未来几周内逐步登陆该平台。但该公司没有透露未来会在多大范围内应用这项基于AI的播客节目翻译技术。
好文章,需要你的鼓励
树莓派工程师托尼·罗伯茨通过定制喷漆和更换键帽,将树莓派500+打造成经典BBC Micro电脑的外观。他拆解设备外壳,使用底漆和米色面漆进行改装,并从Signature Plastics购买了与原版风格相近的键帽。这个项目展示了如何轻松改造键盘一体机,唤起人们对家用电脑黄金时代的怀旧情怀,总投资约260美元。
马萨诸塞大学研究团队通过对11个不同领域的大规模实验发现,AI模型存在"新兴偏差"现象:在特定领域学习的错误行为会意外扩散到无关任务中。研究揭示了"后门触发机制"的工作原理,77.8%的测试域出现显著偏差增加。这项发现为AI安全敲响警钟,提醒开发者和用户注意隐藏的安全风险。
在超级碗前夕,AI竞争对手Anthropic和OpenAI就产品广告问题展开激烈交锋。Anthropic发布系列广告抨击ChatGPT即将引入的广告模式,宣称"广告正在进入AI,但不会进入Claude"。OpenAI CEO阿尔特曼回击称广告让产品更易获取,强调不会像Anthropic描述的那样投放广告。OpenAI计划在聊天答案底部展示相关赞助内容,并承诺广告将明确标注且不影响回答质量。
南京大学等机构联合研究团队针对AI视频生成中的"越生成越偏"问题,提出了路径测试时校正技术。该方法通过在视频生成过程中设置智能校准点,参考初始画面进行实时纠偏,无需重新训练模型即可将稳定生成时长从数秒延长至30秒以上。实验显示该技术在保持视觉质量的同时显著降低了计算成本,为长视频AI生成开辟了新路径。