趁着上下班、徒步旅行或者懒在沙发的工夫,很多人都喜欢收听有趣的播客节目。但如果播客的语种跟我们的母语不同,那听起来就会比较费劲、甚至根本理解不了。
现在,Spotify团队正努力解决这个问题,并得到一大批明星播客的帮助,其中包括Armchair Expert 的 Dax Shepard 和 Monica Padman、The Diary of a CEO 的 Lex Fridman 和 Steven Bartlett, 以及 The Ringer的Bill Simmons。
作为一款面向全球各国用户的平台,Spotify正在测试AI语音翻译工具,以便为非英语听众开放各种流行的英语播客节目。是不是听起来就让人兴奋?该公司的初步计划,是为部分精选节目提供由AI转换的西班牙语、法语和德语版本。
这种语言屏障无疑对潜在听众构成了重大挑战。目前虽有一些工具能够转录播客,再将其翻译成不同的语种并转换为音频文件,但Spotify的官方新工具让整个过程变得更加简单。Spotify表示,此次新增的节目翻译功能不止是语音到文本转换技术,同时也会让AI模仿知名播客主持人的声音,提供更有温度的表达效果。
Spotify个性化副总裁Ziad Sultan在声明中表示:“通过匹配创作者自己的声音,这项Voice Translation服务能够让世界各地的听众享受到更真实的体验。我们相信,精心设计的AI方案能够帮助听众和创作者间建立起更深层次的联系,这也再次凸显出Spotify释放人类创造力的重要使命和愿景。”
Spotify试点计划中的精选节目目前已经在提供西班牙语版本,法语和德语版本翻译也将在未来几周内逐步登陆该平台。但该公司没有透露未来会在多大范围内应用这项基于AI的播客节目翻译技术。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。