即使是顶尖的电台DJ也总有犯错的时候,这是人的本质,无论他们的声音多么丝滑顺畅,也总会有显得突兀的时候,甚至可能打破作品的韵律。无论是小小的卡顿还是不合时宜的插入,听众总能感知到他们的存在。但往好处想,他们毕竟是人,是为我们所熟悉、友好温暖的真人。
当然,现在已经没人愿意听电台了。几乎人人都有Spotify帐号,或者是从朋友那借来的帐号。反正电台DJ早已被时代淘汰,由推荐算法生成的流媒体播放列表才是正道。从某种意义上说,这是一种幸福。只要选择某种流派或者情感,乐曲就会不断播放下去,直到宇宙的尽头。在背后操控这一切的是AI,是人工智能决定下一首该播什么给我们听。
生成式AI近年来的快速兴起,让很多企业不再满足于把算法隐藏在幕后。他们想把算法带向最前沿,一方面是为了以炫耀的方式蹭一把AI狂欢的热度,另外也是为了能让算法更加个性化。得到的宣传越多,我们对AI也就越熟悉,会慢慢意识到它们不只是冰冷的代码、更是我们能够感知到的小伙伴。
作为音乐领域的王者,Spotify当然也想搭上这趟便车。于是他们决定从本周开始推出AI DJ服务,更新Spotify移动应用的beta版本即可体验,当然目前仅向Spotify Premium付费用户开放。该功能是Spotify去年公布的AI语音服务Sonantic的衍生产物。这款机器人DJ会时不时现身于不同曲目之间,向用户讲解目前听的是什么。语音的音色选取自Spotify文化合作伙伴关系负责人Xavier “X” Jernigan。生成的音频效果很棒,对数字模拟音表现得尤其出色。一般的AI生成语音往往语调怪异,说话时的节奏也经常出错。但X的语言能力很强,说起话来听感真实。虽然在念出艺术家或歌曲名字时也偶有失误,但总体上还是能保持很酷且平静的说话风格。X经常会主动提出:“今天让咱们来点爵士乐吧,先从Tommy Lehman开始。”
遗憾的是,虽然我们能从X那边听到关于乐队的趣闻或轶事,但其中永远缺少了几分温度和风格。另外,这位DJ也没办法把语气跟我们刚刚听到的乐曲联系起来。听得越多,我们越能感受到Spotify X背后的那种苍白感——这只是机器学习从庞大混乱的指标中精心计算出的结果,没有情感、没有灵魂。听AI DJ说话会引起一种极度孤独的感觉,因为你能发觉它在用尽全力告诉你它并不是人。
更令人不安的是,这位AI DJ似乎非常了解我们的喜好。跟Spotify Wrapped类似,AI DJ也会访问我们的个人数据并据此给出收听建议。X非常清楚我们之前听过什么乐曲,并猜测特定歌曲能引发用户的某些情感共鸣。当然,我们可以通过点击按钮要求AI改变情感倾向,但它其实也是在乱猜,没准把用户一天的好心情都给毁了。不过必须承认,它仍然在不断学习,想根据当前时段和所在位置迎合用户心意。它仍然是Spotify收集用户数据的一种延续,只是换成了更为友好的机器人形式。我们能从人类DJ身上挑出一万个毛病,但听他们的节目至少会感觉有人在陪伴,而不至于像对着AI DJ这样越听越伤心。
好文章,需要你的鼓励
在Meta Connect大会上,Meta展示了新一代Ray-Ban智能眼镜的硬件实力,配备神经腕带支持手势控制,电池续航翻倍,摄像头性能提升。然而AI演示却频频失败,包括Live AI烹饪指导、WhatsApp通话和实时翻译功能都出现问题。尽管Meta在智能眼镜硬件方面表现出色,但AI软件仍远未达到扎克伯格提出的"超级智能"目标。文章建议Meta考虑开放AI生态,允许用户选择其他AI服务商,这可能帮助Meta在AI硬件市场获得优势。
DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型,无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越,在AIME 2024中达到79.8%准确率,编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型,使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。
英伟达同意以50亿美元收购英特尔股份,双方将合作开发多代数据中心和PC产品。英伟达将以每股23.28美元的价格收购约4%的英特尔股份,成为其最大股东之一。两家公司将通过NVLink接口整合各自架构,实现CPU和GPU间的高速数据传输。英特尔将为英伟达AI平台定制x86处理器,并开发集成RTX GPU的x86系统级芯片,用于消费级PC市场。
微软研究院推出rStar-Math系统,通过创新的"深度思考"训练方法,让小型AI模型在数学推理能力上达到甚至超越OpenAI o1水平。该系统采用代码验证、过程偏好模型和四轮自进化训练,将70亿参数模型的数学能力从58.8%提升至90.0%,在美国数学奥林匹克竞赛中达到前20%水平,证明了精巧方法比模型规模更重要,为AI发展开辟了新路径。