5月21日,在全国瞩目的两会召开之际,搜狗联合新华社推出的全球首个3D AI合成主播“新小微”正式亮相,为全国观众带来最新的两会新闻资讯报道。基于搜狗人工智能核心技术“搜狗分身”打造的“新小微”,将拉开中国传媒行业全面进入智慧时代的序幕。
搜狗分身技术再突破,带领AI合成主播进入3D时代
作为AI合成主播的开创者和引领者,自2018年基于搜狗分身技术推出全球首个AI合成主播后,搜狗分身持续取得重大突破,此次的3D AI合成主播就是搜狗分身最新的突破性成果。

“新小微”以新华社记者赵琬微为原型,基于超写实3D数字人建模、多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前沿技术,使机器可以基于输入文本生成逼真度极高的3D数字人视频内容。
3D AI合成主播结合了原力科技提供的业界领先的扫描还原、面部肌肉驱动、表情肢体捕捉等技术,生产出了高度还原真人发肤、形象逼真的数字人模型;同时基于搜狗分身领先的端到端多模态建模技术,使用语音、图像、文本、3D肌肉运动数据等多模态信息完成联合建模训练。在AI算法的驱动下,只需输入文本内容,“新小微”就能根据语义实时播报新闻,其表情唇动、肢体动作和语音表达高度契合、自然逼真。
从2D到3D,搜狗AI持续引领融媒体应用创新
搜狗推出全球第一位AI合成主播后,通过不断迭代更新使AI合成主播具备了多语种播报、对话交互等诸多能力,用最前沿的技术能力和产品效果,不断推动传媒行业内容生产的效率变革。据统计,首位 AI 合成主播“新小浩”已在新华社客户端上持续为观众服务500 多天,先后产出13,000多条新闻报道,累计时长超过35,000分钟。

较之前的2D AI合成主播,3D“新小微”不仅立体、灵活,可控,还具有同时支持多机位多景深,360°任意角度呈现内容等能力,在应用空间上拥有更多的可能性,为新闻节目多样化制作和呈现带来了更多选择。
5G时代,搜狗分身技术应用将全面爆发
从最初的2D到今天的3D AI合成主播,其背后不仅仅是搜狗分身技术的一次次突破迭代,更体现出人工智能驱动传媒行业生产效率与生产流程的不断革新。不仅减轻了行业从业者的重复性工作,更让相关工作“拟人化”、“生动化”,让传媒新闻播报更加有趣,更具现场性。不久的将来,3D AI合成主播还会走出演播厅,支持外景播报和互动采访,为观众带来最前沿的新闻讯息。
在5G全面铺展的新技术时代,随着分身技术落地经验的不断积累以及产品技术的突破创新,搜狗分身也会从传媒领域出发,快速向影音娱乐、医疗健康、教育金融等众多领域蔓延辐射,持续推动大众智能生活的建设。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。