尽管AI军备竞赛激烈，但多模型共存的未来已成定局

AI无疑是人类最伟大的发明之一，我们坚信它的未来将是、也应该是多种模型共存的局面。

每周、甚至是每一天，世界上都会诞生了新的最为先进的AI模型。2025年，新模型发布的速度将更加令人眼花缭乱，甚至是精疲力竭、难以消化。过山车般的成长曲线继续保持着指数级增长，时而新奇、时而疲惫的感受也成为新时代下的新常态。每一次发布都伴随着此模型比以往所有模型都要更好的宣言，无数基准测试结果和柱状图也塞满了我们的脑容量，一片混乱之再难区分真伪。

十八个月前，绝大部分开发人员和企业都在使用单一AI模型。而如今的情况则正好相反，很少有大规模企业会将自己局限于单一模型的功能樊篱之内。企业对于供应商锁定抱持着谨慎的态度，而且特别不能容忍自己在AI这项正迅速在长期战略与短期基准收入中成为决定性因素的技术被他人所把控。换句话说，将全部赌注押在单一大语言模型（LLM）上所构成的风险正越来越高。

可尽管碎片化现状客观存在，不少模型提供商仍然保持着AI领域将会赢家通吃的市场预判。他们宣称，训练顶尖模型所需要的专业知识和计算能力极其恐怖，这种稀缺性必然会自我强化并形成宽大的护城河。在他们看来，构建AI模型的炒作泡沫终将破灭，只留下单一体量庞大的通用人工智能（AGI）模型。它将被用于处理一切事务，而独家掌握这套模型的组织将成为世界上最强大的公司。瞄准这顶桂冠，越来越多的企业投身其中展开了GPU资源的争夺，新的军备竞赛则每几个月就在模型训练的参数量后面再加一个零。

但我们对此类观点深表怀疑。无论是明年还是未来十年，都不会出现能够统治寰宇的单一大杠。相反，AI的未来必然由多个模型共同支撑，形成百家争鸣、共襄盛举的局面。

语言模型是种模糊商品

《牛津经济学词典》将商品定义为“大规模买卖并可单位互换的标准化产品”。从这两项重要定义上来看，语言模型确实是种商品：
1. 模型本身在更广泛的任务上变得愈发可互换；
2. 开发这些模型所需要的专业知识越来越分散且易于获取，前沿实验室之间没有形成遥遥领先的超越关系，开源社区中的独立研究团队也紧紧跟随。

虽然语言模型正在商品化，但它的发展进度也并不均衡。从GPT-4一直到Mistral Small，任何模型都很适合处理多种核心功能。而与此同时，随着我们迈和边缘位置和极端场景，不同用例间的差异则越来越大。一部分模型提供商明确专注于代码生成、推理、检索增强生成（RAG）或者数学。这也让人们心生焦虑，无休止地在Reddit上搜索、评估和微调，希望为每项工作找到最适合的正确模型选项。

因此，虽然语言模型确实是种商品，但更确切地讲，它们其实是种模糊商品。对于大多数用例，AI模型之间有着很强的可替代性，最终决定选择的往往是价格和延迟等直观指标。但在能力边界上，情况则截然相反：模型将进一步专业化，差异程度也越来越高。例如，Deepseek-V2.5在C#编码方面比GPT-4o还要强大，而体量只是后者的一小部分，使用成本更仅相当于4o大模型的五十分之一。

也就是说，商品化与专业化这两种动态直接推翻了单一模型适合处理所有潜在用例的观点。相反，其明确指出了AI将逐渐分散化的新格局。

多模型编排与路由

关于语言模型的市场动态，我们找到了一个恰当的比喻：人类大脑。我们的大脑结构在过去十万年间一直保持不变，不同大脑间的相似性要远大于差异性。而且在人类种群诞生后的绝大部分时间里，多数人都在学习相同的知识，也表现出了类似的能力。

但后来情况发生了变化。我们发展出用语言交流的能力——先是口语，之后使用文字。接下来的通信协议促进了网络发展，人类在互联网的支撑和引导下也变得越来越专业化。我们摆脱了需要在所有领域成为通才、拘囿于自给自足孤岛之内的负担。而辩证的是，专业化催生出的集体财富反而让如今的普通人比我们的任何祖先都更具备通才的特质、至少是基于查询检索的涉猎广度。

在足够宽广的输入空间之内，宇宙总是趋向于专业化。从分子化学到生物学、再到人类社会，概莫能外。只要有充分的多样性，分布式系统在计算效率上永远比整体系统更高。我们相信AI也同样如此。我们越是能利用多种模型的优势、而非单纯依赖一种模型，这些模型的专业化程度就越高，并开拓出人类能力的新领域。

而在运用不同模型优势方面，一种越来越重要的模式就是路由——即以动态方式将查询发送给最适合的模型，同时在不降低质量的前提下使用成本更低、速度更快的模型。路由机制让我们能够充分发挥专业化带来的所有好处，例如更高的准确度和更低的成本及延迟，同时不必牺牲泛化意义上的稳健性。

我们可以通过以下事实，感受到路由能力的基本逻辑：世界上大多数顶尖模型本身都有路由功能，它们采用混合专家架构构建而成，将每一项下一token生成任务路由到几十个专家子模型。如果大模型真要成为之前提到的模糊商品，那就必须让路由成为AI技术栈中至关重要、不可或缺的组成部分。

还有一种观点认为，随着大语言模型逐渐接近人类智能，它将达到稳定状态——即当能力达成饱和时，我们将围绕单一通用模型进行整合，就如同我们围绕AWS或者iPhone进行功能整合一样。这两大平台（也包括其他同类竞争对手）在过去几年间并没能将能力提高10倍，但这并不影响我们在其生态系统中获得极其舒适的体验。然而我们相信，AI不会止步于人类的当前智能水平，它将继续远远超越我们所能设想的一切极限。随着其实现，AI将变得越来越分散且专业化，就如同其他一切自然系统一样。

需要强调，我们不是在夸大AI模型碎片化有多好、多正确。我只是在说分散的市场才是真正有效率的市场：赋予了买家们权力，能够最大限度发挥创新，同时将成本降至最低水平。而且，如果我们能够使用体量更小、更加专业的模型网络，而非通过单一巨型模型来发送各种内容，那我们距离更安全、更可解释且更自主可控的AI未来也就又进了一步。

最伟大的发明应该没有所有人。富兰克林无法把电力传给他的子嗣，图灵的遗产中也不包括计算机。AI无疑是人类最伟大的发明之一，我们坚信它的未来将是、也应该是多种模型共存的局面。

来源：VentureBeat

0赞

好文章，需要你的鼓励

尽管AI军备竞赛激烈，但多模型共存的未来已成定局

来源：VentureBeat

2025

01/03

10:55

分享

点赞

稚晖君发布全球最小全身力控人形机器人，上纬启元开启个人机器人时代

2026年软件定价大洗牌：IT领导者必须知道的关键变化

Linux 在 2026 年将势不可挡，但一个开源传奇可能难以为继

CES 2026趋势展望：全球最大科技展五大热门话题预测

人工智能时代为何编程技能比以往更重要

AI颠覆云优先战略：混合计算成为唯一出路

谷歌发布JAX-Privacy 1.0：大规模差分隐私机器学习工具库

谷歌量子AI发布新型优化算法DQI：量子计算优化领域的重大突破

缓解电动汽车里程焦虑：简单AI模型如何预测充电桩可用性

Titans + MIRAS：让AI拥有长期记忆能力

Gemini为STOC 2026大会理论计算机科学家提供自动化反馈

夸克AI眼镜持续升级：首次OTA，支持89种语言翻译

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

QwQ-32B模型成本地部署福音，通义App可第一时间体验

入局智驾的印奇，看到了怎样的未来？

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

千里科技亮相吉利AI智能科技发布会，共启“AI+车”新纪元

天翼云CPU实例部署DeepSeek-R1模型最佳实践

京东云与宝德计算战略签约，共绘分布式存储与智算新未来

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: