当智能体撞上“Token通胀”,企业AI还能怎么落地?戴尔给出了一个新答案

Dell AI Factory with NVIDIA进一步扩展,为企业打造本地化、安全且成本可预测的现代化智能基础底座,实现从桌面决策终端到数据中心规模化部署的无缝延展。

过去一年,企业对AI的讨论明显变了味——从“模型有多强”转向“到底能不能上生产、能不能带来真实收益”。智能体(AI Agent)被普遍视为这一转变的关键载体,但产业界也越来越清醒地意识到,从惊艳Demo到可靠的企业级产品之间,隔着一道巨大的工程鸿沟。

最直观的鸿沟,是成本。IDC数据显示,仅仅是2025上半年,中国公有云大模型调用量就已经达到536.7万亿Tokens。Token单价虽然持续下行,但智能体的运行机制天然要求多步骤推理、长上下文处理与频繁工具调用,整体调用量呈指数级膨胀,云端账单也随之水涨船高。一份来自Anthropic与研究机构Material在2025年末对美国500多位技术领导者的调研,更印证了行业的另一种焦虑:高达93%的AI Agent项目卡在了从POC到生产的跨越,失败原因高度集中在成本失控、数据安全与系统集成三大维度。

正是在这样的产业背景下,戴尔科技集团在2026年5月18日召开的戴尔科技全球峰会上,式推出Dell 桌面端现代化智能解决方案,为 Dell AI Factory with NVIDIA 再添全新能力。该解决方案支持工作团队在本地部署并扩展智能体工作流,摆脱纯云端部署方案所带来的高昂成本、网络时延及数据主权管控难题。NVIDIA OpenShell运行环境现已全面适配Dell AI Factory with NVIDIA,企业可依托统一的安全与策略执行层,实现从桌面工作站至戴尔科技服务器的一致管控。

随着AI工作流逐步向智能体架构转型,Token使用量加速增长,即便其单价持续下行,整体云端成本仍会快速攀升至企业难以负担的水平。纯云端部署策略难以满足规模化场景下的三大核心诉求,即成本效益、安全防护与数据主权。因此,企业在落地智能体的过程中,亟需一套可同时兼顾上述三大维度的基础设施,既能随工作负载灵活扩展,也无需随业务迭代反复重构。

Dell AI Factory with NVIDIA 提供了一套从桌面决策终端到数据中心规模化部署的企业就绪型路径。借助Dell 桌面端现代化智能解决方案,企业在运行不同规模的智能体工作负载时,可实现与公有云 API 相当甚至更优的成本收支平衡。桌面端系统可在本地完成 AI 推理,兼顾成本可预测性与数据安全性,助力企业全面掌控 AI 运行环境。与此同时,NVIDIAOpenShell为开发者及IT团队提供安全的沙盒环境,可在 Dell AI Factory with NVIDIA 的工作站到服务器体系中构建、部署并管理智能体。企业团队可更灵活地进行开发与版本迭代,同时降低不可预测的云端推理成本波动、带宽开销及知识产权风险。

面向生产就绪型应用的完整桌面端现代化智能解决方案

Dell 桌面端现代化智能解决方案的设计立足于行业实际现状:约有超过50%的智能体工作流基于开放权重模型运行1。这类模型参数为300 亿至 2840 亿,能够进行批量推理,从而高效支撑各项业务运转。从代码助手、研究型智能体,到面向受监管行业的高安全性私有AI助手,该解决方案提供多款戴尔科技高性能工作站,可根据不同工作负载与预算需求灵活匹配,并结合NVIDIA NemoClaw参考堆栈及戴尔服务,以经济效益最优的方案,承载高强度 AI 工作负载。与使用云端API相比,企业通过采用Dell 桌面端现代化智能解决方案可大幅减少开支。

  • 搭载 GB10 Dell Pro Max机身紧凑、能效优异,面向小规模、个人级的智能体原型开发场景,可运行参数规模为300亿至2000亿的模型。

当智能体撞上“Token通胀”,企业AI还能怎么落地?戴尔给出了一个新答案

搭载 GB10 的 Dell Pro Max

  • Dell Pro Precision 9企业级塔式工作站,搭载英特尔® 至强™ 600系列处理器,至多可配置五块NVIDIA® RTX™ PRO Blackwell工作站版GPU,为主力级GPU工作负载提供可扩展性能,可运行参数规模为300亿至5000亿的模型。

当智能体撞上“Token通胀”,企业AI还能怎么落地?戴尔给出了一个新答案

Dell Pro Precision 9 T4(左)和Dell Pro Precision 9 T6(右)

  • NVIDIA NemoClaw参考堆栈:基于OpenClaw构建的开源堆栈,用于安全管理始终在线运行的智能体。OpenClaw作为智能体架构框架,支持在本地硬件上执行持续、自主的多步骤 AI 工作流。该软件栈将用于推理与编码的NVIDIA Nemotron 高性能开源模型,与可保障运行环境安全的OpenShell 相结合,以上组件均隶属于NVIDIA AgentToolkit,可用于构建和编排长时间运行的智能体。
  • 戴尔服务:提供贯穿智能体全生命周期的端到端支持,从初始战略规划与硬件部署,到工作流匹配、智能体优先级规划及持续优化,助力企业加速投入生产部署,补齐内部 AI 专业能力缺口。

全场景工作负载,可靠架构支撑

在生产环境中部署智能体需要一套统一框架,以保护敏感数据、集成现有业务流程,并完全覆盖基础设施栈。NVIDIAOpenShell 运行环境现已全面适配Dell AI Factory with NVIDIA,为企业提供沙盒环境,用于构建、部署与管理智能体,并在运行时实现隐私与安全防护。在更接近数据的环境中进行智能体开发与部署,有助于提升治理能力、安全性与运营管控能力。

依托NVIDIA AI-Q 2.0 blueprint 能力加持,企业可采用经过验证的基础框架,用于部署处理研究、决策支持及复杂任务的多智能体工作流,加速从业务试点向真正生产的转化。该方案专为要求严苛的本地工作负载而设计,现通过 Dell-NVIDIAAI-Q 2.0 参考架构的形式推出,由戴尔科技智能数据平台提供支持。

戴尔科技集团首席运营官Jeff Clarke 表示:“贴近数据源生成的 token 效率最高,大部分企业数据并不在云端环境中。Dell桌面端现代化智能解决方案让各个团队都能搭建安全的本地环境,用于运行智能体,确保成本可预测性,并确保企业数据隐私绝对安全可控。在桌面端验证可行的能力,同样能够扩展至数据中心,这一部署模式将引领未来十年趋势。”

NVIDIA AI平台副总裁Justin Boitano指出:“随着企业依托智能体重构并拓展未来办公模式,业界正在寻求可覆盖从日常办公桌面终端到AI工厂的基础设施,以实现全场景的覆盖。依托融合NVIDIA OpenShell的Dell AI Factory with NVIDIA,企业可实现本地研发、安全扩展,在统一平台内完成智能体的全域部署。”

Signal65 总裁Ryan Shrout表示:“随着企业从 AI 试点应用迈入全面生产阶段,市场对安全、可扩展且高性价比的基础设施需求愈发强烈。作为 Dell AI Factory 体系的重要组成部分,Dell 桌面端现代化智能解决方案打通本地控制与企业级可扩展性之间的壁垒,同时为持续技术迭代预留充足空间。这套从桌面端延伸至数据中心的能力独具优势,助力企业充分挖掘智能体应用潜能,同时保障数据自主掌握、成本稳定可控。”

戴尔此次发布的产品组合所体现的“桌面—工作站—数据中心”一体化思路,正切中当下企业AI落地最现实的几个矛盾点:既要算力,也要可控成本;既要灵活迭代,也要数据安全。在智能体即将进入规模化生产的关键窗口期,谁能提供一条让企业“敢用、用得起、用得久”的基础设施路径,谁就握住了未来十年企业AI市场的入场券。从这个意义上讲,Dell AI Factory with NVIDIA 的这次扩展,也是行业部署范式从“云优先”向“端云协同”演进的一个重要标志。

来源:业界供稿

0赞

好文章,需要你的鼓励

2026

05/21

16:49

分享

点赞

邮件订阅