2024年,围绕AI PC的讨论不绝于耳,生成式AI已成为各大PC厂商的必争之地,而PC作为一线生产力工具,也为生成式AI提供了一个大显身手的舞台。IDC在一份报告中预测,到2027年,每10台出货的PC产品中,就有6台会是AI PC,市场对AI PC抱有着巨大的热忱。
4月16日,AMD公布全新处理器产品,为AI PC提供全方位支持。作为业界率先在X86处理器内整合了人工智能引擎(NPU)的公司,AMD这次推出的锐龙PRO 8040系列移动处理器能够提供相当出色的性能表现,同时可以降低功耗,保障续航时间,很好地满足移动中的商务用户需求;面向商用台式机产品,AMD也推出了一款由AI驱动的产品——锐龙 PRO 8000系列处理器。
锐龙PRO 8040/8000系列处理器基于目前最先进的4nm制造工艺、Zen 4 CPU架构、RDNA3 GPU架构、XDNA NPU架构的强大组合,并加入AMD PRO技术组合,为商用客户提供更好的的安全性与可管理性,同时还可支持目前最快的Wi-Fi 7和蓝牙5.4无线连接标准。
在商用PC领域,AI PC将从协作能力、能效表现、生产力的提升以及隐私保护等方面,全面提升效率,为未来做好准备。
软件生态方面,AMD也在持续不断地扩大支持范围。不久前,在中国举行的AMD AI PC创新峰会上,AMD也曾表示,预计到2024年底,将看到AMD与超过150个ISV实现基于AI驱动的合作,其中包括Adobe、微软、ZOOM等国际合作伙伴,也包括中国本地的ISV合作伙伴如有道、腾讯、游戏加加等,在AI时代,用户将获得差异化的使用体验。
锐龙PRO 8040系列提供八款不同型号,包括高性能的35-54W 8045HS、20-28W 8040HS、低功耗的15-28W 8040U。锐龙9/7 PRO系列具有8核心16线程、24MB缓存,包括锐龙9 PRO 8945HS、锐龙7 PRO 8845HS/8840HS/8840U,其中最高的加速频率可以达到惊人的5.2GHz。锐龙5系列采用6核心12线程、22MB缓存,包括锐龙5 PRO 8645HS/8640HS/8640U/8540U,其中最高的加速频率高达5.0GHz。入门级的锐龙5 PRO 8540U虽然没有NPU AI引擎,但凭借强大的CPU和GPU,依然具有很好的性能表现。
面向台式机的锐龙PRO 8000系列也分为八款型号,包括高性能的45-65W 8000G系列、低功耗的35W 8000GE两个子系列。
锐龙7 PRO系列采用8核心16线程、24MB缓存,频率最高可达5.1GHz,包括锐龙7 PRO 8700G/8700GE。锐龙5系列为6核心12线程、22MB缓存,频率最高都能跑到5.0GHz,包括锐龙5 PRO 8600G/8500G/8600GE/8500GE。锐龙3系列为4核心8线程、12MB缓存,最高加速频率均可达4.9GHz,包括锐龙3 PRO 8300G/8300GE。
其实对于AMD来说,AI PC并不是一个未来的概念。AMD全球商用产品市场经理Ronak Shah表示,目前AMD已经向市场上出货了数百万台AI PC。
为了将面向生成式AI的计算拉到新的高度,Ryzen AI将确保设备能够在本地实现强大的生成式AI功能。Ronak介绍,Ryzen AI由CPU、GPU和NPU三个要素组成,CPU用来处理对响应速度要求比较高的任务;GPU重点处理AI工作流;NPU用来处理传统PC使用过程中难以完成的、更重的AI负载。
Ryzen AI将是一个面向未来的,在PC上可以实现的强大AI功能组合。
在平台技术方面,通过与高通的合作,AMD携手联想带来全球第一批Wi-Fi 7商用PC——ThinkPad T14。它搭载了锐龙PRO 8040系列处理器,Wi-Fi速度加快60%、延迟降低50%、能效提升50%,蓝牙覆盖范围也扩大至2倍,用户佩戴蓝牙耳机等设备离开电脑更远也能保持稳定连接。
同样通过与联发科的合作,AMD也助力惠普打造了全球首批Wi-Fi 7商用PC,包括Elite 805 G9迷你机、EliteBook 845 G11笔记本、ZBook Firefly G11 A笔记本等。不仅有3倍的数据传输速度提升、4倍的容量提升,单用户、多用户延迟分别改善了80%、25%,并且经过了超过9万多项稳定性测试,确保可靠性。
AMD锐龙PRO 8040/8000系列处理器的问世,标志着商用PC性能的又一次飞跃。凭借Zen 4 CPU和RDNA 3 GPU的强大架构,在性能基准上实现全面超越;Ryzen AI引擎为用户带来前所未有的智能化体验;AMD PRO技术的应用,确保了安全性和可管理性的行业领先地位;同时,Wi-Fi 7和蓝牙5.4的加入,让用户体验到最前沿的连接技术;AMD与众多生态系统合作伙伴的紧密合作,将使从硬件到软件的应用场景日益丰富,更好地满足广泛的用户需求。
好文章,需要你的鼓励
这篇研究介绍了KVzip,一种创新的查询无关KV缓存压缩方法,通过上下文重建机制为大型语言模型提供高效存储解决方案。该技术能将KV缓存大小减少394倍,同时提高解码速度约2倍,在各种任务上性能几乎不受影响。不同于传统查询相关的压缩方法,KVzip创建可在多种查询场景下重用的通用压缩缓存,特别适合个性化AI助手和企业信息检索系统。研究在LLaMA3.1-8B、Qwen2.5-14B和Gemma3-12B等多种模型上进行了验证,处理长度高达17万词元的文本,并能与KV缓存量化等其他优化技术无缝集成。
腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
这项研究揭示了大型语言模型(LLMs)偏好决策的内在机制。以色列理工学院和IBM研究院的团队开发了一种自动化方法,不需人工预设即可发现和解释影响AI判断的关键概念。研究横跨八个领域(从一般问答到安全评估),分析了12种偏好机制,发现人类评判者重视权威性和清晰度,而AI评判更关注事实准确性。他们提出的层次多领域回归模型不仅能准确预测偏好,还能清晰解释判断过程,为构建更透明、更符合人类价值观的AI系统提供了新途径。