AMD和谷歌云今日宣布,在采用第二代AMD EPYC(霄龙)处理器的谷歌计算引擎上推出 N2D虚拟机的测试版本。对于运行通用用途以及需要平衡计算和内存的高性能工作负载客户来说,N2D 虚拟机系列是一个绝佳的选择。
N2D 虚拟机旨在为客户提供:
· 高性能的第二代AMD EPYC处理器为客户提供更大的灵活性来选择满足其工作负载的最优虚拟机,并带来与同类实例相比提升高达39%的Coremark基准性能,同时与N系列实例相比可实现高达13%的节省。
· 128和224个虚拟处理器配置选项,在面向需要高内存带宽的高性能计算(HPC)工作负载的谷歌计算引擎中,提供比现有的同类虚拟机高达70%的内存带宽提升。
· 更高的平台内存带宽和核心数量。与谷歌当前同类虚拟机处理器相比,在包括Gromacs和NAMD在内的多个基准测试上性能提升100%。
AMD高级副总裁兼数据中心与嵌入式解决方案事业部总经理Forrest Norrod表示:“全球的云提供商和托管商均认可第二代AMD EPYC处理器出色的核心扩展、庞大的内存带宽、大幅减少的TCO以及创纪录的性能表现。AMD和Google在这些初始虚拟机上紧密合作,以确保谷歌云客户在多种工作负载环境下都能拥有高性能、成本效益佳的用户体验。我们将继续合作,在今年以及未来持续不断地为客户提供这样的完美体验。”
AMD EPYC处理器为现代云强劲赋能
AMD EPYC处理器为世界各地的云提供商和托管商的120多种虚拟机提供支持,使终端客户能够获得功能强大、成本效益高、且使用灵活的虚拟机产品。
谷歌云平台上的测试版N2D虚拟机已在us-central1, asia-southeast1和europe-west4提供,更多地区将陆续上线。您可以通过谷歌云平台博客阅读有关该虚拟机的更多信息,并访问谷歌云端控制台(Google Cloud Console)开启您的全新体验。
好文章,需要你的鼓励
Snap 推出 Lens Studio 的 iOS 应用和网页工具,让所有技能层次的用户都能通过文字提示和简单编辑,轻松创建 AR 镜头,包括生成 AI 效果和集成 Bitmoji,从而普及 AR 创作,并持续为专业应用提供支持。
SEALQA是维吉尼亚理工大学研究团队开发的新型基准测试,旨在评估搜索增强型语言模型在面对矛盾、嘈杂或无用搜索结果时的推理能力。它包含三种测试:SEAL-0(极具挑战性的核心问题集)、SEAL-HARD(更广泛的困难问题集)和LONGSEAL(测试长上下文多文档推理)。研究发现,即使是前沿模型在这些测试中表现也很差,增加测试时计算资源往往不能带来可靠的性能提升,高级推理模型对嘈杂搜索结果特别敏感,模型在识别大量干扰文档中的相关信息时仍然困难重重。
这篇论文提出了"计划与预算"框架,解决大型语言模型在推理任务中的效率问题。研究者发现模型存在"推理失调"现象——简单问题上过度思考,复杂问题上思考不足。他们开发了贝叶斯预算分配模型(BBAM)作为理论基础,将推理分解为子问题并根据不确定性分配计算资源。实验表明,该方法在不同任务上显著提高推理效率,令牌使用减少39%,E?指标提升187.5%,且能使小型模型达到大型模型的效率水平。