一场突如其来的新型冠状病毒(COVID-19),牵动着全世界的神经,抗击疫情成为社会各界广泛关注的焦点。实际上,除了一直以来奋战在一线的医务人员,先进的“科技力量”也是这场“战疫”中的另外一条关键战线。在针对新型冠状病毒的研究工作中,科研人员首先需要解析病毒全基因组序列,从而根据序列来研发相应诊断试剂盒,并进行病毒同源性分析找到病毒的来源,同时根据病毒的信息和特点决定接下来的防控和治疗方式。
在如何获取更完整详尽的病毒基因组序列方面,目前广泛应用高通量测序技术来完成,但由于病毒体的基因测序会产生TB级甚至PB级的海量数据,使用这种技术产生的DNA序列数据量十分庞大,需要强大的计算能力来支持。为此,高性能计算(HPC)在有效管理、分析和利用这些序列数据方面发挥了重要作用。作为国际知名的基因科研组织之一,俄勒冈州立大学基因组研究和生物计算中心(CGRB)在利用基于AMD EPYC(霄龙)处理器的高性能计算设备开展基因测序方面进行了积极探索,无疑很值得借鉴。
多线程带来高效率,让科研更进一步
俄勒冈州立大学基因组研究和生物计算中心(CGRB)为大学的26 个科系提供服务,从而促进基因组和数据驱动研究。研究人员可以使用该中心开发的 4,000 至 5,000 个程序,这些程序运行在分布式服务架构上,并且该架构拥有 5000 多个处理器、5 PB 可用存储以及安全的专用 1G/10G/40G 网络。 CGRB 每天生成 4TB 到 8TB 的海量数据,同时每时每刻都有成千上万个作业在运行。 因此,如何进一步提升高性能计算水平,增加运行的作业数,帮助该大学以最佳的成本效益进行科学研究,是该中心目前亟需解决的问题。
CGRB 生物计算助理主任 Chris Sullivan表示: “我们每天处理约 20,000 个作业,并且大部分作业与基因组比对有关。可能同时有一百个作业在运行,每个作业包含必须与基因组比对的 5000 万个序列,并且每个都使用不同的算法。 而处理如此庞大的数据需要具有非常多的处理器核心和线程的高性能服务器才能做到。”
经过一系列的评估和对比,AMD EPYC处理器成为了俄勒冈州立大学的选择。“我们在研究上取得的成果要依赖于线程数。我们需要解答科学问题, 但处理器频率并不会改变科学答案,所以我们不会为更高的处理器频率而多花钱。 但是,我们拥有的线程数越多,完成的作业就越多,这意味着我们可以离答案更近一步。因此,我们一直在寻求获得非常高的线程数,希望能达到 100 个以上,同时要拥有高性价比。” Sullivan表示, “就我们所谈论的线程和作业数量而言,只有AMD EPYC真正达到这个要求,可以提供128个线程。”
事实上,通过增加多台基于AMD EPYC的高性能计算设备,CGRB能以较低的总运营成本获得更多的线程,从而完成更多的作业数量,提升投资回报率。
降本增效省空间,让科研更容易
AMD EPYC所拥有的核心密度和线程数在其他方面同样发挥重要作用。 “我无法扩建我的服务器机房,这需要花费成百上千万美元,然而EPYC处理器为我提供了新的选择。”Sullivan 表示, “EPYC处理器的双路配置带来的回报非常显著。我们插上电源,获得所需的线程,以足够快的速度完成作业,并且不用对服务器机房做任何改建。”
除此之外,俄勒冈州立大学的研究组还降低了 CGRB 管理费用,同时使可以执行的作业数量增加了一倍。Sullivan解释道:“由于配备了AMD EPYC,我们不再使用 InfiniBand。它们可以在本机运行,比使用 InfiniBand 更快。” 借助AMD EPYC,该中心不仅减少了管理开销,而且降低了成本,同时将笨拙的大型机器更换为更具成本效益的设备且不影响性能,获得了研究人员的一致好评。
CGCB寻找的新技术要求能够为研究人员更快获得运算结果。 “这项技术令研究人员折服,他们是购买的决策者。 AMD EPYC 正是他们想要的,因为无论价格还是线程数量都极具优势。因此,我们在拨款申请方面也变得非常容易。” Sullivan提到。
科研永无止境,算力永不止步
Sullivan表示,对于俄勒冈州立大学的各种科研项目来说,现有的计算能力还远远不足,科学的发展正在逐渐超越设备的能力。面对不断攀升的计算需求, CGRB将继续携手AMD来部署新一代高性能计算,获得更加前沿、强劲的 “算力 “体验。
“我们的研究组正准备撤换现有的 48 线程、24 核心处理器,替换为更多核心和线程的 AMD EPYC处理器。” Sullivan 表示, “AMD 将会成为推动该中心不断发展的科学事业的重要力量。 AMD 一直在帮助我们,我们期待部署更多的 AMD EPYC,因为更多线程意味着更出色的成本效益。”
毫无疑问,无论是在当前新冠疫情背景下的应用,还是疫情结束之后的科学研究和检测,强大的算力支持都是不可或缺的。在这场收集、研究和分析与医疗信息化环境相关的关键生物医学研究数据的竞赛中,AMD EPYC凭借超强的性能和易用性,加上其领先的总体拥有成本(TCO)优势,为企业和研究机构的分析和不断创新提供了一条捷径。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。