Llama 3.1：Meta迄今为止规模最大、质量最高的开源模型

扎克伯格放出豪言，预计Meta的AI助手使用率将在未来几个月内赶超ChatGPT。

早在今年4月，Meta就曾透露正在为AI行业开发一项首创技术：一种性能足以与OpenAI等厂商的最强私有模型相媲美的开源模型。

现如今，这套模型已经问世。Meta发布了有史以来体量最大的开源AI模型Llama 3.1。该公司声称该模型在多项基准测试中优于GPT-4o和Anthropic的Claude 3.5 Sonnet。新版本还为基于Llama的Meta AI助手带来更多国家和语种支持，同时绞架了一项可以根据特定人物肖像生成图像的新功能。公司CEO马克·扎克伯格更是大胆做出预测，称到今年年底，Meta AI将超越ChatGPT成为使用范围最广的AI助手。

Llama 3.1比几个月前发布的小型Llama 3模型复杂得多。其最大的版本拥有4050亿个参数，且使用超过1.6万张英伟达旗舰级H100 GPU训练而成。Meta没有透露Llama 3.1的开发成本，但单纯计算英伟达芯片的采购成本，就可以肯定资金投入不会低于数亿美元。

那么考虑到如此高昂的成本投入，Meta为何执意让Llama模型家族保持开源，将如此重量级的成果免费交付至众多用户手中？在Meta公司通过官博发表的公开信中，扎克伯格宣称开源AI模型终将超越专有模型——而且目前已经展现出优于专有模型的改进速度。这就如同开源Linux系统，如今成为大多数手机、服务器和小装置上的主导操作系统一样。

他还将Meta对于开源AI的投入，与公司早期的开放计算项目（OCP）进行了比较。他表示在Meta规划自己的基础设施容量时，惠普等其他厂商帮助Meta对数据中心设计进行了改进了标准化，帮助其成功节约下“数十亿美元”。展望未来，他预计同样的情况也将在AI领域上演。他在信中写道：“我相信Llama 3.1的发布将成为行业中的又一个转折点，大多数开发人员开始主要依赖开源成果。”

为了帮助将Llama 3.1推向世界，Meta正在与微软、亚马逊、谷歌、英伟达和Databricks等二十多家公司合作，帮助开发人员部署适合自身需求的版本。Meta声称，Llama 3.1在生产环境中的运行成本大约只相当于OpenAI GPT-4o的一半。他们还一并发布了模型权重，以便企业客户能够立足自身数据以模型进行训练，并根据实际偏好做出调整。

根据Meta公司发言人Jon Carvill的介绍，Gemini未被纳入此番基准比较，因为Meta难以使用谷歌提供的AIP来重现其先前声明的结果。

Meta主要合作伙伴清单及其为Llama 3.1部署提供的功能方案。

不出所料，Meta并没有透露太多关于用于训练Llama 3.1模型的数据信息。先后已经有多位曾经在AI企业工作过的雇员表示，由于涉及商业机密，他们无法透露这部分信息。但批评人士则认为，这是一种通过拖延来对抗版权诉讼纠纷的消极策略。

但Meta强调，他们使用的是合成数据，也就是由模型生成、而非来自真实人类的数据。此外，他们还利用4050亿参数版本的Llama 3.1，对原有小型700亿及80亿参数版本模型做出了改进。Meta公司生成式AI副总裁Ahmad Al-Dahle预计，Llama 3.1将在开发者群体当中受到欢迎，因为它堪称“小模型的老师，能够在提升前者性能之后以更具成本效益的方式实现AI部署”。

在被问及Meta是否认可业界日益增长的普遍共识，即可供模型使用的高质量训练数据即将耗尽时，Al-Dahle表示上限确实即将到来，只不过具体期限可能比部分人想象中的更远。“我们相信目前的数据应该还能再支撑几个训练周期，但具体情况也很难说。”

Meta还首次对Llama 3.1进行了红队测试（即对抗性测试），包括借此寻求潜在的网络安全与生物化学用例。而对模型开展严格测试的另一个理由，在于Meta提到的新兴“代理”行为。

例如，Al-Dahle告诉我们Llama 3.1能够与搜索引擎API相集成，以“通过复杂的查询从互联网上检索信息，并连续调用多种工具以完成用户提交的任务。”他还给出另一个例子，就是要求模型绘制过去五年来全美售出的房屋数量。“它可以检索网络结果，生成Python代码并加以执行。”

Meta自己的Llama实现方案是一款AI助手，其功能定位属于类似ChatGPT的通用型聊天机器人，且几乎能够在Instagram、Facebook和WhatsApp的各个功能模块上发挥作用。从本周开始，Llama 3.1将率先通过WhatsApp和美国Meta AI网站对外开放，并在随后几周内正式登陆Instagram与Facebook。此番更新将让Meta AI助手支持更多新语种，包括法语、德语、印地语、意大利语和西班牙语。

虽然Llama 3.1最先进的4050亿参数模型已经在Meta AI中免费开放，但助手会在一周内提示词超过指定数量后将用户切换至体量更小的700亿参数模型。由此看来，4050亿参数模型对于Meta来说还是太过昂贵，仍无法全面运行。公司发言人Jon Carvil告诉我们，Metra将在评估早期使用情况之后提供关于提示词阈值的更多信息。

Meta AI还提供一项新的“Imagine Me”功能，可以通过手机摄像头扫描用户面部，进而将用户的肖像插入到其生成的图像当中。通过这种方式、而非直接从个人资料照片中捕捉人脸，Meta希望避免其AI功能被deepfakes滥用。该公司意识到越来越多的用户希望创建多种AI媒体，并将结果分享到自己的个人动态之内，尽管这有可能进一步模糊真实与虚假之间的判断边界。

Meta AI也将在未来几周内登陆Quest头显设备，取代其语音命令界面。与Meta Ray-Ban眼镜中的实现效果类似，用户可以在Quest上使用Meta AI来识别并理解头显直通模式下看到的内容，进而通过显示屏解读现实世界。

除了扎克伯格预计Meta AI将在今年年底成为使用率最高的聊天机器人（作为比较，ChatGPT目前拥有超过1亿用户）之外，Meta并未分享其AI助手的任何市场普及度数据。Al-Dahle表示：“我认为整个行业在产品的市场匹配方面仍处于早期探索阶段。”尽管AI科技存在严重的过度炒作之嫌，但Meta及其他参与厂商显然对未来抱有信心，并坚定认为新一轮竞争才刚刚开始。

来源：The Verge

0赞

好文章，需要你的鼓励

Llama 3.1：Meta迄今为止规模最大、质量最高的开源模型

来源：The Verge

2024

07/25

11:21

分享

点赞

Albertsons借助Databricks构建零售商品智能决策平台

微软正式将 Windows 11 打造为 AI 操作系统

工作中使用未授权AI工具之前，请三思

全球首座AI博物馆Dataland：用数据创造多感官视觉盛宴

ANS框架：Linux基金会为AI智能体建立DNS式信任机制

Hirebotics推出无代码防爆协作机器人，专为工业喷涂设计

美国消费品安全委员会拟出台电动自行车电池安全新规

江波龙：建设完成mSSD月产能百万交付能力！mSSD高速存储介质赋能端侧AI规模应用

从IO500双榜第一，看国产存储的系统级突破

Rocket Lab宣布以80亿美元收购卫星运营商铱星公司

OpenAI携手Trail of Bits发起"Patch the Planet"开源安全修复计划

公共电力性价比优势面临多年来最严峻考验

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: