Llama 3.1:Meta迄今为止规模最大、质量最高的开源模型

扎克伯格放出豪言,预计Meta的AI助手使用率将在未来几个月内赶超ChatGPT。

早在今年4月,Meta就曾透露正在为AI行业开发一项首创技术:一种性能足以与OpenAI等厂商的最强私有模型相媲美的开源模型。

现如今,这套模型已经问世。Meta发布了有史以来体量最大的开源AI模型Llama 3.1。该公司声称该模型在多项基准测试中优于GPT-4o和Anthropic的Claude 3.5 Sonnet。新版本还为基于Llama的Meta AI助手带来更多国家和语种支持,同时绞架了一项可以根据特定人物肖像生成图像的新功能。公司CEO马克·扎克伯格更是大胆做出预测,称到今年年底,Meta AI将超越ChatGPT成为使用范围最广的AI助手。

Llama 3.1比几个月前发布的小型Llama 3模型复杂得多。其最大的版本拥有4050亿个参数,且使用超过1.6万张英伟达旗舰级H100 GPU训练而成。Meta没有透露Llama 3.1的开发成本,但单纯计算英伟达芯片的采购成本,就可以肯定资金投入不会低于数亿美元。

那么考虑到如此高昂的成本投入,Meta为何执意让Llama模型家族保持开源,将如此重量级的成果免费交付至众多用户手中?在Meta公司通过官博发表的公开信中,扎克伯格宣称开源AI模型终将超越专有模型——而且目前已经展现出优于专有模型的改进速度。这就如同开源Linux系统,如今成为大多数手机、服务器和小装置上的主导操作系统一样。

他还将Meta对于开源AI的投入,与公司早期的开放计算项目(OCP)进行了比较。他表示在Meta规划自己的基础设施容量时,惠普等其他厂商帮助Meta对数据中心设计进行了改进了标准化,帮助其成功节约下“数十亿美元”。展望未来,他预计同样的情况也将在AI领域上演。他在信中写道:“我相信Llama 3.1的发布将成为行业中的又一个转折点,大多数开发人员开始主要依赖开源成果。”

为了帮助将Llama 3.1推向世界,Meta正在与微软、亚马逊、谷歌、英伟达和Databricks等二十多家公司合作,帮助开发人员部署适合自身需求的版本。Meta声称,Llama 3.1在生产环境中的运行成本大约只相当于OpenAI GPT-4o的一半。他们还一并发布了模型权重,以便企业客户能够立足自身数据以模型进行训练,并根据实际偏好做出调整。

Llama 3.1:Meta迄今为止规模最大、质量最高的开源模型

根据Meta公司发言人Jon Carvill的介绍,Gemini未被纳入此番基准比较,因为Meta难以使用谷歌提供的AIP来重现其先前声明的结果。

Llama 3.1:Meta迄今为止规模最大、质量最高的开源模型

Meta主要合作伙伴清单及其为Llama 3.1部署提供的功能方案。

不出所料,Meta并没有透露太多关于用于训练Llama 3.1模型的数据信息。先后已经有多位曾经在AI企业工作过的雇员表示,由于涉及商业机密,他们无法透露这部分信息。但批评人士则认为,这是一种通过拖延来对抗版权诉讼纠纷的消极策略。

但Meta强调,他们使用的是合成数据,也就是由模型生成、而非来自真实人类的数据。此外,他们还利用4050亿参数版本的Llama 3.1,对原有小型700亿及80亿参数版本模型做出了改进。Meta公司生成式AI副总裁Ahmad Al-Dahle预计,Llama 3.1将在开发者群体当中受到欢迎,因为它堪称“小模型的老师,能够在提升前者性能之后以更具成本效益的方式实现AI部署”。

在被问及Meta是否认可业界日益增长的普遍共识,即可供模型使用的高质量训练数据即将耗尽时,Al-Dahle表示上限确实即将到来,只不过具体期限可能比部分人想象中的更远。“我们相信目前的数据应该还能再支撑几个训练周期,但具体情况也很难说。”

Meta还首次对Llama 3.1进行了红队测试(即对抗性测试),包括借此寻求潜在的网络安全与生物化学用例。而对模型开展严格测试的另一个理由,在于Meta提到的新兴“代理”行为。

例如,Al-Dahle告诉我们Llama 3.1能够与搜索引擎API相集成,以“通过复杂的查询从互联网上检索信息,并连续调用多种工具以完成用户提交的任务。”他还给出另一个例子,就是要求模型绘制过去五年来全美售出的房屋数量。“它可以检索网络结果,生成Python代码并加以执行。”

Meta自己的Llama实现方案是一款AI助手,其功能定位属于类似ChatGPT的通用型聊天机器人,且几乎能够在Instagram、Facebook和WhatsApp的各个功能模块上发挥作用。从本周开始,Llama 3.1将率先通过WhatsApp和美国Meta AI网站对外开放,并在随后几周内正式登陆Instagram与Facebook。此番更新将让Meta AI助手支持更多 新语种,包括法语、德语、印地语、意大利语和西班牙语。

虽然Llama 3.1最先进的4050亿参数模型已经在Meta AI中免费开放,但助手会在一周内提示词超过指定数量后将用户切换至体量更小的700亿参数模型。由此看来,4050亿参数模型对于Meta来说还是太过昂贵,仍无法全面运行。公司发言人Jon Carvil告诉我们,Metra将在评估早期使用情况之后提供关于提示词阈值的更多信息。

Llama 3.1:Meta迄今为止规模最大、质量最高的开源模型

Meta AI还提供一项新的“Imagine Me”功能,可以通过手机摄像头扫描用户面部,进而将用户的肖像插入到其生成的图像当中。通过这种方式、而非直接从个人资料照片中捕捉人脸,Meta希望避免其AI功能被deepfakes滥用。该公司意识到越来越多的用户希望创建多种AI媒体,并将结果分享到自己的个人动态之内,尽管这有可能进一步模糊真实与虚假之间的判断边界。

Meta AI也将在未来几周内登陆Quest头显设备,取代其语音命令界面。与Meta Ray-Ban眼镜中的实现效果类似,用户可以在Quest上使用Meta AI来识别并理解头显直通模式下看到的内容,进而通过显示屏解读现实世界。

除了扎克伯格预计Meta AI将在今年年底成为使用率最高的聊天机器人(作为比较,ChatGPT目前拥有超过1亿用户)之外,Meta并未分享其AI助手的任何市场普及度数据。Al-Dahle表示:“我认为整个行业在产品的市场匹配方面仍处于早期探索阶段。”尽管AI科技存在严重的过度炒作之嫌,但Meta及其他参与厂商显然对未来抱有信心,并坚定认为新一轮竞争才刚刚开始。

来源:The Verge

0赞

好文章,需要你的鼓励

2024

07/25

11:21

分享

点赞

邮件订阅