手机大模型的又一股势力？Hugging Face公布SmolLM模型

号称在性能上超越了微软、Meta以及阿里千问系列的同类产品。

Hugging Face最近公布了一套新的紧凑型语言模型——SmolLM，这套模型在性能上超越了微软、Meta以及阿里巴巴千问系列的同类产品。这些新模型能够为个人设备提供先进的AI功能，且不会影响到设备端性能与用户隐私。

SmolLM家族拥有三位成员，参数规模分别为1.35亿、3.6亿及17亿，旨在适配不同水平的计算资源。尽管占用空间不大，但这些模型在常识推理与世界知识基准测试当中均拥有出色表现。

身小力不亏：SmolLM如何挑战AI行业巨头

Hugging Face公司SmolLM项目首席机器学习工程师Loubna Ben Allal强调，这些紧凑模型在针对特定场景时拥有相当出色的实践效果。她解释称：“我们不需要为每项任务分别建立大规模基础模型，正如我们没必要用拆除锤在墙上打眼儿。专为特定任务设计的小模型也能做好很多工作。”

其中体量最小的SmolLM-135M模型尽管在训练阶段使用的token更少，但表现仍然优于Meta的MobileLM-125M。SmolLM-360M号称在性能上超越了所有参数低于5亿的模型，包括Meta及阿里千问系列产品。旗舰级模型SmolLM-1.7B则在多项基准测试中击败了微软的Phi-1.5、Meta的MobileLM-1.5B以及千问Qwen2-1.5B。

Hugging Face还将包括数据管理到各训练步骤在内整个开发过程进行了开源，迅速获得业界关注。这种透明度也符合该公司对于开源价值主张以及支持可重复研究的承诺。

秘诀：高质量数据管理推动SmolLM获得成功

这些模型的出色表现，离不开精心策划的训练数据。SmolLM以Cosmo-Corpus为基础，其中包括Cosmopedia v2（合成教书与故事内容）、Python-Edu（教育性Python示例）以及FineWeb-Edu（精选的教育性网络内容）。

Ben Allal在采访时解释道：“通过SmolLM的现实性能，我们证明数据质量是决定模型水平的关键因素。我们开发出的创新方法能够精心策划高质量数据，将网络来源与合成数据相结合，从而建立起性能最佳小模型。”

SmolLM的发布也有望对AI的可及性及用户隐私产生重大影响。这些模型完全可以在手机及笔记本电脑等个人设备上运行，因此消除了云计算需求，同时缓解了成本与隐私问题。

推动AI大众化：SmolLM对可及性与隐私的影响

Ben Allal还专门强调了SmolLM家族的可及性优势：“这些能够在手机和个人电脑上运行、且性能出色的小模型，意味着每个人都可以使用AI技术。这些模型能够免费解锁新的可能性，具备完全隐私保障和更低的环境足迹。”

Hugging Face研究团队负责人Leandro von Werra在采访时还特别强调了SmolLM的实际意义。“这些紧凑型模型为开发人员和最终用户打开了一个充满可能性的世界。从个性化自动补全功能到解析复杂的用户请求，SmolLM无需昂贵的GPU或者云基础设施即可支撑起自定义AI应用程序。无论是降低AI的访问门槛、还是为每个人提供隐私保护，SmolLM的出现都代表着迈向未来的重要一步。”

像SmolLM这样强大、高效的小模型，也代表着AI技术迎来了重大转变。通过令高级AI功能更易于访问且符合隐私保护需求，Hugging Face解决了人们对于AI环境影响以及数据隐私等潜在威胁的日益增长的担忧。

随着SmolLM模型家族、数据集以及训练代码的正式亮相，全球AI社区及开发人员现在已经可以探索、改进并构建这种创新的语言模型方法。正如Ben Allal在采访中做出的总结：“希望更多人参与进来，帮助SmolLM更上一层楼！”

来源：VentureBeat

0赞

好文章，需要你的鼓励

手机大模型的又一股势力？Hugging Face公布SmolLM模型

来源：VentureBeat

2024

07/19

10:52

分享

点赞

仿人机器人视觉与运动技术的精细调校

抵御AI驱动的数据融合攻击：芯片安全防护的关键挑战

AI数据中心与汽车行业在能源管理领域的技术融合

GLM-5.2海外爆火，我们翻了1500条评论，看看用户在讨论什么

电动自行车的功过之辩：被忽视的那一面

Neo：印度科技大亨自掏3000万美元，打造微软Office的AI替代品

AI数据中心如何获得电网接入资格？公用事业公司的规划逻辑解析

Brookfield与Bloom能源将融资规模扩至250亿美元，押注AI数据中心独立供电

当CIO的技术提案遭到否决，该如何应对？

这款谷歌实验室 AI 应用如何成为我每日必用的工具

起亚EV5推出Storm特别版并新增全轮驱动选项

Meta效仿SpaceX，将过剩AI算力变现

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

QwQ-32B模型成本地部署福音，通义App可第一时间体验

入局智驾的印奇，看到了怎样的未来？

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

千里科技亮相吉利AI智能科技发布会，共启“AI+车”新纪元

天翼云CPU实例部署DeepSeek-R1模型最佳实践

京东云与宝德计算战略签约，共绘分布式存储与智算新未来

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: