2020年11月5日,小米在北京举办了2020 MIDC(第四届小米开发者大会),这也是小米一年一度硬核科技的阅兵式。在大会中小米发布了智能助理“小爱同学5.0”,展示了小米在相机、屏幕、快充和无线充电等领域取得的突破,并发布了“个性化动态语音识别技术”、“就近唤醒技术”等多项行业领先的自研技术。开场雷军表示:“这一切,离不开我们坚持技术为本,将继续加强研发投入,并把人才作为了小米发展的根本大计。”

死磕硬核技术,小米重回全球第三

上周,根据全球三大知名调研机构的数据,小米在全球智能手机市场的份额重回世界第三。其实早在2014年,小米就达成了这一成就,只是我们又花了足足6年时间来完成一个轮回。
在这些看起来简单的数字背后,所代表的是手机行业极为激烈的竞争。因为站在最后决赛圈的公司,全部是世界上最顶级的公司,而小米两度杀入世界前三,靠得是自身过硬的技术实力。死磕硬核科技,是小米发展之路的必修课。
今天小米回归全球第三,是小米6年来积极补课、夯实基础的成果,也是对小米技术实力最大的认可。同时,也坚定了小米的决心,只有继续死磕硬核技术,才能具备向顶峰冲刺的实力。
相机技术是大家可以看得到的,在小米研发中心里还有很多预研技术,并在这些领域取得了非常大的进展。小米在前段时间公布了的预研技术——小米的UWB技术(一指连技术),这项技术发布后引起了米粉们强烈的反响。
小米的模式是互联网+制造业,所以小米要植根制造业,在三年前,小米就开始思考怎么能为整个制造业进一步赋能,就是小米能不能帮助自己的代工厂,帮助制造业进行互联网的改造,进行提质增效,我们选择的领域是我们有没有可能帮助工厂智能化、自动化甚至无人化。

今年年初,小米建立的智能工厂,其实就是小米的实验工厂,正式落成了。
小米智能工厂,不仅仅是年产百万台超高端手机的“黑灯工厂”,还是新工艺、新材料和新技术预研的“大型实验室”,小米的小米10至尊版就是这个工厂生产的。这个工厂比较厉害的是,除了贴片机之外,几乎所有的装备和设备都是小米自研和小米投资的工厂自研的。智能工厂第一期,整个工厂出了上下料,已经实现全部自动化了。小米未来努力的方向是,整个工厂一个人都是没有,这是小米帮助整个制造也所做的行为。
千人团队、全球9大研发中心 雷军揭示相机技术突进背后故事

2016年,小米正式成立了核心器件部,开始死磕相机、屏幕、充电等技术。当时我们的目标就是要取得DXOMARK评测的世界第一我们在2018年正式组建了相机部。在组建相机部的当年,我们就取得的第一个里。为此,我们在2018年组建了相机部。
在组建相机部当年,小米就取得了第一个里程碑,小米MIX3 进入了DXOMARK评测的世界前三,并且在自拍等单项指标上取得了第一。第二年,小米又迎来了第二个里程碑,高像素路线取得了成果:小米率先发布了全球首款一亿像素手机小米MIX Alpha,并且同样搭载一亿像素的小米CC9Pro首次拿下了DXOMARK的世界第一。
2019年至今,小米已三次登顶,并达成第三个里程碑。今年小米10Pro和小米至尊纪念版相继登项DXOMARK世界第一,在过去300多天里,两款手机一共霸榜了115天。这标志着小米在相机的核心技术路线上取得了全球领先。
2021年扩招5000名工程师 重点覆盖十大领域

四年时间,小米在以相机技术为代表的硬核科技上有了长足的进步,之所以在硬核科技上取得长足进步,这背后有两个最重要的是两个因素:
第一,持续加强研发投入。今年小米10岁了,还是家很年轻的公司,但研发投入全年将超过100亿元。小米也进入了全中国公司中研发投入的前20名。
第二,重视人才队伍的建设。人才是创新之源,提升技术实力的第一步,就是聚拢最顶尖的人才。

以相机技术举例,雷军表示:2018年小米成立相机部时工程师计有122人,今天相机部工程师已达826人,增长了近6倍,这还不包括AI等为相机提供技术支持的350多位工程师。在组建相机研发中心时,我们放眼全球,最顶级人才在哪里,就把研发中心设到哪里。为此,小米在北京、巴黎、东京、圣地亚哥等城市,设立九地研发中心,共设立5个国际研发中心。
今年疫情影响了各行各业,但是小米启动了创业以来规模最大的校园招聘。2020年,小米共入职了2252名大学生,其中研究生以上学历达1470人。”
小米是一家有浓郁工程师文化的科技企业,工程师也是小米的技术基石,也是众多硬核科技的缔造者。雷军表示:“工程师是小米最重要的财富,我们的目标就是要创造一个最好的工作环境,让工程师尽情发挥他们的创造力,激发他们的内在潜力和持久的创新动力,创造条件让优秀的创新团队和青年人才脱颖而出。”
2021年,小米将扩招5000名工程师,在现有工程师团队规模基础上再增50%。未来我们还将不断补充新鲜血液,建立一个全球顶级技术团队,把小米打造成全球首屈一指的科技公司。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。