近日,“柯洁成为中国围棋最年轻八冠王”这一新闻刷爆网络,23岁的中国棋手柯洁不负众望,以2-0的成绩轻松击败韩国“00后”天才申真谞,第四次获得三星杯冠军,这也是他个人的第八个世界冠军。别问,问就是柯洁下棋的技术好,没一个能打的!
竞技类比赛靠的就是选手的硬核实力,“我比别人厉害,我能拿冠军”。在科技圈也是如此,硬核科技是企业的制胜法宝。雷军在今天举办的2020 MIDC(第四届小米开发者大会)上表示,“我们坚持技术为本,将继续加强研发投入,并把人才作为了小米发展的根本大计。”
瞄准一项硬核科技那就得有“死磕”的精神,加大力度招揽人才、持续不断地增加研发经费,这也是我们近几年看到小米技术实力迅速提升的根本原因。
从相机技术开始说起,看小米如何重点突破硬核科技
2016年4月,小米手机业务成立了核心器件部,并且在这个部门下设立了相机组;到了2018年5月,才单独成立了一级研发部门——相机部,雷军回忆道,当时还只有122位工程师,到今天,相机部已经有850位工程师,这还不包括350名AI工程师,他们也在做影响方面的技术。
在组建相机部当年,小米就取得了第一个里程碑,小米MIX3 进入了DXOMARK评测的世界前三,并且在自拍等单项指标上取得了第一。第二年,小米又迎来了第二个里程碑,高像素路线取得了成果:小米率先发布了全球首款一亿像素手机小米MIX Alpha,并且同样搭载一亿像素的小米CC9Pro首次拿下了DXOMARK的世界第一。2019年至今,小米已三次登顶,并达成第三个里程碑。今年小米10Pro和小米至尊纪念版相继登项DXOMARK世界第一,在过去300多天里,两款手机一共霸榜了115天。
雷军表示,在工程师跟专家的共同努力下,过去几年,小米的相机技术才能取得这样突飞猛进的发展。
所以,雷军以及小米如此重视招募人才也事出有因。
2020年,小米计划扩招3000名工程师,但很可惜,因为疫情的原因,今年小米共入职了2252名大学生,小米目前研发团队超过了10000人。雷军表示,小米还会进一步扩招工程师团队,我们2021年的目标是扩招5000名工程师,相信在明年或者更远的将来,小米还会有一系列新的核心技术来跟大家分享。
据了解,小米工程师招募的十个重点领域包括:相机影像技术、屏幕显示技术、快速充电/无线充电技术、IoT平台及连接技术、AI及语音智能交互技术、5G/6G通讯标准技术、大数据及云服务技术、音频技术、信息化及流程管理系统技术、智能制造装备及系统集成技术。从这里可以看出,小米还是极其重视手机业务,另外在IoT、大数据、AI领域也有布局。
用硬核科技赢得消费者的心,小米重回全球第三
手机行业竞争极为激烈,可以说是杀红眼的“红海”,而最后能站在决赛圈的公司,可以说都是世界上的TOP级。2014年Q3季度,小米手机全球出货量排名第三位,时隔六年,根据全球三大知名调研机构的数据,小米在全球智能手机市场的份额重回世界第三。
小米用了足足六年的时间才重新踏入“决赛圈”,依靠的依然是自身过硬的技术实力,死磕硬核科技,是小米发展之路的必修课。
小米在前段时间公布了的预研技术——小米的UWB技术(一指连技术),当手机指向空调时,手机就弹出了空调的遥控器;指向电视,就会弹出电视的遥控器。这项技术发布后也引起了米粉们强烈的反响。
雷军表示,在过去的几年时间里,小米开始了大规模的补课,最核心补得就是技术(硬核科技),小米在攀登技术高峰的路上永不止步。
世界第三只是小米的阶段性目标,毕竟谁还没有个冠军梦了?就看接下来小米的工程师们能够为消费者带来哪些革命性的黑科技了,让我们拭目以待。
互联网+制造业 小米智能工厂(第二期)也要来了
小米会坚持用互联网赋能制造业——这是雷军今年8月的小米十周年演讲说过的一句话。其实,早在三年前,小米就已经开始思考怎么能为整个制造业进一步赋能,就是小米能不能帮助自己的代工厂,帮助制造业进行互联网的改造,进行提质增效,我们选择的领域是我们有没有可能帮助工厂智能化、自动化甚至无人化。
今年年初,小米智能工厂(第一期)正式落成,小米智能工厂,不仅仅是年产百万台超高端手机的“黑灯工厂”,还是新工艺、新材料和新技术预研的“大型实验室”,小米的小米10至尊版就是这个工厂生产的。这个工厂比较厉害的是,除了贴片机之外,几乎所有的装备和设备都是小米自研和小米投资的工厂自研的。智能工厂第一期,整个工厂出了上下料,已经实现全部自动化了。小米未来努力的方向是,整个工厂一个人都是没有,这是小米帮助整个制造也所做的行为。
雷军表示,我们规划第二期(小米智能工厂)的规模比这个大十倍,力求做到工厂一个人都没有。
小米在做的事情,也有其他的厂商在做,小米的优势是什么呢?还是核心科技。依靠自身的核心科技,做出让消费者满意的产品,这才是小米的愿景。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。