至顶网商用办公频道 02月05日 北京消息(文/陶婧婕)你是否用过陪伴机器人或者扫地机器人等产品?
高科技不仅慢慢改变了我们的生活,这些技术也在为社会谋取更多的福利。例如,人们开始利用机器人替代人类去做一些做不到的或者十分危险的工作。
去年4月15日晚,巴黎圣母院遭遇严重火灾,给消防队带来了前所未有的挑战。在这种情况下,消防队派出了由Shark Robotics公司设计并制造的遥控消防自动机——Colossus,它的外形很像一辆“小坦克”,其在“炮塔位置”布置的软管能够将水喷射至250米远的距离。凭借Colossus的耐热且防水的底盘加上强大的全地形踏板,它一路冲向大教堂中最危险的区域,成功扑灭火焰并清除了可能造成人员伤亡的危害碎片。
除此之外,WinterLight Labs公司还曾开发过“AI医生”——名为路德维希(Ludwig)的机器人,它基于能够识别数据、做出预测的机器学习算法运行。对路德维希来说,这些算法让他能够与病人展开交谈,评估病人的语言模式,以确定他们的健康与否。除了可以进行记忆和语言障碍测试,这样的技术甚至可以预测病人的情绪,从而判断病人是否存在焦虑症或抑郁症倾向。
在牵动着万千人心的新型冠状病毒肺炎疫情面前,机器人也开始发挥着作用。
新型冠状病毒性肺炎是指由新型冠状病毒(2019-nCoV)引起的肺炎,是一种急性感染性肺炎,其病原体先前未在人类中发现。新型冠状病毒具有人传人的能力,感染初期病人有发热、乏力、干咳等症状,严重者可能出现呼吸困难或休克,严重危害人们的身心健康。
该病目前尚无特效的治疗方法,预防与隔离是最有效的防护措施。我们要尽量减少去人群密集场所,减少与感染或潜在感染病人接触的机会。外出一定要佩戴口罩!另外,如果出现上述感染症状,也需要及时到医院就诊。
为全力做好新型冠状病毒疫情防控工作,目前,在全国各地的超市、商场、车站等公共场所基本都设有专人来测量体温,并且监督来往人群是否佩戴口罩。这种做法可有效地起到监督及防治作用,但是需要投入大量的人力,也会给巡逻人员带来潜在的交叉感染风险。
近日,广州南沙万达广场聘请了一名“机器人巡逻员”,它边走边说“请大家戴好口罩,注意个人卫生,不要前往人流密集场所,身体若有不适请及时就医……”等警示语,提醒市民时刻注意个人安全防范,它还可以一次性测量10个人的体温,温度误差在0.5摄氏度。
据了解,这是一款由高新兴集团自主研发的名为“千巡警用巡逻机器人”,高新兴集团旗下高新兴机器人公司总经理柏林表示,人员移动到哪,机器人可以实现快速记录。温度超过设定值,或发现行人不戴口罩,机器人立马启动报警系统。通过机器人“执勤”,可以真正做到隔而不离,有效节约了人力,不仅分担了执勤工作任务,也有助于避免人员交叉感染。
抗击疫情期间,高新兴集团发挥高科技的优势,为群众的健康安全保驾护航。目前,高新兴集团的援点包括广州、武汉、上海、天津、北京等大城市,覆盖全国范围内的110多个项目。面对即将到来的春运返工潮,高新兴大部分员工已到岗,保障各个城市的系统和设备正常运作。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。