Sakana AI公司正与牛津大学和不列颠哥伦比亚大学的科学家合作,共同开发出一套能够自主开展端到端科学研究的AI系统。这一突破性项目名为“AI科学家”,有望彻底改变科学发现的具体进程。
AI科学家能够自动推进整个研究生命周期,从产生新颖想法到撰写完整的科学手稿。该团队在新近发布的论文中报告称,“我们提出并运行了一套完全由AI驱动的自动化科学发现系统,用以进行机器学习研究。”
这套创新系统采用大语言模型(LLM)以模拟科学进程。它能够产出研究思路、设计并执行实验、分析结果,甚至对生成的论文进行同行评审。研究人员声称,AI科学家每制作一篇完整的研究论文,计算成本仅需15美元左右。
AI驱动发现的曝光:科学研究或迎来新时代
在发表于预印本服务器arXiv上的研究当中,研究人员们详细介绍了AI科学家项目如何在机器学习研究任务当中接受测试,包括开发出新的扩散模型技术、基于transformer的语言模型以及分析学习动态。据该团队介绍,该系统生成的论文“在我们自动审阅者的评估下,已经超过了顶级机器学习会议的接收门槛。”
这一发展也代表着AI能力的重大飞跃,开始从狭隘的任务特定应用转向更具通用性的科学问题解决方法。AI科学家这种自主驾驭整个研究过程的能力,也表明了强大的推理与创造水平,而这些以往被普遍认为是人类科研人员的专属能力。
这套系统的出现也将在多个方面带来深远的影响。首先,它能够大大加快科学发现的速度,让科研工作不再受到人类体能与精力的限制,真正实现全天候研究。这可能推动药物发现、材料科学和气候变化缓解等领域迎来新一波快速进步。
求取平衡:人类直觉与实验室中的AI效率
然而,科学研究的自动化也给人类科学家的角色定位与未来走向画上一个大大的问号。一般来讲,AI科技往往更擅长处理大量数据和识别模式,而人类的直觉、创造力和道德判断仍然是引导科学研究走向积极结果的重要前提。而目前我们面对的挑战,就是在科学研究中适当求取AI驱动效率与人类引导目的之间的平衡。
此外,该系统以极低成功开展学术研究的能力,也很可能会对学术机构及更广泛的科学界产生重大的经济影响。这可能会重塑研究资助的获取与开展方式,最终给科学领域的就业带来前所未有的冲击。
研究人员们自己也承认,这种强大的AI系统确实存在潜在风险。他们在论文中解释道:“AI科学家目前的能力还在不断提高,这进一步表明机器学习社区需要立即优先探索如何协调这些系统,确保以安全且符合人类价值观的方式开展探索。”
道德考量:探索由AI主导的未知科学领域
研究人员的这份报告,强调了在技术进步的同时制定出强有力的道德框架与保障措施的重要性。随着AI系统在科学研究方面的独立性与自主能力越来越强,必须确保以造福人类、并能够以符合人类价值观的方式保持运行,AI科学家项目代码的对外开源,使得科学界能够对它进行更广泛的审查与开发,这似乎有助于解决其中一些现实问题。项目还允许研究人员在此技术的基础之上进行开发,也让我们相信未来很可能出现更先进的AI驱动型科学发现系统。
随着科学界努力应对AI科技产生的影响,很明显,科学发现的过程正处于新一轮深刻变革的临界点上。
如今的挑战就在于如何利用这股AI驱动的科研之力,同时继续保留人类在科学探究中那些不可替代的优势——包括创造力、直觉和道德考量等。这些曾经在几个世纪之间支撑科学探索活动,未来的AI科研也同样离不开它的指引与督导。
好文章,需要你的鼓励
AT&T、Verizon和T-Mobile宣布计划组建合资企业,利用卫星技术消除美国境内的网络覆盖盲区,重点服务农村及网络欠发达地区。该合资企业将整合知识产权与地面频谱资源,推动下一代直连设备(D2D)通信发展。目前三方尚未签署正式协议,现有运营商与卫星服务协议不受影响。此前,T-Mobile已与SpaceX合作推出星链卫星服务,美国联邦通信委员会也刚批准了价值400亿美元的EchoStar频谱出售案。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
无人机食品配送服务商Flytrex与全球知名披萨连锁品牌Little Caesars宣布合作,推出全新Sky2无人机,最大载重达4公斤,可一次配送两个大披萨及饮料,满足全家用餐需求。Sky2支持最远6.4公里的配送范围,平均从起飞到送达仅需4.5分钟。首个试点门店已在德克萨斯州怀利市上线,并实现与Little Caesars订单系统的直接集成。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。