Sakana AI公司正与牛津大学和不列颠哥伦比亚大学的科学家合作,共同开发出一套能够自主开展端到端科学研究的AI系统。这一突破性项目名为“AI科学家”,有望彻底改变科学发现的具体进程。
AI科学家能够自动推进整个研究生命周期,从产生新颖想法到撰写完整的科学手稿。该团队在新近发布的论文中报告称,“我们提出并运行了一套完全由AI驱动的自动化科学发现系统,用以进行机器学习研究。”
这套创新系统采用大语言模型(LLM)以模拟科学进程。它能够产出研究思路、设计并执行实验、分析结果,甚至对生成的论文进行同行评审。研究人员声称,AI科学家每制作一篇完整的研究论文,计算成本仅需15美元左右。
AI驱动发现的曝光:科学研究或迎来新时代
在发表于预印本服务器arXiv上的研究当中,研究人员们详细介绍了AI科学家项目如何在机器学习研究任务当中接受测试,包括开发出新的扩散模型技术、基于transformer的语言模型以及分析学习动态。据该团队介绍,该系统生成的论文“在我们自动审阅者的评估下,已经超过了顶级机器学习会议的接收门槛。”
这一发展也代表着AI能力的重大飞跃,开始从狭隘的任务特定应用转向更具通用性的科学问题解决方法。AI科学家这种自主驾驭整个研究过程的能力,也表明了强大的推理与创造水平,而这些以往被普遍认为是人类科研人员的专属能力。
这套系统的出现也将在多个方面带来深远的影响。首先,它能够大大加快科学发现的速度,让科研工作不再受到人类体能与精力的限制,真正实现全天候研究。这可能推动药物发现、材料科学和气候变化缓解等领域迎来新一波快速进步。
求取平衡:人类直觉与实验室中的AI效率
然而,科学研究的自动化也给人类科学家的角色定位与未来走向画上一个大大的问号。一般来讲,AI科技往往更擅长处理大量数据和识别模式,而人类的直觉、创造力和道德判断仍然是引导科学研究走向积极结果的重要前提。而目前我们面对的挑战,就是在科学研究中适当求取AI驱动效率与人类引导目的之间的平衡。
此外,该系统以极低成功开展学术研究的能力,也很可能会对学术机构及更广泛的科学界产生重大的经济影响。这可能会重塑研究资助的获取与开展方式,最终给科学领域的就业带来前所未有的冲击。
研究人员们自己也承认,这种强大的AI系统确实存在潜在风险。他们在论文中解释道:“AI科学家目前的能力还在不断提高,这进一步表明机器学习社区需要立即优先探索如何协调这些系统,确保以安全且符合人类价值观的方式开展探索。”
道德考量:探索由AI主导的未知科学领域
研究人员的这份报告,强调了在技术进步的同时制定出强有力的道德框架与保障措施的重要性。随着AI系统在科学研究方面的独立性与自主能力越来越强,必须确保以造福人类、并能够以符合人类价值观的方式保持运行,AI科学家项目代码的对外开源,使得科学界能够对它进行更广泛的审查与开发,这似乎有助于解决其中一些现实问题。项目还允许研究人员在此技术的基础之上进行开发,也让我们相信未来很可能出现更先进的AI驱动型科学发现系统。
随着科学界努力应对AI科技产生的影响,很明显,科学发现的过程正处于新一轮深刻变革的临界点上。
如今的挑战就在于如何利用这股AI驱动的科研之力,同时继续保留人类在科学探究中那些不可替代的优势——包括创造力、直觉和道德考量等。这些曾经在几个世纪之间支撑科学探索活动,未来的AI科研也同样离不开它的指引与督导。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。