伴随着OpenAI最新的旗舰级生成式AI模型GPT-4o的上线,这家人工智能公司的首席科学家兼联合创始人Ilya Sutskever离职的消息,却已被证实。
OpenAI公司CEO Sam Altman已经在X上发帖公布了这一消息。
Altman表示:“这件事于我而言教人难过,Ilya无疑是我们这代人中最伟大的思想家之一,是我们这个领域中的指路明灯,也是一位挚爱好友。如果没有他,OpenAI就走不到今天这一步。尽管他选择去从事对个人更有意义的探索,但我将永远感激他在这里奉献的一切,也将致力于完成这份由我们共同创立的使命。”
接替Sutskever的是OpenAI研究总监Jakub Pachocki。Pachocki于2017年加入OpenAI Dota团队并担任主管,该团队尝试构建一套能够在Valve《Dota 2》策略游戏中击败人类选手的AI系统。随后,Pachocki出任OpenAI深度学习推理与科学部门的研究负责人,随后又被提拔为总研究负责人。
目前还不清楚Pachocki是否也会接任OpenAI Superalignment团队主管,该团队此前一直由Sutskever与Jan Leike负责。据《纽约时报》报道,Leike也将辞去在OpenAI的职务。
OpenAI公司于去年7月建立Superalignment团队,旨在开发能够引导、调节并管理“超级智能”AI系统的方法——也就是其智能水平远超人类的理论AI系统。据《泰晤士报》报道,OpenAI的另一位联合创始人John Schulman将监督这项工作。
而根据TechCrunch的了解,Superalignment团队将“更深入地”整合OpenAI研究成果,以“更好地达成其目标”。换句话说,这可能意味着当前团队未来会有不同的构成形式。
OpenAI公司总裁Greg Brockman在X上写道,Sutskever“在帮助建立OpenAI今日发展的基础方面,发挥了关键性作用。”
继OpenAI最新的旗舰级生成式AI模型GPT-4o发布以及该公司爆款AI聊天机器人ChatGPT迎来重大升级之后,Sutskever的离开从方方面面来讲都为这场从去年11月开启的传奇宫斗剧划上了句号。
在感恩节前一周左右,Sutskever与OpenAI公司CTO Mira Murati联系到OpenAI的前任董事会成员,表达了对Altman行为的担忧。据报道,双方争论的焦点主要集中在对OpenAI发展方向上的分歧。据称Sutskever对于Altman以牺牲安全性为代价,急于推出AI产品的决定感到沮丧。
包括Sutskever在内的原董事会在未做任何通知(包括OpenAI的大部分员工)的情况下,突然解雇了Altman。董事会在一份声明中表示,Altman在与董事会成员的沟通中未能做到“一贯坦诚”。
这一决定激怒了微软和OpenAI的其他投资者,导致该公司的股价摇摇欲坠;同时大多数OpenAI员工(包括Sutskever)也明确表达立场,要么让Altman迅速复职、要么他们就集体辞职。
Altman最终回到了他忠诚的OpenAI,大部分原董事会成员也先后离开。据《泰晤士报》报道,Sutskever此后一直没有重返工作岗位。自去年11月以来,首席科学家职务一直由Pachocki担任。
Sutskever在多伦多大学获得计算机科学博士学位,并曾在AI技术大师Geoffrey Hinton的指导下工作。他于2015年离开谷歌AI研究部门Google Brain后加入了OpenAI。Sutskever在AI领域取得了巨大成功,为首个现代计算机视觉系统ImageNet及DeepMind游戏AI系统AlphaGo项目做出了贡献。
那么,他接下来打算做点什么?Sutskever并未给出说明。但在X上的一篇帖子中,他表示尽管自己选择离开,但相信OpenAI公司将打造出“安全又有益”的通用人工智能——即能够完成一切人类所能完成任务的系统。
Sutskever补充道:“我对接下来的计划感到兴奋——这个项目对我个人来说非常重要,也将在适当的时候与大家分享细节。总之能够在OpenAI工作是我的荣幸,我会非常相信大家。”
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。