本周,一组织在AI项目托管平台Hugging Face上发布了一个项目,该项目似乎与OpenAI的Sora API有关,但目前又不再对外开放。该组织使用自己的身份验证令牌(可能来自早期访问系统)创建了一个前端,让其他用户可以使用Sora生成视频。
我觉得这是真的——因为视频内容确实是使用OpenAI Sora API端点通过Hugging Face空间环境的配置生成和下载,且带有硬编码的请求头。(@btibor91,2024年11月26日)
通过该组织开放的前端,任何用户都可以输入简短的文字描述来生成高达1080p分辨率的10秒短视频。在我们尝试时,队列已经排了很长——但X上有几位用户设法上传了生成结果,其中大部分都带有OpenAI的独特视觉水印。
截至美国东部时间下午12:01,该前端已无法正常使用。我们猜测是OpenAI及/或Hugging Face撤销了访问权限。
该组织声称,三个小时之后OpenAI暂时取消了所有艺术家对Sora的早期访问权限。
那该组织为什么要行此险着?理由是其宣称OpenAI正在向Sora的早期测试人员(包括红队成员及创意合作伙伴)施压,要求他们对Sora做出下面的评价,但同时又未能公平补偿他们的精力投入。
这个自称“Sora PR Puppets”的组织在前端随附的帖子中写道:“数百名艺术家通过bug测试、反馈和实验,为一家价值1500亿美元的企业提供无偿劳动。这个早期访问项目似乎跟创意表达和中肯评价无关,单纯是为了公关和宣传造势。”
该组织最初没有透露成员的具体身份。但在短短一天之内,其开始在Hugging Face的附件中列出部分成员,外加一份单独的请愿书。
OpenAI Sora确实已遭泄露。(@kimmonismus,2024年11月26日)
该组织还声称,OpenAI通过严格控制早期访问的用户对Sora的功能做出误导。该组织表示,每条Sora输出都需要得到OpenAI的批准才能对外分享,而且只有计划中的少数创作者会被选中,负责筛选由Sora生成的作品。
该组织写道,“我们并不反对将AI技术作为艺术工具来使用(如果反对,我们可能也不会受邀参加此计划)。我们所反对的,是这项计划的发布方式以及该工具在公开发布之前的开发方式。我们之所以有此行动,是希望OpenAI变得更开放、对艺术家们更友好,在公关宣传之外真正做点实事。”
OpenAI公司的发言人则在一份声明中回应称,Sora仍处于“研究预览”阶段。该公司“正努力在创造力与广泛使用所必需的强大安全措施之间寻求平衡点。”
这位发言人指出:“参与我们alpha封测的数百名艺术家制定了Sora的发展路径,帮助确定了新功能和保障措施的优先级。本项目为自愿参加,参与者没有提供反馈或者使用该工具的义务。我们很高兴能为这些艺术家提供免费的访问权限,并将继续通过赠款、活动及其他计划支持他们。我们坚信AI可以成为强大的创意工具,并致力于提升Sora的实用性和安全性。”
这位发言人继续补充道,艺术家对于OpenAI“不负有任何义务”,唯一的要求就是以“负责任的方式”使用Sora,并在Sora开发期间避免分享保密细节。然而,其既没有明确“负责任”的使用方式到底是什么,也没有解释OpenAI认为哪些细节需要保密。
OpenAI Sora遭遇泄露!现可在Hugging Face上免费使用……它能生成1080p分辨率最长10秒钟的视频,而且效果好到令人难以置信!(@EHuanglu,2024年11月26日)
自今年早些时候首次亮相以来,Sora曾遭遇技术挫折,当时视频生成领域的竞争对手也以狂热的姿态努力希望赶超。更糟糕的是,Sora项目的联合负责人之一Tim Brooks也于10月初离开OpenAI转投谷歌阵营。
在最近的Reddit AMA问答活动中,OpenAI公司首席产品官Kevin Weil表示,Sora的开发主要面对“模型亟待完善、安全/模仿/其他细节难以正确无误,以及计算资源须进一步扩展”等阻力。另据技术媒体报道,今年2月年的原版系统需要超过10分钟的处理时间,才能制作出长度为1分钟的视频片段。
一致性也是Sora早期迭代时面临的重大难题。电影制片人Patrick Cederberg在体验后发现,至少需要生成数百个片段才能得到一段可用的成果,因为该模型很难在整段视频中让风格、对象和角色始终保持稳定。
根据X用户发现的代码,泄露的Sora似乎是一款速度更快的“增压”版本。该代码还暗示,此版本可能提供风格控制和有限的自定义选项。
另据报道,OpenAI一直在用数百万小时的高质量视频训练Sora。这些视频涵盖各种风格和主题,旨在提高模型生成视频的质量。
除了跟技术相关的阻力之外,OpenAI最近几个月还面临着其他视频生成挑战者们的直接威胁——甚至已经开始失去宝贵的市场份额。今年9月,Runway与《疾速追杀》背后的制片厂狮门签署了一项协议,将以狮门的过往电影作品为依据训练一套定制化视频生成模型。大约一周之后,正着手开发视频生成模型的Stability迎来一位重量级董事会成员——曾拍摄《终结者》和《阿凡达》系列影片的大导詹姆斯·卡梅隆。
据说OpenAI今年早些时候曾会见多位电影制片人及多家好莱坞制片厂,向其展示Sora大模型。该公司前首席技术官Mira Murati则出席了戛纳电影节。但OpenAI尚未正式宣布与大型制片公司的合作计划。
好文章,需要你的鼓励
12月5日,IEEE Tech Frontiers论坛举办,囊括IEEE PES T&D、PVSC、CVP三大会议精华。
年初时,整个存储行业依然处于低迷期,但随着AI需求的迅猛上升,存储需求也随之激增,推动了行业的快速复苏与发展。这一波技术创新与市场需求的双重浪潮,给Solidigm带来了前所未有的机遇,也考验着其应对行业变革的能力。
艾斯本不断推陈出新,依托丰富的行业经验,推出了包括绩效工程、制造与供应链、资产绩效管理、地下科学与工程、数字电网管理和工业数据结构在内的六大解决方案。更值得一提的是艾斯本提出的“工业AI”理念,正以有型的投资回报率,推动客户实现价值跃升。
智谱AI率先推出了 AutoGLM,试图打造一款能够理解、规划、执行,并最终实现“无人驾驶”操作系统的 AI Agent。