已经有三位艺术家对AI艺术创作工具Stable Diffusion及Midjourney的开发商Stability AI和Midjourney提起诉讼;一同被卷入官司的,还有近期刚刚建立自家AI艺术创作工具DreamUp的艺术创作平台DeviantArt。
原告艺术家Sarah Andersen、Kelly McKernan和Karla Ortiz宣称,这些组织侵犯了“数百万艺术家”的权利。他们在“未经艺术家同意 ”的情况下,从网络上抓取50亿张由艺术家原创的图片来训练自己的AI工具。
该诉讼由律师兼字体设计师Matthew Butterick,以及专门从事反垄断及集体诉讼案件的Joseph Saveri律师事务所发起。Butterick和Saveri目前还在起诉微软、GitHub和OpenAI,矛头主要指向AI编程模型CoPilot,该模型所使用的代码训练素材同样收集自网络。
随着对剥削性AI媒体模型实践方式的深入理解,我意识到尚无法律先例用于保护这一权利。我们要改变这样的现实。
在宣布诉讼案的博文中,Butterick将此案描述为“推动AI遵循公平与道德原则的重要一步”。他解释道,像Stable Diffusion这样的AI艺术创作工具能够“用几乎无限数量的侵权图像训练自身,快速产出仿作并给市场、艺术品和艺术家造成永久性的损害。”
过去一年来,这些AI艺术创作工具确实大受欢迎,而艺术界对此反响强烈。有人认为这些工具确实很有用,跟之前几代革命性软件(例如Photoshop和Illustrators)差不多;但更多人反对把自己用以谋生的素材用于训练这些商业系统。生成式AI艺术创作模型依靠网络上收集的数十亿张图像进行训练,且整个过程通常未得到素材创作者的知情或同意。之后,AI艺术创作工具就能快速产出模仿特定艺术家风格的作品。
但这些系统到底有没有侵犯版权法,确实是个复杂的问题。专家表示这个问题恐怕得在法庭上讨论解决,而AI艺术创作工具的开发者们普遍认为,至少在美国,使用受版权保护的数据训练该软件完全符合《合理使用原则》中的要求。考虑到AI艺术创作工具中的种种复杂因素,即使是“合理使用”也需要接受诉讼的考验。包括这些工具背后的开发组织具体位于哪里(欧盟和美国对于数据抓取的法律许可有所区别),还要区分各机构的具体目的(例如,Stable Diffusion是在LAION数据集上训练而成,而该数据由德国人以非营利组织的名义收集,因此享受到了比普通企业更优惠的待遇)。
Butterick和Joseph Saveri律师事务所发起的诉讼,曾因涉及技术错误而受到抨击。例如,诉讼宣称AI艺术创作模型“存储[受版权保护的]训练图像的压缩副本”并加以“重组”,其作用类似于“21世纪的拼贴工具”。但AI艺术创作模型根本不存储图像,而只保存从这些图像中收集到的模式的数学表示。该软件也不是在以拼贴画的形式构建图像,而是根据数学表示从零开始自行创作。
好文章,需要你的鼓励
当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机会而非问题,建立治理流程将有效工具正式化。成功的AI采用需要明确目标、跨部门协作、变革管理和持续学习社区建设。
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
美国垃圾收集行业2024年创收690亿美元,近18万辆垃圾车每周运营六至七天,每日停靠超千次。设备故障成为行业最大隐性成本,每辆车年均故障费用超5000美元。AI技术通过实时监控传感器数据,能提前数周预测故障,优化零部件库存管理,减少重复维修。车队报告显示,预测性维护每辆车年节省高达2500美元,显著提升运营效率和服务可靠性。
小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。