今年Google I/O大会上最令人印象深刻的演示之一,始于瀑布前的一张女性照片。主持人点选人像并将她拖拽至图像的另一侧,应用程序就能自动填补她之前站立的空间。主持人又点选阴云密布的天空,背景瞬间绽放出万里无云的明亮晴蓝。没错,短短几秒钟内,图片内容就发生了翻天覆地的变化。
这款AI驱动的工具名为Magic Editor,现场演示也证实其的确不负“魔法”(Magic)之名。这是Google多年来打造的一款工具,其功能库中已经包含多种AI图像编辑选项,例如能快速从图像背景中去掉人物或物体的Magic Eraser等。更重要的是,这类工具完全有可能篡改照片内容,进而招致我们目前还难以断言的重大后果。
虽然这款工具还称不上完美,具体发布日期也没有确定,但Google的最终目标非常明确:简单在屏幕上点击和拖拽,就打造出完美的照片。Google方面宣称这是一款“无需专业编辑工具,即可实现复杂编辑效果”的产品,用户可以在AI强大功能的支持下点选并调整照片内的特定部分。包括增强天空背景、移动和缩放选定对象,还有轻点几下将特定图像部分删除。
Google的Magic Editor试图在Photoshop等程序的高级编辑操作,统统打包进简单的点击操作当中——至少从演示来看基本是这个意思。例如,在Photoshop中,我们无法使用内容感知移动工具来拾取并移动图像内的特定主体。即使认真完成了抠图,最终效果看起来仍有瑕疵,需要配合克隆图章工具甚至是污点修复画笔等工具,一点点修复遗留下的不自然之处或背景冲突。虽然整个过程也不能说特别复杂,但与大多数专业创意工具一样,Photoshop还是给新手们设定了明确的学习曲线。
面对Photoshop等图像编辑应用程序高昂的售价和远称不上直观的使用感受,我完全支持Google这种让照片编辑工具免费化、易用化的努力。然而,如果真的将功能强大且极易上手的图像编辑工具交到几乎所有人手中,很可能彻底改变我们编辑和查看照片的方式。长久以来,人们一直在讨论篡改甚至伪造出来的照片能逼真到什么程度。而Google的工具让这个问题变得更加切近,每个人似乎都能通过简单点击生成极度逼真的图片,甚至根本不用操心内容是否真实。
三星方面最近通过“Space Zoom”让人们注意到了AI“增强”照片的能力。这项功能允许所有新款Galaxy设备的用户拍下令人难以置信的月球照片。今年3月,一位Reddit用户尝试在一张几乎已无法修复的月球图像上使用Space Zoom,发现三星似乎“捏造”了实际上并不存在的陨石坑等元素。这不仅构成了图像造假的风险,更让那些花几年时间捕捉夜空精彩瞬间的摄影师们身陷尴尬——在AI的操作下,人们根本分不清孰真孰假。
公平地讲,智能手机的拍照功能里也内置了不少类似的增强功能。熟悉手机拍照的朋友都知道,设备拍出来的图像早就跟现实相去甚远了——包括滤镜处理、背景模糊甚至是修改图像内容等。但GoogleMagic Editor让造假变得更简单、更有吸引力。在工具相关博文中,Google认为用户们似乎都在追求完美、接受不了存在缺憾的现实,并指出Magic Editor将“更好的控制照片最终呈现出的效果和感觉”,同时也有机会修复漏洞中的缺憾、反映最好的一面。
大家可以认为我是那种照片原教旨主义者,反正我不喜欢这种对眼前景象擅加修改的照片编辑方式。如果我正拍摄一张婚礼照片,而背景的天空哪怕乌云密布,我也不打算把它替换成更漂亮的样式。没错,也许我可能会考虑把朋友圈里发的照片先PS一下,但就算是这样Magic Editor做得也有点过了。当然,这仅仅只是我的个人观点,相信未来会有很多人用Magic Editor让自己在社交媒体上表现得光鲜亮丽,但这也是在强迫我们重新思考如何看待照片、大家到底有没有义务表达真实但可能没那么美好的世界。
Google将Magic Editor称为一项“实验性技术”,预计将在今年晚些时候登陆“部分”Pixel手机,之后再全面推出。如果Google在其Photos应用中引入AI图像编辑工具,那么智能手机制造商早晚会将这些一键式工具(比如替换背景天空或者移动主体的功能)直接集成到手机的拍照软件中。可有时候,照片的美不就在于它的不完美吗?而智能手机的制造商们似乎正努力让我们放弃这样的坚持。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。