今年Google I/O大会上最令人印象深刻的演示之一,始于瀑布前的一张女性照片。主持人点选人像并将她拖拽至图像的另一侧,应用程序就能自动填补她之前站立的空间。主持人又点选阴云密布的天空,背景瞬间绽放出万里无云的明亮晴蓝。没错,短短几秒钟内,图片内容就发生了翻天覆地的变化。
这款AI驱动的工具名为Magic Editor,现场演示也证实其的确不负“魔法”(Magic)之名。这是Google多年来打造的一款工具,其功能库中已经包含多种AI图像编辑选项,例如能快速从图像背景中去掉人物或物体的Magic Eraser等。更重要的是,这类工具完全有可能篡改照片内容,进而招致我们目前还难以断言的重大后果。
虽然这款工具还称不上完美,具体发布日期也没有确定,但Google的最终目标非常明确:简单在屏幕上点击和拖拽,就打造出完美的照片。Google方面宣称这是一款“无需专业编辑工具,即可实现复杂编辑效果”的产品,用户可以在AI强大功能的支持下点选并调整照片内的特定部分。包括增强天空背景、移动和缩放选定对象,还有轻点几下将特定图像部分删除。
Google的Magic Editor试图在Photoshop等程序的高级编辑操作,统统打包进简单的点击操作当中——至少从演示来看基本是这个意思。例如,在Photoshop中,我们无法使用内容感知移动工具来拾取并移动图像内的特定主体。即使认真完成了抠图,最终效果看起来仍有瑕疵,需要配合克隆图章工具甚至是污点修复画笔等工具,一点点修复遗留下的不自然之处或背景冲突。虽然整个过程也不能说特别复杂,但与大多数专业创意工具一样,Photoshop还是给新手们设定了明确的学习曲线。
面对Photoshop等图像编辑应用程序高昂的售价和远称不上直观的使用感受,我完全支持Google这种让照片编辑工具免费化、易用化的努力。然而,如果真的将功能强大且极易上手的图像编辑工具交到几乎所有人手中,很可能彻底改变我们编辑和查看照片的方式。长久以来,人们一直在讨论篡改甚至伪造出来的照片能逼真到什么程度。而Google的工具让这个问题变得更加切近,每个人似乎都能通过简单点击生成极度逼真的图片,甚至根本不用操心内容是否真实。
三星方面最近通过“Space Zoom”让人们注意到了AI“增强”照片的能力。这项功能允许所有新款Galaxy设备的用户拍下令人难以置信的月球照片。今年3月,一位Reddit用户尝试在一张几乎已无法修复的月球图像上使用Space Zoom,发现三星似乎“捏造”了实际上并不存在的陨石坑等元素。这不仅构成了图像造假的风险,更让那些花几年时间捕捉夜空精彩瞬间的摄影师们身陷尴尬——在AI的操作下,人们根本分不清孰真孰假。
公平地讲,智能手机的拍照功能里也内置了不少类似的增强功能。熟悉手机拍照的朋友都知道,设备拍出来的图像早就跟现实相去甚远了——包括滤镜处理、背景模糊甚至是修改图像内容等。但GoogleMagic Editor让造假变得更简单、更有吸引力。在工具相关博文中,Google认为用户们似乎都在追求完美、接受不了存在缺憾的现实,并指出Magic Editor将“更好的控制照片最终呈现出的效果和感觉”,同时也有机会修复漏洞中的缺憾、反映最好的一面。
大家可以认为我是那种照片原教旨主义者,反正我不喜欢这种对眼前景象擅加修改的照片编辑方式。如果我正拍摄一张婚礼照片,而背景的天空哪怕乌云密布,我也不打算把它替换成更漂亮的样式。没错,也许我可能会考虑把朋友圈里发的照片先PS一下,但就算是这样Magic Editor做得也有点过了。当然,这仅仅只是我的个人观点,相信未来会有很多人用Magic Editor让自己在社交媒体上表现得光鲜亮丽,但这也是在强迫我们重新思考如何看待照片、大家到底有没有义务表达真实但可能没那么美好的世界。
Google将Magic Editor称为一项“实验性技术”,预计将在今年晚些时候登陆“部分”Pixel手机,之后再全面推出。如果Google在其Photos应用中引入AI图像编辑工具,那么智能手机制造商早晚会将这些一键式工具(比如替换背景天空或者移动主体的功能)直接集成到手机的拍照软件中。可有时候,照片的美不就在于它的不完美吗?而智能手机的制造商们似乎正努力让我们放弃这样的坚持。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。