盖帝图像(Getty Images)和NVIDIA正进一步深化在AI领域的合作伙伴关系。此次推出的Generative AI by iStock,就是一套专门用于制作照片库的文本到图像平台。
Generative AI by iStock以盖帝图像首次在AI图像生成领域的开拓性成果,即Generative AI by Getty Images为基础。二者的不同之处在于,iStock的图像平台(Getty旗下的照片库服务)将对个人或单用户开放,而盖帝图像则更像是一种多用户式的企业级解决方案。
Generative AI by iStock使用NVIDIA的Picasso模型进行训练,全部学习素材均来自盖帝图像的创意库和iStock照片库。为了防止生成真实商标或人物,学习过程未使用盖帝图像的编辑图像库。
盖帝图像首席产品官Grant Farhall在采访中表示,Generative AI by iStock主要面向那些需要大量照片库素材的中小型企业。
Farhall解释称:“iStock将帮助用户高效工作,获取自己需要的高精度照片,甚至包括那些不可能用真实相机拍下的画面。”举例来说,假如有用户希望用一系列照片来表现气候变化,则可以提示Generative AI by iStock生成一张企鹅走过城市街道的图像。现在用不着雇佣摄影师再安排一群企鹅,AI就能完成整个画面创作。
Generative AI by iStock的定价为每100条提示词14.99美元,每条提示词可生成4张图像。
盖帝图像平台与新的iStock服务之间的另一大区别,还体现在法律赔偿额度上。与Generative AI by Getty Images不同,iStock不会向用户提供无限赔偿,其每项资产的上限为10000美元,与现有照片库的许可条款保持一致。但与开启盖帝生成式AI先河的盖帝图像平台一样,iStock内容也会向模型训练中的素材贡献者提供收入共享计划。
盖帝图像公司发言人Alexander Lazarou在采访中强调,iStock平台还将“很快”获得图像填充(inpainting)和画面外扩(outpainting)功能。其中填充功能允许用户指定图像中的特定区域,再根据文本提示向其中填充人物或物体。画面外扩则可按不同的画面比例将显示区域扩大,再用AI生成内容将其填满。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。