今年夏初,总部位于旧金山的AI初创公司Anthropic(也是目前OpenAI在大语言模型开发领域的主要竞争对手)发布了一项名为“Artifacts”的惊喜新功能。
该功能允许Anthropic的Claude系列大模型及Web版聊天机器人为用户提供新窗口。此窗口将显示在用户的聊天界面旁边,并根据用户的要求运行代码片段、甚至是由大模型生成的完整程序。
举例来说,用户可以要求Claude生成一份简单的交互式可视化文档、图表或者可运行的游戏,并在自己的浏览器中与聊天机器人共同操作。据Anthropic方面介绍,这项功能的确令人印象深刻,VentureBeat总编还称之为“今年以来最重要的AI功能”。自服务发布以来,用户已经生成了数千万个Artifacts。
然而,用户之前必须手动开启Claude Artifacts,具体方式是单击Claude聊天机器人屏幕左下角的用户名首字母、选择“功能预览”再开启Artifacts。但如今情况有所变化:Anthropic此番宣布Artifacts已经在免费版、专业版和团队版上全面推出,并且正式登陆官方Claude iOS及Android移动应用,现在用户可以更轻松且随时随地创建并使用由其生成的交互式代码。
Anthropic开发者关系主管Alex Albert在社交网络X上发帖提到,他“花了一上午时间跟Claude一起重现简单的游戏。我们即将迎来大模型实时创建移动应用的新时代。”
目前只有免费版和专业版计划与更广泛的Claude社区对接,以共同发布并重组现有Artifacts。这项功能允许用户在其他人所创建成果的基础之上进行构建和迭代,意在促进思想和资源的动态流通。
对于团队版用户,Artifacts只能在项目之内共享,从而实现团队成员间的安全高效协作。
Anthropic希望Artifacts能够简化工作流程并提高生产力,支持团队协作使用并通过Web对彼此成果进行安全迭代。
Claude Artifacts的背后策略:用户体验重于原始能力?
尽管大部分AI开发项目都专注于增强原始能力并扩展模型功能,但Artifacts则代表着对于用户体验及AI界面的重新定位与设计——即摆脱简单的聊天机器人模型。
在某种程度上说,我们认为此举类似于任天堂在游戏界的探索——该公司经常推出处理能力和图形水平远低于微软及索尼等竞争对手的游戏机,但却努力通过新颖的用户界面吸引玩家,而且往往也能取得巨大的商业成功。
Anthropic将Artifacts设想为一种多功能工具,可供各行各业的团队使用,从而加速创造出更高质量的工作产品。
该平台支持多种输出形式,包括代码片段、流程图、SVG图形、网站及交互式仪表板等。
例如,开发人员现在可以直接从自己的代码库中创建架构图,产品经理可以开发交互式原型以进行快速功能测试,设计师则可以生成可视化效果以提高原型设计效率。同样的,营销人员也可设计出包含丰富绩效指标的活动仪表板,而销售团队更可加快可视化速度并获取预测见解。
随着Artifacts成为Claude服务体验中的标准组成部分,Anthropic公司预计其全球用户群体将自发带来更多创造性与实用性兼顾的精彩用例。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。