Snapchat正酝酿推出由OpenAI最新版ChatGPT支持的聊天机器人。公司CEO Evan Spiegel表示,未来AI聊天机器人将成为更多用户日常生活中的重要组成部分。
Snapchat的这款机器人名为“My AI”,将固定在应用中好友会话的聊天标签位置。Spiegel在采访中表示,虽然初步仅面向每月3.99美元的Snapchat Plus付费订户开放,但其最终目标是面向7.5亿月活用户。
“我们的想法是,除了每天与家人和好友交谈之外,未来人们还将每天跟AI聊天。而作为消息收发服务商,我们天然占据着优势地位。”
在启动之后,My AI就相当于Snapchat上的低门槛ChatGPT功能。最大的区别,是Snap上的版本对回答内容做出了更严格的限制。Snap员工已经对其进行训练,确保它遵守公司的信任和安全指南,且不会对包括粗口、暴力、性明示、政治等内容的观点做出回应。
部分在学校内被禁用的功能也在Snap版中受到了控制。例如,它不会根据各类主题输出学术论文,而且拒绝得相当礼貌。随着越来越多用户在体验之后上报不当答案,相信Snap将继续对My AI做出调整。
在尝试之后,我们发现Snap根本就不需要向用户解释ChatGPT是什么——这也证明OpenAI打造的这款大语言模型确实是有史以来增长速度最多的消费级软件产品。与OpenAI的第一方ChatGPT界面不同,我们没有看到Snap提供任何AI交互提示或护栏。它只是开启一个空白聊天页面,接下来就可以开始人机对话了。
尽管ChatGPT正快速成为一种生产力工具,但Snap的版本更多将生成式AI塑造成了一种角色。My AI的个人资料跟普通用户非常相似,只是用了专门的Bitmoji数字表情符号。从设计来看,My AI相当于用户在Snapchat上的一位AI好友,而非搜索引擎。
“我们的想法是,除了每天与家人和好友交谈之外,未来人们还将每天跟AI聊天。”
这样的差异也能帮用户明确区分开两款产品。正如Bing对ChatGPT的融合测试所显示,基于这类聊天机器人的大语言模型(LLM)往往会自信地给出错误的答案,也就是“编造事实”。这些错误答案明显出自不可靠的搜索结果。如果悉心诱导,AI甚至可能表现出非常卑鄙负面的特性。但至少目前来看,大语言模型的大势已成,谷歌和Meta都在迫不及待地向公众发布自家同类产品。
Snap的生态位明显完全不同。其用户群体庞大且年轻,但业务运营效果却不太好。My AI在短期之内有望促进该公司的付费订户比例,而且Spiegel后续还有更多计划,希望能帮Snap开辟更多收入来源。
Snap之前就是OpenAI建立的Foundry企业客户层中的首批成员,可以率先体验专为大规模工作负载打造的最新GPT-3.5。Spiegel表示,随着时间推移,Snap可能还将合并除OpenAI以外的其他厂商的大语言模型,并利用收集自聊天机器人的数据开展其他AI业务。虽然My AI只是起点,但Spiegel认为这是Snap投资新阶段的开始,也意味着AI将正式成为人们日常交流的又一新对象。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。