根据Google Cloud日前发布的最新趋势报告,如果说2024年是AI科技的实验元年,那么2025年将真正成为企业全面推广AI的起步之年。
值得注意的是,复杂的多模态AI将支持越来越多样的任务类别,AI智能体将被嵌入整个企业环境,内部搜索引擎则有望解锁关键的业务洞察见解。
有趣的是,谷歌此番使用到NotebookLM分析先前研究的数据,找出Google Trends当中增速最快的AI主题、并辅以第三方研究和洞察,最终确定了这些关键趋势。
Google Cloud全球生成式AI产品上市副总裁Oliver Parker在采访中表示:“展望未来,大家会看到不同的智能体之间相互交流。届时哪怕整个世界的人类都已安然入眠,AI智能体仍将继续推动幕后一系列任务、事件及行动的开展。”
企业将由聊天机器人转向多智能体系统
AI智能体可以自主(或者半自主)运作并执行多步骤流程。根据凯捷发布的数据,只有约10%的大型企业已经在使用AI智能体,但有82%的企业计划在未来三年之内将其纳入业务体系。
谷歌在报告中明确提及六种AI智能体类型:
• 负责理解用户需求、回答问题、解决问题并推荐产品及服务的客服智能体。它们能够跨频道工作,并可集成语音及视频等信息格式。
• 帮助简化流程、管理重复任务、回答问题并处理编辑及翻译工作的员工智能体。
• 可以生成内容、图像及思维以支持设计、营销与写作项目等工作内容的创意智能体。
• 能够通过查找并处理数据(同时确保事实完整性)以协助研究及数据分析的数据智能体。
• 支持代码生成并提供编码辅助的编程智能体。
• 协助缓解攻击或者提高调查速度的安全智能体。
但Parker也同时强调,让多种智能体承担一众职能中的大量流程,也可能造成新的混合局面。他预计这将催生出新的智能体应用平台。
他解释称:“我们认为,打造一套负责管理及启用智能体的统一平台将带来巨大的市场机遇。”这意味着“以智能体管理智能体”,或者建立单独的智能体层以支持“到处运行并在所有不同系统中运作的各类智能体”。
多模态AI将提供更多背景信息
2025年,全球多模态AI市场总规模预计将达到24亿美元,而到2037年底预计将增长至989亿美元。
多模态AI将把AI理解能力提升至新的水平,使得模型能够解读并处理一系列数据源——除了常见的文本之外,还包括图像、视频以及音频。一部分领先的技术供应商及前沿初创企业已经提供功能强大的模态工具,例如谷歌自己的Gemeini 2.0 Flash、Mistral的Pixtral 12B以及Cohere的Embed 3。
谷歌预测,多模态AI的爆发式增长将能够支持复杂的数据分析任务,并一路平安更加扎实的基础模型与更趋个性化的洞察见解。
与此同时,企业在采用AI时也将拥抱多模态。Parker指出,企业在处理对话时已经由采用单一转型转变为针对不同用例部署多种模型。“除了OpenAI的模型之外,还包括Gemini、Anthropic、Mistral、Cohere以及Llama等大模型。”
Parker提到,过去12个月间这一切都经历了快速发展。企业已经不再单纯关注模型,而开始分析不同平台并制定AI及AI智能体发展路线图。虽然截至目前,大部分重点仍然集中在开发层面,但2025年的目标将转为让企业用户真正掌握AI应用技术。
Parker表示:“2024年上半年启动了大量实验,但还没有进入实际生产。”如今,企业正一步步迈入生产阶段,下阶段的目标就是推动规模化生产(2025年将有更多生产级用例出现)。
“以往这些通常是需要几年才会出现的趋势,但我们亲眼见证这一切在短短12个月内迅猛推进,着实令人惊叹。”
我们终将释放企业搜索的力量
谷歌预测,企业搜索(由查询特定企业数据的内部搜索引擎提供支持)将通过AI变得更加直观。它将不再单纯基于关键字进行查询;相反,员工将能够使用图像、音频、视频以及对话提示词快速访问内部数据。Parker还指出,这种新能力将带来更高级也更直观的搜索体验,且未来的AI可以处理更为丰富的数据格式,包括文档、电子表格和多媒体素材。
Parker补充称:“企业搜索将不再仅仅局限于查询。人们做的实际上是寻找信息并将结果整合在一起,以便获取洞察力并据此采取行动。”
他同时指出,许多组织在不同的应用程序当中都留存有不同的信息——包括编码系统、Jira、Confluence、Box,乃至SharePoint以及Service Now等平台。
AI搜索可以快速跨越多种应用程序,将不同来源的数据整合在一起。“这些推理系统甚至能够跨企业系统进行搜索。长久以来,关于该如何查询并找到所在组织的一切系统中发生的事情,再应用智能体加以分析、采取行动的问题终于有了答案。”
没错,在整个流程当中,AI智能体同样将发挥重要作用。Parker总结道:“我们已经观察到越来越多的对话和基于智能体的功能,正在与组织内部的搜索机制相互融合。”
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
字节跳动团队开发了首个AI研究助手评估系统ReportBench,通过对比AI生成报告与专家综述论文的引用质量,并验证陈述准确性来评估AI助手表现。研究发现OpenAI Deep Research引用准确率38.5%,Gemini为14.5%,两者都存在陈述和引用幻觉问题。该系统为AI研究助手建立了标准化质量检测工具,推动行业发展。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
台湾大学研究团队开发了MovieCORE数据集,这是首个专门训练AI深度理解电影内容的创新工具。该数据集通过多AI智能体协作生成复杂问题,采用认知分类法测量思维深度,99.2%的问答需要高层次思维。研究还开发了ACE增强技术,可将AI性能提升25%。实验显示现有AI在深度视频理解方面仍存在显著不足,为未来AI发展指明了方向。