根据Google Cloud日前发布的最新趋势报告,如果说2024年是AI科技的实验元年,那么2025年将真正成为企业全面推广AI的起步之年。
值得注意的是,复杂的多模态AI将支持越来越多样的任务类别,AI智能体将被嵌入整个企业环境,内部搜索引擎则有望解锁关键的业务洞察见解。
有趣的是,谷歌此番使用到NotebookLM分析先前研究的数据,找出Google Trends当中增速最快的AI主题、并辅以第三方研究和洞察,最终确定了这些关键趋势。
Google Cloud全球生成式AI产品上市副总裁Oliver Parker在采访中表示:“展望未来,大家会看到不同的智能体之间相互交流。届时哪怕整个世界的人类都已安然入眠,AI智能体仍将继续推动幕后一系列任务、事件及行动的开展。”
企业将由聊天机器人转向多智能体系统
AI智能体可以自主(或者半自主)运作并执行多步骤流程。根据凯捷发布的数据,只有约10%的大型企业已经在使用AI智能体,但有82%的企业计划在未来三年之内将其纳入业务体系。
谷歌在报告中明确提及六种AI智能体类型:
• 负责理解用户需求、回答问题、解决问题并推荐产品及服务的客服智能体。它们能够跨频道工作,并可集成语音及视频等信息格式。
• 帮助简化流程、管理重复任务、回答问题并处理编辑及翻译工作的员工智能体。
• 可以生成内容、图像及思维以支持设计、营销与写作项目等工作内容的创意智能体。
• 能够通过查找并处理数据(同时确保事实完整性)以协助研究及数据分析的数据智能体。
• 支持代码生成并提供编码辅助的编程智能体。
• 协助缓解攻击或者提高调查速度的安全智能体。
但Parker也同时强调,让多种智能体承担一众职能中的大量流程,也可能造成新的混合局面。他预计这将催生出新的智能体应用平台。
他解释称:“我们认为,打造一套负责管理及启用智能体的统一平台将带来巨大的市场机遇。”这意味着“以智能体管理智能体”,或者建立单独的智能体层以支持“到处运行并在所有不同系统中运作的各类智能体”。
多模态AI将提供更多背景信息
2025年,全球多模态AI市场总规模预计将达到24亿美元,而到2037年底预计将增长至989亿美元。
多模态AI将把AI理解能力提升至新的水平,使得模型能够解读并处理一系列数据源——除了常见的文本之外,还包括图像、视频以及音频。一部分领先的技术供应商及前沿初创企业已经提供功能强大的模态工具,例如谷歌自己的Gemeini 2.0 Flash、Mistral的Pixtral 12B以及Cohere的Embed 3。
谷歌预测,多模态AI的爆发式增长将能够支持复杂的数据分析任务,并一路平安更加扎实的基础模型与更趋个性化的洞察见解。
与此同时,企业在采用AI时也将拥抱多模态。Parker指出,企业在处理对话时已经由采用单一转型转变为针对不同用例部署多种模型。“除了OpenAI的模型之外,还包括Gemini、Anthropic、Mistral、Cohere以及Llama等大模型。”
Parker提到,过去12个月间这一切都经历了快速发展。企业已经不再单纯关注模型,而开始分析不同平台并制定AI及AI智能体发展路线图。虽然截至目前,大部分重点仍然集中在开发层面,但2025年的目标将转为让企业用户真正掌握AI应用技术。
Parker表示:“2024年上半年启动了大量实验,但还没有进入实际生产。”如今,企业正一步步迈入生产阶段,下阶段的目标就是推动规模化生产(2025年将有更多生产级用例出现)。
“以往这些通常是需要几年才会出现的趋势,但我们亲眼见证这一切在短短12个月内迅猛推进,着实令人惊叹。”
我们终将释放企业搜索的力量
谷歌预测,企业搜索(由查询特定企业数据的内部搜索引擎提供支持)将通过AI变得更加直观。它将不再单纯基于关键字进行查询;相反,员工将能够使用图像、音频、视频以及对话提示词快速访问内部数据。Parker还指出,这种新能力将带来更高级也更直观的搜索体验,且未来的AI可以处理更为丰富的数据格式,包括文档、电子表格和多媒体素材。
Parker补充称:“企业搜索将不再仅仅局限于查询。人们做的实际上是寻找信息并将结果整合在一起,以便获取洞察力并据此采取行动。”
他同时指出,许多组织在不同的应用程序当中都留存有不同的信息——包括编码系统、Jira、Confluence、Box,乃至SharePoint以及Service Now等平台。
AI搜索可以快速跨越多种应用程序,将不同来源的数据整合在一起。“这些推理系统甚至能够跨企业系统进行搜索。长久以来,关于该如何查询并找到所在组织的一切系统中发生的事情,再应用智能体加以分析、采取行动的问题终于有了答案。”
没错,在整个流程当中,AI智能体同样将发挥重要作用。Parker总结道:“我们已经观察到越来越多的对话和基于智能体的功能,正在与组织内部的搜索机制相互融合。”
好文章,需要你的鼓励
亚马逊股价在盘后交易中暴涨超12%,业绩轻松超越分析师预期。公司每股收益1.95美元,大幅超出1.57美元预期;营收1801.7亿美元,同比增长13%。AWS云业务表现亮眼,季度营收330亿美元,同比增长20%,创近年来最强增长。CEO贾西表示AWS增长速度达到2022年以来最快水平,主要得益于AI资源需求激增。公司将2025年资本支出预期从1180亿美元上调至1250亿美元,用于AI数据中心建设。
印度理工学院研究团队从大脑神经科学的戴尔定律出发,开发了基于几何布朗运动的全新AI图像生成技术。该方法使用乘性更新规则替代传统加性方法,使AI训练过程更符合生物学习原理,权重分布呈现对数正态特征。研究团队创建了乘性分数匹配理论框架,在标准数据集上验证了方法的有效性,为生物学启发的AI技术发展开辟了新方向。
微软正将Copilot AI功能集成到Microsoft 365伴侣应用中,包括人员、文件和日历三个任务栏工具。这些轻量级应用仅面向企业和商业客户,将于10月底开始自动安装。Copilot将基于组织数据提供上下文感知的提示和摘要功能。人员应用可显示近期沟通记录,文件应用支持文档摘要和数据分析,日历应用将提供会议摘要。目前人员和文件功能已上线,日历功能即将推出。
Sony AI开发出SoundReactor框架,首次实现逐帧在线视频转音频生成,无需预知未来画面即可实时生成高质量立体声音效。该技术采用因果解码器和扩散头设计,在游戏视频测试中表现出色,延迟仅26.3毫秒,为实时内容创作、游戏世界生成和互动应用开辟新可能。