根据Google Cloud日前发布的最新趋势报告,如果说2024年是AI科技的实验元年,那么2025年将真正成为企业全面推广AI的起步之年。
值得注意的是,复杂的多模态AI将支持越来越多样的任务类别,AI智能体将被嵌入整个企业环境,内部搜索引擎则有望解锁关键的业务洞察见解。
有趣的是,谷歌此番使用到NotebookLM分析先前研究的数据,找出Google Trends当中增速最快的AI主题、并辅以第三方研究和洞察,最终确定了这些关键趋势。
Google Cloud全球生成式AI产品上市副总裁Oliver Parker在采访中表示:“展望未来,大家会看到不同的智能体之间相互交流。届时哪怕整个世界的人类都已安然入眠,AI智能体仍将继续推动幕后一系列任务、事件及行动的开展。”
企业将由聊天机器人转向多智能体系统
AI智能体可以自主(或者半自主)运作并执行多步骤流程。根据凯捷发布的数据,只有约10%的大型企业已经在使用AI智能体,但有82%的企业计划在未来三年之内将其纳入业务体系。
谷歌在报告中明确提及六种AI智能体类型:
• 负责理解用户需求、回答问题、解决问题并推荐产品及服务的客服智能体。它们能够跨频道工作,并可集成语音及视频等信息格式。
• 帮助简化流程、管理重复任务、回答问题并处理编辑及翻译工作的员工智能体。
• 可以生成内容、图像及思维以支持设计、营销与写作项目等工作内容的创意智能体。
• 能够通过查找并处理数据(同时确保事实完整性)以协助研究及数据分析的数据智能体。
• 支持代码生成并提供编码辅助的编程智能体。
• 协助缓解攻击或者提高调查速度的安全智能体。
但Parker也同时强调,让多种智能体承担一众职能中的大量流程,也可能造成新的混合局面。他预计这将催生出新的智能体应用平台。
他解释称:“我们认为,打造一套负责管理及启用智能体的统一平台将带来巨大的市场机遇。”这意味着“以智能体管理智能体”,或者建立单独的智能体层以支持“到处运行并在所有不同系统中运作的各类智能体”。
多模态AI将提供更多背景信息
2025年,全球多模态AI市场总规模预计将达到24亿美元,而到2037年底预计将增长至989亿美元。
多模态AI将把AI理解能力提升至新的水平,使得模型能够解读并处理一系列数据源——除了常见的文本之外,还包括图像、视频以及音频。一部分领先的技术供应商及前沿初创企业已经提供功能强大的模态工具,例如谷歌自己的Gemeini 2.0 Flash、Mistral的Pixtral 12B以及Cohere的Embed 3。
谷歌预测,多模态AI的爆发式增长将能够支持复杂的数据分析任务,并一路平安更加扎实的基础模型与更趋个性化的洞察见解。
与此同时,企业在采用AI时也将拥抱多模态。Parker指出,企业在处理对话时已经由采用单一转型转变为针对不同用例部署多种模型。“除了OpenAI的模型之外,还包括Gemini、Anthropic、Mistral、Cohere以及Llama等大模型。”
Parker提到,过去12个月间这一切都经历了快速发展。企业已经不再单纯关注模型,而开始分析不同平台并制定AI及AI智能体发展路线图。虽然截至目前,大部分重点仍然集中在开发层面,但2025年的目标将转为让企业用户真正掌握AI应用技术。
Parker表示:“2024年上半年启动了大量实验,但还没有进入实际生产。”如今,企业正一步步迈入生产阶段,下阶段的目标就是推动规模化生产(2025年将有更多生产级用例出现)。
“以往这些通常是需要几年才会出现的趋势,但我们亲眼见证这一切在短短12个月内迅猛推进,着实令人惊叹。”
我们终将释放企业搜索的力量
谷歌预测,企业搜索(由查询特定企业数据的内部搜索引擎提供支持)将通过AI变得更加直观。它将不再单纯基于关键字进行查询;相反,员工将能够使用图像、音频、视频以及对话提示词快速访问内部数据。Parker还指出,这种新能力将带来更高级也更直观的搜索体验,且未来的AI可以处理更为丰富的数据格式,包括文档、电子表格和多媒体素材。
Parker补充称:“企业搜索将不再仅仅局限于查询。人们做的实际上是寻找信息并将结果整合在一起,以便获取洞察力并据此采取行动。”
他同时指出,许多组织在不同的应用程序当中都留存有不同的信息——包括编码系统、Jira、Confluence、Box,乃至SharePoint以及Service Now等平台。
AI搜索可以快速跨越多种应用程序,将不同来源的数据整合在一起。“这些推理系统甚至能够跨企业系统进行搜索。长久以来,关于该如何查询并找到所在组织的一切系统中发生的事情,再应用智能体加以分析、采取行动的问题终于有了答案。”
没错,在整个流程当中,AI智能体同样将发挥重要作用。Parker总结道:“我们已经观察到越来越多的对话和基于智能体的功能,正在与组织内部的搜索机制相互融合。”
好文章,需要你的鼓励
Python通过PEP 810提案正式引入惰性导入功能,允许程序延迟加载导入库直到实际需要时才执行,而非在启动时全部加载。该提案由指导委员会成员Pablo Salgado于10月3日提出并于11月3日获批。新功能采用选择性加入方式,保持向后兼容性的同时解决了社区长期面临的启动时间过长问题,标准化了当前分散的自定义解决方案。
这项由斯坦福大学和特拉维夫大学合作的研究揭示了语言模型内部存在三套协同工作的信息处理机制:位置机制、词汇机制和反射机制。研究发现,当文本复杂度增加时,传统的位置机制会变得不稳定,其他两种机制会自动补偿。这一发现解释了AI在长文本处理中的表现模式,为优化模型架构和提升AI可靠性提供了重要理论基础。
Valve最新Steam硬件软件调查显示,Linux用户占比达到3.05%,较上月增长0.37个百分点,相比去年同期增长约50%。游戏网站Boiling Steam分析显示,Windows游戏在Linux平台兼容性达历史最高水平,近90%的Windows游戏能在Linux上启动运行,仅约10%游戏无法启动。
加州大学圣克鲁兹分校联合英伟达等机构开发出世界首个医学离散扩散模型MeDiM,实现了医学影像与报告的双向生成。该系统能根据临床报告生成对应影像,也能看图写报告,甚至可同时生成匹配的影像-报告对。在多项评估中表现优异,为医学教育、临床研究和辅助诊疗提供了强有力的AI工具。