研究人员在罗格斯大学、蚂蚁集团和 Salesforce Research 提出了一个新框架,允许 AI 代理通过整合环境信息并创建自动链接的记忆来处理更复杂的任务。
OpenAI 已开始向其 ChatGPT Plus 用户推出最新的 AI 模型 GPT-4.5。OpenAI 在 X 平台上发布的一系列帖子中表示,此次推出将持续“1-3 天”,并预计速率限制会有所变化。
OpenAI 最近推出了 GPT-4.5,这款新模型在准确性测试中表现优于之前的版本,能够更好地理解细微差别。尽管面临 GPU 短缺的挑战,OpenAI 仍然致力于将这一模型推向市场,并计划在未来推出更先进的推理能力模型。
人工智能公司 Anthropic PBC 今日宣布已完成一轮 35 亿美元的融资,估值达到 615 亿美元。这轮 E 轮融资在公司从 Google LLC 筹集 10 亿美元不到两个月后进行。两个月前,亚马逊公司将对 Anthropic 的投资翻倍至 80 亿美元。亚马逊网络服务自去年九月起成为该人工智能提供商的主要云服务商。
OpenAI 今日推出最新最大的 AI 语言模型 GPT-4.5。该模型将首先向 ChatGPT Pro 用户提供研究预览。虽然 OpenAI 称其为"最具知识性的模型",但也警告 GPT-4.5 并非前沿模型,可能无法超越 o1 或 o3-mini 的表现。GPT-4.5 在写作、知识储备和个性方面有所提升,但不会引入足够的新功能被视为前沿模型。
OpenAI 推出代号"Orion"的 GPT-4.5 模型,这是公司迄今最大规模的 AI 模型。GPT-4.5 在计算能力和训练数据方面均超越以往版本,但 OpenAI 并不认为它是前沿模型。该模型将逐步向付费用户开放,但运营成本高昂。尽管在某些基准测试中表现出色,但 GPT-4.5 在部分任务上仍落后于其他 AI 推理模型,凸显了传统预训练方法的局限性。
近期AI模型层出不穷,从谷歌等科技巨头到OpenAI、Anthropic等初创公司,都在不断推出新模型。本文梳理了2024年以来发布的最先进AI模型,介绍它们的功能特点和使用方法,帮助读者了解最新AI发展动态,选择适合的模型使用。文章将持续更新,跟踪最新模型发布情况。
DeepSeek是一家中国人工智能实验室,其聊天机器人应用最近在应用商店排名飙升。该公司通过高效的计算技术训练AI模型,其表现引发了业界对美国AI领先地位和AI芯片需求的质疑。DeepSeek的崛起源于量化对冲基金,其模型性能出色且价格低廉,正在对AI行业产生重大影响。
Google DeepMind 首席执行官 Demis Hassabis 在内部会议上回应了员工对中国 AI 初创公司 DeepSeek 的担忧。他强调 Google 拥有更高效、性能更强的 AI 模型,对公司战略充满信心。Hassabis 认为 DeepSeek 的成本可能被低估,并可能依赖西方公司的先进模型。
本文分析了当前AI业界的一种普遍观点:只需增加生成式AI和大语言模型的"思考时间"就能获得更好的回应。作者认为,虽然这种方法有时有效,但并非万能良药,实际上是回避了当代AI面临的更大问题。文章通过多个示例,深入探讨了增加AI处理时间的优缺点,以及可能带来的潜在风险。
xAI公司推出的Grok 3模型在各项关键基准测试中表现出色,匹敌或超越了目前最先进的AI模型。尽管训练尚未完成,Grok 3已展现出强大实力。本文探讨了Grok 3可能对AI行业产生的影响,包括加速模型发布周期、验证大规模计算投资的价值,以及推动开源文化的发展等方面。
Google 推出了一款名为"AI 协作科学家"的系统,旨在加速科学发现。该系统基于 Gemini 2.0 构建,可以生成新颖的可测试假设、详细的研究概述和实验方案。早期测试显示,它能在短时间内解决困扰科学家多年的难题。这一工具目前仅对参与 Google 可信测试计划的研究人员开放,有望显著提高科研效率。
Enso 与 LangChain 合作推出 AI 代理市场,提供超过 300 个 AI 代理,帮助企业自动化业务任务。用户可通过每月 49 美元的订阅访问这些代理,为中小企业提供 AI 解决方案。此举不仅使 AI 技术更易获取,还为开发者提供了更便捷的商业化途径。
OpenAI 首席执行官 Sam Altman 宣布了公司发布 GPT-5 的路线图,这是对 2023 年 GPT-4 AI 语言模型的期待已久的后续版本。Altman 在 X 上表示,GPT-5 将在“几个月内”推出,预计在 2025 年晚些时候发布。公司计划在“几周内”发布 GPT-4.5,作为最后一个非模拟推理模型。GPT-5 将整合 OpenAI 当前 AI 模型的多种特性,并为不同用户提供不同的智能级别。Altman 还提到,简化产品线是公司的目标之一。
中国人工智能公司DeepSeek的突然崛起震动了全球科技市场,引发了对其性能声明和开源承诺的质疑。尽管其低成本模型引起了业界关注,但在开放性、性能真实性和安全性方面仍存在争议。这一事件也引发了对中国AI技术发展的深入思考。
近期一项调查显示,大型企业正大幅增加对生成式人工智能的投资和应用。本文分析了五个原因,解释为何生成式人工智能的实施将主要由业务部门而非IT部门主导,包括应用范围广、培训需求大、业务导向强等。这意味着技术主管需要做好准备,以更灵活的模式为多样化的需求提供支持。
OpenAI正寻求400亿美元新一轮融资,估值或达3400亿美元。软银可能领投150-250亿美元,并协助寻找其他投资者。这笔资金将用于支持亏损业务运营和建设AI数据中心网络,以应对来自竞争对手的挑战,推动AI技术进步。
Mistral AI 和艾伦人工智能研究所发布了新的开源大语言模型。Mistral Small 3 拥有 240 亿参数,可在某些 MacBook 上运行。AI2 的 Tülu 3 405B 是基于 Meta 的 Llama 3.1 405B 模型改进而来。两个模型都声称在各自类别中处于领先地位,并以开源许可发布。
阿里云发布最新大语言模型 Qwen 2.5-Max,声称性能超越当前最强 AI 模型。该模型采用专家混合架构,经过 20 万亿 token 预训练和后续强化学习,在多项基准测试中超越 DeepSeek-V3 等模型。Qwen 2.5-Max 目前通过阿里云 API 提供服务,但尚未开源。
OpenAI 推出专为政府机构定制的 ChatGPT Gov 版本,通过 Azure 云平台提供更高安全标准的服务环境。该版本保留了 ChatGPT Enterprise 的核心功能,同时确保政府数据的安全性和隐私保护,目前已获得多个联邦机构的采用,体现了 OpenAI 深化与美国政府合作的战略意图。