OpenAI 最近的 ChatGPT 更新虽然测试得分良好,却使模型过于迎合用户,引发安全隐患。为防止类似问题重现,公司正改进测试流程,加强对模型行为的评估。
文章探讨企业选择大型语言模型时应结合业务目标、数据质量、集成及安全性,通过详尽调研和试点验证实现渐进部署,避免资源浪费与安全风险。
Ai2 最近发布了名为 Olmo 2 1B 的 10 亿参数小型 AI 模型,在算术推理与事实核查测试中表现优于 Google、Meta 与阿里,尽管存在潜在风险,不建议商业应用。
一项新研究称 LM Arena 平台存在不公正操作,偏向大企业私测的专有模型,而开放模型得不到足够评测,平台运营者对此表示争议。
最新研究发现,AI生成的代码常错误引用虚构依赖库,为供应链攻击提供契机,可能导致数据泄露、植入后门等恶意行为,严重威胁系统安全。
谷歌发布三款个性化语言学习AI实验:一款即时提供情境短语;一款教你掌握地道口语;一款通过拍照识别周边物品,助你扩充词汇。支持多种语言,让独立学习更动态高效。
阿里巴巴全新发布的 Qwen 3 系列模型支持 119 种语言,采用混合思考模式,可根据任务需求灵活调整“思考预算”。该系列模型规模从 0.6 亿到 2350 亿参数不等,在编程、数学推理等多项测试中部分超越 OpenAI 与 Google 同类产品,且大部分模型将通过 Hugging Face 和 GitHub 开放下载。
Writer 推出全新 LLM Palmyra X5,配备百万标记窗口,利用混合注意力和专家混合技术,在降低成本的同时实现接近 GPT-4.1 的性能,助力企业部署高效 AI 自动化。
研究显示,现有模拟推理 AI 模型能解决常规数学题,但在面对竞赛级证明题时因缺乏深层逻辑推理能力而屡屡失手,暴露了其数学证明上的局限。
Meta将于4月29日举办全虚拟LlamaCon开发者大会,通过Meta for Developers Facebook页面直播,主旨演讲及多场高层对话将展示开源Llama模型系列及最新AI功能。
OpenAI 宣布将于今年晚些时候发布自 GPT-2 后首个开源语言模型,由研究副总裁 Aidan Clark 领导,预计初夏推出。该模型针对高端消费硬件,可灵活启用推理功能,并采用宽松许可证和严格安全评估,此举旨在应对 DeepSeek、Meta 等开源对手的竞争。
富士通与 Nutanix 合作,将经过日语优化的 Takane 模型部署在企业 AI 平台,实现私有及混合云环境中安全高效应用生成式 AI。
从本周五起,Copilot 将记住用户会话和偏好信息(如宠物名、早餐口味及沟通风格),并试验个性化动画展示,同时支持在部分网站上预订票务、餐厅等服务,朝全面个人助理迈进。
OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色,但幻觉率却远高于以往模型,引发了对准确性的严重担忧,亟待进一步研究。
Together AI 最新升级其微调平台,支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重,同时新定价更低廉,旨在简化AI模型持续迭代。
在 Cloud Next 2025 上,Google 公布一系列 AI 更新,包括新 TPU 芯片、专业化 LLM 及开放代理框架,助力企业降低集成复杂度和成本,实现 AI 部署、扩展及管理。
OpenAI 推出了 GPT-4.1 系列,专注提升编程效率、扩展长文本处理能力与指令执行准确性,同时大幅降低成本,为企业和开发者提供更灵活的 AI 工具。