AI正在渗透我们生活中的方方面面,而且渗透之迅速、覆盖之广泛着实令人印象深刻。谷歌和微软们很不得立刻把AI武装到牙齿,传统的网络浏览器也在短短一年之间变得更加智能。而且不只是科技巨头们正在为此角力,众多初创企业也加紧跟上。各种原本名不见经传的浏览器纷纷融入AI,为网上冲浪赋予更舒适的体验。
微软Edge一马当先
微软的Edge凭借基于ChatGPT的Copilot功能取得了先发优势。得益于AI技术的加持,Edge现在能够准确总结网页内容、直接回答用户提问,甚至根据阅读偏好推荐相关文章。Copilot还利用Bing搜索引擎的知识库和OpenAI ChatGPT不断更新自己的信息来源和储备。
Arc不甘示弱
要论知名度,Arc浏览器肯定不算高,但它在将AI引入上网冲浪的工作上确实先行一步。放弃原本的手机浏览器,以“Arc Search”面貌示人的移动搜索应用已经登陆iOS平台,核心亮点就是“为我浏览”功能。在它的帮助下,浏览器可以根据用户提问抓取网络信息、读取多个页面,给出非常简洁的内容摘要,而且整个过程都将在短短几秒内完成。虽然目前还处于早期阶段,但预计Arc很快就将扩展至Windows、Android等其他平台,将AI之力赋予更多用户。
Chrome即将发力
必须承认,截至目前谷歌还没有为Chrome引入太多AI功能,但相关工作正在积极筹备当中。谷歌的搜索生成体验(SGE)仍处于实验阶段,预计将在改进Chrome使用体验上发挥关键作用。目前的SGE测试版已经能在Chrome工具栏中提供页面摘要与相关搜索,让用户一窥网络浏览的未来形态。相信在桑达尔·皮查伊的带领下,谷歌押注的SGE将逐渐发展成熟,最终颠覆人们的浏览方式。
其他浏览器
苹果则以相对低调的方式为Safari浏览器引入了AI功能。不过在2024年6月的新一届WWDC大会上,相信肯定有更多消息轮番推出。Brave浏览器迎来了Leo聊天助手,同样由AI技术提供支持。Leo基于Meta Llama 2模型构建而成,能够总结用户当前浏览的网页,也允许大家根据网页内容提出问题,快速获取答案、解释及其他观点。Brave Leo还拥有内容创作、语言翻译、音频/视频转录等多种功能。
好文章,需要你的鼓励
谷歌Agent Development Kit(ADK)革新了AI应用开发模式,采用事件驱动的运行时架构,将代理、工具和持久化状态整合为统一应用。ADK以Runner为核心,通过事件循环处理用户请求、模型调用和外部工具执行。执行逻辑层管理LLM调用和工具回调,服务层提供会话、文件存储等持久化能力。这种架构支持多步推理、实时反馈和状态管理,为构建超越简单聊天界面的生产级AI应用提供了完整框架。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
苹果在iOS 26中推出全新游戏应用,为iPhone、iPad和Mac用户提供个性化的游戏中心。该应用包含五个主要版块:主页展示最近游戏和推荐内容,Arcade专区提供超过200款无广告游戏,好友功能显示Game Center动态并支持游戏挑战,资料库可浏览已安装游戏并提供筛选选项,搜索功能支持按类别浏览。iOS 26.2版本还增加了游戏手柄导航支持,为游戏玩家提供更便捷的操作体验。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。