Google于本周发布了Chrome浏览器的重大更新,将Gemini AI聊天机器人直接整合到了地址栏当中。新方案已经面向用户广泛开放,标志着AI技术已经进入全面普及的关键阶段,甚至有望重塑数百万用户与互联网之间的交互方式。而用生成式AI响应取代传统搜索查询,正是这波转折的第一步。
这家科技巨头现在允许Chrome用户在浏览器地址栏中直接输入“@gemini”,而后填写查询内容来直接访问Gemini。这种无缝集成消除了导航至单独网站或者应用程序才能使用AI辅助功能的麻烦,在实质上使得AI成为Chrome庞大用户群体浏览体验当中的默认组成部分。
Google于今年4月中旬就开始测试此项功能,最早曾将它发布至Chrome Canary测试版中。
在成功试水之后,Google于4月30日将发布范围扩大到全球100多个国家,表明已经对该技术的广泛应用充满信心。而随着此番该功能在Chrome正式发行版中推出,进一步凸显了Google致力于将AI技术融入核心产品的承诺。
Gemini 1.5 Flash:为Chrome的AI变革添助力
此番集成利用到Gemini 1.5 Flash,也就是该Google高级语言模型家族的轻量化版本,允许用户直接通过浏览器访问到前沿AI功能。
虽然不像Gemini 1.5 Pro那么专业(目前仍须通过单独渠道访问),但Flash版本较前代产品仍有显著改进。然而与一些竞争对手的产品(例如微软的Copilot)不同,Chrome中的Gemini缺乏对用户浏览活动的情境感知,这也限制了根据特定页面提供帮助的能力。
此次更新属于Google将AI技术融入产品套件的广泛战略中的环节之一。今年8月1愚人节,Google公司已经为Chrome推出过几项AI功能,包括增强的Google Lens集成以实现视觉搜索、用于在线购物的标签比较工具以及改进后的历史记录浏览功能等。在地址栏中引入Gemini,代表着这项AI优先战略再次迎来重大升级。
此举影响可谓深远。由于Chrome占据浏览器市场的主导地位(估计全球份额超过60%),此番集成可能会大大提高全球数亿用户的AI可及规模。这种广泛的可用性有望加速AI工具在日常任务中的采用,进而提高普通互联网用户的生产力和信息访问能力。
地址栏中的AI:隐私问题与业务影响
然而,这一举措也带来了关于数据隐私及AI在我们数字生活中日益重要的现实作用等重要问题。随着AI技术越来越深入地内嵌在我们的主要浏览工具当中,人们对于数据收集、用户分析以及AI影响信息消费模式的潜在担忧可能会进一步加剧。
对于企业和技术决策者来说,Google的决定预示着企业软件和数据管理格局的大幅转变。将高级AI功能集成至网络浏览器等常用工具当中,可能会推动人们对其他业务应用程序中类似AI辅助功能的期待。因此,企业可能需要重新评估自身技术栈,并考虑如何利用这些AI增强型平台、或者与之直接竞争。
再有,此次更新还可能对数字营销和搜索引擎优化(SEO)行业产生重大影响。随着用户越来越习惯于AI辅助浏览,他们的搜索和信息消费行为也可能会发生变化,进而影响到企业对自身线上形象以及客户交互方式的优化思路。
网络浏览的未来:Google的AI优先战略
在各大科技巨头争相投身AI军备竞赛的大背景之下,Google的最新举措可以看作努力保持自身在网页浏览和AI技术方面的领先地位的战略性探索。通过将Gemini直接交付至庞大的Chrome用户群手中,Google不仅扩大了AI业务覆盖范围,同时也收集到了有价值的用户交互数据,有望借此为未来的AI发展提供参考。
当我们站在AI集成浏览这一新时代的风口浪尖,很明显传统网页导航与AI辅助信息检索之间的边界正变得越来越模糊。虽然这一转变的全面影响仍然有待观察,但有一点可以肯定:我们与互联网交互的方式正在发生变化,而Google正在将自己定位在这场变革的最前沿。
换句话说,Google的探索绝不仅仅是在浏览器中添加新的AI功能,而更多是在重新构想我们在线访问和处理信息的根本方式。我们正身处在见证人机交互下一波潜在的根本性转变的早期阶段。
随着这项技术的不断发展,用户、企业和政策制定者必须打起精神,严肃关注这种全新AI互联网格局所带来的种种机遇和挑战。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。