AI正在渗透我们生活中的方方面面,而且渗透之迅速、覆盖之广泛着实令人印象深刻。谷歌和微软们很不得立刻把AI武装到牙齿,传统的网络浏览器也在短短一年之间变得更加智能。而且不只是科技巨头们正在为此角力,众多初创企业也加紧跟上。各种原本名不见经传的浏览器纷纷融入AI,为网上冲浪赋予更舒适的体验。
微软Edge一马当先
微软的Edge凭借基于ChatGPT的Copilot功能取得了先发优势。得益于AI技术的加持,Edge现在能够准确总结网页内容、直接回答用户提问,甚至根据阅读偏好推荐相关文章。Copilot还利用Bing搜索引擎的知识库和OpenAI ChatGPT不断更新自己的信息来源和储备。
Arc不甘示弱
要论知名度,Arc浏览器肯定不算高,但它在将AI引入上网冲浪的工作上确实先行一步。放弃原本的手机浏览器,以“Arc Search”面貌示人的移动搜索应用已经登陆iOS平台,核心亮点就是“为我浏览”功能。在它的帮助下,浏览器可以根据用户提问抓取网络信息、读取多个页面,给出非常简洁的内容摘要,而且整个过程都将在短短几秒内完成。虽然目前还处于早期阶段,但预计Arc很快就将扩展至Windows、Android等其他平台,将AI之力赋予更多用户。
Chrome即将发力
必须承认,截至目前谷歌还没有为Chrome引入太多AI功能,但相关工作正在积极筹备当中。谷歌的搜索生成体验(SGE)仍处于实验阶段,预计将在改进Chrome使用体验上发挥关键作用。目前的SGE测试版已经能在Chrome工具栏中提供页面摘要与相关搜索,让用户一窥网络浏览的未来形态。相信在桑达尔·皮查伊的带领下,谷歌押注的SGE将逐渐发展成熟,最终颠覆人们的浏览方式。
其他浏览器
苹果则以相对低调的方式为Safari浏览器引入了AI功能。不过在2024年6月的新一届WWDC大会上,相信肯定有更多消息轮番推出。Brave浏览器迎来了Leo聊天助手,同样由AI技术提供支持。Leo基于Meta Llama 2模型构建而成,能够总结用户当前浏览的网页,也允许大家根据网页内容提出问题,快速获取答案、解释及其他观点。Brave Leo还拥有内容创作、语言翻译、音频/视频转录等多种功能。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。