凭借新的扩展,谷歌Bard已经能够理解视频内容并响应用户的查询请求。换言之,用户现在可以通过这款AI聊天机器人,快速了解自己关注的YouTube视频大致表达了哪些内容。
谷歌在11月21日的实验更新中发布了这款生成式AI扩展,并表示:“我们正推动Bard向着理解YouTUbe视频迈出第一步……为了帮助更多观众享受YouTube视频,我们决定发布此项扩展以总结视频内容,并据此与Bard开展更丰富的对话。”
现在,当用户为Bard选择特定视频之后,即可在实际观看之前询问各种复杂的相关问题,包括大致内容和具体细节。
自今年年初推出以来,谷歌一直在努力完善自家Bard聊天机器人。9月,谷歌又发布了一系列增强功能,包括Google Flights、Google Maps、Google Drive、Google Docs、Gmail以及YouTube的浏览器扩展程序,允许Bard直接从各类网站处提取数据。
与此同时,谷歌公司还提供一款工具,用户可以借此认真检查机器人的答案。今年10月,谷歌又拿出了新的Assistant with Bard(谷歌的个人助手与生成式AI组合方案)。上周,Bard的访问权限开始向青少年群体正式开放。
有网友担心,此番更新可能会威胁到在线视频教育工作者的前途,同时也加剧了生成式AI给隐私与内容所有权带来的威胁。
如果再想得长远一点,也许在习惯了谷歌Bard的服务之后,我们再也不用亲身参与各种事务,包括观看视频。一切内容,都将被Bard这类“信息贩子”所中介。
好文章,需要你的鼓励
腾讯微信AI团队开发的ComoRAG系统通过模仿人脑认知机制,让AI具备了动态记忆和循环推理能力,在长文本理解任务上相比传统方法准确率提升高达11%。该系统采用三层知识组织结构和五步认知循环过程,能够像侦探破案一样主动探索线索、整合信息、构建完整推理链条,特别在处理复杂叙事推理问题时表现优异,标志着AI从信息检索工具向智能推理伙伴的重要转变。
人工智能代表着第四次工业革命的到来,它不仅是机械化工具,更是全球范围内增强、合作和颠覆的催化剂。AI已深度融入日常生活,在医疗、国防、金融和公共治理等领域发挥变革作用。与以往技术不同,AI能够增强人类决策能力,提升效率和创新。然而,算法偏见、网络安全威胁和隐私问题等风险不容忽视。未来AI发展需要政府、企业和学术界协调合作,建立伦理、法律框架,确保AI成为推动人类进步的积极力量。
新加坡南洋理工大学团队开发的4DNeX系统实现了从单张照片生成完整4D动态场景的突破。该技术采用6D视频表示法融合RGB颜色和XYZ空间信息,构建了包含920万帧数据的4DNeX-10M大规模数据集,通过改进视频扩散模型实现15分钟内的高效生成,在动态程度和一致性指标上显著优于现有方法,为虚拟现实、影视制作等领域提供了新的技术路径。