凭借新的扩展,谷歌Bard已经能够理解视频内容并响应用户的查询请求。换言之,用户现在可以通过这款AI聊天机器人,快速了解自己关注的YouTube视频大致表达了哪些内容。
谷歌在11月21日的实验更新中发布了这款生成式AI扩展,并表示:“我们正推动Bard向着理解YouTUbe视频迈出第一步……为了帮助更多观众享受YouTube视频,我们决定发布此项扩展以总结视频内容,并据此与Bard开展更丰富的对话。”
现在,当用户为Bard选择特定视频之后,即可在实际观看之前询问各种复杂的相关问题,包括大致内容和具体细节。
自今年年初推出以来,谷歌一直在努力完善自家Bard聊天机器人。9月,谷歌又发布了一系列增强功能,包括Google Flights、Google Maps、Google Drive、Google Docs、Gmail以及YouTube的浏览器扩展程序,允许Bard直接从各类网站处提取数据。
与此同时,谷歌公司还提供一款工具,用户可以借此认真检查机器人的答案。今年10月,谷歌又拿出了新的Assistant with Bard(谷歌的个人助手与生成式AI组合方案)。上周,Bard的访问权限开始向青少年群体正式开放。
有网友担心,此番更新可能会威胁到在线视频教育工作者的前途,同时也加剧了生成式AI给隐私与内容所有权带来的威胁。
如果再想得长远一点,也许在习惯了谷歌Bard的服务之后,我们再也不用亲身参与各种事务,包括观看视频。一切内容,都将被Bard这类“信息贩子”所中介。
好文章,需要你的鼓励
美国多州和部分国家要求特定应用进行年龄验证,澳大利亚已禁止16岁以下用户使用社交媒体。新提案《应用商店问责法案》建议由苹果和谷歌负责统一验证用户年龄,而非各开发者单独验证。这将提升用户体验,用户只需向苹果或谷歌验证一次身份。凭借苹果在隐私保护方面的优势,该方案可扩展至Safari浏览器,为需要年龄验证的网站提供确认信息,而无需透露用户个人数据。
Meta AI首次发布多模态奖励评估基准MMRB2,专门评价AI同时处理文字和图像的能力。该基准包含四大任务类型共4000个专家标注样本,测试23个先进模型。结果显示最佳模型Gemini 3 Pro达75-80%准确率,仍低于人类90%水平。研究揭示AI评价存在视觉偏见等问题,为多模态AI发展提供重要参考标准。
AI编程助手Cursor背后的公司Anysphere宣布收购AI代码审查工具初创公司Graphite。据报道收购价远超Graphite今年早些时候B轮融资时2.9亿美元的估值。此次收购具有战略意义,将AI代码生成与AI代码审查工具相结合,可大幅提升从编写到交付的整体效率。Anysphere估值已达290亿美元,近期频繁收购,上月收购技术招聘公司,今年7月还收购AI客户关系管理初创公司Koala的团队。
快手推出的Kling-Omni是首个真正统一的AI视频制作系统,能够理解文字、图像、视频等多种输入方式,不仅可以生成视频,还能进行复杂编辑和推理。该系统通过三个核心模块的协作,实现了从创意理解到最终输出的全流程自动化,让普通用户也能制作专业水准的视频内容,代表了AI视频技术的重要突破。