今年的政府工作报告提出,提高科技创新支撑能力。稳定支持基础研究和应用基础研究,引导企业增加研发投入。两会期间,提高科技创新支撑能力、加速人工智能应用落地成为代表热议的话题。
全国人大代表丁国林为人工智能进言献策:“我们要增强紧迫感和使命感,推动关键核心技术自主创新突破,以互联网思维探索人工智能技术转化运用,用主流价值导向驾驭‘算法’,。”
丁国林表示:“为适应信息主体视听化、网络视频爆发期大势,要更加有力推动AI影像技术的应用,更加精准促进媒体融合转型,更加迅速占领信息传播制高点,一是大力扶持相关技术企业,出台针对性减税降费政策;二是积极开放应用场景空间,合力做强媒体融合国家战略;三是成立产学研一体联盟,共同推动技术进步和业务应用。”
随着5G技术的大规模商用,视频流量将呈指数级增长,视频化表达已是大势所趋。但当前,我国媒体转型与发展正面临着发展瓶颈,主要表现在:低效率的视频生产方式制约了传统媒体向融媒体、智媒体转型;海量化的视频生产规模使内容审核更加复杂困难。
丁国林认为,AI 影像技术的赋能加持可以有效解决传统媒体发展瓶颈,也是实现媒体融合发展战略的必由之路。
目前,AI影像技术对于媒体融合潜力巨大、前景广阔,主要作用有5个方面:一是自动化生产,融合多模态图像识别、情感语境、关键帧捕捉等关键技术,自动化生产全新视频,极大缩短工时、降低成本;二是智能化识别,基于数据快速处理、视频智能识别,有效解决镜头提取准确率不高、类型识别不准、通用性差等问题;三是数据化挖掘,通过人工智能技术,盘活持续性海量视频资料,使其可搜索可随需提取,实现价值最大化;四是结构化服务,提供精确到帧的自动化视频结构化服务,实现视频、图片、声音等内容自动合规性审核;五是个性化推送,分析理解观众兴趣偏好,视频输出从常规单向输出变为按需求输出,更加贴合观众需求。
实际上,国内已经有企业正在利用AI影像技术服务于国家的“媒体融合”战略。作为国内典型的智能影像技术系统的开发者及提倡者,影谱科技(Moviebook)的智能影像系列方案可支持大批量数字内容视频化,融合多模态图像识别、情感语境、关键帧捕捉等关键技术,实现影像生产过程的自动化,提升视频生产效率,降低生产成本,在文娱、媒体、科教等行业得到大规模商用,并使影谱科技迈入中国计算机视觉市场第一阵营。
影谱科技创始人姬晓晨表示,“影像内容将是继文字、图片之后的主要信息载体,随着信息视频化提速,影像内容产制播将进一步向个性化和智能化演进,智能影像与机器影像并存。智能影像技术在流媒体领域的充分应用将推动‘个性化和互动性的智能内容将成为重要组成部分’,并已达到大规模应用的临界点”。
据悉,影谱科技开发了一套AI生成无限视频内容的技术引擎AGC,该技术可基于用户的喜好及技术应用者的需求自动生产符合场景需求的短视频、视频内片段、虚拟主持人等AI智能影像。该技术在很大程度上缓解了高质量内容生产力不足的情况。与单一业务流应用略有不同,Moviebook影谱科技聚焦于从内容创建到分发,形成以元数据为基本单位的一站式智能影像技术服务。面向传媒企业提供包括批量化创建智能影像、视频资产管理与分析、智能影像运营、再到智能视频商业化的全过程。
AI影像技术已成为人工智能在媒体领域的应用标杆之一,不仅能创建及优化内容本质,它还可以在定义“技术如何快速落地”方面发挥重要作用。除此之外,智能影像技术仍然充满了各种可能性。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。