至顶网个人商用频道 03月26日 北京消息:以往,当我们看一部大片时,除了画面亦真亦假的奇幻视觉特效,还有声音特效带来的第一感官。如果说这种震撼只停留在“好莱坞”级别影片,那么Fraunhofer IIS要做的正是,让普通电视也能拥有沉浸式音频体验。
在制定了MP3的标准之后,Fraunhofer IIS在音频领域内的探索并没有停步,现在它又将目光转向了广播电视,推出MPEG-H电视音频系统。
事实上,自2015年起,Fraunhofer IIS便参与到中国三维声标准的制定过程中。针对具有中国特色的广电市场需求,推荐下一代广播电视音频解决方案:MPEG-H电视音频系统。
Fraunhofer IIS中国地区代表Toni Fiedler
目前,该方案被AVS 3D音频工作组推选为我国广电三维声音频候选解决方案之一。
简单来说,MPEG-H系统能够为消费者提供诸多功能,其中包括:
沉浸式声音:MPEG-H添加了3D音频组件,能够提供沉浸式声音体验;
交互式音频:消费者可根据个人喜好调节混音效果,例如在收看体育赛事节目时,可根据自身需要选择合适的解决员;
通用传输:MPEG-H为各种设备和环境定制还放效果从而实现最佳音质。
当然,对于广播电视公司和流媒体服务提供商来说,MPEG-H系统还具备一项“诱人”功能,它能以相对较低的比特率,这意味更低成本的方式传输流媒体和电音音频内容。
那么,下一代电视如何用上这项技术?Fraunhofer IIS早已做好准备。
为了让原始设备商更好采纳音频接收机(AVR)参考设计,Fraunhofer IIS采用德州仪器66AK2G02 DSP+ARM系统芯片(SoC)来改善,在芯片端植入MPEG-H技术。
在CCBN2号馆Fraunhofer IIS展区,我们就看到了一系列基于MPEG-H技术的应用展示。
搭载了MPEG-H技术后,我们日常在观看体育比赛时,即可以根据自己的喜好,比如解说可在多种语言切换,并且可调节对应的环境声与解说声,或根据运动员的位置来定位声源,均可用遥控器操作,简单快捷。
此外Fraunhofer IIS还展出一项声音“黑科技”,正是上图中放置于电视前,这款支持MPEG-H解码的3D Soundbar(条形音箱)原型机,可让用户在家中即可享受三维声带来的“声临其境”。
据悉,去年5月,被成功集成于ATSC3.0和DVB标准的MPEG-H技术,已成功应用于韩国基于ATSC3.0的全新地面超高清电视系统中,MPEG-H技术成为全球首个商用的下一代广播电视音频技术。
在中国,Fraunhofer IIS也有着进一步的规划。Fraunhofer IIS中国地区代表Toni Fiedler在接受至顶网采访时表示,为了能够让中国的消费者尽快体验到MPEG-H技术带来的音频体验,Fraunhofer IIS中国团队正积极推进MPEG-H电视音频系统与中国广电配套设备融合工作,参与符合中国市场的三维声标制定工作。
“我们相信一旦标准发布,Fraunhofer IIS能够帮助电视台迅速制作支持下一代广播电视技术的内容,并与设备制造厂商一起带来支持中国三维声技术的消费电子和专业设备。”Toni说道。
好文章,需要你的鼓励
谷歌今日发布Gemini Enterprise,这是一个集成了先进AI模型、聊天机器人和智能代理的一体化企业平台。该平台提供统一聊天界面,可安全连接各种数据源,包括Google Workspace、Microsoft 365等企业应用。平台内置超过1500个AI代理,支持无代码构建工具,用户可创建自动化工作流程。标准版年费每席位每月30美元起。
华中科技大学联合华为和上海交大研究团队开发出革命性3D人体重建系统Snap-Snap,仅需正面和背面两张照片即可在190毫秒内生成完整3D人像。该技术突破了传统方法对昂贵设备和复杂人体先验模型的依赖,通过智能几何推理和侧面增强算法实现高质量重建,为虚拟现实、游戏开发等领域的大众化应用奠定基础。
OpenAI推出的AI视频生成应用Sora在不到五天内下载量突破100万次,增长速度超过ChatGPT。该应用类似TikTok,提供无限垂直视频流,但所有视频均由AI生成。用户只需输入提示词即可创建10秒视频,还可通过Cameo功能制作个人视频。尽管目前仅在北美地区开放且需要邀请码使用,但已引发版权争议和娱乐行业反弹。
这项研究介绍了aiXiv——首个专为AI科学家设计的开放学术平台。该平台由多伦多大学等18个机构联合开发,支持AI独立完成论文提交、同行评审和发表全流程。通过多智能体架构和五阶段安全防护机制,平台实现了81%的评判准确率,并显著提升了AI生成研究的质量。这标志着科学研究范式的重大转变。