作者/Andreas Lifvendahl, Imint首席执行官
Andreas Lifvendahl, Imint首席执行官
从配备普通摄像头的翻盖手机到先进的多摄智能手机,我们见证了手机拍摄系统的颠覆性变化。与几年前相比,如今的运动相机硬件与基于软件的强大算法相结合,在提高视频质量和性能方面发挥着关键作用。
随着5G和人工智能技术日趋成熟,视频在社会中的应用方式和其稳定性的发展也逐渐迈入全新的阶段,因此,视频防抖的重要性日益突显。
值得注意的是,2022年冬奥会将在中国北京举办,这不仅将大力推动滑雪、滑冰等冰雪运动行业的发展,还将进一步推动运动相机市场需求的快速增长,包括智能手机、无人机、随身相机、智能眼镜等。
与此同时,随着中国步入“视频社会化”的新时代,短视频、直播、VLOG等影像创作需求迎来高峰。视频被赋予的社交属性、人们不断增强的拍摄意愿以及户外拍摄的普及,种种因素推动着视频创作进入一个更加多元、高质、专业的时代,这对运动相机拍摄视频的稳定性提出了更高的要求。
为了尽可能给用户提供最优质的视频体验,所有类型的运动相机在移动时都极大程度地依赖于视频防抖技术。与静态拍摄时的相机相反,当相机处于移动状态时,相机的不稳定将导致视频输出时出现抖动。而相机移动得越快、越频繁,视频防抖就越重要。因此,先进的视频防抖技术必将推动和引领移动影像行业的技术创新和发展趋势。
视频防抖是创新视频增强技术的基础
诚然,除了视频防抖技术,拍摄高质量的视频仍需要其他功能的辅助。然而,在运动相机中,如果没有强有效的视频防抖技术作为基础,其他视频增强功能(例如自动变焦和运动跟踪、视场和失真校正以及运动模糊削弱等)都将或多或少地失去其应有的作用。只有在运动相机中得到有效的稳定性,实现这些额外的视频增强功能才有机会成为可能。我们也将迎来更多的视频增强功能和增值功能,AI、AR和VR的广泛应用必将革新运动相机的用途和使用方式。
相反地,有了基于软件的视频防抖算法作为可靠的基础,这些全新功能将更加有效并且更容易实现。
未来运动相机的视频防抖新要求
在过去几年里,全社会的视频消费大幅增加,从2018年每天花费1.5小时增加到2021年的每天花费2.5小时。在新冠肺炎疫情期间,视频会议的使用呈指数级增长,这进一步推动了视频消费趋势的发展。鉴于5G带来了更快速的视频共享和更高质量的视频流,视频消费将会继续保持上升态势。
为了充分利用5G技术,例如飞行中在智能手机上共享高清视频或从无人机上获取数据流,视频压缩技术需要进一步完善和更新。而视频在智能手机等非专业视频拍摄设备上使用时间的延长也将对设备的电池和散热性能提出全新要求。
因此,未来的视频防抖平台将朝定制化和最优化方向发展,根据使用情况优先考虑压缩、带宽、高清晰度视频、电源管理、噪音管理等其他因素。
重新定义视频防抖技术
为了支持全新的运动相机和视频增强算法,进行更加灵活的优化,我们需要重新定义视频防抖技术。从智能手机OEM、无人机制造商到视频防抖测试机构,视频防抖技术与行业中的每一个人息息相关,这不仅关系到视频防抖软件的设计开发和视频防抖性的测试,还关系到客户的期望与实际体验。
Vidhance视频防抖功能可以平滑地跟随、检测和跟踪移动的拍摄对象,在缩放和平移时同样有效。它能帮助用户记录滑雪、滑冰、冲浪、骑行或其他运动的过程。涉及到运动中各种形势的拍摄,Vidhance始终确保画面清晰稳定,呈现更加优质的拍摄效果。Imint运用其世界领先的算法,在视频防抖的基础上开发出更多的附加功能,例如运动光学防抖,4K@60fps超高清视频拍摄,更高的帧速率(>30fps)和前置摄像头稳定。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。