-关注公众号「QA相对论」,获取「元宇宙」更多情报-
01
/XR交互技术/
扩展现实(XR)是创建元宇宙的核心技术之一,是指通过计算机将真实与虚拟相结合,打造一个人机交互的虚拟环境,是VR(虚拟现实)、AR(增强现实)、MR(混合现实)等多种技术的统称。在虚拟与现实相重叠的空间中,想要打造出 “沉浸式”的XR体验,需要通过高质量的视觉效果和空间音频技术。此外,为了让用户更自然地进入虚拟世界,轻巧的智能眼镜将取代笨重的头显装置,可穿戴设备也将取代智能手机。
02
/虚拟形象/
“虚拟形象”是用户在元宇宙里的化身,用户通过在线创建、装扮虚拟形象,可以更个性化地表达自我,与他人的交互体验也会更加深入,这给无数公司带来了启发。比如Burberry等时装公司创建了虚拟商店,销售供虚拟形象使用的服装。未来随着元宇宙进一步发展,用户对虚拟形象的需求会更加旺盛,这些虚拟形象越逼真,用户体验也会越沉浸,甚至可以通过混合现实技术代替线下旅行。
03
/动作追踪/
元宇宙的另一个特点是人机交互更直接、简单,无需像过去那样输入指令到计算机或智能手机中,用户可以通过语音、动作甚至眼神与设备交互。目前在扩展现实领域,已经有了相关探索,XR技术的开发者们需要建立更强大的动作追踪技术,确保准确捕捉用户的每个手势及动作。
04
/区块链与数字资产的兴起/
随着开放式、去中心化互联网时代的到来,人们越来越关注区块链在数据透明管理上的作用。而且,区块链的分布式网络能够支撑元宇宙经济系统的运行,创作者可以将自己的作品货币化,并由此获得合理的收益,比如通过出售NFT(非同质化代币)获益。很多专家认为,区块链将在构建安全公平的元宇宙系统中发挥重要作用。
05
/低代码平台与开发大众化/
元宇宙将我们推向了Web 3.0时代,在这里创作者、开发者拥有对线上内容的控制权,用户的数据所有权都掌握在自己手里。为了让更多人参与到元宇宙新格局的建设中,一个开放的环境愈发重要,因此,需要建立低代码、甚至是无代码应用平台。虽然现在市场对具备丰富编程知识的人仍有大量需求,但IT咨询公司Gartner预测约有五成大型企业将使用低代码平台构建基础设施。随着程序开发大众化,会有更多人为互联网的新时代、新形态贡献自己的力量。
-关注公众号「QA相对论」,获取宇宙翻译局更多情报-
好文章,需要你的鼓励
Captions公司研究团队开发的Mirage模型实现了从音频直接生成说话视频的突破。该技术能准确生成与声音匹配的面部表情、唇型同步、手势动作和环境背景,甚至可仅从音频推测说话者外貌特征。基于统一的Diffusion Transformer架构,Mirage避免了传统方法的复杂专用模块设计,展现出卓越的情感表达和细节还原能力,为内容创作、教育培训和无障碍技术等领域开辟了新的应用可能。
牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时准确率仅34.5%,甚至低于不使用AI的对照组。问题源于用户提供信息不完整、LLM理解偏差等人机交互问题。专家指出,仅凭非交互式基准测试评估LLM存在误导性,需要真实的人机交互测试才能准确评估AI系统的实际性能。
NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。