[编者按]:《元宇宙十万个为什么》是至顶网策划的一档特别栏目,我们希望做元宇宙时代的观察者、记录者、推动者。本篇为该系列第五问,并同步更新在「QA相对论」微信公众号中,敬请关注。
元宇宙的“入口”并不在少,如果非要选个“第一”,游戏或许是比较合适的。
首先,游戏具有强烈的“两栖”体验需求。在前文中我们提到,“两栖”性是具有横跨于现实世界和虚拟空间的需求。在很多游戏中,玩家在游戏世界都会有一个或多个化身。目前的游戏,玩家的视线从游戏画面移开就算离开了游戏世界;而未来,元宇宙游戏将提供全面的感知,包括视觉,也包括触觉、嗅觉等等。
其次,由于游戏本身就要丰富的场景设定,进入元宇宙,就是沉浸式进入这些场景,所以游戏可以说是元宇宙最直观的体现。
并且,在很多影视文学作品中已经出现过很多的虚拟游戏,比如《头号玩家》中的“绿洲”,以及《三体》中的同名体感游戏。
理解元宇宙,先从了解元宇宙游戏开始。
不仅如此,目前市面上已经有不少体感游戏,健身的、热舞的、生活的等等;当然,还有专门的体感游戏机,比如Xbox、Switch、Play Station。它们共同构成了元宇宙游戏的雏形,也是我们最早体验元宇宙的“入口”。
关注公众号「QA相对论」,获取「元宇宙十万个为什么」。
好文章,需要你的鼓励
亚利桑那州立大学的研究团队开发了RefEdit,这是一种新型图像编辑AI系统,能够准确理解和处理指代表达(如"中间那个人"、"右边的猫")。通过创建RefEdit-Bench基准测试,研究者们证明现有模型在多物体场景中表现不佳。他们设计了一种创新的数据生成流程,仅用2万样本就训练出的RefEdit模型超越了使用数百万样本训练的大型模型。这一突破使AI图像编辑在复杂场景中更加精确和实用。
这项研究提出了Critique-GRPO,一种创新的在线强化学习框架,将自然语言批评与数字反馈相结合,克服了传统仅用数字反馈的三大局限:性能瓶颈、自我反思效果有限和顽固性失败。实验表明,该方法使大语言模型能够从错误中学习并改进,在八项数学和通用推理任务中,将Qwen2.5-7B和Qwen3-8B模型的平均通过率分别提高了约4.5%和5%,超越了包括那些引入专家示范的方法。研究还揭示,高熵探索和长回答并不总是最有效的学习方式,质量更重要。这一方法为大语言模型的自我提升能力开辟了新路径。
这篇研究介绍了"量化LLM评价者",一个创新框架,能使大型语言模型(LLM)在评估其他AI输出时更接近人类判断。由麻省理工和Adobe联合研发的这一方法,将评估过程分为两个阶段:先让LLM生成文本评价,再用轻量级机器学习模型将这些评价转化为更准确的数值评分。研究提出了四种评价者模型,适用于不同评估场景,实验表明它们不仅能显著提高评分准确性,还比传统微调方法更节省计算资源。这一框架特别适合人类反馈有限的场景,为AI评估领域开辟了高效且可解释的新路径。
这项研究由IDEA、华南理工大学和北京大学联合开发的Rex-Thinker系统,通过模仿人类的链式思考方式来解决物体指代问题。与传统直接输出边界框的方法不同,它采用规划-行动-总结的三步骤推理,使AI能像人类一样逐步分析图像中的候选物体,并在找不到匹配物体时拒绝作答。通过构建90,824样本的HumanRef-CoT数据集和两阶段训练方法,系统在精度、可解释性和泛化能力上均取得了显著进步。