作为微软旗下的社交平台,LinkedIn的核心亮点一直是帮助那些希望出于专业及招聘目的的用户们找到建立人际网络、获取知识的最佳场所。也正是凭借这个核心定位,LinkedIn业务目前已拥有超10亿用户。如今,为了增加该平台对于用户的粘性——即人们在平台上花费的时间,该公司决定进军一大全新领域——游戏。
TechCrunch获悉并证实,LinkedIn正在开发新的游戏体验,希望通过轻松但又烧脑的解谜游戏达成这一用户粘性目标。其借鉴对象正是Wordle猜字游戏,事实证明这种简单的体验如病毒般传播并成功吸引到数百万玩家。LinkedIn选择的三款早期作品分别为《Queens》、《Inference》以及《Crossclimb》。
消息一出,众多应用研究人员立刻开始向LinkedIn的平台代码下手,想要剖析其中有哪些蛛丝马迹。一位名叫Nima Owji的研究者表示,LinkedIn似乎正在探索一种新方法,即按工作地点公布玩家得分排行榜,再根据这些分数对企业进行“排名”。
LinkedIn的一位发言人已证实该公司正在开发游戏产品,但强调尚未确定具体发布日期。
这位发言人向TechCrunch证实:“我们正尝试在LinkedIn体验中添加解谜类游戏以增添使用乐趣、加深关系并希望激发人们的社交热情。更多消息将稍后发布,敬请期待!”
这位发言人还补充称,研究人员在X上分享的截屏已经不是最新版本。
LinkedIn的母公司微软自己就是一家游戏巨头。其游戏业务包括Xbox、动视暴雪和ZeniMax,上季度收入达71亿美元,首次超过了Windows业务收入。
但LinkedIn公司发言人拒绝透露微软是否以及将如何参与LinkedIn的游戏项目。
无论是从收入还是用户参与度角度来看,游戏通常都是手机和PC平台上最受欢迎的应用软件之一,而基于解谜的休闲游戏一直是该领域最受移动用户青睐的类别。非游戏平台长期以来一直在利用这类产品为自己吸引流量——大家应该还记得当初报纸和杂志上随处可见的填字游戏或者有奖猜谜,可以说这种趋势早在互联网诞生之前就已经存在。
《纽约时报》于2022年收购了热门游戏Wordle,并在去年年底表示仍有数百万用户在持续享受这款游戏。该游戏现已成为《纽约时报》整体在线解谜与游戏平台的重要组成部分。
但其他着力投入游戏业务的企业却不一定能够收到预期中的效果。作为全球规模最大的社交网络,Facebook多年来一直是社交游戏业务的主要推动者。但在2022年,由于使用量下降,该公司决定关闭独立游戏应用;如今,他们开始将主要精力放在混合现实体验与Meta Quest业务身上。
多年以来,LinkedIn也曾尝试过多种不同新功能,希望提高人们对该平台的粘性和参与度。所以对当前游戏策略的最佳总结,也许是“我们该如何利用人们最喜爱的流行工具,并将其与LinkedIn主体受众关联起来,从而在不分散职场这一焦点的前提下提高平台人气?”
之前的举措已经包括在线教育与职业培养、出版与新闻运营、引入更多视频工具以及招揽创作者与意见领袖等,这次引入游戏业务无疑是对LinkedIn整体战略的最新探索与合理延续。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。