Twitter尚未解释为什么上周末Twitterific和Tweetbot等第三方客户端会突然无法使用。但从一份最新报告外加一位应用开发者的测试结果来看,此次屏蔽绝对是故意的。
媒体拿到的Twitter内部Slack聊天记录显示,某高级软件工程师在“命令中心”频道上提到,“屏蔽第三方应用程序是有意为之。”根据The Information的报道,另一名员工在请求如何向产品合作伙伴解释中断问题时,有产品营销经理告诉他,Twitter已经有“开发聊天软件”的打算,但暂无确切交付日期。
部分Tweetbot用户似乎在上周日早晨暂时恢复了账户访问权限,但仍无法发帖,之后很快重新失去连接。原因是Tweetbot的联合创始人Paul Haddad换掉了该应用程序的API密钥,因此短暂恢复正常,但之后Twitter再次撤销了所有密钥权限。外媒The Verge提到,从结果来看“这绝对是故意的,我们和其他第三方应用都被Twitter狠狠针对了。”
Haddad写道,“如果Twitter那边能稍微跟我们沟通一下,我刚开始就不会换掉密钥。但事实证明,他们就是冲着我们来的,就是要压缩我们的生存空间。”
Twitter公司及其新东家马斯克都没有就第三方客户端连接失效发表任何评论。Twitter的状态页面本周一上午曾提到,所有系统均在运行,但只字未提最早从1月2号起就陆续出现的第三方客户端阻断问题。倒是用于监控Twitter参与度和主题跟踪的商用“企业”客户端似乎仍在正常运行,另外Twitterific for Mac等特定第三方客户端版本也未受影响。
长期以来,Twitter一直跟第三方客户端保持着某种微妙的距离。用户和小型团队可以借助这些客户端查看、跟踪和参与推文讨论。而在马斯克入驻之前,Twitter也曾要求各软件商不要开发这类客户端、限制其API,甚至取消了客户端的推送通知和自动刷新功能。
马斯克的到来伴随着一大波裁员,如今几乎没人能判断Twitter公司下一步要干什么、往哪里走。因此部分行业观察家和技术专家怀疑此次第三方API中断也可能单纯源自基础设施故障,Twitter只是未能快速完成修复。
但更靠谱的解释认为,问题的核心在于广告收入这块蛋糕的归属。马斯克曾在去年12月中旬翻译过Twitter大规模裁员的理由,称Twitter可能将出现“30亿美元的负现金流”。马斯克之所以收紧现金流,似乎是想早点填上收购Twitter所欠下的15亿美元债务,外加他接管以来Twitter遭遇的广告收入暴跌。事实上,Twitter公司已经多次因拖欠房租而被办公楼业主起诉。
最近,Twitter刚刚将iOS应用上的默认显示内容切换为基于算法的“猜你喜欢”(For You),用户每次打开应用都得手动切换才能转回之前的“你关注的”页面。而传统第三方客户端向来对用户的内容排序更宽容、提供更多控制权——而且值得注意的是,第三方客户端压根不显示Twitter的“推广”内容。面对广告销售额的急剧下降,Twitter公司最近推出了不少优惠幅度巨大的广告套餐。
我们暂时无法联络Twitter以获取置评,因为该公司的公关和传播部门已经被整体裁撤。1月16日美国东部时间的午夜刚过,马斯克又从容发出一条推文,暗示媒体早已被国家力量所渗透。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。