长久以来,智能电视端的输入体验都很糟糕。那些又长又乱的屏幕键盘不仅使用起来很麻烦,对于想要立足电视端开发软件的企业来说也是问题多多。
在CES 2025大会上,我们迎来了一种更好的解决方案。这家名叫Direction9的公司已经投入了约一年的研究时间,而依托的就是大家都很熟悉的经典打字方式:九键布局,即俗称的“九宫格”。九键设计当初之所以诞生,是为了匹配手机上仅有的九个数字键。智能电视也一样,遥控器只有包括方向键在内的少数按键,因此大多数机顶盒和电视都缺少良好的打字体验。
Direction9系统的工作原理如下:将所有字母都排列在一个3 x 3的数字网格当中,每个数字对应多个字母,与九键布局一样。在打开键盘后,光标默认位于中央,用户可以单击要查找的字母。每次单击中间按键选择字母时,光标都会再次跳回中心,也就是说用户永远只需一、两次单击即可找到要查找的字母。
用户也可以使用键盘上的“智能”模式,它会尝试预测你要查找的单词。单击“abc”按键、再单击“def”按键,之后再单击“def”按键,它就会猜到您想要输入的可能是“bed”。当然,大家也可以关闭联想模式并手动输入更多内容:在单击“abc”按键之后,系统会弹出一个新阵列,让用户在字母中做出进一步选择。
当然,回车键、空格键和退格键等其他辅助按键也不能少,它们会排列在网格的两侧。Direction9的设计思路是,用户不必按下回车才能选定,而是用方向键按往回车键后就会自动将其触发。
Direction9公司CEO Leon Chang实际在去年的CES大会上展示了这款键盘的早期版本。他表示,Direction9公司目前正与各潜在合作伙伴洽谈,希望将其引入更多流媒体应用与智能电视。但现阶段,整套方案仍然只处于运行演示阶段。
虽然使用过程听起来有点复杂,但用户们在Direction9的展位上一般花个几十秒就能掌握。Chang表示,这款软件的一大吸引力在于,熟悉之后甚至无需盯着遥控器即可实现盲打,而且熟悉的过程一般举超过两分钟。虽然智能联想软件似乎无法给出“Shogun”等比较复杂的词汇,但总体而言它基本能够理解我想表达什么。系统本身肯定还称不上完美,而且学习曲线也比盯着屏幕上的字母行要陡峭一点,但这确实给我带来了在电视上最快的输入体验。相信Direction9未来会被更多人认可并接受。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。