长久以来,智能电视端的输入体验都很糟糕。那些又长又乱的屏幕键盘不仅使用起来很麻烦,对于想要立足电视端开发软件的企业来说也是问题多多。
在CES 2025大会上,我们迎来了一种更好的解决方案。这家名叫Direction9的公司已经投入了约一年的研究时间,而依托的就是大家都很熟悉的经典打字方式:九键布局,即俗称的“九宫格”。九键设计当初之所以诞生,是为了匹配手机上仅有的九个数字键。智能电视也一样,遥控器只有包括方向键在内的少数按键,因此大多数机顶盒和电视都缺少良好的打字体验。
Direction9系统的工作原理如下:将所有字母都排列在一个3 x 3的数字网格当中,每个数字对应多个字母,与九键布局一样。在打开键盘后,光标默认位于中央,用户可以单击要查找的字母。每次单击中间按键选择字母时,光标都会再次跳回中心,也就是说用户永远只需一、两次单击即可找到要查找的字母。
用户也可以使用键盘上的“智能”模式,它会尝试预测你要查找的单词。单击“abc”按键、再单击“def”按键,之后再单击“def”按键,它就会猜到您想要输入的可能是“bed”。当然,大家也可以关闭联想模式并手动输入更多内容:在单击“abc”按键之后,系统会弹出一个新阵列,让用户在字母中做出进一步选择。
当然,回车键、空格键和退格键等其他辅助按键也不能少,它们会排列在网格的两侧。Direction9的设计思路是,用户不必按下回车才能选定,而是用方向键按往回车键后就会自动将其触发。
Direction9公司CEO Leon Chang实际在去年的CES大会上展示了这款键盘的早期版本。他表示,Direction9公司目前正与各潜在合作伙伴洽谈,希望将其引入更多流媒体应用与智能电视。但现阶段,整套方案仍然只处于运行演示阶段。
虽然使用过程听起来有点复杂,但用户们在Direction9的展位上一般花个几十秒就能掌握。Chang表示,这款软件的一大吸引力在于,熟悉之后甚至无需盯着遥控器即可实现盲打,而且熟悉的过程一般举超过两分钟。虽然智能联想软件似乎无法给出“Shogun”等比较复杂的词汇,但总体而言它基本能够理解我想表达什么。系统本身肯定还称不上完美,而且学习曲线也比盯着屏幕上的字母行要陡峭一点,但这确实给我带来了在电视上最快的输入体验。相信Direction9未来会被更多人认可并接受。
好文章,需要你的鼓励
英伟达宣布推出Alpamayo-R1开源推理视觉语言模型,专为自动驾驶研究设计,这是首个专注于自动驾驶的视觉语言行动模型。该模型基于英伟达Cosmos Reason模型构建,能够处理文本和图像,让车辆"看见"周围环境并做出决策。英伟达还发布了Cosmos Cookbook开发指南,帮助开发者训练和使用模型。这些技术对实现L4级自动驾驶至关重要。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
波兰AI语音公司ElevenLabs由两位30岁创始人Staniszewski和Dabkowski创立,其AI语音技术能够生成极其逼真的人声。公司在四年内从零发展到估值66亿美元,两位创始人均成为亿万富翁。该公司年收入1.93亿美元,净利润1.16亿美元,服务客户包括思科、Epic Games等知名企业。尽管面临深度伪造等技术滥用风险,ElevenLabs仍在与谷歌、微软等科技巨头竞争AI语音市场主导地位。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。