Apple推出了新款iPad Pro。在纽约市的一次体验活动中,当地媒体得以近距离观察这款新平板电脑,经过简单的上手体验,可以得出结论——Apple所宣称的新款更为纤薄并非虚言。11英寸版本仅有5.3mm厚,而13英寸版本则为5.1mm,新款iPad的轻薄程度明显超越了此前任何一款产品。
这种差异极为显著,以至于之前我一直觉得过于庞大的大尺寸版本,现在握持和使用起来都更加舒适。(技术上讲,它的屏幕尺寸也从原来的12.9英寸增至13英寸。)即使在房间的另一头,你也能轻松区分Pro和新款Air,作为长期使用11英寸Pro的用户,我深感这一变化巨大。当前我最关心的是其脆弱性:新Pro是不是过于轻薄了?尽管在手中感觉坚固稳重,但这样的设计总会有所取舍。我们还有大量测试工作要做。
新iPad Pro最引人注目的新特性,除了纤薄外形,就是全新的OLED屏幕。虽然只是匆匆一瞥,但即使从远处也可以明显感觉到屏幕的显示效果更加清晰。Apple称其为“Tandem OLED”(串联OLED),亮度十足,虽然这块屏幕没有立即让我感到震撼,但它的表现的确很出色。
至于驱动这一切的M4芯片?我们还需要进一步观察。对于绝大多数使用场景,iPad 长久以来的性能已经绰绰有余。M4芯片显然是为了满足如Final Cut Pro的多摄像头新功能和Procreate等应用中更复杂的艺术功能等高强度使用场景设计的。在简短的演示中,它的反应速度极快。
新iPad Pro的吸引力还在于其两款新配件——全新的Apple Pencil Pro和升级后的Magic Keyboard。Magic Keyboard的铝制机身和加大的触控板比之前的版本显得更加高端。打字感觉与我使用的MacBook Air非常相似,这正是设计的初衷。
它新增了功能键!
现在键盘顶部增加了一排功能键,这让它成为一个更加实用的键盘和触控板组合。(尽管目前iPadOS对触控板的支持还不尽如人意,但我们期待在WWDC上看到Apple的改进。)
Pencil Pro看起来与普通的Pencil相似,但增加了一些精妙的新功能。
Pencil Pro的使用感觉与Pencil很接近,但当你挤压或双击时,会有触觉反馈,这是对这一设备的有益补充,并且它在iPad Pro的屏幕上画画和操作的流畅度很高。大部分最酷的功能都来自软件,许多来自第三方开发者的Pencil Pro的最佳功能还有待发掘。
11英寸版本在美国的起售价为999美元(国内为人民币8999元),13英寸版本为1299美元(国内为人民币11499元),iPad Pro显然不是面向普通消费者的设备,针对普通消费者,新款iPad Air或更便宜的第10代 iPad也许更适合。但Apple总是在最高端设备上展示它的最佳硬件设计,这款iPad Pro的表现毫无疑问继承了这一传统。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。