如今的智能手机真的安全无忧吗?答案恐怕要取决于我们对“安全”的具体定义,而且这个问题在企业环境往往更显复杂。大部分支持自带设备办公的企业,都会在员工的智能手机上安装应用程序或代理以发挥保护作用,同时借用Android和iOS等操作系统的内置管理功能。但这些与真正的安全无忧之间似乎还有一段距离。
这就是Cloudflare在本周宣传新服务时强调的价值主张。此次,该公司正式推出Zero Trust SIM卡与Zero Trust for Mobile Operators,两款产品分别针对智能手机用户、希望保护业务电话的公司以及销售数据服务的运营商。
让我们先从Zero Trust SIM说起。这款打着“零信任”旗号推出的SIM卡将可以保护由智能手机发出的所有数据包,而且在美国推出之后,它将通过现有移动设备管理平台在iOS和Android设备上作为eSIM使用。它能够锁定特定设备,降低换卡攻击风险,既支持独立配置使用,也能与Cloudflare的移动代理WARP协同配合。
在最近的邮件采访中,Cloudflare公司CEO John Graham-Cumming证明,Zero Trust SIM卡可以完成VPN和其他安全层实现不了的目标:单元级保护。他认为,SIM将作为新的安全因素与硬件安全密钥结合使用,由此基本消除员工被冒名顶替的可能性。
Graham-Cumming指出:“Zero Trust SIM卡能提供纵深防御。虽然VPN层也属于同类组件,但却仍需要在现有移动设备上部署蜂窝连接。而传统的‘AnyConnect式’VPN更是无法阻止攻击在侵入网络后的横向移动。我们已经看到,不少组织由于应用程序和网络保护不力而遭受入侵。从IT安全的角度出发,以往的固定保护思路也必须尽快转化为‘保护远程与分布式劳动力’这一新形式。”
Graham-Cumming还进一步解释称,Zero Trust SIM卡使Cloudflare能够重写DNS请求,让设备转而使用Cloudflare Gateway进行DNS过滤。他补充道,这种eSIM卡还支持在各主机与IP地址接入互联网之前,验证其与服务/其他设备之间的身份连接,借此作为身份验证流程的第二种因素。
虽然价格还未敲定,但Zero Trust SIM卡已经确定将在未来几个月内推出,并成为Cloudflare零信任平台的组成部分。目前该平台还是按照客户的座席数量定价。预计在Cloudflare推出物理SIM卡后,这项技术将能够顺畅兼容大部分设备。
Graham-Cumming指出,“我们的目标是先从美国市场起步,而后迅速将其打造成一项全球服务——运行全球网络,一直是我们工作中的核心部分。虽然我们尚处于早期开发阶段,但我们已经在工业物联网领域(例如车辆、支付终端、集装箱、自动售货机等)开展并行计划。Zero Trust SIM卡本身将成为一项基础技术,逐步解锁出更多新型用例。”
在物联网一边,Cloudflare此次发布了物联网设备平台的预览版本,名为IoT Platform,旨在为一组联网设备提供单一透明视图。Cloudflare的这款产品将与微软Azure、亚马逊云科技和Google Cloud的物联网管理服务直接竞争,负责实现物联网设备蜂窝连接与安全性的排序、配置与管理。
根据Cloudflare的介绍,物联网设备发出的每个数据包都将在抵达互联网、云端或其他设备之前,接受客户创建策略的检查、批准或拒绝。此外,设备还可以锁定至特定地理位置,以确保敏感流量绝不会暴露在公共渠道上。
Cloudflare表示,随着IoT Platform正式发布日的逐渐临近,未来几个月还将有更多消息放出。
Cloudflare对Zero Trust for Mobile Operators的着墨不多。Graham-Cumming表示,运营商合作伙伴能够借助Zero Trust for Mobile Operators订阅来自Cloudflare零信任平台的各种移动安全工具。感兴趣的运营商可以即刻注册以获取更多细节信息。
有人认为,从这个角度来看,Zero Trust for Mobile Operators和Zero Trust SIM卡很可能成为Cloudflare又一条利润丰厚的试点业务线,甚至有望超越该公司三年前以免费增值模式推出的WARP。根据Allied Market Research公布的数据,2020年全球移动安全市场总值约33亿美元,到2030年预计将增长至221亿美元。
考虑到物联网市场的稳健性,IoT Platform对Cloudflare公司自身也有着重要意义。一位消息人士透露,随着供应链挑战等不利因素的加剧,企业物联网支出在2021年内增长了22.4%,达到1580亿美元。虽然这部分市场上已经有不少头部厂商,但Cloudflare显然有信心凭借自己的技术实力掀起新的波澜。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。