现在讨论以太坊区块链的合并影响还为时过早,但这至少初步解决了Web3过度消耗能源这个头号难题。当然,批评者们总能找到抨击以太坊的新理由,但在我看来,这次合并还有另一个重要意义:让我们有望将Web 2.0的优点同Web3的长处结合起来。
硅谷的内斗似乎越来越严重了。传统Web 2.0行业和蓬勃发展的Web3生态系统似乎水火不容,各家初创企业则带着自己的技术方案被夹在两大阵营之间。
我在这三个群体中都很活跃,而且总觉得其实各方之间并没有什么核心矛盾,问题主要是那帮无良媒体故意炒作出来的。例如,总有名人在宣传NFT项目,给人造成了Web3整体就是个庞氏骗局的印象。但NFT当然只是Web3生态系统中的一小部分,而且我觉得它甚至既不是最有趣的、也不是最有前途的部分。
虽然Web 2.0和Web3似乎并不兼容,但我觉得最好能将区块链和以太坊等技术理解成一种可行的、负责解决可扩展性问题的后端方案。同样的,Web3倡导者们也该意识到,Web 2.0拥有无与伦比的成熟度,想要将其彻底赶出各种核心用例也是根本不可能的。
尽管Web3拥有巨大潜力,但Web 2.0应用程序在开发方面还是容易得多,毕竟它已经拥有成熟的生态系统和庞大繁荣的开发者社区。
下面咱们就分别看看各方的优势所在:
Web3:一场新兴的开源革命
要了解当前Web3开发的具体进展,我们先得从Web 2.0时代说起。
在网站兴起那段时间,开源、Linux和Red Hat等热词引起了广泛关注。虽然很少有消费者会直接用Linux当作个人操作系统,但这股风潮至少已经刮了起来。而且在后端,几乎没人注意到Linux正迅速在上百万网络域的后端服务器上占据96.5%的比例,更不用说庞大的Android市场了。
但开源代码还面临着另一个关键挑战:如果不具备设置和运行这些成果的能力,它就发挥不了任何作用。必须承认,相当一部分代码的说明文档质量很差,而且缺少可以提供帮助的开发者社区。与之相对,Web3开发者社区以非常实用的方式为传统开源带来一种更动态、更透明的运营思路。
Web3相当于提供了一台统一、庞大且可公开访问的计算机,也就是以太坊,它能够实时运行代码。有了它,我们就不必从GitHub处下载他人的代码,再祈祷一切能顺利执行,现在代码可以直接运行在以太坊区块链上,世界上的其他开发者也能访问这些代码并集成到自己的应用程序当中。例如,应用程序开发者可能需要部署自己的开源库副本,但在以太坊上,这类开源库只需要部署一次,就能供其他开发者重复使用。
整个开发者生态在迅速发展,尽管大多数科技媒体更愿意关注不断萎缩的NFT市场,但自2020年以来,Solc和Hardhat(用于编写和部署以太坊智能合约的关键开发工具)的下载数量已经增长10倍,目前的单周总下载量在50万次左右。
Web 2.0:成熟生态系统的力量
尽管Web3的潜力巨大,但Web 2.0应用程序的开发难度还是要低得多,原因自然是其背后的生态系统更为成熟,也拥有庞大且蓬勃发展的开发者社区。换句话说,其各类开发者工具都是最领先的,可供选择的网络托管、数据库、视频转码、用户开发教程等各类资源也应有尽有。
最重要的是,大部分流行的Web 2.0服务都提供一个免费层。初创企业可以用它以极低、甚至是零成本的方式启动自己的应用程序,而且在用户规模达到一定水平之前保持这种低成本。
最后,作为一个成熟的生态系统,Web 2.0还提供卓越的垂直整合体系。大家可以单凭Google服务也构建起整个应用程序,包括购买域名、托管网站、使用Google的编程语言(Dart、Go)、使用Google Web框架(Angular、Flutter等)、在Android上运行并将成果放在Google Play商店出售。大家甚至可以通过Google Fiber在联网Chromebook上编写代码。
Web3还需要低调一点,暂时低调点
虽然Web3技术正迅速发展,我们也值得对其抱有一定期待,但我个人认为,Web3永远不可能达到Web 2.0那样的垂直整合水平。
事实上,Web3厂商也根本没必要把2.0的路再重走一遍,这跟Web3的去中心化理念可谓背道而驰。另外,整合不是说干就能干的事情,需要整个生态都发展至足够的成熟度。
也就是说,大部分Web3开发者已经得到了相当强大的工具方案。五年之前,我们还没法高效编写智能合约,但Hardhat和ethers.js等工具的出现大大降低了开发门槛。相信未来还会出现更好的工具,比如最新的智能合约开发工具包Foundry。
而且这种发展向来是潜移默化的,Web 2.0时代也是如此。大多数技术培训人员是直到Web 2.0成为市场上的主导力量之后,才突然意识到原来AWS这样的云服务巨头并不是天上掉下来的。
规划合并后的新未来
重要的是,目前已经出现了一些早期的、颇有希望的Web 2.0与Web3合并的迹象。
Reddit最近就在开售定制版化身,其实质就是种NFT,只是没有把话讲明。Reddit CEO Steve Huffman解释道,“我们在努力回避跟加密货币有关的词汇,那只会让人们更难理解。”
但Reddit也绝对没有放弃自己的Web 2.0云服务器,他们其实是把Web3的思路植入到了2.0这个更大、更复杂的遗留系统当中,让用户能同时享受到两个时代的优势。
不知道未来Web 2.0与Web3平衡共存时会是怎样的情景,但我希望能在这个方向上看到更多探索。也许Web3会用实践证明,它才是更适合支撑后端的技术解决方案。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。