AI时代，关于人工智能你需要知道的一切

机器会不会就此爆发，迅速脱离人类的掌控？

AI似乎正渗透至现代生活中的每个角落，从音乐到媒体，再到商业/生产力乃至私人约会。要想在这个快速发展的时代跟上节奏，每个人都有必要留点时间认真了解关于人工智能的一切。

人工智能，也称机器学习，是一种开创于几十年前、基于神经网络的软件系统。随着近来新型算力的迅猛发展，AI终于获得了高效可靠的语音和图像识别能力，甚至掌握了生成图像和语音的诀窍。研究人员如今正努力借AI之手，帮助用户轻松总结网页内容、订购商品、调整食谱。

那机器会不会就此爆发，迅速脱离人类的掌控？！先别急，后文会认真讨论这个问题。相比之下，我们更希望读过本文，大家都能把握当前AI的发展动向。

AI基础知识

关于AI最有趣的事实在于：尽管其核心概念早在50多年前就已经诞生，但直到现在也没有多少技术专家真正熟悉个中原理。因此如果大家感到迷茫，请不必担心——其他人也差不多。

这里我们要先强调一点：虽然名叫“人工智能”，但这个词本身其实并不准确。智能还没有统一定义，而且AI系统的行为更接近计算机、而非人类大脑。只是这个计算机的输入和输出更加灵活，能在一定程度上模仿智能的表现。
下面来看看AI讨论中经常用到的基本术语。

神经网络（Neural network）

人类大脑主要由名为“神经元”的相互连接的细胞组成，它们相互啮合，形成可执行任务并存储信息的复杂网络。自1960年代以来，人们一直希望在软件当中重建这套惊人的认知系统，但直到最近的15到20年，GPU的发展成熟才让数字定义的神经网络迎来蓬勃发展，可谓是算力出奇迹的典型案例。

从本质上讲，神经网络就是大量点和线的组合：点代表数据，线则是各数值间的统计关系。

如同人脑一样，这一基本原理能够建立起多功能系统：快速接收输入，再通过网络传递并生成输出。这样一套系统，被称为“模型”。

模型（Model）

模型是指能接收输入并返回输出的具体代码的集合。之所以选择“模型”这个词，是想体现与统计模型、或者能模拟复杂自然过程的建模系统之间的相似性。在AI领域，模型可以指代ChatGPT这类完整系统，也可以是几乎一切AI或机器学习结构，目的和功能不限。模型的体量各有不同，其规模代表着占用的存储空间和运行起来需要消耗何等程度的算力。而实际体量，则由模型的训练方式所决定。

训练（Training）

要创建AI模型，先要向构成系统基础的神经网络“投喂”数据集或语料库所承载的大量信息。在此过程中，庞大的网络会创建起该数据的统计表征。训练过程也是计算密度最高的环节，往往需要在大规模高性能计算机上运行几周甚至几个月时间。这不仅是因为网络本身非常复杂，也是因为数据集规模往往极为庞大：须分析数十亿个单词或图像，并在巨大的统计模型中得到表征。但在模型完成训练之后，研究人员可以想办法对其“瘦身”，运行时的资源要求也更低——这就是所谓推理过程。

推理（Inference）

推理，就是模型实际发挥作用的过程：领先对现有证据进行推理以得出结论。当然，这跟我们人类的“推理”不同，AI模型是在统计学意义上将摄取到的各个数据点联系起来，据此预测出下一个点的位置。例如，假定要求其“补全以下序列：红色、橙色、黄色……”它就会意识到这些词跟所摄取的某一列表相匹配，也就是彩虹的颜色分布，再由此推理并补全列表中的其余部分。推理消耗的计算成本通常比训练低得多：毕竟查询目录也要比整理目录简单得多。虽然某些大模型还是得靠超级计算机加GPU才能执行推理，但也有不少小模已经能运行在智能手机甚至配置更低的设备之上。

生成式AI（Generative AI）

今时今日，人人都在讨论生成式AI。这是个广义术语，指那些能够生成原始输出（如图像和文本）的AI模型。某些模型能做总结，有些能做整理，有些能做识别——但至少目前最炙手可热的选手，还是那些能“凭空”生成新内容的AI模型（究竟是不是真的凭空，目前还存在争议）。但请千万记住，AI生成的结果可并不一定就是正确的，甚至根本是在胡说八道！一切完全可能是神经网络的胡思乱想，包括那些绘声绘色的故事或者栩栩如生的画作。

AI热门词汇

讲罢基础知识，咱们再来看看2023年比较热门的AI词汇。

大语言模型（Large language model, LLM）

大语言模型已经成为当前最具影响力、用途最广泛的AI形式，几乎所有构成网络的文本和英语文学素材都被纳入训练范畴。由此训练出的，就是一套体量巨大的基础模型。大语言模型能够以自然语言交谈并回答问题，模仿各种风格的类型的书面文件，ChatGPT、Claude和LLaMa等成果都已经证明了其强大能力。尽管这些模型的表现令人印象深刻，但请注意其本质上仍属于模式识别引擎——在回答问题时，它实际是在补全识别出的模式，却无法判断该模式是否与事实相符。LLM在回答问题时经常产生“幻觉”，后文将进一步扩展延伸。

基础模型（Foundation model）

在巨大的数据集之上从零开始训练巨型模型，无疑是个昂贵且复杂的过程，当然应该能免则免。基础模型属于从零开始训练出的大模型，需要超级计算机才能承载得起；但我们通常可以减少其中的参数量，以精简方式使其适应更小的承载。所谓参数，也就是我们前文提到的模型中待处理的“点”的数量，目前常见的大语言模型往往拥有百万、十亿甚至是万亿级参数。

微调（Fine tuning）

GPT-4这类基础模型非常聪明，但在设计上只能算是“通才”。从文学名著到奇幻故事，它都有所涉猎。可如果想让它帮助整理一封求职信用的简历，其表现甚至还不如普通中学生。好在我们可以使用专门的数据集对模型做点额外训练，这个过程就是模型微调。比如我们可以从网上搜集几千份求职申请，在“投喂”之后模型终于理解了简历的套路所在，同时又不影响它在原始训练数据中掌握的其他知识。

另外还有人类反馈强化学习（RLHF），这是一种特殊的微调方法，通过人类与LLM的交互数据来提高模型的沟通技巧。

扩散（Diffusion）

图像生成可以通过多种方式实现，但迄今为止最成功的办法还是“扩散”技术。Stable Diffusion、Midjourney等流行的生成式AI核心成果都是据此发展而来。在通过展示图像来训练扩散模型时，这些图像会在添加数字噪声的过程中逐渐退化，直至原始图像荡然无存。通过观察整个过程，扩散模型能学会如何反向执行整个过程，逐渐向纯噪声中添加细节以构成预定义的任意图像。其实在图像生成领域我们已经探索出了更新、更好的实现方法，但扩散技术仍然比较可靠且相对容易理解，所以相信还会有不小的应用空间。

幻觉（Hallucination）

最初的“幻觉”概念，是指模型在输出中夹杂着与输入完全无关内容的情况。例如因为训练素材中包含大量狗的元素，所以模型偶尔会用狗作为纹理贴到建筑物上。根据猜测，如今AI所产生的幻觉主要源自训练集中缺乏足够数据、或者数据内容间相互冲突，于是它只能编造出一些似是而非的结论。

“幻觉”的存在有好处也有弊端：利用幻觉可以引导AI生成原创或更加多样的衍生艺术成果。但如果需要就事实获取明确的答案，幻觉肯定是个大麻烦——模型会一本正经地胡说八道，让不熟悉实情的用户误信为真。目前除了手动检查之外，还没有什么简单方法来判断AI输出是真是假，毕竟模型本身根本就没有“真假”的概念，只是在努力补全自己识别出的“疑似”模式。

通用人工智能（Artificial General Intelligence, AGI）

通用人工智能，又称强人工智能（Strong AI），其实并没有明确的概念定义。用最简单的话语来解释，这是一种足够强大的智能，不仅能够替人类完成很多工作，甚至能像人类一样自我学习和改进。有人担心这种学习、整合思维，然后加快学习和成长速度的循环将恒久持续，最终造就一套无法约束或控制的超级智能系统。甚至有人认为应该叫停相关研究，暂缓或阻止这种可怕的未来。

看过《黑客帝国》或者《终结者》电影的朋友肯定能理解其中的担忧，毕竟AI失控并试图消灭或奴役人类的可能性确实令人不寒而栗。但这些故事纯属编剧想象，跟现实并没什么关系。ChatGPT等成果虽然能给人留下深刻印象，但在抽象推理和动态多领域活动方面与“真正的智能”几乎没有半毛钱关系。我们尚无法断言AI未来会如何发展，但暂时不妨将AGI理解成星际旅行——人人都能把握其概念并朝着这个方向努力，可目标本身仍然遥不可及。其间需要巨大的资源投入和基础科学的飞跃式进步，绝非一夜之间便可成真。

评论人士也在反复强调，“杞人忧天”式的探讨缺乏现实意义。毕竟AI如今表现出的真正威胁，反而源自其局限性和“智障”表现。虽然没人想让天网成真，但如果不能在AI初期解决好自动化消灭工作岗位的现实问题，我们哪还有机会被T-1000满街追杀？

AI主要玩家

OpenAI

要说如今的AI领域最赫赫有名的“门派”，无疑是以OpenAI为首。顾名思义，OpenAI强调把自己的研究成果对外分享。但在有所斩获之后，OpenAI决意重组为一家更传统的营利性公司，通过API和应用软件向用户开放ChatGPT等高级语言模型的访问服务。这家公司的掌门人是Sam Altman，尽管靠技术突破赚得盆满钵满，但他本人还是对AI可能引发的风险发出了警告。OpenAI是大语言模型领域的领导者，在其他方向上也有探索。

微软

微软其实也在AI研究方面做出过不少贡献，但因为种种原因没能真正将实验成果转化成现实产品。但其最明智的举动就是早期投资了OpenAI，并与后者建立起长期合作伙伴关系。微软目前已经在Bing搜索引擎上引入ChatGPT功能。尽管微软的AI贡献相对有限且难以直接使用，但其研发实力仍旧不容小觑。

谷歌

想靠“登月计划”引领AI技术革命的谷歌，不知何故没能摘取最后的胜利果实。但必须承认，谷歌研究人员的发明为如今AI的全面爆发奠定了基础，这就是tarnsformer。如今，谷歌正努力开发自己的大语言模型和其他智能体。在过去十年浪费大量时间和金钱推动AI助手无果之后，谷歌正在迎头赶上。公司CEO Sundar Pichai多次表示，公司将在搜索和生产力方面牢牢守住以AI为中心的发展理念。

Anthropic

在OpenAI“背叛”开源社区之后，Dario和Daniela Amodei兄妹毅然出走并创立了Anthropic，希望打造一个开放且更具道德责任感的AI研究组织。凭借充裕的资金，他们发展成为OpenAI的有力竞争对手，只是其Claude模型暂时还无法在人气和知名度上与GPT匹敌。

Stability

虽有巨大争议，但Stability仍在AI浪潮中拥有自己的一席之地。他们正收集互联网上的各种内容，并以开放硬件的方式免费提供其生成式AI模型。这既符合“信息应免费”的理念，也让项目本身蒙上了一层道德阴影。很多人认为Stability的成果被用于生成色情图像，及未经同意使用知识产权。

埃隆·马斯克

长期以来，马斯克经常直言不讳地表达自己对于AI失控的担忧。他曾在早期支持过OpenAI，但不满于该公司朝着自己不支持的方向发展。虽然马斯克并不算是AI技术专家，但他夸张的表达和评论确实引发了广泛反响（他本人还在“暂停AI研究”倡议书上签了字），而且正着手建立自己的AI研究机构。

来源：TechCrunch

0赞

好文章，需要你的鼓励

AI时代，关于人工智能你需要知道的一切

来源：TechCrunch

2023

06/16

10:35

分享

点赞

张凌赫同款AI眼镜震撼亮相：联想AI眼镜M1售价998元起，V1开启预售

联想发布天禧个人超级智能体3.5版本：AI看世界、AI翻译海量AI热门应用全面升级

当轻薄与智能融入日常，联想正在讲述新的终端故事

联想moto X70 Air正式发布：以极致轻薄重塑轻薄AI手机新体验

科世达、德华安顾人寿、宝洁和汇丰银行荣获2025红帽亚太创新奖

联想集团荣获拉姆·查兰管理实践奖 以AI原生组织“破局”开源降本提效

英伟达与诺基亚联手开创AI驱动6G通信平台

智能座舱的“理想”样本背后，为什么需要一朵AI云?

ChatGPT不是万能的：11个不应该依赖AI的重要领域

核能能否成为推动全球AI发展的能源伙伴？

Blue Energy计划建设燃气转核能数据中心电厂

AI公平性：如何让人工智能真正服务社区

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

联想集团荣获拉姆·查兰管理实践奖以AI原生组织“破局”开源降本提效