从蒸汽动力到电能驱动,再到如今的计算机与互联网,每一轮技术进步都会给劳动力市场带来颠覆与冲击,在毁灭众多岗位的同时再创造更多岗位。如今的“人工智能”仍然名不副实,即使是最强大的计算机系统其实也没有真正的认知能力。但这项技术的应用已经迎来新拐点,即将给艺术家和知识工作者一点小小的AI震撼。
具体来讲,由海量文本训练而成的大语言模型已经能让计算机生成与人类高度相似的书面语言,并将描述性短语转换为现实图像。在本次访谈中,我们邀请五位AI研究人员,讨论大语言模型可能给艺术家和知识工作者带来的影响。专家们也提醒不要盲目乐观,毕竟目前的AI技术远非完美,仍存在捏造信息和内容剽窃等各种问题。
赋予每个人创造力,同时消灭传统技能?
Lynne Parker, 田纳西大学助理副校长
大语言模型的意义,在于为每个人赋予丰富的创造力和知识。如今,任何互联网用户都能通过ChatGPT或DALL-E来表达自我,并通过AI生成的文本摘要来理解大量信息。
值得注意的是,大语言模型确实显示出了与人类相仿的专业知识积累深度。短短几分钟之内,它就能帮新手创建业务演示插图、生成营销宣传材料,帮助作者找到新的创作灵感,或者输出编程代码以执行特定功能。所有这一切,以往都需要由人类专家经过多年学习才能掌握。
这些新型AI工具当然无法直接“读心”,所以要求人类以文本提示这种更简单的形式描述需求,为模型指明工作方向。通过迭代提示(人类协作的一种示例),AI系统将生成连续输出,直到用户表示对结果感到满意。以数字艺术家为例,最近科罗拉多州博览会美术比赛的优胜者就使用了AI工具,用实际行动证明创造力并不一定要依附于画笔和颜料,而更多取决于发现美的眼睛。
虽然这种向所有人开放创造力与知识工具的时代值得向往,但这些AI工具也仍有种种不足。首先,如果不加控制,那么短短几年之后“写作”这一至关重要的人类技能可能消失。教育机构必须制定和执行关于大语言模型的使用政策,确保使用者在娱乐和学习之间找到理想的平衡点。
其次,这些AI工具的训练数据来源,也让知识产权保护问题再度面临考验。尽管人类创作者也经常从建筑、他人著作、乐曲和绘画中寻找灵感,但大语言模型无疑是在以前所未有的速度“吞噬”版权成果,并在消化之后转为自己的输出性能。当前已经有在诉案件讨论此事,最终判决结果可能对大语言模型的未来设计和使用造成影响。
但人类社会似乎并不在意,新型AI工具在诞生之后就快速受到公众的追捧。从聊天机器人ChatGPT到图像生成专家DALL-E Mini,各位新秀已经成为茶余饭后的热门谈资。这表明人类的创造力确实还有尚待开发的巨额存量,赋予每个人创造力和专业知识的前景也着实令人兴奋。
潜在的不准确性、偏见与剽窃行为
Daniel Acuña, 科罗拉多大学博尔德分校计算机科学副教授
我自己一直在用GitHub Copilot。GitHub Copilot是一款帮助人们编写计算机代码的工具,所以我在ChatGPT之类AI文本生成工具方面已经有很丰富的使用经验了。根据个人感受,我觉得这些工具特别擅长另辟蹊径、探索我之前从未考虑过的思路。
这些模型能够将指示转化成连续的文本或代码,这种能力给我留下了深刻印象。它们有助于改善我的思路,甚至用我压根没听说过的软件包创建解决方案。在看到这些工具的输出之后,我可以快速评估内容质量并快速编辑。总的来说,我认为它们确实提高了用户的创造力上限。
但要不要全面支持,我也有自己的疑虑。
首先就是它们的准确性还有问题,这方面影响可大可小。使用Copilot和ChatGPT时,我会觉得生成的答案往往太浅——比如文本言之无物,或者代码执行效率过低,甚至干脆给出错误的比喻或结论。如果用户没有能力对生成的内容做出评判,那么这些工具反而可能有害。
最近,Meta公司刚刚叫停了其用于生成科学文本的Galactica大语言模型,原因是它不仅捏造事实、而且表现得相当笃定。令人担忧的是,这种言之凿凿的虚假信息很可能污染互联网环境。
另一个问题是偏见。语言模型可能从数据中学习并继承偏见。这些偏见虽然不一定直接体现为生成文本,但在图像生成模型中却相当常见。ChatGPT创造者OpenAI的研究人员虽然对模型的响应结果持谨慎态度,但用户已经找到了不少绕开这些“护栏”的方法。
剽窃也是个大问题。最近有研究表明,图像生成工具经常会剽窃他人工作成果。ChatGPT也有类似的行为吗?暂时还不清楚,但从模型对训练数据的解释这个角度看,AI技术本身其实就是一种比较高级的剽窃形式。我们实验室中的工作表明,相较于振奋人心的生成性能,现有工具在检测文本剽窃方面的表现要远远落后。
没错,考虑到其巨大的发展潜力,目前的AI工具尚处于起步阶段。当下局限性也都有相应的解决方案可以参考。例如,我们可以基于知识库对AI工具生成的文本做事实性检查,使用更新的方法来检测/删除大语言模型中的偏见,并通过更复杂的剽窃检测工具规避这类问题。
尽管AI隐隐有“超越”人类之势,小众和“手工”岗位仍将继续存在
Kentaro Toyama, 密歇根大学社区信息教授
人类总是坚信自己有某种特殊性,但科学反复证明这种观念是错的。我们曾经以为只有人类会使用工具,只有人类会结成团队或传播观念,但科学表明其他动物也有类似的行为。
与此同时,那些宣称执行认知任务离不开人脑的技术也已一一溃败。首个加法器诞生于1623年。过去一年来,计算机生成的作品已经赢下艺术比赛。我坚信,计算机趋近并超越人类智能的奇点时刻即将到来。
那么,当机器比最聪明的人类更聪明、比最有创造力的人类更有创造力时,人类的智能和创造力还有意义吗?认知往往滞后于事实,所以在某些领域,即使计算机能做得更好,人们可能仍然更相信同类。自IBM的深蓝超级计算机击败国际象棋冠军卡斯帕罗夫以来已经25年了,但人类棋手并没有消失、仍在方寸之间对垒搏杀。
但在其他一些领域,坚持选择人类技能似乎既没必要、也缺乏成本效益。以插画为例,大多数情况下读者并不关心文章配图是人画的、还是计算机生成的,他们只希望保证图文相关,再加上新颖有趣。如果计算机也能完成这项工作,那读者不会管作者一栏写着Mary Chen还是X系统。插画家自己也许要抗议,但受众们不在乎。
当然,这不是个非黑即白的问题。很多领域将出现人与机器协同工作的新局面。以制造业为例,如今大部分生产制造活动都是由技术工人监督下的机器完成的,但手工制品仍有其市场、甚至愈发壮大。
如果历史教给过我们什么,那就是AI的进步必然会消灭众多工作岗位。到那个时候,掌握机器无法替代的人类创意能力的群体虽然总量将会减少,但其赚取的财富和获得的影响力都将提升。当然,如果大多数人都因AI冲击而失去体面的工作时,可能会酝酿出新的政治诉求以遏制不受控的财富比例失衡现象。
旧岗位依旧,新岗位在望
Mark Finlayson, 佛罗里达国际大学计算机科学副教授
大语言模型其实是种复杂精密的序列补全机器:给出一段单词序列(比如“我想吃……”),它可能续上缺失的部分(比如 “……苹果”)。经过训练的大语言模型接受过数万亿计单词的训练,因此其最终表现出的补全能力在翔实度、广泛性、灵活性和上下文映射度方面,远远超出了普通人甚至是AI研究者的预期。
与每一种强大的自动化新技术一样,这类主要立足通用领域的顺畅文本生成能力,必然会影响到在市场上靠这类技能吃饭的群体。在这方面,我们不妨回想1980年代初文字处理程序刚刚诞生时的情况。当时的打字员还是一类专门的职业,但现在几乎完全消失了。但从好的方面来说,打字技能的大众化意味着任何计算机用户都能轻松创建高质量文档,从而大大提高生产效率。
此外,以往无法想象的新型工作和技能也将随之诞生,正如当初被很多应届生写进简历的“熟练使用Office”。高端文档的处理岗位仍在,但对于业务水平和专业性的要求已经远远高于普罗大众。
我认为这种情况肯定会在大语言模型上重现:大家不用再靠其他人来起草连贯顺畅的通用文本。但另一方面,大语言模型也必将创造新的工作方式,带来我们从未经历过的生活。
从目前的表现来看,大语言模型主要有三个刮板:首先,提示的编写和设计往往高度依赖于人类智能;第二,大语言模型可能在不知不觉中,生成不当甚至荒谬的输出结果。
第三,AI研究人员发现大语言模型仍然不具备抽象能力,或者说对是非、对错的一般性理解能力。更简单讲,AI模型仍然不具备常识。值得注意的是,其甚至无法完成相对简单的数学计算。这意味着其输出往往会意外引发误导、偏见、逻辑缺陷或者纯粹的错误。
这些缺陷,也是创造性与知识工作者的机会。在创造大量内容的过程中,人们仍然需要由这些创造性及知识工作者们的判断,由他们提示、指导、整理、策划、编辑,特别是增强机器的输出结果。在可预见的未来,机器还不可能消化得了领域专业语言和高科技表达。此外,也必将出现新的岗位类型——比如通过微调大语言模型开展业务的专家,确保AI能够生成领域专用文本以服务于针对性场景。
总而言之,尽管大语言模型必然会给创造性和知识工作者带来冲击,但只要我们愿意适应并整合这些新工具提供的强大力量,未来的职业发展仍将一片光明。
技术飞跃创造新的劳动技能
Casey Greene, 科罗拉多大学安索斯校区医学院生物医学信息学教授
技术会改变工作的性质,知识性工作也不例外。过去二十年来,随着分子表征(例如快速、廉价的DNA测序技术)、应用程序、远程医疗和数据分析能力的快速提升,医学数字化浪潮已经席卷整个生物学和医学领域。
但不同技术对于人类社会的影响也各有区别。在当初万维网发展成熟的前夜,雅虎就曾打造出用于索引新内容的前沿技术。这种嵌入至网络链接模式内的信息算法能够对结果进行优先排序,从根本上改变了搜索业务的格局、甚至定义了人们当下收集信息的标准方式。
OpenAI ChatGPT的发布代表着另一个飞跃。ChatGPT将最先进的大语言模型包装成了高度可用的对话界面,可以说把AI成果的全面普及提前了十年。该工具已经能编写出基本可用的求职信,并帮助用户解决语言风格方面的各种问题。
正如随着谷歌的出现,在互联网上搜索信息成了每位职场人士必备的技能;从语言模型中获取最佳输出,特别是撰写高质量的AI生成提示,也许会成为接下来劳动力市场上最重要的新需求。
仍然以求职信为例,我们可以用多种方式编写生成提示。如果简单表示“给数据输入专家写封求职信”,那么输出结果往往较为宽泛;而如果能提供更具体的职位描述、简历和特定说明,同时强调“多关注细节”,那么ChatGPT的生成效果也会更好。
与历史上的众多技术进步一样,在人们能够广泛访问AI模型的新时代,我们与世界的交互方式将彻底改变。而接下来的问题,是人类能否把握住这个宝贵的机会——也许社会将空前公平,也许贫富差距将进一步加大。一切未来,就在我们手中。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。