像 ChatGPT 这样强大的天生式人工智能系统是如何事情的,它们与其他类型的人工智能有何不同?

麻省理工学院专家解读生成式人工智能和ChatGPT现象_人工智能_模子 文字写作

快速浏览一下***,就会创造天生式人工智能如今彷佛无处不在。
事实上,有些***可能真的是由天生式人工智能撰写的,比如 OpenAI 的 ChatGPT,它是一个谈天机器人,展示了一种不可思议的能力,可以天生看似由人类撰写的文本。

但是,当人们说\公众天生式人工智能\公众时,到底是什么意思呢?

在过去几年的天生式人工智能热潮之前,人们在评论辩论人工智能时,常日是在评论辩论机器学习模型,这些模型可以学会根据数据进行预测。
例如,这种模型通过数百万个实例的演习,可以预测某张 X 光片是否显示出肿瘤迹象,或者某个借款人是否有可能拖欠贷款。

人们说\"大众天生式人工智能\"大众是什么意思?为什么这些系统彷佛正在进入险些所有可以想象到的运用领域?麻省理工学院的人工智能专家将为您解析这项日益盛行、无处不在的技能的来龙去脉。
资料来源:Jose-Luis Olivares,麻省理工学院

天生式人工智能(Generative AI)可以被认为是一种机器学习模型,它被演习来创建新数据,而不是对特天命据集进行预测。
天生式人工智能系统可以学习天生更多与演习数据相似的工具。

\"大众说到天生式人工智能和其他类型人工智能的实际根本机器,它们之间的差异可能有点模糊。
\"大众麻省理工学院电子工程与打算机科学副教授、打算机科学与人工智能实验室(CSAIL)成员菲利普-伊索拉(Phillip Isola)说:\"大众很多时候,同样的算法可以用于这两种人工智能。
\"大众

历史背景与模型繁芜性

只管 ChatGPT 及其同类产品的发布引起了热议,但技能本身并不是全新的观点。
这些强大的机器学习模型借鉴了 50 多年前的研究和打算进展。

天生式人工智能的早期范例是一种被称为马尔科夫链的大略得多的模型。
该技能以俄罗斯数学家安德烈-马尔科夫(Andrey Markov)的名字命名,他于 1906 年引入了这种统计方法来仿照随机过程的行为。
在机器学习中,马尔可夫模型长期以来一贯被用于下一个单词的预测任务,如电子邮件程序中的自动完成功能。

在文本预测中,马尔科夫模型通过查看前一个词或前几个词来天生句子中的下一个词。
麻省理工学院电气工程与打算机科学托马斯-西贝尔(Thomas Siebel)教授托米-雅科拉(Tommi Jaakkola)说,但由于这些大略的模型只能回溯那么远,因此它们并不善于天生可信的文本,他同时也是 CSAIL 和数据、系统与社会研究所(IDSS)的成员。

他阐明说:\"大众在过去十年前,我们就已经在天生内容了,但现在的紧张差异在于我们可以天生的工具的繁芜性以及我们可以演习这些模型的规模。
\公众

就在几年前,研究职员每每专注于探求一种能最好地利用特天命据集的机器学习算法。
但现在,研究重点发生了一些变革,许多研究职员开始利用更大的数据集(可能有数亿乃至数十亿个数据点)来演习模型,从而取得令人瞩目的成果。

最近人工智能研究的重点转移

ChatGPT 和类似系统的根本模型与马尔可夫模型的事情办法基本相同。
但一个最大的差异是,ChatGPT 的规模更大、更繁芜,拥有数十亿个参数。
而且它是在海量数据的根本上演习出来的--在这种情形下,海量数据便是互联网上的大部分公开文本。

在这个弘大的文本语料库中,单词和句子以具有一定依赖性的序列涌现。
这种递归性有助于模型理解如何将文本切割成具有一定可预测性的统计块。
它可以学习这些文本块的模式,并利用这些知识提出下一步可能涌现的内容。

深度学习架构的进步

虽然更大的数据集是催生人工智能热潮的催化剂之一,但各种重大研究进展也带来了更繁芜的深度学习架构。

2014 年,蒙特利尔大学的研究职员提出了一种称为天生对抗网络(GAN)的机器学习架构。
GAN 利用两个协同事情的模型: 一个学会天生目标输出(如图像),另一个学会从天生器的输出等分辨真实数据。
天生器试图欺骗鉴别器,并在此过程中学会天生更真实的输出。
图像天生器 StyleGAN 便是基于这类模型。

一年后,斯坦福大学和加州大学伯克利分校的研究职员引入了扩散模型。
通过迭代改进输出,这些模型学会天生与演习数据集中的样本相似的新数据样本,并被用于创建逼真的图像。
扩散模型是文本到图像天生系统\公众稳定扩散\"大众的核心。

2017 年,Google的研究职员推出了转换器架构,该架构已被用于开拓大型措辞模型,如为 ChatGPT 供应动力的模型。
在自然措辞处理中,转换器将文本语料库中的每个单词编码为一个标记,然后天生一个把稳力争,该图捕捉每个标记与所有其他标记的关系。
当转换器天生新文本时,该把稳图有助于转换器理解高下文。

以上只是可用于天生式人工智能的浩瀚方法中的一小部分。

天生式人工智能运用

所有这些方法的共同点是,它们都能将输入转换为一组词块,即数据块的数字表示。
只要你的数据可以转换成这种标准的标记格式,那么理论上,你就可以运用这些方法天生类似的新数据。

伊索拉说:\公众详细情形可能会有所不同,这取决于数据的喧华程度和旗子暗记提取的难度,但它确实越来越靠近通用 CPU 吸收任何类型数据并开始统一处理的办法。
\"大众

这为天生式人工智能开辟了大量的运用领域。
例如,伊索拉的研究小组正在利用天生式人工智能创建合成图像数据,这些数据可用于演习另一个智能系统,比如教打算机视觉模型如何识别物体。

Jaakkola 的研究小组正在利用天生式人工智能设计新的蛋白质构造或有效的晶体构造,以指定新的材料。
他阐明说,天生模型学习措辞依赖关系的办法与此相同,如果给它展示晶体构造,它就能学习到使构造稳定和可实现的关系。

不过,虽然天生模型可以取得令人难以置信的结果,但并不是所有类型数据的最佳选择。
麻省理工学院电子工程与打算机科学安德鲁-维特比和埃尔纳-维特比教授、IDSS 和信息与决策系统实验室成员德瓦夫拉特-沙阿(Devavrat Shah)说,对付涉及对构造化数据(如电子表格中的表格数据)进行预测的任务,天生式人工智能模型的表现每每会优于传统的机器学习方法。

\公众在我看来,它们的最高代价在于成为人类友好的机器界面。
以前,人类必须用机器的措辞与机器对话,才能使事情发生。
现在,这个界面已经知道如何与人类和机器对话了。
\"大众

寻衅和伦理考虑

天生式人工智能谈天机器人目前正被用于呼叫中央,回答人类客户的问题,但这种运用凸显了履行这些模型的一个潜在风险--工人失落业。

此外,天生式人工智能可能会继续和扩散演习数据中存在的偏见,或放大仇恨辞吐和虚假陈述。
这些模型具有剽窃能力,可以天生看起来像是由特定人类创作者制作的内容,从而引发潜在的版权问题。

另一方面,沙阿提出,天生式人工智能可以增强艺术家的能力,他们可以利用天生式工具来帮助他们制作创意内容,否则他们可能没有办法制作这些内容。

天生式人工智能的未来

在未来,他认为天生式人工智能将改变许多学科的经济学。

伊索拉认为,天生式人工智能的一个前景广阔的未来方向是用于制造。
与其让模型制作椅子的图像,大概它可以天生一个可以生产的椅子操持。
他还认为,天生式人工智能系统未来还可用于开拓更普遍的智能人工智能代理。

\公众这些模型的事情办法与我们认为的人脑事情办法存在差异,但我认为也有相似之处。
我们有能力在头脑中思考和梦想,提出有趣的想法或操持,我认为天生式人工智能是一种工具,它将使代理也能做到这一点,\"大众伊索拉说。