最新研究！AI的创意表现或跨越人类！_措辞_人类

2024-10-08 22:39:34 计算机

大措辞模型是由人工智能技能驱动的自然措辞处理工具，能够通过学习和理解人类的措辞来进行对话，还能根据谈天的高下文进行互动，像真正的人类一样来谈天互换。
在参加一些衡量人类创造力的测试时，人工智能的表现正越来越好。

最新研究！AI的创意表现或跨越人类！_措辞_人类计算机

图库版权图片，转载利用可能引发版权轇轕

2023年9月14日，挪威卑尔根大学、斯塔万格大学的研究职员在《科学报告》揭橥了一项题为《人工智能在创造性发散思维任务中仍不仇敌类最佳表现》（Best humans still outperform artificialintelligence in a creative divergent thinking task）的研究。
研究指出，大型措辞模型AI对话机器人在创造性思维任务测试上或能超越一样平常人类。
不过，得分最高的人类受试者依然能超过对话机器人的最佳答案。

参加测试的有ChatGPT3、ChatGPT4以及基于 GPT-3 构建的 Copy.Ai三个大型措辞模型AI对话机器人，还有人类。
AI和人类被试都被哀求在30秒内想出四种物体（绳子、盒子、铅笔、烛炬）的其他用场，越多越好，这是发散性思维的一个例子，常日用于评估人类的创造性思维。

研究职员从流利度、灵巧性、原创性和风雅度四个维度、8个评分项上，利用了两种方法来评估人工智能和人类的表现。
第一种是算法，用于评估该物体的建议用场与原始用场之间的靠近程度。
第二种方法用到了6名人类评估员，在不知道哪个答案是由AI给出的情形下，直接根据创意和原创性给每个答案打分。
之后研究职员司帐算人类和人工智能打出的均匀分。

结果显示，AI在这一任务中的均匀表现超过了人类，但人类被试的得分差距更大——最低分远低于AI，但最高分普遍比AI高。
并且最佳人类回答在 8个评分项中的7项都超过了所有AI的最佳回答。

当然，这个结果并不一定表明人工智能已经发展出了超越人类的创造力，由于参加测试的大措辞模型，它们都是从海量语估中进行了深度学习，它们的确能够基于这些已经存在的语料，组合推理出某个物品的用场，只管这种组合推理的能力还很低级。
但当面对全新的、从未涌如今演习语料库中的物品时，大措辞模型与人类的创造性思维还是存在着明显差距的。

例如，人类哪怕面对一个从未见过的物品，也能够从物品的外表、构造、功能等角度来理解这个物品，从而与已知的物品进行类比，推测出该物品是用来干什么的。
而大措辞模型过于依赖措辞输入，无法从视觉上理解该物品，这就已经输了一局。
纵然人类用措辞从该物品的外表、构造和功能等方面对大措辞模型进行描述性输入，期望它能理解这个新物品的样子容貌时，由于措辞描述本身不可避免地会带入一些隐含意义的词语，这相称于人类在不知不觉中已经隐晦地见告大措辞模型，这个新物品可能具有什么用场。

此外，当物品的用场须要繁芜多步的推理才能推断出来时，大措辞模型很难“创造性”地建立遐想，由于在大量推理任务中大措辞模型做得并不好。

参考文献

[1]https://www.nature.com/articles/s41598-023-40858-3

策划制作

本文为科普中国-星空操持作品

出品｜中国科协科普部

监制｜中国科学技能出版社有限公司、北京中科星河文化传媒有限公司

作者丨曾心月科普创作者

审核丨王威北京通用人工智能研究院研究员