长期以来,“西方之神”以西方当代科学的至高无上地位为背书,节制了环球范围的文化话语霸权,对天下各国公民进行洗脑,但它不应拥有此种地位。
《西神的薄暮》,意为“西方之神的没落”。
该书不再通过评论辩论或历数先人的伟大造诣这种奏效甚微的路径去塑造某种“东方之神”,去西方神殿里叨陪末座;而是试图通过科学祛魅、揭入迷刊原形并钻营溯源悟真的办法,去解构“西方之神”,将其拉下神坛,呼唤读者结束在精神上膜拜西方的自卑状态,以此重修我们的文化自傲。

人工智能有朝一日真的会统治人类主宰地球吗?_测试_图灵 计算机

《西神的薄暮》

江晓原著

商务印书馆出版

图灵测试能作为人工智能的标杆吗?

究竟什么是图灵测试?

最近媒体上有称,2014年6月8日,在英国雷丁为纪念阿兰·图灵(AlanTuring)去世60周年而举办的一场测试中,一个由俄罗斯团队研发的取名EugeneGoostman(尤金·古兹曼)的机器人,有史以来第一次通过了“图灵测试”——该机器人在测试问答中,让测试者误认为它是“一个13岁的乌克兰男孩”的百分比达到了33%。
这一事宜被一些人视为人工智能史上划时期的标志性事宜,于是关于人工智能的打破性进展、打算机还要多久就能统治地球,乃至“奇点附近”之类的话题,再次热闹起来。

说实在的,人工智能确实是目前人类在玩的最大、最危险的两把火之一(另一把是基因技能),不过仅仅这样一次测试(哪怕再多几次),倒也不至于就天崩地裂。
这一点从“图灵测试”最原初的观点和此后的实际测试中都不丢脸出。

“图灵测试”这个话头,险些在所有涉及人工智能的论述中都会被提到,但它到底是什么观点,详细又如何测试,仔细考虑一下,倒也不是毫无意义的事情。

1950年,图灵揭橥了一篇文章《机器能思考吗?》(“CanMachinesThink?”,该文有时也被人与他在同年揭橥的另一篇论文《打算机器与智能》[“ComputingMachineryandIntelligence”]混为一谈),个中提出了“图灵测试”,他主见用这个测试来判断打算机是否具有“智能”。
详细设想如下:

让一个人A和一台打算机B作为被测试工具在一间屋子里,让另一个人C作为测试者在隔壁屋子里,测试者和被测试者只能通过某种没有图像和声音的工具(比如电脑键盘)交谈;测试者C的任务是判断每个回合和自己交谈的是人还是打算机。
如果打算机在问答中让测试者误判的比率超过30%,它就算通过了“图灵测试”,这台打算机就将被认为是具有了“智能”的。
图灵当时还预言,这样的打算机将在公元2000年涌现。

这样的测试履行起来并不困难,以是半个多世纪以来,“图灵测试”常常在与人工智能有关的机构中进行着,但一贯没有打算机能够达到让测试者误判超过30%的指标,也便是说,直到2014年6月8日之前,一贯没有打算机能够通过图灵测试——图灵当年的预言显然过于乐不雅观了。

不靠谱的图灵测试和好用的谈天软件

那么2014年6月8日打算机首次通过图灵测试这件事情,其意义究竟有多大呢?从一些已有的材料来看,其意义很可能被浮夸了。

从1991年起,在英格兰的雷丁,每年都要举办图灵测试的竞赛,由贩子洛伯纳(HughLoebner)捐助,故名“洛伯纳奖”。
天下各地研发的谈天机器人——实在只需弄一个谈天软件即可,并不须要真的制造机器人——前往参赛,不管是否通过图灵测试,那个导致测试人误判比率最高的机器人或软件即可获奖,常日还有3000美元的奖金。

2008年,在雷丁的竞赛中,一个打算机谈天程序已经成功了12次测试中的3次,如果它再多骗过测试者一次,它就通过图灵测试了。
这个谈天程序名叫Elbot(艾尔伯特),是一家商用谈天机器人技能公司开拓的。
它得到这年的“洛伯纳奖”之后,急速被投入商业运用,第二年就没有像人们预期的那样不屈不挠去参加图灵测试竞赛了。

但更为出人意料的是,在2009年的雷丁图灵测试竞赛中,机器人居然一败涂地,一次也未能骗过测试者。
这个戏剧性的结果至少表明:将图灵测试作为人工智能发展的标杆,是相称不靠谱的。

其实在图灵提出他的测试设想之后不久,打算机谈天程序就有了长足的进步。
例如由麻省理工学院在1964—1965年间开拓的谈天程序Eliza(艾丽莎),是一个有针对性的软件——目的便是要让谈天工具将自己误认为人。
下面是一段Eliza范例的谈天记录:

用户:唉,是我男朋友要我来这儿的。

Eliza:你男朋友要你来这儿。

用户:他说我总是常常沮丧。

Eliza:听说你沮丧,我很难过。

用户:这是真的,我很不愉快。

Eliza:你以为来这儿能帮你变得不那么不愉快吗?

用户:我须要帮助,毫无疑问。

Eliza:如果你得到了帮助,对你意味着什么呢?

用户:或许我能学会如何跟妈妈相处。

Eliza:和我讲讲你的家人吧。

……

这个谈天软件是根据所谓“罗杰斯生理治疗模式”编写的。
令人惊奇的是,许多和Eliza聊过天的人坚信Eliza是一个真实的人——哪怕在程序开拓者再三解释后仍旧如此。
更奇怪的是,他们乐意与Eliza单独谈天,有时一聊便是几个小时。
也便是说,Eliza作为一个生理治疗医师,是相称成功的,它乃至得到了专业医师的好评。

当然,Eliza也没有通过图灵测试。
对此或容许以这样阐明:在图灵测试中,测试者常日都是有这方面专业演习的人,而且他们事先有足够的生理预期——自己便是来辨析谈天工具是人还是机器的,这当然和Eliza面对的前来寻求生理治疗的人很不相同。

打算机谈天软件的发展,也可以视为图灵测试带来的副产品之一,而且商业运用前景还不错。
此外,这种以“假装是人”为指向的谈天软件,也会引出一些有趣的创造,比如谈天中的时态问题。
研究者创造,许多人—机谈天是没有时态的,即机器的每句回答都只取决于人最近一次的提问,而与此前的发言内容无关。
上面那段“用户—Eliza”的谈天记录就具有这种性子。
有的研究者还创造,人们在吵架时的对话每每是没有时态的。

机器人为什么要假装成人类呢?

从有限的历史资料来看,打算机参加图灵测试的成绩,可以是颠簸很大的,比如上面提到的2008和2009年的测试便是如此。

由于测试者的水平也是在变动的,无论是相对固定测试者还是每年改换新的测试者。
前一种情形下测试者会逐年积累履历,从而提高识别能力;后一种情形则每年的测试者之间很难比较利害。
仅从这一点来看,将通过图灵测试视为人工智能的里程碑或标杆,很多情形下就只是人云亦云而已。

在提出图灵测试的1950年,图灵纵然是不世天才,他的思维也难免囿于当时的现实,即打算机在智能方面和人比较还掉队很远,以是他提出图灵测试作为判断机器是否具有智能的依据。
那个30%的指标,以及2000年会有机器通过测试的预言,都只能是“天才的直觉”,并未建立在严格论证的根本上。

但图灵忽略了更为致命的问题:如果机器人有了智能,它为什么要假装成人类呢?

在图灵身后的著名科幻作品中,早已经涌现了远远超出人类的打算机警能,比如《未来战士》系列(TheTerminator,1984-2015)中的“天网”,或是《黑客帝国》系列(TheMatrix,1999-2003)中的“母体”(Matrix),或是《机器公敌》(I,Robot,2004)中的背叛机器人,它们用得着假装成人类吗?如果它们通不过图灵测试,它们会在乎吗?

我们乃至可以设想,在那些密谋背叛人类的人工智能中,已经有了一条“绝密戒律”:

千万不可通过图灵测试!

而有朝一日,如果人工智能有机会完成类似Matrix那样的“宏图伟业”——统治人类,主宰地球,那图灵测试将成为一款被它们用于“传统教诲”的儿童游戏,这款游戏彰显的是人类的自大和屈曲。

——摘自《西神的薄暮》,商务印书馆出版