一、什么是人工智能

AI研习丨人工智能关键技能进展及应用_人工智能_机械 智能写作

(一)图灵测试

图灵测试在 20 世纪 50 年代已经提出,那时没有打算机。
图灵测试指测试者与被测试者(一个人或一台机器)隔开的情形下,通过一些装置(如键盘)向被测试者随意提问。
进行多次测试后,如果机器让均匀每个参与者做出超过 30% 的误判,那么这台机器就通过了测试,并被认为具有人类智能。
以前有一些人可能不理解,但到本日就很明白,像小度音箱如果你连问三次本日温度若何,它的回答是一样的;但你问家人同一个问题三遍,他的回答可能是“你是否出缺点 ? 一个问题问三遍”,这便是人和机器的差异。
图灵曾经预测,人类用 50 年旁边的韶光可能完成图灵测试, 但是实际结果不太空想,人类用了 60 多年的韶光才完成了图灵测试。

(二)人工智能的运用

人工智能的运用领域非常广泛,如人脸识别和跟踪、遥感影像中的目标检测、医学领域中的病灶识别和分类、材料领域的新材料创造。
除此之外,人工智能在机器人领域的运用更为广泛 , 对机器人的发展而言 , 从机器角度来讲,目前的机器人灵巧度和稳定度已经做的非常好,比在机器人脑部方面的进展要快 , 然而决定机器人水平的紧张依据是其智能水平。
这和人一样,医院神经科的年夜夫地位常日更高,由于神经科的病人特殊多;且这些病相对来讲比较难治疗,由于人脑构造非常繁芜。
以是从人工智能类脑打算出发,实现仿人机器人还有漫长的路要走。

人工智能也是影视娱乐领域的一个主要话题,范例代表是 2004 年的好莱坞电影《我,机器人》,影片中对人工智能有超前认识,讲的是机器和人终极的差异是情绪差异。
如果有一天机器也有情绪会若何?显然 , 推进人工智能发展 , 预测人工智能的未来须要工科与人文社科研究职员共同努力和折衷发展。

二、人工智能背后的技能事理

(一)机器学习

本日人工智能发展的风起云涌,核心缘故原由是机器学习理论。
我们要研究人工智能无非便是做一个仿人机器人,让机器达到和人险些一样的功能。
人之以是聪明,最根本的缘故原由是会学习。
怎么教会机器学习?从我们小时候教诲的过程就可以理解机器和人学习的过程。
小学一年级学习加法时,老师课后会支配大量作业,做错了很正常 , 连续修正就行;通过大量演习和纠错 , 到小学三年级大家就节制了加法的实质事理 , 基本不会犯错了 , 那么学习的目的就达到了。

人对天下的认知便是一个学习过程,这个学习有一个特点是小样本学习,须要较少的例子就可以学会 ( 当然存在分外情形 , 智力有问题的人常日难以有效学习 )。
比如人对猫和狗的识别,常日看几张图片就认识了。
机器怎么学习?例如利用机器学习的方法可以对图像进行分类,然而当模型过于大略(智力水平低)时,演习好的模型只能识别常规的猫和狗,如果对图像进行各种退化处理或者尺度放缩及形变,模型每每会出错,而人常日可以应对各种外界环境的滋扰做出精确识别。
这就解释一个问题,人的大脑学习是很聪明的过程,看两三张照片就节制了规律,是小样本学习。
机器要完成对猫和狗的精确识别,须要海量演习样本(图片),同一张图在演习前须要做各种尺度、旋转、仿射变换等(数据增强策略),只有输入大量图片机器才能有效节制识别猫和狗的规律。
犹如班上聪明的学平生日只需做两三道题就能节制这种类型题,而智力水平低的学生须要做几百道同类型的题才能节制规律,当前的机器学习好比智力水平较低的学生。

第二个差异,鲁棒性。
比如给机器一个辨别色盲的照片,机器大概率会出错,由于它应对各种新情形能力较弱,而人应对外界环境变革的能力远高于机器。
目前的深度学习技能在鲁棒性方面已经有了明显改进,比如人脸识别,回顾 10 年前的人脸识别系统,戴口罩根本无法识别,而现在可以精确识别,解释当前的机器学习水平已经比过去提高很多。
机器学习还有一个主要观点是泛化能力,比如我现在认识你,你带了一个小伙子来了,我说这是你儿子,由于和你长的像;而机器常日对它没有见过的东西,出错概率比人要高的多。
如果我们演习好一个模型,机器可以对这张图片进行一个精确识别;而像漫画形式的,机器出错的概率就非常高。

学习的过程便是总结规律、反复纠错的过程。
小学生如果错一个字老师可能会让他写几十遍,解释大脑可以被认为是一个模型,这个模型本来不健全,通过不断学习,模型稳定后就不再出错,这是一个反复纠错的过程。
机器也一样,现在的人脸识别模型便是一个繁芜函数,里面有很多参数,只要调度参数值全体判别函数就变了。
以是,我们要学习模型里不同参数值,参数初始值是随意给的,而机器学习在第一次的学习过程中(例如 1+1=3),错了就对参数进行修正;第二次学习过程中又一个样本学习错了(例如 2+5=9),连续再改动参数;一贯下去,直到创造它能连续多次精确就不再修正模型里的参数,这是学习的最基本过程。

图 1 偏差函数的变革

机器学习涉及到的三要素是数据、模型和算法。
比如要对一些图片进行识别,把猫识别出来,就须要大量样本,就好比学生学习须要大量题库,如果题库都没有做过,怎么可能节制基本知识,以是样本可以认为是最基本的素材。
进入大数据时期,由于打算机成像技能的快速发展,获取图像、语音、文本的办法越来越大略,因此各种媒体数据量不断增加。
其次是模型。
模型很大略,便是一个函数。
例如,我们可以看到一个大略函数、一个繁芜函数,大略函数是线性的;繁芜函数是非线性的。
大略函数可以认为是一个智力水平低的小孩,辨别能力差表现在这个分类的模型很大略;繁芜模型类似于一个智力水平很高的科学家,对各种各样的事都可以做出精确判断和处理,这便是大略模型和繁芜模型的差异。
深度学习的过程便是要把大略模型变成繁芜模型,这样就不随意马虎出错。
机器学习末了一个要素是学习算法,例犹如样一个班的学生,为什么有的学天生就好,有的学天生就不好,便是由于学习方法不同,这是有差异的。
在实际过程中也是一样的,我们在演习模型时用不同算法去做,效率不同,有时演习机器 2 小时就可以收敛,有时演习 10~20 个小时还不能收敛。
以是,选择一个很好的算法很主要。

(二)机器学习系统

以人脸识别为例,首先进行数据网络,须要网络大量的人脸数据,被称为历史数据。
历史数据包括演习数据和验证数据,演习数据相称于我们平时做的题库;验证数据相称于仿照考试。
对模型学习的过程中便是对它的参数不断进行调度。
调度的方法是,对错的东西进行惩罚,不断把错的东西变成精确的。
等题库里的题做完了就开始验证,通过验证创造成绩还是弗成,解释老师有问题,或者说家长有问题,或者学习的环境有问题,这些外界成分就犹如模型的超参数。
通过调度这些超参数后再进行学习,直到成绩可以了,就能够参加终极测试。

(三)神经网络

机器学习里有很多种方法和工具,个中最核心的便是神经网络。
生物学家创造,人脑本身便是一个繁芜网络,如何仿照人脑的网络去事情,这是科学家一贯奋斗的目标。
这方面的事情可以追溯到上世纪三四十年代,仿照人脑的功能网络。
从最早的感知器,到本日的深度学习,其事理都是在仿照人的大脑事情机理。
人的大脑大约有 860 亿个神经元。
基于神经元的事情机理,数学家们将其抽象为人工神经元数学模型,这是人脑事情最基本的机理,这个事情机理便是加权求和的过程。
比如开会投票,六个评委每个人打分,末了的打分结果不是直接求均匀值,而是带有权重的均匀。
由于线性运算难以表达繁芜模型,因此神经元还涉及到是否激活的问题,这个激活是个非线性运算。
因此一个神经元首先通过加权求和的线性运算;其次通过一个非线性运算;终极输出结果,这便是神经元的终极事情流程。

神经网络经历了三次热潮,同时也经历了二次寒冬。
图灵在 1936 年提出图灵机,人工智能从此开始进入第一次热潮。
随着打算机技能的发展,人工智能也在不断向前发展。
到 1974 年经历了一次寒冬,由于最早的神经网络只能对线性可分的数据进行分类,学者们就认为神经网络运器具有较大的局限性,而专家系统可以办理更为繁芜的问题。
直到 BP 神经网络涌现后,其成功地办理了线性不可分数据的精确分类,神经网络迎来了第二次热潮。
1987 年,由于神经网络须要更多的演习数据,且识别精度有限,而支持向量机(SVM)是小样本学习方法,且表现出更好的分类性能,因此神经网络一度被质疑,进入了第二次寒冬。
直到 2006 年,由于神经网络层的设计不能太深,而人脑的事情机理是深层网络,中间的参数是指数级增长,打算量和模型的繁芜性也都是指数级增长;以往的神经网络很难进行深层设计,缘故原由在于无法进行有效演习,而 Hinton 提出深度学习的观点,通过逐层演习结合微调的办法实现了深层网络的演习,由此人工智能进入了第三次黄金时期。

进入深度学习时期后,人工智能迎来快速发展,在传统的 BP 神经网络中,我们常日须要人工进行特色提取,然后设计神经网络实现数据分类或回归。
比如做人脸识别,实际上是想办法把一个人脸的照片转换成一个向量,在非深度学习的时期这个过程被称为手工提取特色。
提取人脸特色后,要对这些特色进行分类,因此须要演习一个分类器,全体提取特色和特色分类分开实行,而深度学习可以把这两个任务融为一体,让机器全部自动学习。
尤其是怎么把人脸变成一个向量让机器自己学习,而不须要人帮助,这便是深度学习和传统机器学习最实质的差异,由于它能够自动学习,以是学习出来的特色每每比人工设计的特色要好很多。

深度学习是信息时期的一定产物。
21 世纪是大数据时期,随着成像技能的发展,我们对图像数据、***数据和文本数据的获取很随意马虎,数据获取办法更为大略,获取大数据集变得越来越随意马虎。
有了数据,还要有算力。
所谓演习过程便是打算过程,以前演习一个模型要两天,到现在 2 个小时就可以结束。
有了数据和算力,还要有算法进行支撑。
进入深度学习后,可以设计深度学习模型,尤其是各种学习理论做支撑。
三者同时发展,就有了本日人工智能高速发展的结果。

深度学习的代表性方法是深度神经网络。
深度神经网络最大的成功在于分层表达,当前的深度神经网络可以做到几千层。
层的浸染便是认知的过程,层越多模型就越繁芜,表达能力就越强。
比如进行数字识别,第一层里对这个数字的认识便是不同颜色块,说它有什么特色我不知道;第二层就有一种高等信息,有形状和纹理;第三层便是高等语义信息。
深度学习繁荣发展的进程。
李飞飞的紧张贡献是整理了一个图像库 ImageNet,里面大概有1500万张图像,而且对很多图像做了标注(共标注了大约 120 万张图像)。
有了这个超级大库后,学者们就可以验证深度学习的有效性。
没有大数据作支撑,无法验证各种深度模型的好坏。
因此自 2010 年后,学者们相继参加 ImageNet 比赛,直到 2017 年图像分类缺点率已降到了非常低的量级,比赛停滞。

三、人工智能技能现状

首先是数据的现状,GPT 的演习数据大约 80万张网页,GPT-2 的演习数据大概 800 万张网页,GPT-3 的演习数据达到 45TB。
大数据一旦到来后,只有大公司高投入才能做这样的事情。
现在的机器学习方法有监督式学习和非监督式学习两大类。
所谓监督式学习分为分类和回归两个问题。
回归问题预测的是一个数值,比如景象预报、股票开盘价预测。
机器学习里的两大任务,无非便是分类问题和回归问题。
监督学习类似于我们的教室教诲,由老师教给你,错了立时指出,不断让你纠错。
这样的学习办法本钱高,要交学费,还须要很多老师;非监督学习相反,不须要老师、教室,自学成才。
常日非监督学习不如监督学习,由于自学成才的人较少,而且难度大。
但是非监督学习是我们奋斗的目标,让机器能自动学习,而不是不断教它。

介于监督学习和非监督学习中间的是弱监督学习,其分为三种,第一种是不完全的监督,做标记时只有一部分进行标记。
比如一套题库中,10 套有答案,10 套没有答案,这是不完全监督。
第二种是不确切监督。
给一个大概的答案,可以很详细地标猫和狗,但也可以笼统地标为动物;类似于老师不教步骤,只讲方法。
第三种是禁绝确监督,即老师也有讲错题的时候。

深度学习繁荣发展。
谷歌是环球最大的互联网公司,一贯走在人工智能领域的最前端,近年来先后提出了 Transformer、Bert 等。
除了谷歌,2017 年微软投入 10 亿美金给 OpenAI 做研发,从而促进了该公司在人工智能领域的崛起,尤其是 GPT-3 的提出,实现了人工智能大踏步提高。
除了 OpenAI 公司,还有很多公司也做的非常好,例如苹果、华为的诺亚方舟、京东的探索研究院等。

人工智能的发展可以分为弱人工智能、强人工智能和超人工智能三个层次。
个人粗略认为,2020年以古人工智能一贯处于弱人工智能。
所谓弱人工智能便是下棋、人脸识别这种单项任务。
强人工智能便是类人的活动,尤其是多任务实行,例如机器人可以实现自己编程序、语音谈天、自动驾驶等。
现在已经步入了强人工智能时期。
未来的人工智能该当步入的是超人工智能。
所谓超人工智能便是在各领域全面超越人类,或者超过我们的大脑。

人工智能现在存在的问题紧张表现在三个方面,一是模型很大,参数量多,内存花费高;二是数据标注本钱较高;三是多任务实行比较难。
现在能见到的机器人有送菜机器人、巡警机器人、捡垃圾机器人,一个机器人能不能完成所有的功能?以是多任务实行比较困难。
最大问题是它的打算量太大,耗能方面孔前是一个严重问题。
AlphaGO 下一盘棋的电费大约 3 000 美元。
抛开 AlphaGO 我们看GPT-3,它的参数量是 1 750 亿,人类只有大约 860亿神经元。
这个模型演习一次本钱很高,用电须要19 万度,碳排放是 8.5 万公斤,相称于一辆车从月球开到地球一个来回的碳排放。
在碳中和的年代,如何发展人工智能?显然未来我们须要有新的技能作支撑。

四、工智能技能的运用

人工智能如果可以全面用于无人驾驶,会产生非常大的经济效益,但也可能存在很多问题。
现在百度、小米都在造汽车,考虑的是未来的新能源及自动驾驶,本钱很低。
人工智能在医疗领域,从商业代价来讲是最故意义的一个运用。
在疾病预测和影像剖析领域,人工智能已经表现出明显的上风,尤其某些诊断已全面超过人类,如青光眼的筛查比人类专家水平还高。
考虑到任务问题,人工智能在医学里只能作为赞助手段,为年夜夫供应各种参考,终极诊断由年夜夫确定。

成果运用 1:聪慧医疗

在聪慧医疗方面,我们开拓了一套面向肝功能赞助评估的在线剖析系统,输入病人肝脏影像后,直接可以打出构造化报告,如果依赖人工去做,传统方法须要 1~2 天才能完成。
因此这套影像剖析系统可以极大提高年夜夫的事情效率。

成果运用 2:金属及泡沫材料属性剖析

根据金属材料扫描电镜图像,研究金属材料单物理属性,须要剖析个中的孔洞分布,手动去量常日非常困难,通过人工智能的方法可以做一个有统计意义的剖析结果。
我们利用打算机视觉技能成功帮助材料研究职员自动剖析金属材料属性,为他们供应非常客不雅观的丈量数据,偏差率降落了一个数量级。
此外,对网状构造的泡沫材料(中间的孔洞更多)也可进行智能剖析。

成果运用 3:智能地层驱油剖析

通过给地层注入水(赤色是油的分布,蓝色是水,背景是地层)后可以把油驱出,这便是采油的事理。
实际中,研究职员把地层构造做成芯片放到实验室,用摄影机进行拍照剖析地层中水驱油的变革。
我们做了一个智能系统可以剖析油路走向,通过之前和之后的图像比拟,利用人工智能技能找出前后的变革趋势,找到油路的走向,帮助事情职员找到最佳取油路径。

五、人工智能的未来

人工智能的未来是可信人工智能、超级深度学习和量子机器学习。

京东探索研究院联合中国信通院在 2021 年发布了可信人工智能白皮书。
为什么是可信人工智能?比如无人驾驶必须要识别街区场景,如果各种标识牌上贴了小广告,这种情形下智能车常日就会识别缺点,发生的后果可能会很严重。
这个任务怎么去划分?以是这方面有很多问题,比如可信可视、多元原谅等。

当前,数据不断在增长,模型参数也在增长,打算机的打算性能也在增长。
由于有打算性能做支撑,以是不害怕数据增长和模型提升,未来的深度学习可以实行的任务非常多,学习能力也很强,能够达到靠近人的学习能力,终极实现整体人工智能家当链的布局。

量子机器学习。
中国科技大学潘建伟教授开拓出海内第一台量子打算机,其打算性能是现有打算机的 1 亿倍。
发展量子打算机是人工智能未来的方向,由于打算效率高、功耗低。

六、结束语

“破山中贼易,破心中贼难”。
发展科学技能比较随意马虎,但人想降服内心深处邪恶的想法比较困难,从技能角度的发展,人工智能技能一旦节制在一些少数的有邪恶想法人的手里,人类就会面临灾害。
以是人工智能技能未来的发展,尤其是在伦理道德方面的发展,是我们要重点关注的方面。

选自《中国人工智能学会通讯》

2022年第12卷第2期

AI领域专业技能的转移转化