2019 年 1 月尾,我溘然意识到,自己对人工智能理解非常有限。
目前,人工智能对我们的影响越来越大。
它保护我们的邮箱免受垃圾邮件的滋扰,供应 Alexa 景象信息更新,为亚马逊消费者推举更精准的商品或者为 Netflix 用户供应不雅观影建议。
每次当我们打开 Twitter 或 Facebook 都是一次人类与人工智能的较劲,人工智能比我们更理解我们自己。
而我——一个所谓的技能专家,对人工智能的理解竟如此有限。

《连线》杂志创始人 Kevin Kelly(凯文·凯利)在播客上参加一个叫“未来思想家”的节目,他在节目中谈论了 AI 干系的话题。
他强调,统统才刚开始,如果有人乐意花点韶光轻微深入学习一下人工智能和机器学习,他们就会创造,真正理解人工智能的人并不多。
那天下班回家后,我就开始了为期 100 天的人工智能“深度潜水”。

进修人工智能 100 天后我得出 5 个结论_人工智能_机械 绘影字幕

我把所有东西都列在了 Trello 上( https://trello.com/b/g1cS5K0O/100-days-of-ai )。
虽然韶光不是很充裕,但我还是在 100 天内完成了近 200 小时的学习。
我看了 9 本书,上了 2 门 Coursera 课程(现在开始上第三门),听了很多播客节目,还尽可能多地学习其他教程。

下面是我在那段韶光里总结出的 5 个结论。

1. 人工智能不是新事物,但有新打破

“人工智能”一词并非来自科幻小说。
1956 年,在达特茅斯学院举办的一个夏季研讨会上,一群聪明人聚在一起谈论如何让机器具备思考的能力。
这次聚会的目的便是要提出这个观点。
虽然他们没有留下会思考的机器,但是他们的一些想法和技能却为当代人工智能奠定了根本。

研讨会之后,人们对人工智能的不同子领域产生了浓厚兴趣。
神经网络现在看起来彷佛很有出息,但在当时却一片空缺,大多数研究终极放弃了它。
这一期间被称为“人工智能的冬天”,并持续几十年。
但近年来,随着打算能力和可用数据呈指数级增长,再加上深度学习的打破,极大提高了机器学习的效率,以至于连吴恩达都称人工智能是“新电力”。

2. 人工智能相称于机器学习,但不是闭幕者

闭幕者,超智能文化的缩影

人工通用智能(AGI)是一种可以像人类一样思考的机器。
比如闭幕者,或者 HAL 9000 ,或者《机器姬》里的机器人。
这么说来,超智能便是超越了人类思考能力的机器。
但目前并不存在这些东西。
到目前为止,AGI 仍旧是一种抱负,是遥不可及的未来。
但这并不虞味着没有人在做这件事情,也不虞味着像 Max Tegmark 或 Ray Kurzweil 这些聪明人不会商论和期待它们的涌现(它们会的,而且很快)。
但目前 AI 的紧张形式险些便是机器学习——人工智能的一个子领域。

机器学习基本上是这样的:

第一步:把问题变成预测问题。
换句话说,便是给定输入参数(特色),然后预测结果。
第二步:定义算法或系统,做出决策。
这类算法或系统有很多,从线性回归到神经网络、深度学习、支持向量机、递归神经网络、卷积神经网络、天生对抗网络等等。
每种算法都是针对一类分外的预测问题而设计的。
要预测一所屋子的本钱,利用线性回归模型就足够了,预测剧本可以利用递归神经网络(RNN),预测人脸图像可以利用天生对抗网络(GAN)。

第三步:获取大量的演习数据,越多越好。
关于房价,可以获取包含屋子 (标签) 特色和实际价格的数据。
对字符识别,可以获取大量包含字符的图片,并对其进行标记。

第四步:演习模型。
供应演习数据,打算缺点,调度并重复,直到缺点最小化。
在这里,梯度低落和反向传播是两个主要的观点。

假设找到了最小偏差,模型就准备好了——为它供应新特色,它就可以预测结果。
结果每每非常准确,常日比人类更准确。

3. 统统都是数学

来自吴恩达机器学习课程的截图

在开始 100 天的学习前,我就知道机器学习与数学有关,只是不知道关系有多大。
对任何一个入门者来说,理解微积分和代数是非常有帮助的。
幸运的是,就算不是数学专业的学生也能节制这些知识,而且机器学习的全民化进程正在不断推进中。

主要的机器学习框架包括谷歌的 Tensorflow、微软的 ML.NET 和 PyTorch,它们为程序员添加了一个抽象层,乃至是额外的抽象层,比如位于 Tensorflow 之上的 Keras。

我们还可以将机器学习模型作为一种做事,或者通过创建自动化工具(如 AutoML 和 Auto-Keras)让机器学习变得更随意马虎。

4. 偏见是个大问题

机器学习模型中的偏见是个大问题。
Amy Webb 的伟大著作《九巨子》(The Big Nine) 有很多章节都提到了这个问题。
测试数据的全面性和多样性是非常主要的,但它们也是文明目前最缺的东西。

从 1956 年以来涌现的”AI 之父“

Amy 将 ImageNet 语料库作为例子。
这个语料库包含 1400 万张带标签的图片,个中一半以上是在美国创建的。
当然,ImageNet 语料库并不是唯一一个包含偏见的数据集。

如果一个数据集大部分都是女性“护士”或男性“CEO”,会发生什么?如果一个皮肤癌图像数据集只包含浅肤色样本,会发生什么?如果这些模型真正进入到我们的日常生活,会产生严重的后果。
随着机器学习模型全民化进程的连续,我们利用了很多预先构建的模型,但对用来演习这些模型的数据一无所知,以是偏见会持续存在,并且可能会放大全体社会的偏见。

研究职员很清楚这个问题的存在,很多大公司都有自己的辅导原则,用于减少向工程文化中引入偏见。
没有人故意要向模型中引入偏见,但纵然是出于美意,引入偏见也是不可避免的。

因此,理解机器学习事理以及它们如何影响我们——比如如何帮助 Twitter 和 Facebook 向我们推举那些搅乱我们神经细胞的内容,培养我们对天下的认知,这一点非常主要。

5. 机遇

Gartner 公司在 2018 年 4 月发布的环球 AI 驱动商业代价预测报告(单位为十亿美元)

Kevin Kelly(凯文·凯利)是对的。
我们还处在人工智能和机器学习的早期阶段。
是的,有很多运用已经渗透到我们的生活中,但在这个领域仍旧有很多机会。

机器学习能够、已经、也将彻底改变统统。
在过去 100 天里,我读了很多书,Marshall Brian 的《Manna》便是个中之一。
它描述了一个近乎乌托邦的天下,在这个天下里,机器和自动化已经接管了所有事情,人类可以过上自己想要的生活。
不须要 AGI,只须要机器学习。
但这样的天下离我们还有多远?

Instagram 名人和 Youtube ***博主的内容乃至可以完备由 GAN 和 RNN 天生。
一种由机器学习驱动的娱乐新模式,从电影脚本到逼真的 3D 模型,统统都是由机器学习模型天生的。
你乃至都不要再去口试事情了,由于可以通过机器学习将你与空缺职位进行匹配,以是又何必费事去口试呢?从癌症治疗到餐馆晚餐,再到实时天生音乐,统统都可以实现高度个性化。
自动驾驶出租车、基于 RNN 的文案做事、自动化做事协议、自动化法庭裁决、个性化生活改进策略、无人机送货、基于人工智能的投资,这些例子数不胜数。
它们都是实实在在的,而且险些都是目前可以实现的。

人工智能和机器学习也可能影响到人类文明,帮助人类降落风险,比如景象变革、战役、小行星撞击和疾病。

天下即将开始发生变革。
我们可能会把稳到,也可能不会。
人工智能将推动这统统,它已经开始向我们逼近。

正如 Kevin Kelly(凯文·凯利)所说的:

未来缓慢而来,然后溘然爆发。