《云上的中国》第3季——剧变中的AI时期。
通过调研100+家AI企业,拜访50位AI专家与企业代表,以真实案例和一线访谈捕捉和记录中国AI行业的动态发展和技能创新,剖析AI技能在中国的创新运用处景,虔诚反响此时此刻行业的现状和趋势,铺陈出人工智能新时期的崭新图景。

AI能取代“爱因斯坦”吗?| 品牌新事_卵白质_爱因斯坦 云服务

文 / 木每言

走在阳光下的草坪,手机上溘然弹出景象预警,30分钟后有雨。
然而,一个AI气候大模型见告你,可以连续坐在草坪上,享受和煦的温暖。

这时,你会怎么选择?

2023年9月1日,复旦大学2023级新生开学仪式在光华楼前大草坪举行。
这是近20年来复旦大学第一次的户外开学仪式,本科生和研究生齐聚一堂。

对付这次不同平凡的开学仪式安排,复旦大学校长金力自有其道理。
只管在开学仪式前,气候台预报仪式当天有雨,但“伏羲大模型很武断地认定,本日上海不会下雨”。

如果你是金校长,你会相信谁?

尤其当你知道,这个气候大模型,只须要不到三秒钟,就能让你足不出户地精准预知全天下任何一个国家和地区的景象状况,预测韶光长度乃至超过未来一个多月时,你又会怎么选择?

这不是凭空想象,而是在现实生活中的真实场景。
一贯以来,AI在不同专业领域超越人类是个被说烂的话题。
即便AI即将取代气候学家,你或许依然不会感到惊异。

但如果,那个被取代的人是爱因斯坦呢?

在AI技能前沿的探索方向上,这条道路被称为“AI for Science”,简称“AI4S”,也便是用AI去占领科研难题,培养AI成为像牛顿、爱因斯坦那样的伟大科学家。

这该怎么做?回答这个问题前,让我们先来看看为什么须要做科学研究。

AI如何成为科学家?

做科学研究有两个紧张目的:创造事理和解决问题。

环绕这两个目的,科学界形成了两套紧张研究方法——从数据中总结规律和从规律中推导事理。

什么是从数据中总结规律呢?

高中物理学教材有讲过,德国天文学家开普勒把老师第谷的天文不雅观测数据进行整理剖析,创造了行星运动三定律,比如所有行星环绕太阳运动的轨道都是椭圆形的,太阳在椭圆的焦点上;又比如行星靠近太阳时,速率会加快,阔别太阳时,速率则会减慢。

那什么是从规律中推导事理呢?

开普勒虽然总结出行星运动的规律,但至于为什么是这样的,他并不知道。

以是英国物理学家牛顿在这个根本上提出了力学第二定律和万有引力定律,将行星运动问题归结为一个常微分方程问题,并推导出行星运动三定律。

◎ 从数据中总结规律,开普勒创造了行星运动的科学规律,回答了行星运动是什么样子的。

◎ 从规律中推导事理,牛顿推导出了行星运动的基本事理,则回答了行星运动为什么如此运转。

通过这两套方法,科学界不断地研究数据,创造规律,推导事理,办理问题,实现了科学的进步并反哺到各行各业的发展。

再回到用AI来做科学研究的问题,那接下来就要回答:AI如何在这两套方法的过程里,给予人类帮助?

从运用层面看,科学界在量子力学建立后,探求并创造基本事理的任务取得了极大打破。
在拥有基本事理的根本之后,科学研究的目的,紧张变成办理实际问题,研究方法也紧张变成,从数据中总结规律。

而从数据中总结规律,恰好是AI的拿手好戏。

由于当前的科学创造,紧张依赖于实验和人脑聪慧,而AI在影象力、高维繁芜、全视野、推理深度、猜想等方面具有较大上风,从数据中总结规律,因此AI能主动进行科学创造和技能发明。

原阿里巴巴副总裁,现复旦大学人工智能创新与家当研究院院长漆远就指出,AI在蛋白质设计、药物设计、康健管理等领域的科学研究方面极具潜力。

一个范例的案例是2021年,曾经创造了“阿法狗”的公司DeepMind,正式发布了AlphaFold 2。

这个AI项目成功预测了98.5%的人类蛋白质三维构造,而且它预测的构造,与大部分蛋白质的真实构造,只有一个原子宽度的偏差。

而以往科学家想要预测成功蛋白质的构造,须要花费多年韶光,进行上百万次的验证实验。

为什么AI能做到这一点?

高中生物教材提到,蛋白质的最小单位是氨基酸,多个不同的氨基酸连接成多肽链,多肽链达到一定的长度,便会组成蛋白质的一级构造;一级构造局部折叠,形成二级构造;所有的二级构造在三维空间中形成的形状,便是蛋白质的三级构造。

就像幼儿园玩的“串珠子”游戏,珠子串得越多,不仅排列越繁芜,串好的珠链子,本身也会具备不同的形状,在一个空间里也会显得越繁芜。

而蛋白质的功能,由蛋白质的三级构造决定。
在预测蛋白质构造的领域,诺贝尔化学奖得主还提出过一个“安芬森法则”,即蛋白质的一级构造能决定终极的三级构造。

以是当科学家看到具备某个功能的蛋白质时,只要知道它的一级构造,就基本能知道统统。

不过,虽然这听起来难度已经大大降落,但组成蛋白质肽链的氨基酸数量依然弘大到让人恐怖,通过一级构造来预测蛋白质折叠后的三级构造,依然非常困难。

直到2018年AlphaFold横空出世,它先学习大量蛋白质的序列和构造数据,从中探求氨基酸分子之间的相互浸染,以及蛋白质片段之间的蜕变规律,然后再按照找到的规律对蛋白质的构造进行预测。

2022年,DeepMind在官网上宣告,AlphaFold已对险些所有已知蛋白质的构造做出了预测。
它的预测的精确程度,直接让不少科学家疑惑起了自己,以至于《Nature》杂志声称“它会改变统统”。

伏羲为什么能预测对?

既然AI for Science已被成功证明是大有可为的方向,那接下来该如何实现在这方面的打破?

漆远的回答是:“数据、算力和人才是AI如今发展的必需要素。
同时,生产要素、技能要素要达到足够丰富且便宜的程度。

在他的答案里,人才取代了原来AI发展三要素——数据、算力、算法中的算法。

这绝不是随口而言。

AI的三大要素里,数据构成了最直不雅观的壁垒。
GPT 3.5、Llama 2等大措辞模型,纵然曾开源了模型源代码,也都未选择公布演习数据集。
而如果没有精良的数据集,就很难演习出精良的AI模型。

至于算力,则扮演着发动机的角色,目前在海内,算力的供需之间存在鸿沟。

一方面,AI算力的能耗过大。
例如,用1000张英伟达V100 GPU演习GPT-3大模型,单次演习耗电就相称于一个人4年的生活用电总量。

另一方面,算力芯片存在缺口。
英特尔、AMD和英伟达霸占了海内85%以上的做事器芯片市场,高性能芯片的供给严重不敷。

而算法的需求,实质是对AI大模型人才的需求。
行业智库MacroPolo发布的《环球AI人才追踪2.0》报告显示,美国拥有全天下最多的AI精英,占比57%,比较之下,中国只有12%,两者相差约5倍。

以是,如果中国想在AI for Science方面实现重大打破,这三大要素就至关主要。

这个打破口,如今即将显现曙光。

在《云上的中国》第三季中,吴老师提到:“科技进步中最大的一个推动力,除了天才以外,便是大学和创业者和大型企业之间相互推动的结果。

漆远的经历便是对这句话最好的印证。

原来在阿里担当副总裁的他,曾建立并带领团队开拓了阿里首个基于参数做事器的超大规模机器学习平台;他还建立起阿里第一个专业的基于深度学习的语音识别团队,迅速将语音识别能力提升到天下前辈水平;在蚂蚁金服,他领导的人工智能部门将机器学习运用于各个业务线。

后来漆远加入复旦,担当人工智能创新与家当研究院院长,又在上海成立了一家主攻AI for Science的研究院。

这个过程中,通过将阿里云的算力资源引入一流高校,他推动机器学习在学界实现打破,让AI不仅有家当运用,还真正驱动硬核科技创新。

在他看来,通用大模型领域,比较于国外,海内更须要产学研一起抱团打破。
他说:“在创新链资源方面,我们可能未必非常充足。
但把高校、家当企业、创新机构结合起来,我们同样可以做很多探索和研究。

“国际上最好的高校都有同样的寻衅。
老师很厉害,很聪明,但数据不足多,算力也有欠缺。
”他的路径是,在中国的AI创新链资源距天下领先水平仍有差距的情形下,高校可以与家当、创新机构进行互助,上风互补,匆匆成良性的“化学反应”。

“切问近思”代表着这一思路的两大落地项目。

“切问”和“近思”是复旦与阿里云联合培植的全国高校最大的云上科研智算平台——CFFF中的两个算力集群:“切问”位于乌兰察布,“近思”则支配在复旦校内。

这套算力集群,可以给复旦的科研职员供应“天涯若比邻”般的支持便捷度。
从内蒙古的乌兰察布到上海,数据传输的韶光只有几毫秒。

算力集群乃至不只是面向复旦校内,也对外开放。
漆远说:“希望这个集群能成为一个支点,去帮助和促进更多干系的科研事情。

回到2023年9月的那个复旦操场,金校长终极选择相信“伏羲”,而终极事实证明,“伏羲”是对的,那每天色虽阴,但真的未曾落雨。

根据金校长当时的先容,“伏羲”是复旦在海内高校最强的云上科研智算平台上,演习出的气候大模型,拥有45亿参数,每次预测耗时不到3秒,能精准预报未来15天的环球景象。

“伏羲”并未止步于此。
在持续的迭代优化下,如今“伏羲”气候大模型对环球景象的预报天数,更是延长到了42天。

漆远在记录片中说道:“ChatGPT是对措辞的建模,Sora是对视觉的建模,而伏羲是对真实天下的建模。

在他看来,许多中国大学之以是无法在AI for Science上取得科研打破,就在于缺少算力,而复旦的成功正好供应了一条可行的路径。

他说:“当复旦大学有了算力中央后,它就能在半年韶光里,做出中国最好乃至环球领先的气候大模型。

AI版“爱因斯坦”何时涌现?

吴老师曾问漆远:“你以为多少年后会涌现人工智能的‘爱因斯坦’吗?”

他的回答是:“未来几年涌现的概率很小,但十年后会是什么样,没有人能预测。

他表示:“本日的AI能力还不足强。
目前的大模型只是对天下的压缩,还不具备探索天下各种可能性的能力。

在他看来,AI for Science的真正意义,在于去探索和创造科学定律,由于创造科学定律才是人类在智能表现上的“皇冠上的明珠”。

从创造勾股定理的毕达哥拉斯,到建立经典力学体系的牛顿,再到提出相对论理论的爱因斯坦,漆远说:“这些正是构建人类社会知识和智能的关键节点。

直到有一天,涌现堪比爱因斯坦智能表现的“AI节点”时,人类天下便会看到更大的可能性。

从长远来看,漆远对AI版“爱因斯坦”的涌现,抱有充分信心。

他在六七年前参加过机器学习领域的顶级会议NIPS。
当时会议上谈论的内容是,未来多久才能涌现靠近爱因斯坦水平的AGI(通用人工智能)。

“在那个韶光点上,有人认为再过100年都不会发生这件事。
”漆远说,“但是,在ChatGPT涌现后,事情就变得非常故意思。
有人认为,这件事的发生韶光会大幅缩短。

漆远看到了希望,原来是有多少人工才有多少智能,如今在人工智能和数据结合后,“通用人工智能的火花”已经开始在不远的地方闪烁。

“未来是什么样,没有人知道。
人工智能的技能飞跃正在加速。
这就像人一样,小学的时候以为日子都很慢,到了四五十岁时,创造统统变得越来越快。
”他说。

那假如有一天,AI版“爱因斯坦”涌现时,天下会变成什么样?

漆远说:“科学考试测验基于通用规律以大略幽美的办法阐明天下,这也叫作‘奥卡姆剃刀事理’。
但这些仍基于人类的思考范式,AI大概会带来范式转变,找到更简洁的路径。

他认为,或许存在其余一种可能:AI 创造的科学,未必是用本日的措辞来书写,也未必是人类能理解的。

AI领域一贯流传这样一个公式:AI+HI=SI,即人工智能+人类智能=超级智能。
或许情形的确如此。
AI善于“解题”,科学家善于发问。

未来,或许是科学家向AI发出醍醐灌顶之问,AI则在理论的边界上探寻一个又一个高峰。

不仅仅是科研,在当下的中国,无论是高校研究者,还是企业开拓者与行业创业者,每个人都面临AI发展的“大航海时期”。

漆远提到:“在AI出身前,很多用家当互联网来改造传统行业的试验,已经在按部就班地进行。
但是在2023年往后,溘然间算力发生了几何级变革,处理的数据量从原来的几亿级,变成现在的上千亿级。

千亿级的数据量意味着对算力弘大的需求。

然而根据中国信通院的数据,美国做事器存量规模约为2100万台,个中有60%支配在公共云。
中国做事器存量规模是2000万台,但只有28%在公共云中,不仅不到美国的一半,也低于欧洲的50%。

公共云的渗透率,意味着算力的遍及程度。

算力,正成为在AI大潮中承载人类通向AGI的大船。

正如“伏羲”的成功所展示,只有链接起科研和家当界多方的力量,充分利用和发挥算力的代价,才能船坚帆韧,在第三次技能浪潮下的AI时期谋得先机。

毕竟在AI时期,more is different。

本文的不雅观点和内容,来自《云上的中国》第三季记录片与5月9日吴晓波频道人工智能专场对谈。

伴随着中国的公共云渗透率的不断提升,AI发展日月牙异,AI for Science也已成为既定的发展方向,并逐渐渗透到产学研的多个环节。

在《云上的中国》第三季中,财经作家吴晓波与原阿里巴巴副总裁,现复旦大学人工智能创新与家当研究院院长漆远对谈,理解AI for Science的最新进展,阿里云对付高校和研究机构的算力助力,伏羲气候大模型的最新成果,共同展望AI for Science时期下,中国人工智能的星星之火。