在复旦大学浩清特聘教授、上海科学智能研究院(以下简称“上智院”)院长、可信大模型公司“无限光年”创始人漆远看来,“通用人工智能的最高表示之一是创造繁芜天下的未知规律,简言之便是该当是一位‘AI爱因斯坦’,这须要我们打造结合快思考的‘黑盒’概率预测和慢思考的‘白盒’逻辑推理,打造‘灰盒’可信大模型;并且通过科技和家当的深度领悟,推进根本研究、人才培养、成果落地,打造科学智能创新生态。

从玩具、对象到“同事”再到“AI爱因斯坦”我们离通用人工智能有多远?_模子_人工智能 计算机

就在不久前落幕的2024天下人工智能大会(WAIC)暨人工智能环球管理高等别会议,上智院成功举办了“人工智能:科研范式变革与家当发展”主题论坛,这也是这家新型研发机构首次亮相WAIC。
上智院可以说是上海在探索创新驱动的“1+1+N”科学智能生态模式方面的典范,即由上智院这个“1”作为生态系统的中央和枢纽,卖力整体计策方案、资源整合和关键技能的研发与创新,联合另一个“1”复旦大学,携手多家高校、科研机构、科技企业、创新团队和投资机构这些“N”,共同推动科学研究、人才培养、科技成果转化以及家当的创新、升级。

AGI的标准该当是打造“AI爱因斯坦”

从技能视角而言,越来越多参数的大模型,会走向通用人工智能吗?时至今日,无论是从AI技能本身的角度还是从能耗的角度而言,基于Transformer自回归架构的大模型虽然还有红利,但并不敷以通往通用人工智能。
人工智能须要发展新的“灰盒”可信大模型。
这是漆远在学界、家当界多年实战的履历总结。

十年前,怀揣着“让人工智能有用”的想法,漆远带领团队把阿里巴巴的核心机器学习系统第一次从200万参数提升百倍到几亿参数,取得了大规模的业务效果提升,彰显出数据、算法和工程能力的集成变革。
这正是本日人工智能圈津津乐道的Scaling law的表示。

漆远回顾,团队当时的确尝到了Scaling Law的甜头:模型参数百倍的增加之后,整体效果得到了突飞年夜进的提升。
“但是现在我却想:我们当年做AI模型为什么没有做到更大的程度?为什么当年再往前走一步的时候,我却停在了这里?”他说,“大模型上亿参数还是不足,要走向百亿、千亿,乃至是万亿。
当时不论是学术界还是机构缺的都是算力,而且纵然在工业界,要达到如此高的算力,也须要非常高的本钱,更不用说学界。

之以是说AGI的标准该当是打造“AI爱因斯坦”,漆远阐明称,便是要有效而聪明。
首先,爱因斯坦当年通过几个关键的数据点,看到了“20世纪初物理学的乌云”,AGI也该当能创造理解繁芜天下的未知规律。
但目前的大模型无一能够做到,虽说视觉大模型SORA对物理天下的仿照达到了前所未有的程度,然而SORA依旧是基于对二维天下的仿照来构建三维天下,离透彻理解物理天下还有很大间隔。
其次是功耗,人脑的功率大概是15瓦,而一张GPU的峰值功率便是几百瓦,更不用说支持演习通用大模型须要千卡或者万卡集群。
就当下而言,如果持续沿用现有的架构,将须要天量的功耗,很难达成有效且聪明这个目标。

“AI爱因斯坦”也是AI for Science(注:科学智能,下文简称AI4S)的关键目标。
科学智能在加速求解已知的物理方程中已经发挥主要浸染,但是科学智能更须要结合已知规则与数据,减少对数据和算力的严重依赖,提升推理预测的精准性,并根据数据来调度知识规则,提出崭新的科学理论。
这也与漆远在复旦大学和上智院事情的长远目标——“用人工智能来理解繁芜天下,创造不知道的规律”不谋而合。

“灰盒”可信垂直领域大模型赋能千行百业

大模型从AI工具落地新质生产力,亟需办理哪些问题?在漆远来看,大模型行业面临诸多共性寻衅,使得技能、产品与市场需求难以匹配。

“目前大模型落地,我以为最大的问题便是:猛一看彷佛有用,真的一用又弗成。
”漆远阐明称,本日大措辞模型的核心大略来说便是预测下一个词,根据过去多个词来预测下一个词,但是这并不适用于多步骤的严谨推理。
“措辞是互换的工具,而不是思维的工具。
”近期,麻省理工学院(MIT)等机构揭橥在顶级学术期刊《自然》杂志的文章指出,措辞是传播文化知识的有力工具,它可能与我们的思考和推理能力共同进化,能够反响人类认知的繁芜性。
但是措辞并不产生推理的繁芜性。

针对大模型现有的不靠谱、阐明性不高、本钱高档特点,一个真正有效的办理方法是把概率的神经网络推理与逻辑的符号打算结合起来,类似于诺奖经济学得主丹尼尔·卡尼曼所著的《思考快与慢》一书所说的人类基于本能的快思考和基于逻辑推理的慢思考的结合,“可以说是一种‘灰盒’大模型。
”漆远认为,将符号打算与神经网络相结合的“灰盒”可信大模型,可降落人工智能的“幻觉”,办理垂直领域专业问题,从而赋能千行百业,开释大模型的生产力。

什么是“灰盒”可信大模型?“原来认为深度学习是‘黑盒’,现在我们把逻辑推理的‘白盒’与深度学习结合起来,就变成‘灰盒’了。
”漆远阐明说,“原来的‘黑盒’使人们对数据产生结果的过程一无所知,而‘灰盒’大模型借助逻辑推理可以令人‘知其然,更知其以是然’。
同时,从其余一个角度来看,‘灰盒’大模型可以用深度学习来减少不符合现实天下不雅观测数据的规则。

漆远表示,要让各行业的繁芜场景成为AI发挥核心浸染的新沙场,无论是在金融保险、风电能源,还是远洋运输、医疗制药的场景,须要将系统的行业知识、推理逻辑和决策机制与大模型结合。
“灰盒”大模型既是通用人工智能的大方向,更是大模型在垂直领域里深度渗透、真正办理实际问题的利器。
“如果从工业界角度来看,这个理解非常直不雅观。
”漆远举例,年夜夫不须要成为状师,状师也不须要成为投资专家,每个专业角色都该当专注自己的领域,做好自己的生产力工具。
从技能层面来说,如果让一个大模型过度学习不干系的任务,就可能会发生“灾害性遗忘”。
就像李白如果整天做司帐而不写诗,他的诗歌灵感可能也会逐渐消退。
“我们已经不雅观察到,在演习垂直领域的大模型时,如果让模型学习过多不干系的功能,会对其原有的能力产生滋扰。
因此,做好垂直领域的‘灰盒’大模型,我认为在家当落地中具有极大的代价。

“我认为,‘灰盒’大模型会在通往AGI和垂直领域家当落地的路上发挥越来越主要的浸染,由于从贝叶斯的方法论上来说,便是把我们已知的知识,和隐蔽在数据中的未知信息结合在一起,来发掘新的规律,办理科学与家当问题。
”漆远直言,未来,“AI爱因斯坦”也可以是“AI巴菲特”。

打通创新链,构建科学智能创新生态

就在这次2024天下人工智能大会上,漆远领衔的团队发布了百亿参数的可信光语金融和医疗大模型。
这两个垂直领域大模型的测试都超越OPEN AI的万亿参数大模型GPT4-Turbo,再次引发业界对大模型落地的关注。

“本日的人工智能打破不仅来自底层事理的创新,更有面向社会需求的产品驱动。
社会须要的不仅是理论文章的揭橥或者商业模式的创新,而是科技创新与家当创新深度领悟,是基于第一性事理的打破。
这两者一旦结合,我们就可以游到海水更蓝的地方。
”漆远说。

学界和业界有着不同的义务,学界要探索新事物,工业界首先要办理实际问题。
目前国内外普遍存在的一个共性问题:研究机构须要研究很多技能创新问题,但如果忽略产品化和社会需求,会有两个短板:缺少真正的竞争压力,无法在竞争中熬炼创新技能;没有有效的市场信息反馈来牵引技能研发的方向。

为此,漆远一贯期待打通“大学—研究院—初创企业”的创新链条,营造一个好的创新生态,不仅思考底层技能,也要抓紧市场需求。
以市场需求和场景牵引产品方向,从底层创新打造产品核心竞争力。

2023年景立的上智院,正致力于知识与数据结合的AI for Science原始创新。
近期,上智院发布了面向新能源、保险、城市管理等家当运用的伏羲系列气候大模型2.0,并牵头发起了智能气候创新生态同盟,联合多家单位逐步推进伏羲系列气候大模型2.0的家当化运用。
“灰盒”可信大模型的产品落地也在进程之中,漆远担当创始人的可信大模型公司——无限光年已成立。

为进一步繁荣科学智能创新生态,由上智院与复旦大学联合主理,上海市科学技能委员会、上海市发展和改革委员会、上海市经济和信息化委员会、上海市教诲委员会等多部门联合辅导的第二届天下科学智能大赛已启动。
大赛设置百万奖金面向环球招募选手,共同探索科学智能前沿领域。
同时,上智院主导开拓了一套涵盖多模态科学数据的科学数据平台,该平台具备从数据采集、加工到管理和建模的全链路能力,担保数据的高效加工、可信和安全互通。
基于这一平台,上智院与互助伙伴构建了面向生命科学、物质科学和大气科学等领域的多个高质量科学数据集,为科学智能研究供应了宝贵的资源。
此外,上智院牵头发起了环球科学数据生态同盟,首批同盟成员单位包括中国电信株式会社、中远海运财产保险自保有限公司、上海临港新片区跨境数据科技有限公司等十余家单位。
同盟将通过政府、企业、高校、研究机构等多方互助,构建环球性、多领域的科研大数据资源开放与共享平台。

“不论科研还是家当,都不应‘为了新而新’,期待我们能构建未来的通用人工智能和运用,办理真实天下的问题。
”漆远说。