作者丨何力新

中科大年夜何力新教授:当量子力学碰见AI——深度进修在超算平台上模拟量子多体问题_量子_模子 计算机

整理 | Don

编辑 | 青暮

人工智能的下一个目标是从模拟认知学习,转向办理一贯存在的大规模科学打算问题,UC伯克利教授Michael Jordan曾经强调。
而李国杰院士也曾在与雷峰网的互换中进一步指出,人工智能该当打破约翰·麦肯锡和艾伦·图灵定下来的框框,去研究NP-hard级别的大难题,让根本科研走向大工程化。
也便是说,要用数据、算力和算法协力去探求这类难题的详细解,并落地运用,而不仅仅追求理论边界的证明。

这些具有组合爆炸性特点的难题很早就已存在,并且有非常显式的定义,但依然由于打算难题被卡住。
而人工智能特殊是深度学习在层级特色建模、压缩表征等方面的上风,为办理这类问题带来了新的曙光。
AlphaFold是个中的绝佳范例,再往上一层看,在全体AI for Science领域中,比如物理、化学、生物等都存在大量的未办理NP-hard问题,个中就包括了物理学中的量子多体问题。

比如,确定量子稠浊态是否存在纠缠便是一个NP-hard问题。
k-Local Hamiltonian 问题(k-LH)至少是NP-hard问题。
它们都涉及量子多体系统。

k-LH问题是指:给定k,在n个量子比特的系统中,存在一组约束,每个约束最多涉及k个量子比特,希望确定系统的基态能量是高于某个阈值或低于某个阈值。
它属于一种量子多体问题,并且k不小于2时,至少是NP-hard的。
当k=3或以上时,乃至涌现了更高阶的繁芜性类——QMA完备。

QMA类似于经典繁芜性类中的NP,也便是说,如果一个问题的答案可以在量子打算机上以多项式韶光验证(并且至少有2/3的概率是精确的),但无法以多项式韶光给出答案,则该问题的繁芜性类为QMA。
同样,QMA完备也类似于NP完备。

多年以来,量子多体物理领域是凝聚态物理中最核心和最优寻衅性的话题之一。
比如物理天下中我们能够不雅观测到的一些奇特物理征象和物质中,最具代表性的便是超导、超固量子Hall效应、超流、玻色-爱因斯坦凝聚和量子自旋液体等,都是基于大量粒子相互浸染的量子征象。

著名的物理学家Phlips Anderson曾说,“More is Different”,这是指我们的天下并非各个物质的大略叠加,当系统中的粒子数以及元素种类增多的时候,会导致1+1>2的效果。
从理论上来说便是量子多体之间的相互浸染所致的结果。

由于希尔伯特空间随着粒子数增加而指数增长(组合爆炸),量子多体问题的高精度仿照是对付经典打算机极富寻衅性的问题。
近几年景长起来的深度学习算法为仿照量子多体供应了新的有效的打算工具。

2021年12月16日,中国科技大学物理系教授何力新在CNCC 2021“人工智能在超大规模科学打算领域的运用探索”专题论坛上做了题为《深度学习算法在新一代神威超算平台的运用:量子多体问题仿照》的学术报告,分享了深度学习算法在量子多体仿照问题上的研究事情和领域进展。

在报告中,何力新表示,他们团队设计了基于卷积神经网络的新算法,对强阻挫的强关联自旋系统实现了高精度的基态仿照。
他们还在新一代神威超级打算机上移植并优化了该算法,并打算了著名的方格J1-J2模型,将打算的系统规模及打算精度提高到了新的高度。
在移植、优化程序的过程中,通过物理学-并行优化-超算系统三方面交叉团队,成功在新一代神威超算上实现高性能的量子多体问题仿照,为构建国产AI-HPC生态供应一个精良的模板示例。

何力新教授是中国科技大学物理系教授,1997年毕业于中国科技大学,2003年在美国罗格斯大学攻读博士,2003~2006年在美国国家再生能源实验室从事量子点的理论研究事情,并于2006年返国到中科大中科院量子信息中央进行研究事情,2011年得到杰青称号,2012年入选IOP Fellow,曾任科技部量子调控量子通信网络和量子仿真关键器件物理实现之首席科学家。

以下是演讲全文,AI科技评论进行了不改变原意的整理:

1

量子多体问题及其模型

研究量子多体问题具有极强的科学意义,可以从两个方面进行概括。
首先在根本研究的角度上来看,量子多体问题的一个紧张目标是创造和研究新的物质形态。
我们可能对生活中常见的固体、液体和气体形式十分熟习,但实在自然界中有很多其他物质形态,比如我们之前所说的超导和量子自旋液体等,这些新型的物理形态都具有各自的存在意义以及研究代价。

因此通过对新型物质形态的研究,我们便可以洞悉和总结物理天下的深层规律和法则。

另一项具故意义的方向是研究其运用代价。
例如高温超导已经在能源、交通、精密丈量和信息等领域有了广泛的运用。
托克马克装置须要非常强的磁场进行物理约束,因此可以利用超导体产生超强的磁场。
此外,拓扑序也可以进行拓扑量子打算。

在量子多体物理的模型中,有两个经典模型,即海森堡自旋模型,以及哈伯德电子模型。
个中海森堡模型实在质是一个自旋模型,它描述了格点上两个自旋量子的相互浸染。
比如图中描述了两个最近邻的两个量子发生的交流浸染J,如果J>0,则两个粒子方向于自旋反平行。
但是当J

另一个经典模型是哈伯德模型,它描述了电子运动的模型。
该模型描述了量子在格点上的运动,个中第一项表示的是电子从一个格点跳跃到另一个格点的过程。
第二项,描述的是同一格点上电子的库仑排斥浸染。

从局部的角度来看,这两种模型很随意马虎理解。
但是当粒子数逐渐增加的时候,系统将变得十分繁芜,对其求解将会变得十分困难,算力需求也难以知足。

2

多体模型打算的困难性

打算困难的根本缘故原由在于量子态的希尔伯特空间会随着粒子数量的增加而呈现指数级的增长。
比如有N个1/2的自旋粒子,每个自旋有高下两个状态,那么态空间将达到2^N级别。
因此如果我们须要对其进行严格求解,会碰着“指数墙”的问题,也便是算力需求巨大。
目前我们只能实现大约40个格点的自旋系统的严格求解。

此外,我们也有一些其它近似方法,例如量子蒙特卡洛方法。
但是它在打算费米系统(电子系统)和阻挫系统时会涌现符号问题,即负几率问题。
而动力学均匀场方法,会对一维和二维等低维度的模型有打算问题。
末了是密度矩阵重整化方法,只能打算一维和准一维的问题。

在过去的十几年间,国际上发展了一些新的算法,例如张量网络态方法(PEPS算法)。
这些算法将量子态表示为格点上的张量乘积形式。
原则上这种方法可以在一定程度上战胜已有方法的不敷,它可以运用于二维系统,也不存在对阻挫系统和费米系统中的符号问题。

但是另一方面,它的打算繁芜度很高,尤其是对周期性边界条件的问题。
因此我们目前无法对具有周期性边界条件的系统进行有效的仿照。

在2018年,我们曾经在神威机器上进行了PEPS算法的实现和仿照。
当时可以将算法的并行度做到1000万核。
我们可以看到之前事情的算法精度仅能达到10-3,但是神威机上的PEPS算法则将精度是提高了2个量级。
但是这个算法仍旧仅适用于开放边界条件的问题。

3

量子力学遇见人工智能

我们知道在AlphaGo在击败人类围棋玩家之后,深度学习大热,引起了很多领域的改革。
实际上,深度学习在凝聚态物理学中也掀起了一番热烈谈论和考试测验。
它可以做实验数据的处理,可以进行机器学习势场模型的仿照和求解,也有事情研究了用AI进行分子和晶体构造的分类和预测,进行电子密度的学习等。
近些年DeepMind的最新事情便是在这些方面进行研究和创造,比如利用神经网络估计电荷的密度,并且超越了人类的估计结果。

大家也在考试测验将深度学习和机器学习用在量子多体问题中。
上图是2017年的一篇Science事情,它利用受限玻尔兹曼机模型研究海森堡自旋模型,将系统的粒子波函数利用玻尔兹曼机进行表示和学习,通过优化系统的能量,得到神经网络的最佳参数。

在量子多体系统中,算法的好坏判断标准是打算的能量是否最优。
从结果中我们看到,该打算能量的精度已经到达10-3量级,乃至超过了(我们神威事情)之前PEPS的算法效果。

但是该神经网络也面临一些问题,它只能描述大略的物理模型,无法仿照具有竞争相互浸染的物理系统。

4

人工智能的多体问题寻衅

那么什么是相互竞争浸染呢?我们结合这里的模型进行阐明。
J1-J2模型是一个范例的具有竞争相互浸染的自旋模型。
我们看到图中每个格点上有一个自旋,它们与隔壁的自旋有相互浸染,个中J1描述两个最近临的格点上的自旋相互浸染,J2则描述了两个次隔壁格点上自旋的相互浸染,也便是对角线上的相互浸染。
如果相互浸染的J大于0,则意味着这两个格点的自旋都方向反平行。
当J1, J2 都大于0时就会涌现问题,即如果隔壁格点是反平行,那么次隔壁格点就一定是平行的,这就和J2相互浸染的哀求抵牾。
该种带有竞争相互浸染的系统被称为阻挫系统。

打个比方,一个员工可能有两个老板,个中一个老板哀求你向东走,另一个哀求向西走。
则此时会产生抵牾(Frustrated Interaction)。
当然,如果个中一个老板很强势,我们随着强势的走。
但是如果两个老板半斤八两,你就会很迷茫。

对J1-J2模型也是如此,如果J1较为强势,那么系统中的自旋会方向于做出棋盘形状的持续排列。
如果J2更强势,自旋则会沿对角线进行反平行排列。
当两者相互浸染效果附近时,则会产生更多丰富的物理征象。

J1-J2模型十分经典,人们对其基态进行了长期的研究。
目前针对J1较强,以及J2较强的情形研究已经较为清晰的结论,但是对付J1-J2共同浸染的中间区域,一贯存在争议。

对付该区域的基态,人们有几种不同的意见。
比如,有人认为格点可以形成Plaguette态,Plaguette态是一个规则有序的态;此外,也可能会形成Columnar态;也有人提出,可能个中便是一种混乱无序的状态,即自旋液体态。
自旋液体态十分繁芜,有着非常繁芜的量子纠缠和奇异量子行为。
Philip Anderson认为量子自旋液体是研究高温超导的关键问题之一。

5

深度学习和量子多体

之前的玻尔兹曼机模型是无法很好地仿照该场景的。
在该方法中,它将波函数视作所有可能自旋构造的叠加,个中W(S)便是自旋构型的权重,该权重在海森堡模型中都是>0的,但是在有竞争的模型中正负都有可能。
因此在玻尔兹曼机模型中,就无法处理此类同时具有正负情形的波函数。

为此,我们提出利用深度卷积神经网络来描述波函数。
我们的网络包括了很多Building Block,每个Block又分为多种算子,包括卷积、Max pooling和反卷积等。

当我们输入一个自旋构型,该网络可以给出有正有负的构型权重,此时的参数量是随格点数量线性增长,而非灾害的指数形增长,这就意味着我们的神经网络可以利用有限扩增的参数量来仿照出系统中指数增长的Hilbert空间。
当然这个空间也是仅在基态附近的部分。

当我们确定了神经网络的构造来仿照波函数后,主要的是须要得到系统的基态,所谓基态是指系统的能量最低态。
也便是我们须要通过神经网络求解系统能量最低态的参数。

这里的能量可以表示成所有自旋构型加权求和的形式,因此可以利用马尔可夫抽样的办法进行求解。
这是一个范例的强化学习场景,我们可以通过优化系统能量来得到网络参数。

但是这个模型和一样平常的机器学习算法有所差异。
第一,它须要极高的精度,我们须要比其他方法哀求高至少2个量级的精度。
其缘故原由是量子态的求解精度需求极高,眇小的偏差将对基态解产生巨大影响。
此外,系统中可能存在多个局部最优点,若我们用普通方法进行优化,则可能陷入局域极值中。

为理解决这个问题,我们利用SR方法进行办理。
在机器学习中我们常称之为自然梯度法。
为了更新网络参数,我们须要求解能量对参数的多个梯度,为了打算梯度相,我们须要进行求导,并求解关联矩阵的预处理,加速收敛。

这里的打算热点包括马尔可夫采样。
由于我们须要打算关联矩阵,须要50万sweep的自旋样本,每个sweep都须要对所有网格进行翻转。
但是在sweep之间是不须要进行求导和反向传播的,我们只须要正向实行,并在全部sweep做完后进行反向传播,以此降落通讯韶光占比,以及打算量。

另一个打算热点是SR优化方法。
在SR算法中一个主要步骤是打算大的关联矩阵,然后求解线性方程组。
详细哪部分的耗时是最严重的,实在是由模型参数大小所决定的。
如果系统越大,采样越耗时,参数越多,SR方法的耗时越大。

6

实际效果

我们分别在自己的机器以及新一代的神威机上进行了验证和支配。
神威机具有异构的构造,其NPI处于核组之间,因此有64个组合。
在核组级别上的并行实质是线程并行。
神威机的异构构造很适宜此类运用,因此为了最大化利用神威机的能力,我们针对神威机的特点和运用特点设计了双层并行方案。
首先在核组之间的并行被用作自旋采样,即每个自旋支配在不同的核组之上进行独立采样。
在求解线性方程组的时候,会利用ScaLAPACK进行打算划分。
在并行内部,我们利用卷积算子从核加速,并利用网络输出时采取批次>1的打算,将从核的打算性能妥善利用。

这是我们的程序在新的神威机上的移植和优化的示意图全览。
可以看到在不同的核组之间我们进行了单独独立的采样;采样后将其网络并打算关联矩阵,并求导更新参数。
这项事情最大利用了10万核组测试。

在性能表现方面,我们比拟各个主机的用时结果。
从上图中我们可以看到,我们分别比较了16000个参数,和10万个参数的场景。
不论参数量如何,其紧张的打算韶光还是集中在前向打算部分,SR优化的占比只有1/4旁边。

本事情的另一个优点在于其可迁移性极高。
我们首先可以在较小的神经网络中进行学习,而后将其扩展到体历年夜的网络中。
在实践中,迁移后常日只须要几百步便可以使大网络收敛,这无疑加速了模型的演习和运用。

这里我们比拟了性能。
绿色和棕色线都是直接学习的结果,蓝色和赤色是迁移的结果。
通过图中结果我们知道,如果利用直接学习,则网络很难收敛到最佳结果,而迁移则极大加快了这个最优化的过程。

我们也剖析了基态能量部分的外推结果,经由打算创造,能量在网格达到24×24后便逐渐收敛,我们也对多种磁序进行外推,比如Dimer序和反铁磁序。
结果创造,系统在中间区域的基态是自旋液体相。

与之前的最佳结果比拟,我们的上风在于,网络的扩展性更高,也便是可以处理的系统尺寸更大,具有极好的迁移学习特色。

不才一步事情中,我们将连续进行干系研究,紧张优化卷积算子的性能,提高神经网络的打算速率;优化ScaLAPACK库,提升优化算法的速率;增加网络参数,得到精度更高的基态。

该模型可以进一步拓展到其他种类模型上,比如三角格子、六角格子和kagome格子等场景。
我们还可以在隔壁、次隔壁浸染的根本上添加次次隔壁的相互浸染。
这些物理模型都有其分外物理征象。

该模型还能用在费米子(电子)模型比如t-J模型上,我们初步的测试目前来看效果很好。

但是当前我们的研究还是限于系统的基态,即T=0K的场景。
而真正有限温度下的系统,可能存在更丰富的物理系统属性,可以打算更多的物理量和实验进行比拟。

有限温度的研究是个极大寻衅。
由于绝对零度场景下系统处于基态,因此可以利用波函数进行描述。
但是当温度不即是零时,系统处于混态,就必须利用密度矩阵进行描述。
此时样本空间将会成倍的增加,因此须要更多的网络参数,乃至到达100万旁边的级别。

雷峰网雷峰网