中国超算新命题：AI+大年夜数据若何重塑“国之重器”？_数据_中心

2024-12-22 06:03:21 科技快讯

可以说，超算的算力表现，是一个国家科技发展水平和综合国力的标志之一。

中国超算新命题：AI+大年夜数据若何重塑“国之重器”？_数据_中心科技快讯

今年早些时候，伴随第 53 届天下 500 强（Top 500）超算排名公布，新的排名结果也造诣榜单出身 26 年以来的一个里程碑：榜单上的末了一位是一台遐想超算，但其运算速率都达到了 1.022 petaflops（千万亿次），宣告 Top 500 榜单的算力整体进入到“Petaflop 时期”。

进入到“Petaflop 时期”，还只是一个榜单在数字上的朴素定义。

背后更主要的蜕变趋势是，以超算为代表的高性能打算不仅在传统科学与工程打算领域承担主要的创新根本举动步伐浸染，同时与人工智能、大数据的领悟趋势也日益明确，打算的定义变得更加广泛。

正在路上的中国 E 级打算机将是一个范例代表。
它将会是一个超算与大数据、人工智能深度领悟的高性能打算做事平台。

按照此前的公开说法，最新一款 E 级超级打算机将是我国自主研发的新一代百亿亿次超级打算机，估量于 2020 年完备研制成功。
凭借于此，中国有望再回超算排名榜首，由于按照公开的进度，目前位列榜单前排的美国、日本和欧盟均已提出 E 级超级打算机的研制操持，险些都是在 2021 年旁边完成。

环绕着超级打算机和各大超算中央，各种新运用也在问世。
例如，长沙的超算中央正在进行大量的 AI+医疗、基于超算的精准医疗项目。

伴随生物技能和医学信息化匆匆使每年产生的 PB 级生物医学大数据，超算让科学家们利用生物信息解密疾病机理、实现精准医疗成为可能，尤其是利用同时涵盖电子病历、医学图像等信息的多模态医学大数据。

图｜AI 医疗的 3 类技能和 3 个阶段（来源：CNCC2019 超算论坛）

在 10 月 17 日的 CNCC2019 超算论坛上，国家超级打算长沙中央副主任彭绍亮分享道，长沙超算中央的团队正在从诊前、诊中、诊后三个阶段，研发能够支持和赞助年夜夫进行全方位精准的智能诊疗技能，例如挖掘电子病历数据中的信息进行临床终点预测，干系的论文即将面世。
此前业内比较有名的类似事情是谷歌团队揭橥在 Digital Medicine 上的成果。
除此之外，一款区块链药品溯源平台也正在路上。

据理解，2009 年起到现在，中国已先后在天津、深圳、济南、长沙、广州、无锡建成 6 家国家级超算中央。

6 家超算中央发展至今，也是中国超打算技能创新与运用创新的相互耦合十年。
那么，接下来，在大数据、人工智能时期，超算又将如何与其领悟发展？

简而言之，超算为 AI 供应打算根本举动步伐，大多数的 AI 算法本身则须要由大数据驱动。

AI 和大数据技能深度交融提出的新的寻衅和需求，正在引领高性能打算的发展方向。

天津大学胡清华教授认为，详细而言，大数据提出的几个寻衅在于，信息来源多元，数据形式异构，和小数据比较不愿定性变得越来越强。
因此，以机器学习为例，如何针对大数据进行 AI 建模将变得越来越主要。

（来源：CNCC2019 超算论坛）

上海交大教授陈海波则提到，在面向大数据的操作系统上，大数据的处理正在从粗放走向集约，性能、本钱、功耗等多方面的约束为面向数据的系统构造设计供应了新的维度。
一方面，众核 CPU、新型存储器件、开源硬件等的涌现为面向大数据的系统构造供应了新的机会；另一方面，新型运用对时延、吞吐等方面哀求的不断提升对大数据的系统构造提出了新的寻衅。

他指出，人机物领悟大数据操作系统正在涌现三堵墙：1、数据墙——随着算力的不断增加，数据的传输能力远小于算力增长；2、时延墙——智能驾驶、安防、医疗等交互过程的强实时性，但泛在运用在云、边、墙上却存在动态任务分割；3、异构墙——多种智能硬件和传统硬件共存，任务须要云边端协同。

与此同时，大数据处理也在给数据中央能效带来寻衅。
IDC 报告预测，2018 年至2025 年，中国数据总量将以 30%的年均匀增长速率领先环球。
估量到 2025 年，中国的数据总量将占环球数据总量的27.8%，位居天下第一。
而海量的数据绝大部分都将储存在“云端”——数据中央内。
近年来，国家和地方干系部门都发布了浩瀚政策文件，以掌握新投建的数据中央的能耗。
不少企业已开始在数据中央的大数据处理低能耗技能上发力。