国产大年夜模型清晨时曙光全栈AI亮剑_曙光_模子
作者 | 三北编辑 | 漠影
随着大模型发展中的硬件瓶颈凸显,软件优化成为一条必由之路。
在近日举办的2024中国天生式AI大会上,国产算力龙头中科曙光亮出AI软件“肌肉”,推出曙光AI根本软件系统DAS,为大模型迁移和优化供应了一条新捷径。
众所周知,中科曙光是国产算力之光的代表。在大模型的驱动下,曙光又建立起了软硬一体和AI全链路能力,展现了算力玩家能力扩圈的新趋势。
大模型的发展势不可挡。国际数据公司IDC的报告预测,2024年企业在AI上的投入增长将高达250%。大模型发展对算力做事提出了什么新哀求?曙光AI根本软件系统DAS能供应什么样的升级做事和真实代价?
通过对话中科曙光智能打算产品奇迹部副总经理胡晓东,本文对此进行了深入磋商。
一、大模型催生AI新沙场,国产算力龙头“变软”大模型家当正进入高速发展期,所需的不再是单项算力能力,而是多维综合能力。
根据IDC中国副总裁钟振山在近期中国ICT市场趋势论坛上的发言,2024年大模型发展涌现五大趋势:中国大模型在2024年“卷”向家当;开源和闭源共同促进运用生态繁荣;大模型走向手机、PC等端侧;多模态将匆匆使杀手级运用涌现;新一代AI根本举动步伐成为下一个沙场。
在AI根本举动步伐新沙场,以曙光为代表的核心根本举动步伐领军企业已经提前布局。
胡晓东见告智东西:“我们深知算力是AI技能发展的核心驱动力。然而,仅拥有强大的硬件算力是不足的,须要软硬一体化的能力支撑AI技能的落地运用,并联合伙伴一起打造完全的AI生态圈。”
在与客户深入互换的过程中,胡晓东和他的团队创造许多客户在AI运用过程中面临着各类寻衅,如模型演习效率低下、算法支配困难、算力资源利用率不高档问题。这些问题严重影响了AI技能的遍及和运用。
为理解决这些问题,曙光在今年推出了DAS人工智能根本软件系统,帮助客户更快速、更高效地实现AI技能的落地运用。
曙光深耕算力底座根本能力几十年,自1993年研发出海内首台全对称共享存储多处理机系统曙光一号之后,逐步完成了对算力家当的百口当链覆盖,近年来还推出了海内首款规模化量产液冷做事器等核心高端硬件,成为核心硬件实力担当。
DAS人工智能根本软件系统,是这家算力龙头向全栈AI阶段迈出的关键历史性一步。
合营曙光根本硬件及开拓工具栈等能力,DAS人工智能根本软件系统聚焦打造一套完全的人工智能软硬件生态体系,帮助用户抵达AI运用迁移、开拓及迭代的“末了一公里”。
胡晓东谈道,DAS人工智能根本软件系统是从2019年就基于曙光过往的技能及项目积累开始投入研发的,经多年不断发展,近期逐步产品化并对外发布:
1、首先,打造算力根本举动步伐是曙光在全国产化能力上构建的一个最坚实的根本。
2、第二个是软件生态,只有通过软件才能真正将算力发挥出来。
3、第三方面是平台层,该当是能将底层的硬件能力、软件能力实现打包统一化交付的能力,依托平台将全体算力以做事的形式交付到用户手上。
可以看到,大模型催生了AI算力新需求,而国产算力之光主动选择“变软”,背后是对AI家当需求和痛点的深入洞察。
二、软件扛着硬件跑,曙光全栈AI亮剑当下,市情上已经涌现了昇腾MindSpore、阿里魔搭等AI开拓平台及社区,而曙光打造的DAS人工智能根本软件系统的一大差异化是国产化自主可控属性。
胡晓东见告智东西,环绕过往的产品及技能的储备,曙光希望拉通算力底层、软件栈、平台、内容侧,共同打通一套赋能机制,将所有的产品及做事能力化地交付到用户手上,构建出一套国产AI能力化输出流程。
站在大模型闭环角度来看,从模型开拓到场景适配、运用支配,从根本演习到准备资源、准备不同的库去微调,再到压缩、推理、做事,到把这个模型输出,曙光都结合项目履历和伙伴互换情形进行了剖析。
AI赛道性能为王。“每个层级有不同的关注点,对付硬件、软件栈有不同的需求。从算力来讲,通用大模型须要更高算力,很多细分领域则须要更风雅的数据,每个环节有不同的关注特性。”胡晓东在DAS人工智能根本软件系统的发布时说。
曙光如何帮企业快速把高吞吐率的模型演习出来?
DAS人工智能根本软件系统从AI组件的纳管、性能组件的优化、软件工程化能力的培植等多方面来打造AI模型的“发射台”,助力用户更轻松应对AI领域事情运用处景。
1、AI组件纳管:广泛覆盖框架及加速库,保持高速迭代
一方面,AI组件须要广泛的根本。曙光DAS人工智能根本软件系统尽可能适配了市情已经有的不同的框架、加速库,包括演习、推理或者通信,从而得到广泛的根本。
另一方面,软件组件须要高速迭代。比如PyTorch、TensorFlow、PaddlePaddle等主流深度学习框架都会快速迭代,为此曙光开拓了快速适配工具,从而形成快速适配、快速迁移、快速优化的根本体系。
2、性能组件优化:提高打算访存密度,保障组件性能开释
性能组件层面涉及更多“慢工细活”。首先第一个层面须要做根本打算库,担保它有一个根本能力的运行;同时,对付很多访存密集型算子,曙光会做手动的领悟,去提高打算访存密度。
对付高阶开拓者,曙光打造了算子模板库Composable Kernel,供应Tile级风雅的算力能力,便于去快速地天生算子模板。
在编译器层面,DAS人工智能根本软件系统则有Triton、OpenXLA、TVM做整体编译集成,帮助开拓者形成快速整体优化的工具,保障所有的组件快速利用,同时保障性能发挥到极致。
3、软件工程化能力培植:不同组件及策略整合,大规模异构算力加速比达70%
在软件工程化能力的培植阶段,曙光把各样的组件、不同的策略进行了整合。
以大模型演习为例,一方面曙光结合像Megatron-DeepSpeed这样的库以及各种不同策略的组合,用冗余重打算等手段进行整合,提高大模型演习效应。
对付推理层面,曙光通过FlashDecoding、FlashAttention等机制进行优化,去提高模型的吞吐量,降落延迟。在基于24000张卡进行大模型演习案例中,DAS人工智能根本软件系统使得大规模异构算力保持了70%以上的加速比。
总的来说,曙光在性能层面构建了一整套开放的AI全栈优化能力,实现AI全场景框架组件的全面适配,知足AI场景快速变革的需求。
而在软件之上,曙光打造了开拓中台、内容平台、云做事等一整套平台能力,实现各种能力的快速迁移调度,供应完全的云化的做事环境。
可以看到,曙光已经率先“亮剑”,打造国产大模型的AI根本软件“发射台”。
胡晓东谈道,在软件开拓的过程中团队碰着的问题有很多,包括技能难点的占领,关键项目的交付,他们和技能团队,和终极客户、互助伙伴一起,战胜了一个个技能难题,逐步完善了现在的DAS体系。
三、造就软硬一体AI生态,加速大模型落地千行百业“亮剑”AI大模型时期,中科曙光已涉足行业实战。
过去一年以来,曙光逐步完善了集“研发、运用、生产、运营”于一体的完全AI生态链,已经为数字金融、智能驾驶、生物医疗、聪慧通信等领域全景赋能。
近日,某公司自主研发的算力管理平台与中科曙光智能打算产品成功适配,通过高效管理、智能调度和稳定性不雅观测等能力,实现打算资源的最优化管理和利用,显著提升稳定性,降落运维本钱。
某有名家昔时夜模型已在近日与中科曙光智能打算产品成功适配,结合中科曙光智能打算产品卓越的打算能力和性价比,在聪慧城市领域、时空信息领域、企业智能做事等领域供应全国产化行业运用智能体基座,实现全面降本增效。
曙光人工智能根本软件系统DAS在某工业检测领域的运用涉及图像识别、模式剖析和数据预测等方面,大大提高了数据处理的效率,降落了人为缺点的风险,并且极大地提升了该领域工业检测的准确性和科学性。
为了推进AI能力化实践,曙光与产学研互助落地,包括与国内外主流模型适配并探索商业模式,把AI能力输出去用作AI集群的设计,与行业伙伴的业务做结合等,以此把智能算力-大模型-行业AI化的流程走通。
大模型家当发展目前正处于迅猛发展的阶段。大模型在各个领域的运用日益广泛,家当面临着多重利好成分,包括政府层面的有力支持、用户提升生活和事情效率的需求激增,以及科技公司对AI领域的加大投入。
胡晓东说,作为国产算力的领军企业,曙光将持续打造并完善AI打算家当生态,为大模型家当的发展供应了坚实的算力底座。同时,曙光也积极探索大模型在各行业的运用处景,推动AI技能的遍及和运用。
结语:国产大模型清晨时,算力龙头全栈AI亮剑随着“百模大战”进入深水区,模型参数量增长和模型增多带来了底层算力的爆发式需求,也为根本举动步伐厂商带来巨大的机遇。透过中科曙光在大模型时期的AI新布局,我们看到这家算力龙头已将AI生态培植升级为一大计策举措,亮剑全栈AI。
国产大模型清晨时,国外对中国的算力进行禁运,为家当发展带来了严厉寻衅。如果我们把大模型的浪潮比作淘金,首先淘到淘不到不知道,铲子就不足用了。而要办理“铲子”问题,仅靠堆硬件是无法胜任的,而是须要软件加持、软硬结合的闭环思路。
奔到差务,算力龙头开始打造全栈AI能力。以人工智能根本软件系统DAS为抓手,曙光正将其几十年的算力积累与大模型的时期需求和痛点结合,为家当打造优质模型及运用的“发射台”,加速国产AI生态培植,推动国产大模型家当发展的进程。
本文系作者个人观点,不代表本站立场,转载请注明出处!