“AI原生”时代光降根本举动办法怎么建?_芯片_模子
在业内人士看来,这便是最好的AI Native(AI原生)根本举动步伐。
如何高效整合异构算力资源
在2024天下人工智能大会(WAIC)暨人工智能环球管理高等别会议上的一场AI根本举动步伐论坛上,业内专家热议这种被称为AI Native的观点。它是指将人工智能融入到各个产品、业务和做事中,从而实现更高效和智能化的运作办法。
“AI Native我们也把它叫做AI原生,这就像是互联网原生的观点,但不同的是,互联网是由流量驱动的,AI是由算力驱动的。”无问芯穹联合创始人、清华大学电子工程系副研究员颜深根表示,“AI时期哀求我们构建新的生态,以适应算力驱动的需求。”
颜深根表示,AI根本举动步伐该当“向上对接应用,向下对接芯片设计与制造工艺”,从而让算力能够更为充分地发挥出来,提升算力的利用效率。
针对如何构建适应多模型与多芯片格局的AI Native根本举动步伐,无问芯穹联合创始人兼CEO夏立雪对第一财经表示:“我们须要供应高效整合异构算力资源的算力平台,以及支持软硬件联合优化与加速的中间件,让异构芯片真正转化为大算力。”
演习和推理是大模型生命周期中不可或缺的两个阶段,都须要强大的算力资源来支撑。然而,比较国际上模型层与芯片层呈现的“双头垄断”格局,中国的模型层与芯片层表现得“百花齐放”,尤其是在芯片层。
异构的芯片之间存在一种“生态竖井”,即硬件生态系统封闭且互不兼容。用了A卡的开拓者,无法轻易迁移至B卡上展开事情,也难以同时利用A卡和B卡完成大模型演习或推理,这导致如果一个算力集群中存在两种或以上的芯片,算力利用方会面临一系列技能寻衅。
在今年的WAIC大会上,无问芯穹发布了环球首个可进行单任务千卡规模异构芯片稠浊演习的平台,具备万卡扩展性,支持包括AMD、华为昇腾、天数智芯、沐曦、摩尔线程、英伟达六种异构芯片在内的大模型稠浊演习,千卡异构稠浊演习集群算力利用率最高达到97.6%。
算力分散且利用效率不高是目前制约海内子工智能技能发展的一个瓶颈。中科加禾创始人兼中科院打算技能研究所研究员崔慧敏表示:“我们必须承认,目前在海内,中间层的AI根本举动步伐仍旧掉队于上层的运用以及下层的芯片。”她也认为,算力优化非常主要,也便是做到在不降落算法精度的情形下,提升算力的性能。
崔慧敏提出,通过构建根本的软件平台层,就能让底下的芯片层以及上面的模型层随意切换。这就像是供应了一个中间的编译平台,让模型、运用可以在不同的硬件平台之间自由移植,同时优化性能,从而补齐AI家当生态的缺位,降落上层运用在国产芯片平台上的落地门槛和本钱,提升多种异构算力的利用和适配效率。
如何打造自主可控的AI生态
随着海内大模型的发展,构建AI家当生态成为业内高度关注的话题。上海算丰信息总经理顾萌指出:“在根本举动步伐培植领域,英伟达生态不可攻破,存在压倒性的上风,这对付我们的AI根本举动步伐如何做事于AI发展,以及AI发展如何反哺AI根本举动步伐的培植提出寻衅。”
科大讯飞董事长刘庆峰在大会上表示:“国产大模型的底座能力决定了企业在这条路上到底能走多远,我们要以长期主义来打造中国真正自主可控的AI家当生态。在国产化的底座下,能为行业带来更高的话语权与安全性。”
在提到AI根本举动步伐培植时,刘庆峰对第一财经表示:“我们希望通过一些技能的创新方法,来提升算力的利用效率,从而填补我们在算力上的某些不敷。”
长期以来,云端大模型和根本举动步伐一贯是AI领域的投资重点。刘庆峰说道:“未来,云、边、端结合软硬一体化一定是大模型发展的一个趋势。”
颜深根认为,在互联网时期,平台霸占强势地位,比如百度、阿里、美团这些大平台是流量的紧张入口,而未来,随着人工智能的发展,端侧智能的能力会迅速增强,平台的收益将会向设备侧转移,这会给端侧带来更加丰硕的利润。
“我们也希望在端侧做一些优化,比如芯片的IP等,但在技能上要实现还面临一定的寻衅,一方面是现在模型本身的规模还比较大,内存方面的问题没有办理,另一方面是要发展端侧,在芯片层面也还有欠缺,海内对大模型的支持还没有空想的办理方案。”他表示。
(本文来自第一财经)
本文系作者个人观点,不代表本站立场,转载请注明出处!