作者 | 程茜编辑 | Panken

珠海出身的GPGPU新势力!清华系芯片老兵创业首款芯片已量产_芯片_动力 云服务

蛰伏六年后,这家清华系AI芯片创企终于开始在国产GPGPU江湖高频出场。

今年4月,海内首款基于可重构架构的GPGPU芯片RPP-R8亮相,现已小规模量产。
其背后的珠海GPU芯片创企芯动力,就此浮出水面。

▲芯动力GPGPU芯片RPP-R8

芯动力创始人、CEO李原是一位芯片连续创业者。
他1989年本科毕业于清华大学物理系,随后任职于英特尔、德州仪器等芯片巨子。
在英特尔任职期间,他曾开拓至强CPU做事器系统,拥有从产品定义、量产到商用的全链条履历。

从德州仪器辞职后,李原2008年在美国加州创立IPG Communications,承接通讯基站大型芯片设计项目。
IPG独创的Turbo译码器被英特尔运用于其至强处理器。
这家公司后来被美国老牌通信芯片商敏讯科技(MindSpeed)收购,敏讯科技的无线业务又在2013年被英特尔收购。

就在英伟达提出GPGPU新观点的前后脚,李原也开始琢磨类似的思路,即如何在发挥GPU并行打算能力和通用性上风的同时,通过引入其他类架构的长处,研发出能更好平衡性能、功耗、本钱、延迟、支配速率的硬件。
从2011年到2016年,经由长达六年的摸索,他们团队独创了一个将NPU的高效率与GPU的高通用性相结合的创新架构——可重构并行处理器架构(RPP)。

他为何早早选择进入GPGPU赛道创业?又如何组建团队,将芯动力RPP架构从图纸中的创新设想,变成了在实际运用处景中发挥代价的硬件?在这外部环境繁芜多变的五年之间,他对AI芯片及GPU行业的发展脉络与方向有哪些新的感悟与思考?近日,芯东西与这位海内GPGPU领域的创业代表人物进行了深入互换。

插播一则会议预报。
9月14-15日,2023环球AI芯片峰会将在深圳举行。
清华大学魏少军教授领衔近50位演讲高朋,NVIDIA与AMD齐聚,15+国产AI芯片企业届时将登台交手,海内边缘打算AI芯片代表公司亮相。
珠海芯动力创始人、CEO李原将在AI芯片架构创新专场,发布主题为《RPP芯片架构给AI芯片带来的发展前景及机遇》的演讲。
欢迎扫码报名~

一、清华物理系校友创业,已在半导体领域深耕19年

创立芯动力之际,李原早已是一位入局半导体行业19年之久的资深老兵。

1989年,他从清华大学物理系本科毕业后,接连远赴日本、加拿大学习无线通信专业。
2004年,李原入职德州仪器,主攻通讯系统研发,在这里,他和芯动力的另一位联合创始人、当时已是德州仪器资深硬件工程师的朱建斌相识,这为多年后芯动力核心团队的组建奠定了根本。

当李原第一次预备创业期间,朱建斌主动提出要转到芯片设计行业,并要从一位硬件工程师跨界成算法工程师,这令李原感到“有点不可思议”。
朱建斌很快凭借其出色的学习能力、抗压能力证明了自己,李原的创业团队也组建就绪。

2008年,李原、朱建斌以及几位来自德州仪器的同事共同创业,在美国加州创办了一家无线通信芯片公司IPG Communications。

他们的初始目标很大略,先靠创业生存下来,再换个视角不雅观察全体半导体行业。
IPG创立后不久就承接设计了休斯顿卫星GlobalStar系统的通讯芯片,自研的Turbo译码器被英特尔运用至其至强处理器,随后在2011年顺利被美国老牌通信芯片商敏讯科技(MindSpeed)收购。

▲芯动力发展进程

这一次创业,也让李原对半导体家当的认识更加深刻,他们创造几个特点:

半导体行业家当链绵长,芯片设计公司便是个中的灵魂。

半导体行业环球竞争激烈,中小规模的公司一直被吞并、收购,很多从业人士被迫转业。
李原的不雅观点是,不能这样,“我们要逆流而上,要去看一看不同的风景”。

竞争激烈的行业共识后,他们还意识到,一旦在半导体行业里处于领先地位,企业就能得到巨大市场。
末了可能形成第一家公司供应产品,第二家公司困难竞争,第三家公司基本不存在的征象。

因此,第二次创业,李原和团队的目标便是:“我们该当成为一家什么样的公司才有可能存活下来。

2011年,他们把各种各样不同种类的芯片摆到一张图上,他们创造个中有一个很大的空缺,在常见的CPU、GPU、DSP,以及专用的通信芯片之外,还有一类芯片的位置空缺,未被创造。

在这个空缺处画下的大大的问号,成为芯动力创立的出发点。
经由5年的探索,2016年他们找到了答案——可重构并行处理器架构。
基于这一创新架构,李原等人先是在美国成立了公司,2017年转返国内,在珠海创立芯动力公司。

二、研发“六边形战士”处理器,已实现千片级小规模量产

芯动力刚刚成立,李原曾问过朱建斌一个问题:什么样的节点代表他们做的事情成功了?朱建斌的答案是:“我们只要把这颗芯片真的做出来,达到了我们预期的性能指标。

今年他们迎来了这一时候。
4月,芯动力发布首款基于可重构架构的GPGPU芯片RPP-R8。

RPP-R8每颗芯片内含有1024个打算核,比较传统GPU架构在同样的算力占用更小的芯片面积,实现了低功耗和高能效的有效平衡。
RPP-R8除了具备专用芯片所没有的通用编程性,面积效率比可达到同类产品的7~10倍,能效比也超过3倍,可知足高效并行打算及AI打算运用。

▲GPU和RPP架构性能比较

这颗芯片于2020年一次性流片成功,李原透露,RPP-R8目前实现上千片级小规模量产,并且已经进行大规模测试,之后他们会根据客户反馈进行产品改动,再连续下一个产品研发。

事实上,基于RPP架构的芯片成果做出来,在成立时的他们看来是不可能的事情。

这背后的缘故原由可以先从现在的三大GPGPU技能流派来看,第一类较多公司采取的是在比较成熟的GPU架构之上,构建矩阵打算的能力;第二类是纯粹基于可重构技能来做;第三类是将可重构技能与GPU编程模型CUDA措辞相结合。

芯动力选择的即是第三类。
李原阐明说,紧张有两大技能缘故原由,首先选择可重构技能是由于,采取传统GPU架构很难追齐行业头部玩家,因此他们须要探求更好的技能;其次,与CUDA措辞相结合是由于其可扩展且广为行业所接管。

走一条全新的路径,也意味着他们一定程度上须要从0开始。
李原谈道,最难的地方就在于,不仅要创新,还要达到市场的需求。

RPP架构是针对并行打算设计的芯片架构,芯动力将其称作“六边形战士”。
这一架构既结合了NPU的高效率与GPU的高通用性上风,还支持实时操作系统(RTOS),具备DSP的低延时,可知足高效并行打算及AI打算运用,大大提高了系统的实时性和相应速率。

芯动力同样制程下的GPGPU芯片,与英伟达比较,在一些场景下性能提高达50%,且面积为类似芯片的1/7,功耗仅为其1/2-1/3。

这背后离不开芯动力的研发团队,其核心成员有均匀年限超过15年的资深半导体从业背景,且均来自英特尔、高通、德州仪器、联发科等半导体有名企业,研发职员占比超过80%。

时至今日,当李原再次问到什么是最大的成功时,朱建斌已经忘却了当初的说法,他的回答变成了:“我们把它在商业上做到成功,我们把这个事情变成一个客户喜好的商品,这样才是真的成功。

三、第一家客户是银行,率先落地三大运用处景

李原也一贯在为做“客户喜好的商品”而努力。

芯动力GPGPU芯片的第一家客户是一家银行。
李原认为,芯片行业周期长,因此芯片设计必须按照产品需求来设计,否则芯片公司拿出的产品很随意马虎因市场需求变革而被淘汰。

因此2017年往后,芯动力团队花了很长一段韶光进行市场调研,调研结果与这家银行的需求不谋而合。
银行希望将智能摄像头的“智能”和“摄像头”区分开,边缘算力盒子可以独立于摄像头进行升级迭代。

李原谈道,这也是他们与同类企业在市场策略上的不同之处——更加强调对付客户需求的剖析。

在这个过程中,他们将客户分为三层,终端用户、软件集成商、硬件集成商。
个中,关注设备功能的终端用户目前不在芯动力的互助伙伴之列。

目前,他们采取的策略是,与软件集成商互助先拿到市场,赢得硬件集成商的认同,进一步推广芯片产品。

芯动力的产品已经在边缘打算领域与银行、通讯领域与医疗超声波方向、AI方向的高性能打算等领域实现运用。

作为家当链的上嬉戏家,芯片行业的封装、模组、软件、芯片本身领域都会影响到干系芯片企业研发或者进入新领域的动作,因此,芯动力目前的策略是把现存的几个方向做踏实,按照节奏来走。

在公司的未来方案中,李原有一个最为清晰的原则,那便是“技能是有边界的”。
放到RPP架构中来说,便是这一架构只做适宜的并行打算,不会做串行打算。

从任职大厂到自主创业、从半导体老兵到创企CEO,这些此前的事情经历及身份的转变,帮助李原为芯动力一步步确立起了清晰的技能路线和运用方向等。
他说,最大的改变是视野不同。
创业之前,有限的视野让他产生诸多困惑,例如自己到底在做什么,做的东西有没有用;创业之后,会更关注面前的困惑,更加重视现在的产品。

四、GPGPU赛道竞争激烈,必须在细分赛道拿下第一

针对当前海内GPGPU家当,李原反复提及四个字:竞争激烈。

海内干系创企迎着半导体热潮涌入GPGPU赛道,李原认为,想要在这条赛道活下来,企业必须拿出产品验证自己存在的代价,在某一些方面超过英伟达,做到英伟达做不到的事。

英伟达这个强大的竞争对手,也是海内GPGPU芯片走向落地的最大拦路虎。
李原感慨道,最高端,英伟达的A100、H100芯片拥有市场其它芯片无法匹敌的能力;最低端,英伟达的芯片同样在性能、价格上有竞争力。

面对这一劲敌,李原认为,环球竞争激烈的半导体家傍边,他们必须超过第一位,成为这个赛道的龙头,才有可能生存下来。
想要和英伟达竞争,就要先从与之不同的行业切入。
他补充道,英伟达虽然有不同产品,但不见得其产品在每个行业都无可替代。
深耕这些行业,使得产品在性能、价格上拥有竞争力是芯动力目前最主要的事情。

此外,当下大模型狂潮席卷,GPU缺货风波不断,也为GPGPU家当带来了很好的机会。
在李原看来,紧张有两个方向:

首先是AI演习,参数规模弘大的大型措辞模型,须要强大的打算能力,海内创企未来的技能演进或许能知足这一需求。
不过,目前而言,英伟达在这一方向的领先性鲜少有企业可以与之反抗。

其次是运用部分,大型措辞模型在运用真个打算需求,一样平常芯片也可以知足,因此这对付海内创企而言是一个巨大的机会。
即便大型措辞模型间隔未来真正落到某一个场景还有一段间隔,但李原对这个方向十分乐不雅观,其现在面临的局限性未来有机会被冲破。

就芯动力而言,他认为,大型措辞模型呈现出的能力和人比较还有一段间隔,芯动力会在自己的技能上做一些思考,如何找到创新的芯片架构路径,使得大型措辞模型性能达到替代人的地步。

末了,在半导体行业的漫漫创业路中,李原说:“要保持乐不雅观。
”他和团队选择了一条困难的路创业,正由于他们没有在全体半导体行业走下坡路时放弃,现在也幸运地碰到了个中为数不多发达发展的好机会。

结语:国产GPGPU新秀发力,核心团队离不开三大要素

GPGPU将GPU的运用范围扩展到了图形打算之外,在浩瀚大规模并行打算中得到了广泛的运用。
今年芯片实现小规模量产的芯动力开始在这一领域崭露锋芒。

李原总结了芯动力核心研发团队具备的几大核心要素:

首先要有资深从业背景,芯动力的研发团队准入门槛非常高,有闇练研发履历、长于从事这一行业的事情,是最最少的哀求。

其次,要对新技能保持开放的心态,他说:“当我们把这件事情做的很好的时候,我们每每会给自己画地为牢,走出来是很难的。

第三,研发团队要有激情,碰着寻衅不低头。
芯动力选择的路线是没人做过的事情,因此挫折每每更多。

对付GPGPU赛道则更为困难,英伟达身处霸主地位已经成为业界共识,另辟路子的芯动力或许有望通过“六边形战士”的RPP架构,在部分特定能力上做到超越英伟达。

在今年9月14日-15日举行的2023环球AI芯片峰会期间,李原教授将对RPP芯片架构给AI芯片带来的发展前景及机遇进行深入解读,分享这一架构在适配各种不同AI算法和运用处景方面的通用性,以及如何为AI企业供应强大的打算能力,推动AI产品的运用落地。