随着智好手机须要处理的内容变得日益繁芜,用户对当今主流和入门级移动设备的哀求已越来越高。
人工智能技能的日益成熟,以及边缘打算的兴起,使得人工智能成为了提升智好手机体验的主要法宝。
目前浩瀚的高端智好手机都已经开始引入人工智能技能。
去年,华为、苹果等厂商都推出了集成人工智能核心的手机处理器,而作为环球最大的移动芯片IP供应商,Arm自去年以来也在不断的加码人工智能。

Arm人工智能计策揭秘:全新AI处理器机能可秒杀麒麟970的NPU内核_处置器_人工智能 绘影字幕

去年3月,Arm正式发布了全新的DynamIQ技能(详细先容可参考此前文章《ARM全新DynamIQ技能详解:真正的人工智好手机要来了!
》),加入了针对人工智能的指令集和优化库,ARM V8.2版本的指令集开始支持神经网路卷积运算,极大的提升人工智能和机器学习的效率。
随后在去年5月尾,Arm发布了首款DynamIQ技能处理器Cortex-A75/A55。
今年2月下旬,Arm又宣告了针对人工智能的Project Trillium项目,推出了多款独立的人工智能IP。

2018年3月6-7日,Arm在北京召开2018环球技能发布会,再次详细先容了Project Trillium项目,同时Arm还正式发布了全新的面向主流市场的图形处理器Mali-G52,以及面向入门级的Mali-G31。
特殊值得一提的是,Mali-G52还首次加入了对付机器学习的支持,进一步加码人工智能。
而且新的IP套件可与现有基于DynamIQ的CPU和其他Arm IP无缝集成。

Project Trillium:全新人工智能IP

Project Trillium是今年2月Arm公布的针对人工智能的Arm IP 套件。
包括了全新的机器学习处理器IP、目标检测处理器IP和神经网络软件库。

得益于终端侧人工智能市场的快速增长,以及ARM在移动及物联网市场的巨大上风,Project Trillium项目目前紧张针对的也是移动终端和物联网设备。

1、全新架构的机器学习处理器IP

根据Arm及研究机构的估量,到 2028 年,移动设备的数量将从现在的17亿台增长到 22 亿台,智能IP Camera将由现在的1.6亿台增长到13亿台。
在终端侧具有人工智能的设备将会由现在的3亿台增长到32亿台。
足见人工智能市场增长之迅速。
而Arm的机器学习处理器IP的推出则是顺应了市场对付专用的人工智能加速芯片的需求。

据先容,Arm的机器学习处理器IP依托于Arm多年的研究成果,采取的是全新的架构,可以为其CPU和GPU碰着的寻衅供应办理方案。
该架构还为16位整数运算进行了优化。

根据Arm公布的数据显示,其机器学习处理器IP的性能最高可以达到每平方毫米(芯片面积)超过4.6 TOPs的性能,而且在实际运用中,结合系统及运用优化,可以实现2-4倍提升。

那么Arm的机器学习处理器的4.6 TOPs/平方毫米的性能属于一个什么水平呢?我们拿华为麒麟970所集成的NPU来比较一下。

据华为先容,麒麟970集成的NPU专用硬件处理单元,设计了HiAI移动打算架构,其AI性能密度大幅优于CPU和GPU。
相较于四个Cortex-A73核心,处理相同AI任务,新的异构打算架构拥有约50倍能效,以及25倍性能上风,面积只有CPU的1/2,运算能力达到了1.92TOPs。

根据Arm的资料显示,Cortex-A73是采取ARMv8-A架构中核心最小的处理器,每核心面积在0.65平方毫米。
四个Cortex-A73核心,面积至少该当是2.6平方毫米(实际上该当还要大不少)。
那么华为麒麟970的NPU的面积该当是在1.3平方毫米旁边。
换算下来,麒麟970的NPU每平方毫米的性能约为1.48 TOPs。
也便是说,Arm新推出的机器学习处理器IP的单位面积性能至少能达到麒麟970的NPU的4倍以上,确实非常的刁悍。

其余,对付移动设备和一些物联网设备,能效也是非常主要的,Arm的机器学习处理器IP在能效上可以实现3 TOPs/W,Arm认为3 TOPs/W将是移动AI芯片的一个“甜蜜点”。

在Arm看来,其目前的紧张上风还是在移动市场,而且现在很多AI创新都是从移动端发生的。
其余,Arm的业务模式紧张是进行IP授权,这就须要体量比较大的市场来支撑,显然目前移动市场对付人工智能的需求量最最为弘大的。
以是Arm的人工智能处理器会先从移动市场进行切入。

根据Arm的机器学习处理器的路线图也显示,移动市场将会是Arm的机器学习处理器首先切入的市场。
Arm透露,其首款针对移动市场的机器学习处理器IP将会在2018年年中推向市场。

其余,Arm也表示,其机器学习处理器IP是具有高可扩展性、兼容性和可编程的,可以供应打算性能最低从2 GOPs到超过70 TOPs的产品。
除了移动市场之外,Arm的机器学习处理器IP也将会开始向物联网、工业、汽车、网络以及做事器市场进军。

2、第二代的目标检测处理器

除了首次推出的机器学习处理器IP之外,Arm这次还针对安防监控市场带来了其第二代的目标检测处理器。
实在早在2016年Arm就推出了其首款目标检测处理器Spirit,随后被其2016年收购的打算机视觉和图像处理器的公司Apical(其产品覆盖超过15亿设备)所采取,随后广泛的用于英国智能家居品牌Hive安防摄像头当中。
如果说,Arm此前推出的目标检测处理器Spirit是一次试水,那么这次的第二代的目标检测处理器产品则将是Arm全面进军安防监控市场的开始。

根据Arm公布的数据显示,其第二代目标检测处理器可以支持全高清画质下60fps实时检测,支持50×60像素以上的无限数量的目标检测。
其还供应了详细的人体模型供应了丰富的源数据,使人脸、方向、轨迹、姿势和动作检测成为可能。

Arm表示,其还可供应集成办理方案,采取其机器学习处理器+目标检测处理器,可以更高效的实现比如人脸、物体识别等运用。
在实时目标识别任务中,目标检测处理器会首先分离出区域,比如人脸、物体。
这样,机器学习处理器就能够剖析更少的像素,以实现更快、更风雅的结果。

3、神经网络软件库

Arm的神经网络库包括:CMSIS-NN,Compute Library和Object Detection Libraries。

CMSIS-NN是Arm供应的神经网络推理运算库,根据Arm此前的数据,其对付运行韶光/吞吐量将会有4.6倍的提升,而对付能效将有4.9倍的提升;Arm Compute Library是Arm公司去年发布的开源工具,旨在为图像/视频/多媒体/打算机视觉等领域的开拓者供应Arm平台的硬件加速库;Object Detection Libraries则是Arm针对其目前检测处理器的目标检测库。

据先容,Arm的神经网络库可支持主流的神经网络框架,如TensorFlow、Caffe/Caffe2、mxnet等。
此外,Arm的神经网络库还针对 Arm Cortex CPU、Mali GPU 和新的机器学习处理器和目标检测处理器进行了优化。
通过以上这些主流框架,开拓者可以轻松调用Arm的神经网络库API,从而发挥出Arm的AI/ML硬件IP的性能。

Mali-G52发布,Arm GPU首次加入了对付机器学习的支持

在3月6日的发布会上,Arm发布了两款全新的GPU产品:针对中端市场Mali-G52和针对入门级市场的Mali-G31。

个中,Mali G31是基于Arm此前只用于中高端产品线当中的Bifrost架构,是Arm目前最小的GPU,还加入了对付Vulkan的支持。
可以说Mali-G31的推出是Arm首次将之前一些中高端产品的能力开始引入到入门级产品当中。

而Mali-G52则是Mali-G51的升级产品,不仅可从容应对更高的图形繁芜度,许可在主流移动系统的功率和带脱期制内实现更多的机器学习功能。

根据Arm的资料显示,Mali-G52由于采取了更宽的实行引擎,比较前代产品的4线程,Mali-G52最多可供应8线程,可在相同芯片面积上,供应更高的图形性能,性能密度相对付Mali-G51提高了30%。
其余,在能效方面,Mali-G52也提高了15%。
这里须要指出的是,Mali-G52的面积是G51的1.2倍。

当然,更为值得关注的是Mali-G52首次加入了对付INT8数据类型的支持,再加上Mali-G52的实行引擎增加到了8个,使得其可以更加高效的进行进行针对人工智能的运算。

我们都知道,相对付CPU来说,采取GPU来做AI运算效率会更高一些。
以是,我们看到Nvidia的人工智能打算卡紧张也是基于GPU来运算的。

根据Arm公布的数据显示,与Mali-G51比较,在图形识别能力方面,Mali-G52的性能提升了3.6倍,在Yolonetwork卷积性能测试当中,性能提升了3.5倍。

近年来随着Arm GPU产品线的越来越强大,目前Arm的Mali系列GPU已经成为环球出货最多的GPU。
根据资料显示,2017年Arm的Mali系列GPU出货超过12亿颗。
随着这次,Arm首次使得其Mali-G52 GPU开始支持机器学习,相信后续将会有更多的新的Arm GPU也将会支持。

据理解,今年年中,Mali-G52 GPU就将会推向市场。

将人工智能带入到每一个设备当中

Arm认为机器学习正变得日益遍及,可超过多个设备,触达每一位用户。
而Arm的愿景则是让将机器学习在更多智能设备中遍及。

目前一些高端智能设备当中的人脸识别、物体识别、指纹识别、用户习气学习等运用都有用到机器学习,有些厂商还在SoC上配置了独立的人工智能处理器来进行加速。
但是对付目前的主流智好手机市场来说,都配备专门的人工智能处理器并不实际,以是这些任务可以交给SoC上的其他单元来进行 ,比如DynamIQ CPU和Mali-G52 GPU,以提升现有运用的机器学习性能。

Arm资深市场营销总监Ian Smythe师长西席也在会上表示:“对终端设备而言,支持丰富的多层用户界面以及一系列广泛的最新运用已成为一定趋势。
更为主要的是,机器学习不再是高端智好手机的专有配置。
各级用户都希望轻松利用配备机器学习功能的各种APP运用。

当然,对付须要用到专用的人工智能处理器的设备和市场,Arm这次也推出了Project Trillium项目,推出了专用的独立的机器学习处理器IP和目标检测处理器IP。
并且,Arm的机器学习和目标检测处理器IP是具有高可扩展性、兼容性和可编程的,可以覆盖更为广泛的市场。

其余值得一提的是,Arm这次推出的新的Project Trillium项目的IP套件可与现有基于DynamIQ的CPU、Mali-G52 GPU和其他Arm IP无缝集成。

根据IDC的研究数据显示,目前90%的具有人工智能能力的设备都是基于Arm的(紧张是基于ARM的CPU/GPU)。
而随着Arm将人工智能的能力带入其GPU产品,以及Project Trillium项目的推出,再加上去年就推出的针对人工智能优化的DynamIQ CPU,未来这一比例可能将进一步提升。

显然,从前面的一系列先容,我们不丢脸出,现在的Arm已经开始全面拥抱AI,并希望通过AI获取更大的市场份额。

得益于Arm在移动CPU及GPU市场的领先地位和生态上风,随着Project Trillium的推出,Arm的人工智能IP或将成为Arm一条全新的产品线,而且随着人工智能在终端侧的快速发展,未来其有望成为与Cortex系列CPU、Mali系列多媒体IP并驾齐驱的第三大产品线。

作者:芯智讯-浪客剑

_____________________________

更多干货、爆料、独家不雅观点,欢迎订阅芯智讯

官方微信"大众年夜众号:芯智讯