今年早些时候,英特尔发布了第四代至强可扩展处理器Sapphire Rapids。
由于内置了用于加速深度学习实时推理和演习性能提升的英特尔AMX加速器,因此矩阵乘法运算性能得到了大幅提升,与上一代比较,第四代英特尔至强可扩展处理器将PyTorch实时推理和演习性能提升了10倍,将广泛的AI事情负载的推理和演习性能提升到了新的高度。

第四代至强可扩展AI机能有多强?最新MLPerf基准测试结果展示强劲机能_英特尔_处置器 AI快讯

就在最近,MLCommons公布了针对AI模型演习的行业标准MLPerf演习v3.1基准测试结果。
作为唯一提交MLPerf测试结果的CPU,第四代至强可扩展处理器在测试中展现出强大的性能,进一步印证了英特尔对加速在云、网、边、真个事情负载中大规模支配AI的承诺。

本次测试中,英特尔提交了ResNet50、RetinaNet、BERT和DLRMdcnv2的测试结果。
值得把稳的是,在DLRM dcnv2这一个新提交的测试模型中,第四代英特尔至强可扩展处理器仅利用四个节点就在227分钟内完成了演习。
而对付ResNet50、RetinaNet和BERT,第四代英特尔至强可扩展处理器亦展示出了强大的开箱即用的性能。

今年早些时候,MLCommons也分别公布了三次测试结果,在此前的测试里,英特尔提交了基于第四代英特尔至强可扩展处理器的多个推理基准测试,结果显示,包括视觉、措辞处理、语音和音频翻译模型,以及更大的DLRM v2深度学习推举模型及60亿参数大措辞模型及打算机视觉与自然措辞处理模型ChatGPT-J在内,第四代英特尔至强处理器对付通用AI事情负载拥有出色的性能。
英特尔也与OEM厂商互助提交了测试结果,进一步展示了其AI性能的可扩展性,以及基于英特尔至强处理器的通用做事器的可获取性,充分知足客户做事水平协议 (SLA)。

第四代英特尔至强可扩展处理器的强大性能为企业供应了“开箱即用”的功能,可以在通用系统上支配AI以用于数据预处理、模型演习和支配,从而得到兼具AI性能、效率、准确性和可扩展性的最优组合,避免了引入专用AI系统的高昂本钱和繁芜性,其范围覆盖了多个框架、端到端数据科学工具,以及广泛的智能办理方案生态系统。
许多企业可以在其现有的企业级IT根本举动步伐上利用通用CPU进行高性价比、可持续地演习中小型深度学习模型,尤实在用于演习工具是间歇性事情负载的用例。

出货量方面,目前第四代至强可扩展处理器已出货一百万片,并凭借其强劲的AI性能被本地生态伙伴广泛运用于浩瀚领域。
在于百度智能云9月发布的新一代云做事器BCC实例中,第四代至强可扩展处理器以AMX加速器扩展AI算力,从而使百度智能云用户在任何实例上轻松获取原生的强大AI能力。
得益于英特尔AMX指令集针对矩阵运算的强大加速能力,腾讯BERT模型BF16吞吐量得到大幅提升,从而有效地优化了其AI用户的终端体验。
通过AMX INT8及BF16的不同精度数据处理、AVX-512的深入调优,以及英特尔软件的加持,阿里云地址标准化业务和淘宝搜索的定制化推举业务实现了大幅性能提升。

目前,第四代至强可扩展处理器已经助力亚信、用友、金蝶和东软等独立软件做事商实现在OCR等领域的多项业务升级,助力其成功应对来自不同运用处景的多样化AI事情负载需求。

“AI代表着新时期的到来。
AI正在催生环球增长的新时期,在新时期中,算力起着更为主要的浸染,让所有人迎来更美好的未来。
对开拓者而言,这将带来巨大的社会和商业机遇,以创造更多可能,为天下上的重大寻衅打造办理方案,并造福地球上每一个人。
“在今年的英特尔on技能创新大会上,英特尔公司首席实行官帕特·基辛格如此形容AI带来的时期机遇。
以第四代至强可扩展处理器为代表的硬件产品和开源的软件堆栈和开放的生态,正在不断夯实英特尔在AI时期的布局,以知足千行百业对多重性能、能效和易用性的动态哀求,进一步推动AI运用落地。

(8422223)