小编
去年算法岗秋招哀鸿遍野,根据目前知乎与脉脉上各大企业HR发布的数据,达到了胆怯的100:1,打算机视觉岗位尤其如此。 究其缘故原由,随着深度学习的框架越来越便利,开源代码越来越丰富, 打算机视觉的入门门槛低得恐怖 (不论是 打算机、自动化、数学等理工科专业的同学,还是经管类、商科类专业的同学,多多少少都跑过深度学习模型) 之前我们总是想尽办法追求算法能达到多少准召率,但在实际落地时却创造这些SOTA推理太慢,压根不符合实际,比如自动驾驶中希望图像或点云感知算法能达到100-200Hz,但大部分算法只能达到30-50Hz。这时 算法支配工程师派上极大用场!
顾名思义,便是将算法在嵌入式设备端或者做事器端进行推理支配,尽可能对算法进行优化和加速以知足实时性需求。支配岗位常日哀求的技能点为熟习CUDA开拓与TensorRT支配

CUDA是NVIDIA推出的运算平台 ,TensorRT是NVIDIA推出的高性能的深度学习推理(Inference)优化器,是目前运用最广泛的推理框架之一,在超大规模数据中央、嵌入式平台、自动驾驶平台等运用十分广泛。
虽然NVIDIA有官方的TensorRT文档以及案例库,但英文的材料对初学者入门并不友好。为此,深蓝学院与腾讯高等研究员一起研发了 《 深度神经网络加速:cuDNN 与 TensorRT 》 的课程, 面向就业 ,细致讲解CUDA运算的理论支撑与实践,以及cuDNN、TensorRT这两个当下最热门的深度神经网络加速的工具。
毕业后一贯在腾讯从事语音领域深度学习加速上线事情。近10年 CUDA 开拓履历, 近5年 TensorRT 开拓履历; Github TensorRT_Tutorial 作者。 紧张方向为自然措辞处理、智能语音及其在端侧的支配。博士毕业于清华大学,在各种国际AI会媾和刊物中揭橥论文10篇以上,多次得到NIST主理的国际比赛top 2成绩。近年来紧张研究方向为AI在场景中的落地运用。 1. 内容精简: 主讲CUDA核心的并走运算操作
2 . 知识前沿: 本期课程涵盖当下主流的深度学习模型加速工具
1. 人工智能领域的算法或者开拓工程师,尤其是事情涉及深度学习的模型。 2. 希望学习并行打算系统的科研事情者以及工程师。 1. 节制CUDA并行系统的剖析、开拓、调试与优化方法。 3. 理解cuDNN与TensorRT两个深度学习模型的加速工具