审校 | 梁策 孙淑娟

简介

若何打造一支高效率的人工智能团队?_人工智能_数据 云服务

本文将先容把机器学习根本举动步伐、员工和流程领悟的办法,以实实际用于企业的MLOps(面向人工智能系统的运维管理)。
本文希望对旨在以高效人工智能团队开拓强大的人工智能/机器学习(AI/ML)项目的经理和主管供应启示。

本文的履历来自Provectus公司的人工智能团队,该团队在人工智能技能的不同发展阶段先后与多家客户有过成功的互助。

若何才算是一支平衡的人工智能团队?

几年前,AI/ML(人工智能/机器学习)项目中相称一部分事情是由数据科学家卖力完成的。
虽然有些团队依赖更前辈的角色与工具的组合来完成任务,但是由数据科学家通过自己的条记本电脑来处理干系模型已经成为行业常态。

如今,仅仅雇佣一名数据科学家已经不敷以快速、高效、大规模地将一个可行的AI/ML项目交付生产。
更现实的方案是,这些项目最好由一个具有多个角色的跨职能、高绩效的团队来协作完成——每个角色仅卖力处理自己的ML根本举动步伐和MLOps部分。

在当代团队中,数据科学家或公民数据科学家仍旧是不可或缺的成员。
数据科学家是卖力从整体上理解数据及干系业务的主题专家。
他们是数据挖掘、数据建模和数据可视化方面的实际操作职员,此外还关注数据质量和数据偏差问题、剖析实验和模型输出、验证假设并为ML工程路线蓝图出谋划策。

一支平衡的人工智能团队还应包括一名ML工程师,但其技能与数据科学家不同。
他们该当在特定的AI和ML运用程序与案例方面拥有深厚的专业知识。
比如你想要构建一款打算机视觉运用程序,那么ML工程师该当理解打算机视觉方面前沿而广泛的深度学习模型知识。

理论上讲,每个ML工程师都该当具备MLOps专业知识,但对付ML/MLOps根本举动步伐本身(包括干系工具和组件)来说,所有这些都交由专门的MLOps专业职员卖力会更好。

项目经理还应接管实行ML和AI项目的培训。
传统的Scrum或Kanban项目事情流已不适用于ML项目。
例如,在Provectus公司中,我们采取一种特定的方法来管理ML项目的范围和时限,并设定公司各业务利益干系者的期望值。

下文中会更详细地磋商这个中(以及其他)的每一个角色,并阐明它们如何映射到ML根本举动步伐、MLOps支持流程和ML交付方面。
这里要传达的信息是,人工智能团队急迫须要一种平衡的组成,以实现MLOps并加速人工智能技能的采取。

有兴趣的读者可参阅“Provectus和GoCheck Kids公司如何在视觉筛查中共同协作构建ML根本举动步伐以提高可用性”(原文链接https://aws.amazon.com/cn/blogs/apn/how-provectus-and-gocheck-kids-built-ml-infrastructure-for-improved-usability-during-vision-screening/)。

打造人工智能团队的管理寻衅

除了实际的团队组成之外,有效的管理对付使AI团队与ML根本举动步伐和MLOps根本同步是至关主要的。

从管理角度来看,一个范例的组织构造该当包括以下成员:

卖力向工程副总裁申报请示的业务部门和传统软件工程师卖力向根本举动步伐副总裁申报请示的DevOps专业人士和根本举动步伐专家处理数据的数据科学家,常日直接与商业利益干系者互助数据工程师,他们构建的系统旨在将原始数据转换为数据科学家和业务剖析师可用的信息

从上图不丢脸出,这种组织构造很随意马虎带来部门孤岛等寻衅,例如:

1. 由于公司对ML事情流和AI项目管理的理解有限,上述团队中没有人完备理解如何将业务目标转化为在生产中推出的AI产品。
因此,无法管理项目的界线和KPI(关键绩效指标),导致无法知足业务利益干系者的期望。

2. 一些公司试图将人工智能项目委托给现有的数据科学团队。
然而,这些团队过去一贯在自己的孤岛上事情,而且他们依赖于不适用于人工智能/机器学习项目的数据科学方法。
结果是,他们开拓出的是未成形产品以及根本无法支配莅临盆中的项目。

3. 其他一些公司则常日选择将人工智能项目或者分配给传统的Java和.NET程序员或者利用第三方ML API。
这种方法每每也会失落败,由于他们仍旧须要深入理解数据及其底层算法才能有效地利用这些API。
结果,他们终极以数据科学代码的形式背负着越来越大的技能债务,而这些代码永久不会投入生产。

实在,办理这些寻衅的办法在于找到一种人与工具之间的适当的平衡。
在本文所供应的方案中,这意味着须要一个平衡的AI团队,他们能够利用端到真个MLOps根本举动步伐进行协作和迭代开拓。

切不可大略地雇佣MLOps专家或购买MLOps平台,我们须要的是让一个强大的根本举动步伐和一个平衡的人工智能团队两者结合,只有二者共同努力才能让你的AI/ML项目终极落地。

一个平衡的人工智能团队和MLOps根本举动步伐如何协同事情

在一支平衡的人工智能团队和MLOps根本举动步伐之间,一些详细角色的协同浸染可以通过下面这个三层生态系统来形象展示:

1. 最底部的第一层是MLOps的根本举动步伐主干,由云端与安全专家和DevOps支持。
这一层承载基本的根本举动步伐组件,如访问、网络、安全和CI/CD管道。

2. 第二层是MLOps的可共享和可重用的资源部分。
这一层由ML工程师和MLOps专业职员管理,包括配备有各种图像软件、内核及模板运用的Notebook;包含被视为共享资源的组件和库组成的管道;实验;数据集和特色数据;还有模型部分。
这一层的每一项资源都可以被不同的团队利用和重用,从而加快人工智能的开拓和采取。

3. 第三层是人工智能项目,由数据科学家、全栈工程师和项目经理卖力。
这一层独立于其他两层,但由这两层启用。

请把稳,云端与安全、DevOps、ML工程师和MLOps角色位于不同的层之间,并为彼此做出贡献。
例如:

云端及安全部分拥有根本举动步伐主干网,但它们也卖力重用资源层,确保所有组件和检讨都到位。
DevOps专业职员卖力底部两层的自动化任务,详细包括从自动构建到管理环境等任务。
ML工程师拥有MLOps根本举动步伐和项目专业知识。
他们卖力重用资源层的各个组件。
MLOps专家与ML工程师携手互助,但他们拥有全体根本举动步伐(例如亚马逊的机器学习平台做事SageMaker以及谷歌发布的机器学习工具库Kubeflow等),终极目标是把统统都领悟在一起。

与此同时,公民数据科学家可以优先履行特定的AI/ML项目,紧张通过Notebook事情。
他们可以拥有ML管道的特定部分,但不会被迫进入MLOps“缭乱”的部分。
全栈工程师卖力实现AI产品从UI到API的常规软件部分,受过ML培训的项目经理则卖力产品的履行。

当然,上面仅是一个抽象的表述。
下图给出的是一个可供参考的根本举动步伐,个中紧张展示了根本举动步伐中主干部分的组成部件。

在这里,我们看到数据科学家可以通过工具来处理原始数据,在他们的Notebook中进行数据剖析并完成考验假设。
他们可以在ML工程师管理的实验环境中轻松运行实验。
实验环境由共享和重用的组件组成,如特色存储、数据集天生、模型演习、模型评估和预配置的数据访问模式等。
这使得繁琐、随意马虎出错的任务能够自动化,同时又不会把数据科学家逼出他们的舒适事情区。

另一方面,ML工程师卖力将ML模型产品化。
这意味着,他们能够开拓出将在生产环境中利用的算法代码和数据预处理代码。
其余,他们还可以为实验环境搭建和运行各种管道。

末了,DevOps专业职员可以帮助高效地管理所有根本举动步伐组件。
例如,在我们的参考体系架构中,通过从1到4的大略的几个数字即可以演示出由DevOps处理的CI事情流。

结语

真正使MLOps在企业中落地须要韶光和资源。
最主要的是,你须要理解MLOps与人和流程的关系,就像它和实际技能的关系一样。
如果你能够组织特定的角色和功能,并将它们与机器学习根本举动步伐的相应组件相匹配,问题就不会过于繁芜。
记住:职员+根本举动步伐= MLOps。

在Provectus公司,我们已经成功地帮助企业构建出前辈的AI/ML办理方案,同时培养了高效的AI团队,并为MLOps供应强大的根本举动步伐支持。

【注】本文作者Stepan Pushkarev是Provectus公司的CEO、CTO和联合创始人。
Provectus是一家人工智能咨询和解决方案供应商,目标是帮助企业加快人工智能技能的采取并促进增长。
Pushkarev在Provectus公司率先提出了针对特定行业的人工智能办理方案的愿景,该办理方案有助于重塑企业运营、竞争和供应客户代价的办法。
此外,Pushkarev还是一位在机器学习、云打算和分布式数据处理系统方面拥有深厚专业知识的见地领袖,他在开拓专业的做事业务和创建SaaS技能方面都有过出色的古迹。

译者先容

朱先忠,51CTO社区编辑,51CTO专家博客、讲师,潍坊一所高校打算机西席,自由编程界老兵一枚。
早期专注各种微软技能(编著成ASP.NET AJX、Cocos 2d-X干系三本技能图书),近十多年投身于开源天下(熟习盛行全栈Web开拓技能),理解基于OneNet/AliOS+Arduino/ESP32/树莓派等物联网开拓技能与Scala+Hadoop+Spark+Flink等大数据开拓技能。

原文标题:​People Management for AI: Building High-Velocity AI Teams​​,作者:Stepan Pushkarev