AI产品经理 VS 数据产品经理看这5点差异与联系_数据_产物
人工智能快速渗入到各个行业,AI 产品经理缺口高达 6.8 万,成为稀缺人才。「AI 产品经理」项目面向想要通过AI 技能推动业务发展的产品经理以及商业领导者。
将先容如何创建能带来商业代价的 AI 产品,学习 AI 产品开拓流程。你将跟LineLian学习案例研究、创建数据集,并构建AI模型,闇练节制各种 AI 观点和实用技能并能够构思、开拓、评估和履行基于人工智能技能的新产品。
而数据产品经理也是时下的热门岗位。
两者关系是,AI产品经理以数据为根本,数据产品经理发展的晋级阶段是AI产品经理。
第一点差异:产品目标不同
有时候产品经理不得不拍着胸脯提需求,常常会遭遇多方的质疑,这个需求靠谱吗?有时候产品上线后大家觉得该当一片欢畅,但是公司却没有带来很好的商业增长;
当增长遇瓶颈;当产品不能精准的推举给用户;当生产效率变低;当产品经理不能预测新的产品需求和新的做事需求;当人力本钱变高,当有些固定流程的事情可以被机器人代替;
前类紧张是数据产品经理要办理的问题,通过数据来验证产品提出的产品需求的精确性,通过上线后的数据来创造产品须要迭代改进乃至创新的点,通过数据剖析,数据挖掘创造原来创造不了的产品问题,改进问题。
后类紧张是AI产品经理的产品目标,AI一方面能帮人节省韶光,其余能预测原来创造不了的产品和做事需求,还有AI能够办理不愿定性的产品做事需求。
数据产品经理的产品目标是用数据确认确定性的需求;AI产品经理的产品目标是创造性的办理不愿定性的产品需求。
第二点差异:产品实战过程不同
先讲数据产品经理的产品过程,再看AI产品经理的产品过程。
数据产品经理的数据剖析的步骤一样平常可以分为如下6个步骤:
明确剖析的目的数据准备数据洗濯数据剖析数据可视化剖析报告数据产品经理案例:朝阳医院医药发卖情形数据剖析经典案例拆解
1. 剖析目的
通过对朝阳区医院的药品发卖数据的剖析,理解朝阳医院的患者的月均消费次数,月均消费金额、客单价以及消费趋势、需求量前几位的药品等。
2. 数据导入
从笔者LineLian本地读取数据,如果须要数据剖析进一步的可以点击文章末了的链接。
3. 数据洗濯
数据洗濯包含,行缺失落值、列缺失落值、非常值如不该涌现负值涌现了负值,不该过大不该过小等非常值的洗濯、数据列名的修正变更、数据类型的转换、数据重新抽取排序等等洗濯。
4. 数据剖析
数据产品经理的数据剖析紧张是数据对应的业务剖析,数据场景剖析,常由数据产经理提出产品剖析方案,例如本案例中,月均消费次数的业务定义打算办法是:月均消费次数 = 总消费次数 / 月份数;
月均消费金额的业务定义打算办法是:月均消费金额 = 总消费金额 / 月份数;客单价业务定义打算办法是:客单价 = 总消费金额 / 总消费次数。等等
5. 数据可视化
对付善于形象思维的同学来说,文不如图,图不如***,数据可视化便是讲数据剖析的文变成形象的图或者变成可视化直不雅观化的构造呈现的更直接明了。
例如本案例中药品发卖前十的情形如下图:
6. 产品数据剖析报告
产品数据剖析报告无固定的形式,根据笔者的履历有的专家直接带着一张嘴也行,有的写成PPT,有的用Word文档,有的则是PDF,有的是个其他的文档或者图片。
AI产品经理案例:
AI产品内容领域增长方向更加明显,根据笔者LineLian实际事情创造有以下几个产品实战过程方案。
神经网络、机器学习、深度学习以软件为主的产品;机器人、芯片、智能硬件、软硬件协同类的产品;具有行业履历以场景驱动探求AI赋能;以AI算法创新为主。本篇先讲以神经网络、机器学习、深度学习软件为主的产品方案办理过程。
AI产品经理案例:演习神经网络经典案例拆解
选定一个根本模型设定初始化参数代入模型用演习集对模型进行演习通过一些数量指标,评估演习偏差如果演习偏差不知足哀求,连续调度参数重复7–8次采集新的数据,天生新的数据集。(1)选定一个根本模型
本篇选择sklearn.neural作为根本演习模型框架。如下图
(2)设定初始化参数代入模型
设置神经网络模型参数,隐蔽层坐标大小(50,50)。
(3)演习出模型,用演习集对模型进行演习
导入数据,须要如下图中数据集的同学请不雅观看笔者的微信公众年夜众号LineLian数智产品窗口。
一次演习模型,采取演习集数据演习MLP分类器模型
一次查看模型演习结果
将一次演习的模型保存
(4)通过一些数量指标,评估演习偏差
通过准确率数据、通过绘制偏差曲线等等评估模型演习效率。
(5)如果演习偏差不知足哀求,连续调度参数
重新优化节点数等参数,再次演习模型
(6)重复7–8
重新调度,坐标、节点、演习次数等参数、超参数,重复演习模型,终极选择精良的模型备用。
(7)选择新的数据,天生新的数据集
本篇利用的是著名的MINST数据集,如果须要请关注笔者的微信"大众年夜众号LineLian数智产品窗口。
针对这个图像数据集存在的问题比较明显,1.演习的数据数量;2.数据标注的质量;鉴于此,可以利用自己的自有Label数据集重新演习新的模型。
第三点差异:算法模型不同
数据产品经理常用的算法如下:
对付数据剖析所采取的的算法非常多,紧张是办理验证性和确定性问题的算法,例如:回归、三次多项式等等算法均可以属于数据产品经理采取的数据剖析算法。
1. RFM算法模型
RFM模型想必很多搞数据做产品运营的同学都听说过,最常用在用户分层管理中。而且很多提到RFM模型都会动不动就祭出。
RFM模型是衡量客户代价和客户创利能力的主要工具和手段。
2. CART: 分类与回归树
CART, Classification and Regression Trees。
在分类树下面有两个关键的思想:第一个 是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。
3. K-Means算法
k-means algorithm算法是一个聚类算法,把n的工具根据他们的属性分为k个分割(k < n)。
它与处理稠浊正态分布的最大期望算法(本十大算法第五条)很相似,由于他们都试图找到数据中自然聚类的中央。
它假设工具属性来自于空间向量,并且目标是使各个群组内部的均方偏差总和最小。
4. 关联规则Apriori算法
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
5. SVM支持向量机
支持向量机,英文为Support Vector Machine,简称SV机(论文中一样平常简称SVM)。
它是一种监督式学习的方法,它广泛的运用于统计分类以及回归剖析中。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个相互平行的超平面,分隔超平面使两个平行超平面的间隔最大化。假定平行超平面间的间隔或差距越大,分类器的总偏差越小。一个极好的指南是C.J.C Burges的《模式识别支持向量机指南》。van der Walt 和 Barnard 将支持向量机和其他分类器进行了比较。
6. 最大期望(EM)算法
在统计打算中,最大期望 (EM,Expectation–Maximization)算法是在概率(probabilistic)模型中探求参数最大似然估计的算法,个中概率模型依赖于无法不雅观测的隐蔽变量(Latent Variabl)。最大期望常常用在机器学习和打算机视觉数据集聚(Data Clustering)领域。
7. PageRank算法
PageRank是Google算法的主要内容。2001年9月被付与美国专利,专利人是Google创始人之一拉里•佩奇(Larry Page)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法因此佩奇来命名的。PageRank根据网站的外部链接和内部链接的数量和质量,衡量网站的代价。
PageRank背后的观点是,每个到页面的链接都是对该页面的一次投票,被链接的越多,就意味着被其他网站投票越多。这个便是所谓的“链接盛行度”——衡量多少人乐意将他们的网站和你的网站挂钩。PageRank这个观点引自学术中一篇论文的被引述的频度——即被别人引述的次数越多,一样平常判断这篇论文的威信性就越高。
8. AdaBoost 迭代算法
Adaboost是一种迭代算法,其核心思想是针对同一个演习集演习不同的分类器(弱分类器),然后把这些弱分类器凑集起来,构成一个更强的终极分类器(强分类器)。
其算法本身是通过改变数据分布来实现的,它根据每次演习集之中每个样本的分类是否精确,以及上次的总体分类的准确率,来确定每个样本的权值。
9. 其他数据剖析算法模型
AI产品经理常用的算法如下:
(1)神经网络算法模型
起步神经网络算法( Neural Network )是机器学习中非常非常主要的算法。这是全体深度学习的核心算法,深度学习便是根据神经网络算法进行的一个运用特例。某种程度上来说AI产品的入门在于对神经网络算法的理解和运用。
(2)机器学习算法模型 Maching learning
机器学习的工具是:具有一定的统计规律的数据。
机器学习根据任务类型,可以划分为:
监督学习任务:从已标记的演习数据来演习模型。紧张分为:分类任务、回归任务、序列标注任务。无监督学习任务:从未标记的演习数据来演习模型。紧张分为:聚类任务、降维任务。半监督学习任务:用大量的未标记演习数据和少量的已标记数据来演习模型。强化学习任务:从系统与环境的大量交互知识中演习模型。机器学习根据算法类型,可以划分为:
传统统计数据学习:基于数学模型的机器学习方法。包括SVM、逻辑回归、决策树等。这一类算法基于严格的数学推理,具有可阐明性强、运行速率快、可运用于小规模数据集的特点。
(3)深度学习DeepLearning
深度学习:基于神经网络的机器学习方法。包括前馈神经网络、卷积神经网络、递归神经网络等。
这一类算法基于神经网络,可阐明性较差,强烈依赖于数据集规模。但是这类算法在语音、视觉、自然措辞等领域非常成功。
没有免费的午餐定理(No Free Lunch Theorem:NFL):对付一个学习算法A,如果在某些问题上它比算法B好,那么一定存在另一些问题,在那些问题中B比A更好。
(4)CNN
卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以相应一部分覆盖范围内的周围单元,对付大型图像处理有出色表现。
(5)RNN
循环神经网络(Recurrent neural network:RNN)是神经网络的一种。纯挚的RNN由于无法处理随着递归,权重指数级爆炸或梯度消逝问题,难以捕捉长期韶光关联;而结合不同的LSTM可以很好办理这个问题。
韶光循环神经网络可以描述动态韶光行为,由于和前馈神经网络(feedforward neural network)接管较特定构造的输入不同,RNN将状态在自身网络中循环通报,因此可以接管更广泛的韶光序列构造输入。手写识别是最早成功利用RNN的研究结果。
(6)GNN
图神经网络,图神经网络划分为五大种别,分别是:图卷积网络(Graph Convolution Networks,GCN)、 图把稳力网络(Graph Attention Networks)、图自编码器( Graph Autoencoders)、图天生网络( Graph Generative Networks) 和图时空网络(Graph Spatial-temporal Networks)。
(7)其他神经网络。
第四点差异:产品经理驾驭难度不同
产品经理驾驭产品的难易程度参考下图:
第五点联系:末了AI产品经理与数据产品经理既有差异也有联系
联系是:数据产品经理常用的元素数据是AI产品经理常用的元素数据+算法+算力三元素之一。
做好数据产品经理是为了本日的饭碗,做好AI产品经理是为了来日诰日的希望。两者都很主要。
总之AI产品经理和数据产品经理是唇齿相依的关系!
#专栏作家#
连诗路,"大众年夜众号:LineLian。大家都是产品经理专栏作家,《产品进化论:AI+时期产品经理的思维方法》一书作者,前阿里产品专家,希望与创业者多多互换。
本文原创发布于大家都是产品经理。未经容许,禁止转载。
题图来自Unsplash, 基于CC0协议
本文系作者个人观点,不代表本站立场,转载请注明出处!