当人工智能“入侵”NBA这些球队是若何完成数字化逆袭的?_数据_球员
作者 | Harry Wu,Young Lin
题图 | 视觉中国
虽然足球是环球第一大体育运动,但篮球,尤其是NBA,在中国和北美的成功让人感到惊异。以是,数据侠Young和Harry就一起研究了NBA的数字化技能,拜访了球队的数据剖析师及干系技能领域专家,为大家探究这个成功篮球赛事里的数字基因。
美国四大职业体育同盟之一的NBA(美职篮)是天下篮球最高殿堂。NBA总冠军球队的每一位球员和教练都会收到一枚总冠军戒指,上面除了雕刻着冠军球队和个人的名字,还在显眼的地方印上“World Champion”(天下冠军),可见NBA在篮球天下的地位。
2002年随着姚明以NBA选秀状元的身份加入火箭队,并打出全明星级别表现之后,NBA的热潮顺势席卷中国乃至全亚洲,截至当下,NBA已经成为中国体育迷们最喜好的赛事,没有之一。
▍NBA的数字基因
美国有着环球最好的数字化技能与运用处景,这使得NBA自2009年之后通过注入数据DNA,成为了环球最智能、科技感最强的运动体育赛事,并在商业领域得到巨大的成功。
在开启探究NBA数字化成功之道前,我们先来理解一下NBA的数字基因。
马克·库班和达里尔·莫雷可谓是NBA“数字基因编辑”的代表人物。
被誉为“NBA最猖獗的球队老板”的库班,年轻时候曾在达拉斯最早的软件零售商担当发卖员。推销软件前,他自然要理解软件,并执念于新技能能创造更大代价。
日后,通过创立与***MicroSolutions打算机咨询公司、BROADCAST体育***网站等,库班赚取了自己的人生财富。2000年,他买下达拉斯小牛队(现改名独行侠),虽从一名科技企业家变身体育家昔时夜老板,但库班的信条始终是“相信科技”。
小牛队可能是同盟最早让球员穿着智能设备与利用AI、数据剖析帮忙球队经营与提高球场成绩的军队,库班(注:其与迈克尔·乔丹一起投资了瑞士运动数据公司Sportradar)十分相信人工智能,他说:“我们做生意的办法,我们的生活办法,所有的统统都被网络改变,但与人工智能比较,这些都相形见绌。”
NBA的数字化除了有相信科技的人,还要有懂大数据的。休斯顿火箭队总经理达里尔·莫雷便是这样一位“数据徒弟”。
莫雷(注:目前还担当体育数据公司Stats的顾问)曾经是一位打算机科学家,在得到MIT的MBA学位之后,他在芝加哥创办了一家专门为各种职业球队供应运营数据剖析的体育信息咨询公司。加盟火箭之初,他基于数据剖析的魔球理论(Money Ball)重修球队,通过数据网络与剖析进行条约风险管理与薪资掌握,在选贤方面,一些二轮新秀被他点石成金。莫雷曾如此定义赢得一场比赛:第一要量化每一回合得多少分,第二要理解如何去争取到更多的回合数,这就要靠数据剖析。
早在NBA三分狂潮掀起之前,莫雷团队就通过剖析球场上个点位投篮的得分效率数据,得到一个答案——三分球的有效性比长两分更好。
(图片解释:打算机视觉技能识别球场上球员移动位置、轨迹和篮球运动轨迹,并推算进球的可能性 图片来源:The Economist)
比较于90年代NBA盛行的长两分球,三分球的得分效率与威慑力都更强。2012年均匀每场比赛投出18.4次三分,相较2017年的27次提高了50%,一个三分球射手有65%的概率改变比赛走势。以是,NBA教练们在近年来开始大量利用三分射手。
(图片解释:十年间NBA的三分球投射比率从22.3%上升至33.7%)
以休斯顿火箭(最早利用智能摄像头、可穿着硬件和利用数据剖析的球队之一)为首的一批顶尖强队掀起了三分狂潮(有兴趣可以阅读数据侠干系文章《NBA的三分球革命》),直至本日,利用三分球作为紧张进攻武器的球队,都在这几年的NBA赛场上胜多负少。
数据剖析的核心在于海量数据。在美国五大联赛中,NBA的数据点排名第三(注:NHL场上选手和比赛韶光都长于NBA,MLB赛程和比赛办法更有利于产生更大数据量)。2009年起,NBA在每个球场(包括演习场)支配6个每秒25帧拍摄速率的摄像头以网络数据,单赛季就能产生超过1.77亿张图像,超过23亿个数据点。
(图片解释:NBA的数据点;总计最小数据点=一个赛季总计比赛场次×一场比赛参与球员数量)
NBA大数据的背后是什么技能加持?数据下贱是什么样的运用在办理详细问题?
2012年,时任NBA总裁的大卫-斯特恩在先容NBA的数字化运营时说:“统计学与数字化革命将改变NBA商业模式,“SportVU”智能摄像头系统跟踪每一个球员和球的运动,网络海量球场数据,教练可以在自己的平板电脑上得到各种数据统计及剖析结果。这些数据势必影响比赛与执教。”
(图片解释:SportVU系统对付场上球员移动轨迹的监测)
早在2009年,SportVU系统就被支配到部分NBA球队。这是一套球员追踪与剖析的监控系统,也是NBA数字化革命的出发点。这套价格不贵、效果奇佳(据传一套大约10万多美金)的设备在球场上支配六个运动捕捉摄像头,它们会以每秒25帧的速率捕捉球员的空间坐标,与此同时,为每个坐标点加上韶光戳和球员ID,将这些数据捕捉到做事器端之后,数据网络的事情就已经基本完成了。
▍当“数字化革命”发生
2005年,以色列导弹追踪以及光学领域的顶尖科学家米基·塔米尔发明了SportVU系统,最初用于军事领域,但在金融危急期间,运动数据公司STATS收购了SportVU,于是这套系统很快被运用到了篮球场上。
如今每只NBA球队都配备几名数据剖析师,他们将诸如SportVU这类的智能设备网络来的数据结合传统统计数据,进行交叉剖析,一方面监测球员疲倦度及积极性等状态,以帮助分配最得当的球员上场竞技,另一方面,根据场上的进攻与防守数据帮忙教练员制订战术,以及选择签约得当的球员。
2013年,来自哈佛大学两位博士瑟沃尼和艾利克斯建立了一个丈量NBA球员表现代价的指标——预球权分(Expected Possession Value,预期球权得分机制)。该模型源自于竞争风险模型(注:处理多种终点事宜和竞争风险事宜存在的生存数据的剖析方法),大略地说便是研究“一名球员是否被低估了其在球场上代价”的一套指标(不同于得分、篮板、助攻及命中率等传统衡量球员的数据)。
(图片解释:伦纳德在三分线外持球,如果投篮EPV为0.68分,如果传给邓肯,EPV为0.8分,传给帕克为0.94分,传给博纳为0.94分,传给格林为1.08分)
有了模型,只差数据。SportVU向瑟沃尼和艾利克斯供应了“大数据”,这些用于跑模型的数据就包括了2012-2013赛季中14个球馆的8亿个球员位置坐标,光这个项目的数据集就达到93GB。为了处理“大数据”,瑟沃尼和艾利克斯启用了哈佛大学的超级打算机(打算机集群)——奥德赛,通过500台电脑并行处理器和2TB内存的算力完成了剖析。而这套指标正在赞助教练员更好地评估每一位球员的真实代价。
做好了数据网络与领悟,拥有一套智能剖析系统就显得更加主要了。NBA一度又引入了德国软件巨子SAP的SAP HANA系统。智能设备网络来的战术、空间位置、球员康健等数据实时传送到SAP HANA系统上,并将数据保持在最细的颗粒度,不进行任何预先的聚合,通过自动剖析,每秒并发处理250个繁芜查询,在不同数据颗粒度层次都能知够数据剖析的诉求,最大限度的方便了球队剖析师、第三方机构,乃至于球迷的数据剖析以及可视化需求。
▍数字化驱动的新商业
NBA的数字化计策不止于此。互联网科技公司常常利用骇客松(Hackathon)的办法(注:针对黑客设计的马拉松,主理单位会将一批打算机极客聚拢起来,在极短的韶光内让极客们针对特定的议题进行头脑风暴并供应办理方案),来刺激用户间的互助与公司外部的创新,体育界的领头羊NBA从2016年开始,也决定要利用群众的力量与聪慧,来找寻运营和商业中的隐蔽机会。
(图片解释:NBA官网关照,2018年9月22日NBA新泽西办公室举行骇客松)
NBA从2016年开始对外举办NBA骇客松,目前仅限于北美地区。经由海选的50只军队,被分配到两种题目的剖析组——篮球剖析组与商业剖析组。篮球剖析组队的问题紧张是和球队教练和球队经理干系的,例如“如何利用NBA采集到的多样空间数据,来改变比赛规则,增加比赛的精彩程度”;又或是“预测未来十年的投篮趋势,剖析现在这种从后卫到中锋都学习勇士库里飘射三分的狂潮,到底能持续多久。”而商业剖析则更靠近球队的商业考量,例如如何量化球队的“娱乐代价”,或是如何利用现有的CRM(客户关系管理)数据来挖掘更多的商业代价。
2017年篮球剖析组的冠军根据数据剖析的结果,针对未来投篮趋势提出的建议:一旦比赛中中间隔投篮的进球数量超过16个,就可以将中间隔的得分从两分提高到三分,以增加比赛的精采程度。而商业剖析组的冠军,则创建了一个韶光序列为主的互动工具,能够预测未来NBA任意一场比赛的娱乐代价。
如此经营骇客松,无论对付球迷或是NBA而言,都是个双赢的局势。对参赛者而言,由于赛题环绕数据与剖析运用展开,参赛者的数据剖析能力必不可少,而这些数据是NBA最真实的运营数据,作为球迷的剖析师,除了在比赛中可以和球员面对面谈论题目,晚上熬夜时吃着球星送来的外卖以外,在探索数据的代价中,还能更理解所关心的主队和球员,乃至是旁边未来同盟的规则发展。这切实其实是球迷的天国(注:第一名的褒奖是和NBA总裁共进午餐、球赛门票和一大堆的周边产品)。而对付同盟或球队而言,这些活动既可以创造更强的粉丝粘性,又可以网络好的剖析与运用思维和解决方案,进而改进同盟与球队的经营效果,何乐而不为?
(图片解释:NBA骇客松上,NBA球星肖恩·巴蒂尔与极客们的互换互动 图片来源:网络)
除了NBA同盟希望利用大数据挖掘更多代价外,30只球队也积累了很大的数据能量。以华盛顿奇才队为例,先从公开数据来看看他们的表现:这只位于美国首府华盛顿特区的球队,代价1.3亿美金,紧张来自于体育奇迹的贡献(占比约40%),前年(2017)的球队收入发展了43%,一口气来到了两亿多美金有趣的是,球队门票发卖在过去五年持续发展的缘故原由,紧张是成功的营销,一部分上升来自于2013-2014年开始增加的AdWords广告花费(注:该季AdWords花费上升将近300%,并从Adwords获取的新客上升了72%),另一部分则来自于过去五年不断上升的票价(注:2019年票价的增长率大约是10%,依照44种不同的座位分区有不同的调度)。
(图片解释:奇才队的历史战绩与攻防评分数据 来源:Tableau public )
而从球队表现来看,ORtg (Offensitve Rating, 进攻评分)与DRtg (Defensive Rating,防守评分)显示,奇才队从2003由Eddie Jordan执教后,利用出色的进攻打出一波1970年代后期之后未曾瞥见的佳绩。虽然之后陷入低谷,但新教练的到来匆匆使球队风格逐渐由进攻转为防守,并在最近的赛季表现都不错,过去五个赛季中有三次进入分区半决赛。
以上成绩都与奇才队的精益数据剖析不无关系。
▍AI驱动的NBA
无论是大数据还是其他黑科技,全体NBA拥抱技能的态度都非常积极。各只球队为了提高球队表现与商业化,大量引进与利用人工智能。
目前NBA的官方数据技能互助方除了STATS公司外,还包括运动科技公司Second Spectrum。Second Spectrum公司创立于加州的洛杉矶,创始人是来自南加州大学(USC)的两位教授,他们希望利用机器学习算法真正地让机器看懂篮球,然后产出有培植性见地的洞察结果。
Second Spectrum通过一种叫作“时空模式识别”的算法,识别球员在球场上实行教练的战术特色,该系统能认知出挡拆、双档掩护等篮球场上的技战术。起初,Second Spectrum的系统学习了20种旁边篮球战术,现在已经能学会并记住500种战术,这让预测球场上“由于履行某种技战术而产生固定的结果”变成了可能。
(图片解释:Second Spectrum对场上球员与球的轨迹监测 来源:TED)
其余,通过打算机视觉技能,结合持球球员及其他数据(进攻动作、防守者位置、球员历史定点命中率等数据),建模预判一个球员在特定区域的投篮命中率,一旦球不能被投进,还可预判篮板球的落点,以及谁将抢到篮板球。
(图片解释:Second Spectrum监测持球球员与无球球员移动,以打算不同点位的命中率)
除了硅谷,来自澳大利亚的Catapult科技公司正在通过自己的智能硬件设备改变球场上的战术履行,Catapult的可穿着设备记录球员的移动、速率、身体状况等数据,帮助教练员更好地分配场上球员,支配战术。
类似Cataplut的公司还有不少,并且都在为NBA球队带来科技红利。目前冠军之师金州勇士队(有兴趣可以阅读数据侠干系文章《大数据见告你勇士凭什么“4年3冠”》)除了利用SportVu的智能摄像头监测球员场上状况,球队还让球员穿着一款高科技“智能服装”,监测球员实时运动状态、呼吸和肌肉活动等信息,避免过度演习造成疲倦并帮助减少运动损伤。
NBA医务总监John DiFiori博士说,从智能可穿着设备上获取的数据不但可以帮忙坚持球员康健,还能通过更多细节数据,结合球队拥有的医疗设备,帮助球员更好的预防伤病,并从伤病中更好、更快地规复。
NBA的教练们也在受到大数据等新兴信息技能的影响。人工智能能够在打仗、识别、反馈数据模型的过程中完成自我学习。喷鼻香港理工大学OpenCog AI实验室首席研究员Ben Goertzel认为,如果AI系统学习大量的NBA比赛***,它就会聪明到能够理解比赛中发生的各种事宜,如此,人工智能就能够做出更好的篮球战术安排,比如选择最得当的首发阵容。Goertzel预言,NBA球队主教练的大部分事情,未来都可以由AI来完成。
自2016年,来自瑞士的Sportradar公司就开始为美国市场之外的国家供应NBA的实时数据和高标准的视听做事。NBA还将Sportradar纳入其数据综合业务中,从2018年开始, Sportradar就开始为NBA、WNBA和NBA发展同盟供应统计信息,并将数据完全地运送美国的球迷、球队、媒体和其他80个国际和地区的球迷及用户,而这些数据中包含了Second Spectrum检测的球场上球员的运营轨迹数据(包括速率、运动间隔、禁区勾留市场和防守反击等数据)。
基于这些大数据,萨克拉门托国王队开拓了一款类似iPhone Siri的APP——国王的人工智能(KAI),它能与球队粉丝互动,根据不同的提问,将数据与信息通过笔墨与语音回答给粉丝。
(图片解释:国王队基于大数据开拓的机器人KAI)
在一次体育家当峰会上,美国体育媒体EPSN剖析总监Benjamin Alamar总结了十年间NBA的数字化变迁,他表示,十年前,一个赛季每场比赛详细宣布(Play by Play)的数据可以打包成6兆的数据包,现在,一场比赛详细宣布数据就达到16兆,现在一场比赛的数据是十年前连续三个赛季的数据之和。
大数据与AI技能在NBA的利用案例远远不止机器学习、亦或是基于卷积神经网络的打算机视觉技能,包括贝叶斯网络、知识图谱等广义AI技能也在被采取。
关于未来,新科技在NBA的想象空间非常大。STATS公司CEO Gary Walrath说:“未来全新的NBA术语将包括速率档案、进攻战术类型、防守对位和球场覆盖舆图等信息。”
在NBA的身后,包括中国CBA在内的多个篮球联赛都在探索一条属于自己的数字化计策。紧随成功支配数字化计策的NBA,中国篮球正在篮协主席姚明的带领下走出低谷,作为NBA数字化先驱球队休斯顿火箭队的前明星球员,姚明大概明白NBA的数字化革命将为中国篮球带来什么样的启迪。
期待更多数据侠干货分享、话题谈论、福利发放?在公众年夜众号DT数据侠(ID:DTdatahero)后台回答“数据社群”,可申请加入DT数据社群。
▍数据侠门派
本文数据侠Harry Wu,篮球球迷,自诩“非范例宇宙免检知识混子”,喜好在数字化峰会、券商投资策略会和高校公开课上YY人工智能和大数据。之前写了不少财经类文章,在各大财经网站短暂飘过,怒砍百万流量,个人不雅观点和内容还登上过南华早报、路透社等外洋媒体。目前是“DT数据侠”项目的卖力人。
本文数据侠Young Lin,篮球球迷,在某大型数据剖析与咨询公司担当资深数据剖析师,帮忙娱乐、高科技等客户透过数据挖掘的办法创造并创造代价。热爱数据和统计、营销、科技,曾自主创业,担当过跨国发卖、上市专案经理等职位。旅居欧洲、美国等地,喜好旅行、阅读、运动、音乐、Podcast。现与朋友经营“RS实验室”"大众年夜众号(ID: rs_lab),希望利用数据剖析的办法创造生活中有趣的事物。
● 作者话痨小故事:我和老友Ben
2018年,我(Young)回到华盛顿,抽空和读研时的老友Ben(奇才队数据剖析师)见面。
(图片解释:马里兰大学的同学们,左一是Ben,右一是Young)
Ben是犹太人,状师家庭出生的他是一位范例美国人,非常热衷参与职业体育,除了会在比赛期间不雅观看球赛,他还在大学期间成为了马里兰大学的篮球校队经理,半工半读,和球队出生入死。
马大篮球队从2014年开始加入Big 10 Conference,同盟的14所大学集中在美国东北部,并以篮球这个运动项目著称。
Ben在研究生(营销剖析专业)毕业后加入了华盛顿奇才队,从事球队数据剖析、球员薪资计策方案等事情。
目前奇才内部的组织架构,卖力剖析的团队有两大部门,分别是球探(卖力在美国各州学校创造有代价的球星)和科技/数据剖析团队。Ben刚加入球队时,紧张卖力比赛影片的剪辑,供应给教练和球员,作为动作和战术上的改进参考。有趣的是,奇才是NBA第一个开始采取VR演习球员技能的球队(2015年开始采取STRIVR Lab的技能),Ben的事情也就包含了剪辑与利用VR影片。
(图片解释:Ben在接管华盛顿邮报专访时,让利用VR来练习投篮)
Ben向我进一步阐明Oculus的VR眼镜时说到:“奇才2017年末成立的G-League(NBA发展同盟)军队Capital City Go Go(很有趣的名字),将可以利用这样的技能来演习年轻球员。奇才队确当家球员们比较没有韶光和机会利用这样的技能。”(我自己觉得这VR挺鸡肋的....)
Ben位于Capital One Arena的办公室,坐落在体育馆场的二楼。全体体育馆从Locker Room到健身房、SPA房、练习场,都是他的游乐场。穿梭在球场与球员间的他,日常的事情,除了球员薪资计策方案外,还包含了球队赛前的对手剖析,和球队每赛季的条约计策。他指着桌上一本厚厚的报告说:“这是2017年针对奇才在季后赛对战凯尔特人所做的专题研究,完全剖析了每个球员的表现和对战状况。”想想有多少从事数据剖析的人,可以这样玩数据?
球队的经营目标之一,便是要创造更多的代价。通过各种技能:无论是Google Adwords、VR、还是大数据剖析球员表现或是球员条约,都可以帮忙球队在球场表现或是门票发卖上,得到显著的提升。但运动有趣的地方便是运动充满不愿定性:预算最高的球队也可能会输球,没有球星的球队也可能逆转比赛。
▍加入数据侠
“数据侠操持”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠同盟,旨在聚拢大数据领域精英,共同挖掘数据代价。理解数据侠操持详情请回答“数据侠操持”,投稿、互助请联系datahero@dtcj.com。
本文系作者个人观点,不代表本站立场,转载请注明出处!