过去几天,我们一直在发布一份通过RPM衡量的各支球队休赛期自由市场和交易的评分表。在这个表中,我们为了平衡球队得到和离开的球员的上场时间差异,引入了一个可替代球员(Replacement Player)的概念,许多球迷不太明白这个可替代球员是什么意思,这里就给大家详细解释一下。
Replacement Player这个词最早并不是出现在体育数据分析中,它原本是指体育联盟在球员罢工时,从联盟以外引入的用来替代罢工球员,让联赛运营下去的球员,这最早发生在1987年的NFL中。这些临时顶包的球员实力自然是不如正选球员,水平可能相当于联盟的边缘人。后来在数据分析比较领先的棒球比赛中,首先出现了Replacement Level的概念,它大约是指球队对一名以最小代价获得的球员所抱有的期待。在篮球中,它通常是指底薪水平的球员或是无法为比赛胜利做出贡献的球员,在不同的评价模型里,它的含义也通常会有些细微的差异,但大体意思是相同的。
数据分析中引入这个概念是为了在衡量一名球员的价值时能够有一个标准的参照物。由于我们通常定义一名可替代球员对比赛胜利的贡献为0,因此,一名球员超过可替代球员水平的程度就是他为球队胜利所作出的实质贡献,有时候,我们也把可替代球员作为“背景色”来使用,因为要评估一名球员在一项团队运动中的价值,需要将球员孤立出来,排除他的队友对比赛的影响,而可替代球员就可以成为不产生任何影响的“队友”。
有许多高阶数据的评价体系用到了可替代球员的概念,比如我们之前详细介绍过的BPM。
由BPM衍生出的一项数据是VORP,它的全称即为Value over Replacement Player,即是球员超出可替代球员的价值。它的计算方法很简单:
VORP=(BPM-2)×MP/Team MIN
从式子里就可以很清楚的看出这个数据的含义,球员的百回合净胜分贡献超出可替代球员的程度乘以他的上场时间占比就是他的赛季总贡献了。这里BPM模型就将Replacement Level定义为-2,在具体攻防两端中,进攻为-1.7,防守为-0.3。
需要指出的是,可替代球员虽然被定义为一个底薪球员或是边缘轮换球员的水平,但并不意味着他们是联盟最低水平的。由于NBA并没有像棒球那样关系十分紧密的小联盟,有许多低于可替代球员水平的新秀也会获得出场锻炼的机会。以去年为例,17届选秀进入联盟的球员里,只有18名球员的BPM最终超过了-2,而进一步扩大范围,实质上有将近120名球员在17-18赛季第一次获得NBA常规赛的上场机会,仅仅有20人左右的球场表现是超过可替代球员的。
在BPM的体系下也经常会有一些球队的主力轮换甚至首发打出-2的水平,比如上赛季的卡尔德隆,胡德,克拉克森,韦德,杰夫-格林,他们的BPM都在-2左右,等等….这些人好像有什么共同点(陷入深思
这也是为什么我们有理由在做球队交易签约评分表时,要把上场时间不够的部分用RPM看起来很差的可替代球员来填补,球队用来填补那些时间的新秀球员的水平大部分是不够的。(当然一些乐透球队很有可能会得到高于这个水平的新秀,但他们往往还是会被一些较差的落选球员稀释掉)。
VORP相对于胜场贡献的关系也很简单,一般来说VORP×2.7就是球员贡献的胜场。因此,VORP一般还会和理论薪资产生线性关系,当然,由于劳资协议的种种限制,比如顶薪条款,以及市场原因,亦或是慷慨过头的GM和报复社会的全明星中锋,VORP实际和薪资的线性关系并没有那么强烈。
ESPN的RPM模型从未公布过他们如何定义一个可替代球员,也没有在有关RPM的任何正式说明中提到过这个概念。但我们有了分析BPM的经验就可以对其进行反推。因为BPM尽管在算法思路上和RPM有天差地别,但他们有一个共同的爹,也就是RAPM,他们的数值所反应的含义也是相同的,更棒的部分是RPM也有一个衡量胜场贡献的数据,即WINS,我们相信WINS是一个类似VORP的数据,所以我们根据RPM公布的过去五个赛季的数据进行了简单的推测。
我们按照VORP的思路推测WINS和RPM之间也是线性关系,其中存在上场时间占比这一个已知的量,以及可替代球员水平和一个没有实际含义的系数两个未知的量。从图上可以看出,我们对两者之间是线性关系的推测是完全正确的,而且还有个意外的收获。在图上,橙色部分是16-18年的,蓝色部分是13-15年的。也就是说,ESPN的可替代球员水平的定义在15年做出了调整。在14-15赛季以前,RPM模型中将百回合净胜分贡献为-2.35的球员定义为一个可替代球员,。而从15-16赛季开始,这个可替代球员水平变更为了-3.12。这一变动也让全联盟超过可替代球员水平的球员比例大幅度提升了,在14-15赛季之前,这一比例不足70%,而最近三年高于这个水平的球员比例达到了将近90%。可见,这一数据的变动并不是单纯的线性缩放了整个RPM,ESPN可能有更深层次的考虑,我在推特上问了阴沟侠这个问题,他把锅甩给了他的合作者Steve Ilardi,此人是堪萨斯大学的教授,临床心理学和神经系统方面的专家,业余分析NBA,看起来一定很忙而没法回答我的问题。
所以这里不得不很抱歉地告诉大家,前几天发布的交易签约榜单里把可替代球员水平假定为-2的做法是有问题的,实际应该是-3.12。那些引进的新援上场时间远低于离开球员的球队实际评分会更低。比如骑士的总差值将会达到-8.03,几乎两倍于倒数第二的球队,因为他们到目前为止没有任何交易,只签下了弗莱一名自由球员,包括勒布朗,杰夫格林等人的离开,让骑士的阵容缺口超过5000分钟,他们可能不得不用新秀填满这些空缺,很显然会让球队重返“过程”。
另一位喜欢采用可替代球员这个概念的数据专家是凯文-佩尔顿,他经常在他的文章里用可替代球员填补人员名单的缺口。比如,他在估计每年休赛期的市场行情时就采用各支球队可使用的薪资总空间和市场上的主要自由人的球场贡献来计算平均每一点贡献值需要多少工资,而对于名单不足的部分则用可替代球员和底薪来补缺。佩尔顿自己的数据模型WARP(Wins Above Replacement Player)也是以可替代球员这一概念为基础来建立的,他把某一名球员和四名平均水平的球员组成的队伍和由一名可替代球员和四名平均水平的球员组成的队伍进行比较来评估这名球员的能力。不过在他的模型里,10名可替代球员组成的队伍参加一整个赛季的比赛的话并不是如同可替代球员这一概念本身所描述的那样一场也赢不了。佩尔顿相信正常情况下NBA比赛的胜场数会有边际效应,在他2012年介绍WARP的早期版本时曾说过,这样一支“可替代球队”能取得10场胜利。
有趣的是,2015-16赛季,“过程”中的费城76人恰好就只赢了10场比赛,这支球队在常规赛共有18名球员获得过出场机会,其中有11名的BPM低于-2,也就是低于可替代球员的水平。这11名球员里目前只有当时2年级的斯陶斯卡斯一人现在还在联盟中打球,而其他7个高于可替代球员水平的球员除了老将兰德里去年来了CBA之外,其他6人都还在联盟里打球。
大家更熟悉的上一代综合型数据PER也延伸出过类似的数据。在PER模型中有一项叫VA(Value Added)的衍生数据。它的概念和前面提到的VORP也是类似的,就是球员一个赛季所作的总贡献。
Value Added = MIN × (PER – PRL)/67
这里的PRL就是Position Replacement Level, 霍林格在定义可替代水平的时候区分了不同位置的情况。一个可替代中锋的PER为10.6,大前锋为11.5,小前锋和得分后卫为10.5,控卫为11.0。不过我们没有在RPM中发现类似的做法,RPM并没有区分不同位置球员的可替代水平。在他的模型中,可替代球员相当于球队大名单中的第十二人,而2017年以前,这是球队大名单的最低激活人数。
到这里,我想大家应该都清楚可替代球员所代表的含义,它的作用和在几个常见高阶数据中的应用了吧。
我相信这篇文章能全看完的一定对NBA数据有特别的兴趣,欢迎关注公众号“篮圈即是原点”和同名微博
来源:知乎 www.zhihu.com
作者:知乎用户(登录查看详情)
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载