最近在设计一款公司的KPI画像,由此推想BPM这类数据当年开发的底层逻辑是什么:1.乔丹必须第一,这是“权威性底线”。否则这个排名在2014年左右对外发布的权威性就不复存在,即使张伯伦场均50.4的赛季也得排在后面,一切要为了这个目标而调整。至于在此之后有球星打破乔丹记录,那就无能为力了:推出前可以“设证推理”,推出后只能“演绎推理”。2.其他球员排名也要贴合主流认知才显得靠谱。但切片无需太细,因为多数赛季不会被人清楚记得,把重点球员的代表性赛季放在合理位置是很关键的。所以,这类数据算法必然存在不为外人道的“黑箱”,用于灵活校准结果。3.产品亮点必须要有。什么叫守正创新?排名既不能太颠覆认知,也不能太循规蹈矩,要有点“恰到好处的反常识”来凸显专业性。不过逻辑得自洽,比如命中率就是最合理的切入点,让整体命中率低迷的00年代初期千禧球星集体降档,就是其中典型设计。4.数据推出后,如果有明显不合理的球星打破乔丹级纪录(如16威少的BPM和VORP),便需通过调整阈值修正结果;若出现集体性反常识数据,那就只能推出新算法替代旧模型,最近几年很少被提及的Per/Gmsc便是这种迭代过时的产品。5. BPM对角色球员评估有局限性,根源在于算法核心是围绕历史顶流球星调整的——聚焦顶流设计,必然牺牲角色球员精度,就会导致部分球员收益、部分受损。例如当年削弱威少数据后,罗德曼的篮板也突然变得不值钱,于是他的DBPM常年低于1。6. 开发某项数据或用好数据并构建一套逻辑自洽的话术,是树立“专家人设”的捷径。毕竟没有任何人能完整且高质量看完所有比赛,数据肯定是了解球员和比赛的最重要窗口之一。7. 有排名就有小心思,球员也会反向参照数据调整打法:早年刷分,后来兼顾篮板/助攻,再后来刻意保护命中率以提升BPM/EPM/WS等数据——不是人人如此,但必然会有一部分这么去做。当然线性模型并非想刷就能刷,不过球星若有意愿总能产生影响。这种数据导向,既推动了球员打法和理念的升级,也在一定程度上成了年轻球星的成长枷锁和误区。