新闻中心
“印象流”就是不懂球?你知道现在的篮球数据分析有多先进吗?(最详细的篮球数据网站)
一段来自两位球迷之间的对话:
甲:“这个球员打球我看过,投篮还挺准的,没错就是他。”
乙:“什么?你说他投篮准?没搞错吧,他三分命中率只有三成出头啊!”
甲:“怎么会?我记得看他比赛的时候投的挺准啊,投篮动作,手型,节奏什么的都不错,看着就像个投手。”
乙:“老哥,我看你大概是个印象流吧?平时都不看数据的吧?”
甲:“你说谁印象流呢?再说了,整天数据数据的,数据就能解释一切吗?”
乙:“一看你就不懂球,XXXXXX(省略若干字)。”
甲:“XXXXXXXXX(此处内容不宜显示)。”
这段对话是我虚构的,但现实中出现的可能性以及概率有多大,不用我多说,经常逛各大论坛的诸位心里都清楚。
对话中涉及两个重点词,一是【印象流】,二是【数据】,由此可以延伸出两个经常引发争议的话题:
一:印象流看球是否不可取?
二:数据可以解释一切现象吗?
问题一:印象流看球是否不可取?
先得知道什么是印象流?印象这个词,网上的解释是【指接触过的客观事物在人的头脑里留下的迹象】,运用在看球上,可以理解为至少是看过比赛的,看过才可能在头脑里留下迹象,所以如果连球都不看,被说印象流的资格都没有。
重点在于看了多少球,一般说别人印象流也不是质疑他从来没看过比赛,而是指看的不够多,印象过于片面,不足以支撑结论,一叶障目。
比如我说一个球员投篮准,我可能只看了他为数不多投准的几场,大部分不准的比赛没看到,这样的结论就站不住脚,容易被说印象流。
所以,印象流的合理解释应该是:观察样本数量太小,不足以支撑结论。
其实还有一层隐身含义:不参考数据,不重视数据的重要性。你在各大论坛看到有人被说印象流,肯定不只被吐槽看球少,很多都是因为结论与数据不符,被质疑不看数据,只凭印象就妄下结论。这点应该不难理解,因为在很多场景下,印象流与数据流都存在对立关系。
于是我们得到了印象流的完整定义:观察样本数量太小,不足以支撑结论,不重视数据或根本不看数据。
可是问题就来了,如果看的球足够多,还算印象流吗?还必须借助数据吗?
如果一名球员整赛季打满82场,我只看了其中十几二十场,结论难免站不住脚,可要是看了七八十场,甚至一场不落呢?如果整个赛季看下来都觉得他很准,不准的场次占比很低,是否可以纯凭经验判断,不看数据就说他是优质射手呢?
我认为可以,如果结论还是与数据相差甚远,只可能有两种可能,要么眼睛有问题,要么数据有错误。(前提是对篮球有基础认知水平)。反过来说,先通过数据了解到命中率很高,结果看了大部分比赛发现根本不准,也不现实。
不过话说回来,现实生活中能一场不落地追完一个赛季,还都记得住的人,凤毛麟角。毕竟光常规赛就要进行半年之久,记忆总会有偏差,所以才需要数据来辅助。但理论上的确有可能做到的。
回过头来看第一个问题,印象流看球是否不可取?首先要搞清印象流的定义,看球不够多,不参考数据就下结论一定不可取,但如果看球足够多,记忆力又足够好,理论上可以不参考数据就得出具有说服力的结论。
毕竟数据永远是用来验证比赛,辅助理解比赛的,我们看比赛关注的是场上十名战士的血肉之躯与灵魂之间的碰撞,而非一堆冷冰冰的数字。
问题二:数据能解释一切现象吗?
这事很早就有人讨论了,差不多20年前吧,NBA刚在国内兴起那会儿,互联网还远没有今天发达,很多人刚换上彩屏手机,上网查数据的机会不多,能查到的也只是得分、篮板、助攻、抢断、盖帽这些基础数据。
于是对于那些数据不够亮眼但实际作用不可或缺的角色球员,比如老火箭的巴蒂尔,人们常常说“数据不能体现他的价值”,在当时这句话基本属于共识。
随着互联网科技的飞速发展,上网早已成为人们的刚需,愿意查数据的人越来越多,NBA也陆续推出了一系列高阶数据,不再局限于“老几样”。
近些年国内涌现出大批篮球数据爱好者,对高阶数据有着深入的研究与独特的见解,我们发现数据可以体现的维度越来越广,很多固有观念都被打破了。
不由得引人深思,在大数据时代下,数据是否真的可以解释一切现象呢?或者说,绝大多数现象都是可以通过数据推演得出的吗?
事先说明,无论数据发展到什么地步,都是用来辅助观赛,验证结论的,要先看球再谈数据,不看球直接用数据反推比赛的行为是不可取的,相当于本末倒置。
现在的数据分析有多先进呢?
以前评价一支球队的攻防水平,会比较场均得分和失分,现在则看进攻效率和防守效率,在百回合的相同条件下比较得失分,避免由于回合数不同(节奏快慢问题)引起的误差。
以前习惯看命中率,现在会参考“真实命中率”,有助于更全面地衡量投篮水平。
我们可以查到哈登每场面框单打几次,约基奇在肘区触球次数,大帝背身单打每回合得多少分,韦少的控球时间,库里的跑动距离,以及戈贝尔在禁区时对手的进攻效果与他下场后的反差有多大。
当我们看到一名球员三分命中率很突出时,不仅知道他准,还能分析出他的投篮习惯,具体有多少投篮是定点出手,多少是持球干拔出手,多少是无球跑动后的接球就投,都能轻易查到。
不仅如此,同样的高命中率,原因却不一定相同。隆多在赛季中也曾保持过40%左右的三分命中率,但和雷迪克的40%显然不是一个概念,通过数据可以了解到球员三分出手时防守人距离有多远,有多少是空位投的,有多少是贴防下出手,由此判断防守方对他的出手环境和防守方对他的重视程度。
甚至还能查到运两次球之后出手的有多少次,运三次的有多少次,以及运几秒出手的有几次,等等,不一一列举了,总之你能想到的,基本都能查到。
现在只看单一数据还不够,要结合起来看,比如我们看到一支球队的场均抢断数名列前茅,会说这支球队防守不错,可是一查数据发现防守效率并不好,什么原因呢?
具体分析,抢断多只是表象,背后很可能是大量的冒险尝试,抢到了记一次数据,抢不到就送对手大礼,所以要结合对手的空位投篮产量和效率。
如果对手空位投篮很多,说明抢断漏空位的频率高,如果效率高,说明在这里失分严重。相反,如果效率不高则说明防守轮转流畅,不容易漏空位。
NBA从球员到教练到管理层,都有不少数据爱好者,火箭总经理莫雷就是数据专家出身,推崇“魔球”理论,在火箭试验较为成功,很多教练也逐渐开始接受大数据给出的建议,当年巴蒂尔在热火的时候也曾通过数据分析给詹姆斯提建议。
可以这样说,以现有数据库的丰富程度,几乎可以解释篮球场上的绝大多数现象,但验证过程很复杂,要考虑到所有环节,万无一失,就要动用大量数据,再经过整合对比,最终给出令人满意的答案。
但是,数据只能解释现象本身,或者用来验证结论,并不能解释现象发生的原因。这才是数据的局限性所在,也是很多人依然坚持“数据无法体现价值”的原因。
举个例子,上赛季克莱汤普森入选最佳防守阵容二阵,有些球迷表示欣慰,也有人提出质疑,认为克莱不符合标准,因为他的篮板、抢断、盖帽数据都很一般,ESPN的防守真实正负值甚至是负数(一项认可度很高的综合评价攻防水平的数据)。只看数据,克莱的确配不上,关键其他入选者的数据又偏偏符合标准,更让质疑者无法接受。
可是数据并不能告诉我们为什么教练愿意让他去盯防对面的箭头人物,也无法体现他的防守基本功、步伐有多扎实,他的对抗能力、防守态度、进攻端消耗体能后留给防守端的还有多少,都无法显示。
以及,克莱的防守判断精准,十分谨慎,不轻易下手掏球,习惯先通过脚步移动卡住对手路线,再上手干扰。很多球员喜欢冒险突击,抢到了数据+1,抢不到则大门敞开,数据没任何影响。数据无法体现克莱限制了一次进攻,他却送了对手一份大礼。
比如我想知道雷阿伦投篮准的原因,你不能告诉我因为他命中率高,投进总数多,命中经典绝杀多,这是结果而非原因。
原因是他的投篮动作像教科书一样标准,千锤百炼到从不变形,无球步伐精益求精,速度快且不拖泥带水,接球瞬间调整站位,干拔到最高点稳稳出手,一气呵成。
跑的本身就比别人快,出手快,出手点还高,所以即使防守人在身后穷追不舍也能轻松找到空位,贴脸防也能投进。
时至今日,人们对于数据分析的态度应该是有别于十几年前的,对于数据流分析者理应给予足够的尊重,数据的确可以解释绝大多数的现象,但却无法给出具体原因。
道理很简单,篮球问题,还是要对应篮球原因。