辛普森悖论是指,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。
比如这个表中,两分球和三分球投中率都比球员A高的球员 B,整体的命中率反比球员A低。
NBA两位球员投球表现
球员A | 球员A | 球员B | 球员B | |
---|---|---|---|---|
2分球 | 3分球 | 2分球 | 3分球 | |
投中 | 200 | 5 | 90 | 50 |
总投球数 | 250 | 50 | 100 | 150 |
头中率 | 80% | 10% | 90% | 33.3% |
球员A | 球员B | |
---|---|---|
投中 | 205 | 140 |
总投球数 | 300 | 250 |
头中率 | 68.33% | 56% |
也就是说,“质”(命中率)与“量”(投球数)是两个维度的数据,如果全部合并成“质”(命中率)这个维度的数据,那就会出错。