虚假相关性(spurious correlation),理学-统计学-生物、医药、卫生统计-临床试验的自适应性设计,两个或多个变量间看起来高度相关,但却不存在因果关系的现象。又称伪相关性。缺失的混杂因素通常会造成虚假相关性。有时从数据中得出的相关关系,可能由一些没有得到控制的变量造成。随着观测变量个数的变化,观测到的相关(如正相关)可能转变为反向相关(如负相关)甚至不相关。因此这样的相关属于虚假相关性。例如,由于不考虑群体的年龄分布的不同,造成某些观测到的相关性是虚假相关性。假设要判断A城市人口的吸烟率是否比B城市人口的吸烟率高。从A城调查100名年轻人和400名老年人。从B城调查100名老年人和400名年轻人。发现A城有2名年轻人吸烟,80名老年人吸烟。B城有12名年轻人吸烟,50名老年人吸烟。忽略年龄因素的影响,B城的吸烟率要低于A城的吸烟率。但是如果仅考察年轻人,B城吸烟率要高于A城。仅考察老年人,B城吸烟率也比A城要高。此时忽略年龄而观察到的城市和吸烟率的相关性与真实的吸烟率情况相反,因而是虚假相关性。通过控制年龄进行分层,可以解决虚假相关性的问题。