Q-Q' Plot

大致步骤:

  1. 求出原数据的经验累计分布,对比数据(如正态分布)的累积分布函数 (CDF)。对于正态分布,其分位点横坐标取值为$(i-0.5)/N,\quad i=1,2,..,N$
  2. 画出Q-Q’图

如下图,为普通的QQ图。普通QQ图用于评估数据集的分布的相似程度。如果两个数据集具有相同的分布,普通QQ图中的点将落在45度直线上。如果经过线性变换后两个数据集有相同的分布,则QQ图落在某条直线上,但不一定是$y=x$。

常规 QQ 图

当对比数据集为正态分布时,如下图

正态 QQ 图

在R语言中,

1
2
3
4
5
6
# data为数据集,这个命令用于画出概率密度图
plot(density(data))

# 画出正态QQ图与直线,其中col=2代表红线
qqnorm(data)
qqline(data, col=2)