大致步骤:
- 求出原数据的经验累计分布,对比数据(如正态分布)的累积分布函数 (CDF)。对于正态分布,其分位点横坐标取值为$(i-0.5)/N,\quad i=1,2,..,N$
- 画出Q-Q’图
如下图,为普通的QQ图。普通QQ图用于评估数据集的分布的相似程度。如果两个数据集具有相同的分布,普通QQ图中的点将落在45度直线上。如果经过线性变换后两个数据集有相同的分布,则QQ图落在某条直线上,但不一定是$y=x$。
当对比数据集为正态分布时,如下图
在R语言中,
1 | # data为数据集,这个命令用于画出概率密度图 |