相關分析說明
相關分析壹般是研究定量數據和定量數據的相關性,以及變量之間存在相關性,相關程度是如何的,比如研究身高和體重之間是否有關聯等等。
相關分析數據格式
在進行數據分析之前都需要將數據整理成正確的數據格式然後在進行分析,那麽相關分析的數據格式是什麽樣的呢?如下說明:
相關分析的數據格式為壹個分析項為壹列,比如上圖中研究身高和體重,則身高為壹列、體重為壹列。
Pearson相關系數也叫皮爾遜積矩相關系數,通常用r表示,使用pearson相關系數,數據需要滿足:
線性
正態分布
沒有異常值
如果不滿足條件可以考慮使用spearman相關系數,以及pearson相關系數的計算如下:
Speaman計算公式如下:
針對pearson相關系數不能識別非線性關系以及並且對壹個或者幾個異常值比較敏感,此時可以使用spearman相關系數進行替代,spearman相關系數有時也被稱為級別相關系數或者秩相關系數,該相關系數是根據兩個變量的秩進行相關分析,spearman相關系可以用來衡量兩個變量之間是否存在單調相關關系。當值為1時說明壹個變量隨著壹個變量單調遞增,當值為-1時,說明壹個變量隨著另壹個變量單調遞減。