典型相關分析(CCA) 用於研究壹組X與壹組Y數據之間的相關關系情況。它是借助主成分分析思想,從兩組變量中提取出壹個或少數幾個綜合變量(即典型變量),從而將對兩組變量關系集中到少數幾對典型變量間的關系之上。
從步驟上講:典型相關分析***分為三個步驟。
第壹步:提取出典型相關變量非常重要
第二步:尋找典型變量與研究變量之間的關系表達式,以及典型變量與研究變量間的關系情況
第三步:典型冗余分析
下面通過壹個案例讓大家對典型相關有更為直觀的認識。
(1)背景
為研究運動員體力和運動能力之間的相關關系情況。***收集38個學生樣本進行分析。測試數據包括體力指標***7項(反復橫向跳、縱跳、背力、握力、臺階試驗指數、立定體前屈、俯臥向體後仰);運動能力指標***5項(50米跑時間、跳遠、投球、引體向上、耐力跑)。
從上述背景來看,X***由7項表示,Y由5項表示。若是研究X和Y這兩組指標之間的相關關系情況,不能通過常規的相關分析直接研究,因而使用典型相關分析進行研究。
(2)操作步驟
分析時如有需要可保存典型變量,用於後續研究。
(3)結果分析
SPSSAU***輸出4個表格:表格1用於典型變量表述典型變量之間的相關關系情況;表格2和表格3用於展示典型變量與研究變量間的數學表達式關系和相關有關系;表格4可用於典型冗余分析。
①典型相關系數及顯著性結果
表1展現的是典型變量的提取情況,上表中***顯示***有5個典型變量被提取,經過顯著性檢驗,有2個典型變量呈現出顯著性(P<0.01),因此,最終以兩個典型變量為準進行後續研究。
典型變量是成對出現的,也就是說,這兩個典型變量事實上分為典型變量X1和典型變量Y1;典型變量X2和典型變量Y2。
對呈現出顯著性的典型相關變量間的相關系數值進行分析,第壹對典型變量的相關系數值為0.763,第二對典型變量為0.706,相關系數值較高,說明典型變量之間有著緊密的正向相關關系。
②典型系數和典型載荷系數(X)
表2展現的是典型變量X與原始X組分析項間的關系情況。 典型系數 用於構建典型變量與X組指標的模型公式; 典型載荷系數 用於具體了解典型變量與X組7項指標之間的相關性。
由於表1中已經得出只有典型相關變量X1,X2通過顯著性檢驗,此時重點關註各指標與典型變量X1,X2的相關情況即可。典型載荷系數絕對值越大說明該項與典型變量之間的相關關系越強:
典型變量X1與X組7項的相關系數(載荷系數)值分別是:-0.598,-0.751,-0.316,-0.380,-0.296,-0.306,-0.277。
典型變量X2與X組7項的相關系數(載荷系數)值分別是:0.311,-0.510,-0.118,0.039,0.773,-0.060,-0.163。
用示意圖來表達,如下圖所示:
明顯的,典型變量與X1(反向橫向跳),X2(縱跳)的關系很強,即典型變量更多地提取反向橫向跳、縱跳這兩項的信息。
典型變量與X2(縱跳),X5(臺階試驗指數)的關系很強,即典型變量更多地提取縱跳、臺階試驗指數這兩項的信息。
③典型系數和典型載荷系數(Y)
同樣步驟,分析典型變量y與原始y組分析項間的關系情況。典型變量Y1與原始變量Y1(50米跑時間),Y2(跳遠),Y3(投球),Y4(引體向上)的關系很強,載荷系數絕對值均大於0.5,即 典型變量更多地提取50米跑時間、跳遠、投球、引體向上這4項的信息。
典型變量與Y2(跳遠)的關系很強,載荷系數絕對值為0.446,即典型變量更多地提取Y2(跳遠)的信息。
用示意圖表達,即如下圖所示:
④典型冗余分析
表4為典型冗余分析,即了解典型變量對於研究數據的信息提取量情況。上表格展示5個典型變量分別對於X組或者Y組指標的信息提取情況;比如上表中典型變量X1可提取出X組7個指標20.325%的信息量,典型變量X1可提取出Y組5個指標11.826%的信息量。
從上表可以看出:典型變量X1和典型變量X2對於X組7項指標的信息提取量分別是20.325%和14.293%,***計34.62%;以及典型變量Y1和和典型變量Y2對於Y組5項指標的信息提取量分別是46.751%和7.760%,***計54.51%。
(4)分析總結
分析到此,大致可以總結得出: X組與Y組進行典型相關分析,總***提取出兩個典型變量對。
典型變量對1更多地提取反向橫向跳、縱跳這兩項的信息;典型變量對2更多地提取縱跳、臺階試驗指數這兩項的信息;典型變量對1更多地提取50米跑時間、跳遠、投球、引體向上這4項的信息;典型變量對2更多地提取跳遠的信息。
除此之外,典型變量對1之間的相關系數值為0.763,並且典型變量對2之間的相關系數值為0.703,典型變量相關系數值均高於0.7,意味著X組7項指標與Y組5項指標之間有著非常緊密的正向相關關系。
最終分析情況可歸納為如下兩圖:
登錄 SPSSAU官網 體驗在線數據分析