1 典型相关分析的基本思想5 |( ]5 H$ c. `9 X) \
通常情况下,为了研究两组变量 $ n9 p" ]/ R8 N, B' Y ) y: b1 t8 A/ m) R+ l' r0 |5 K9 @2 L. h% b
8 I5 t5 a. [/ t* M4 |0 G O$ G `
的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有 pq 个简单相关系数,这样又繁琐又不能抓住问题的本质。如果能够采用类似于主成分的思 想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。 首先分别在每组变量中找出第一对线性组合,使其具有最大相关性, + E8 `# T: K' n a) c 2 w o: v3 u" c 4 Y# e) \" L6 f9 I( ]$ |9 E ! ?. u9 }3 @4 J* o( S& N然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相 关,第二对本身具有次大的相关性。9 {( X4 W) h! {: d6 ^, P
: K, z; ?$ k' Q2 J) r) z5 L0 K; N, @7 T, Q! |$ Y, P$ L
2 R4 d6 Y+ }# t8 d, O典型相关的数学描述 5 h. V( W6 {( k7 D# [ }+ j+ ^ c: b& v研究两组随机变量之间的相关关系,可用复相关系数(也称全相关系数)。1936 年 Hotelling 将简单相关系数推广到多个随机变量与多个随机变量之间的相关关系的讨论 中,提出了典型相关分析。 实际问题中,需要考虑两组变量之间的相关关系的问题很多,例如,考虑几种主要 产品的价格(作为第一组变量)和相应这些产品的销售量(作为第二组变量)之间的相 关关系;考虑投资性变量(如劳动者人数、货物周转量、生产建设投资等)与国民收入 变量(如工农业国民收入、运输业国民收入、建筑业国民收入等)之间的相关关系等等。 5 H1 ~ @6 _) `1 q8 X/ S. `0 n" E; U7 A$ U
复相关系数:' R2 I, V- Z8 V0 n C1 y' D
# P% C+ J7 o: W/ F( o5 I$ J5 s: G2 G3 S7 k* l
$ g7 `8 g2 X) t! Z3 o i/ X+ s. x/ J( O; `5 V+ t5 @* x+ t! k$ ]
/ K7 x9 f1 [* ~2 E/ G7 V