这玩意有很多异同,总体来说两者最大的相似之处就是基于客观数据然后在数据上进行一通矩阵相关的操作得出一些相关性的结论。两者主要是降维操作。两者各有优势,不能说哪个好,哪个搓比。
主成分分析是利用线性变换的思想与方法,把多个指标转化为几个不相关的综合指标(主成分),也就是说最后得到的指标(列)是原始变量(列,指标,属性)的线性组合而成。
比如原来有10个指标,最后的主成分是5个,后面的5个是前面10个指标的组合而成。新的指标数量更少(降维了),名称也要变过,这样使得主成分比原始变量具有某些更优越的性能,从而达到简化系统结构,抓住问题实质的目的。
而因子分析更倾向于从数据出发,描述原始变量的相关关系,是由研究原始变量相关矩阵内部的依赖关系出发,把错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。
上面的图很现成的了,解释得非常清楚。
PCA的主成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等)。而FA的因子个数需要分析者指定,指定的因子数量不同而结果也不同。
PCA常被用作达到目的的中间过程的手段。最烦的是要降维,还要给这些玩意命名重新命名等。
因子分析可确切的得出公共因子。然后直接解释原因。
这两种分析方法都有很成熟的软件进行计算,比如SPSS、Stata等统计软件都可以轻松的计算出来。其它的编程语言也是都有例子。比如C ,C++,Js,Php,matlab,R,python。甚至excel都可以计算。
两种方法都可以用来算权重,或者是来降维。但是降维本身不要过份依赖这种客观法。
这里举一个实际中常用的综合评价问题。
CE,是综合评价(Comprehensive Evaluation)简写。 所有的综合评价只要是涉及多个评价对象都可以用SAISM模型来指示。比如环境监测综合评价、药物临床试验综合评价、地质灾害综合评价、气候特征综合评价、产品质量综合评价等等;在社会科学中广泛应用于总体特征和个体特征的综合评价。比如,社会治安综合评价,生活质量综合评价、社会发展综合评价、教学水平综合评价、人居环境综合评价等等。在经济学学科领域更为普遍。如,综合经济效益评价、小康建设进程评价、经济预警评价分析、生产方式综合评价、房地产市场景气程度综合评价等等
CE有三个关键技术。
1、指标的选取。即有多少列。
2、权重的确定。即求权重的方法,用主观法,还是客观法
3、模型方法的适宜。只要是多个评价对象的,都可以用SAISM
综合评价最关键的一步是指标的选取。
以高考选拔的指标来说。
选什么指标如果根据考分然后弄个主成分分析、与因子分析来个降维。这说服力的不行的。
上面左边的一个流程是通用的,从本科论文到博士论文都用得上。
其中指标确认的地方,可以加一个因子分析达到降维的作用。用因子分析比主成分分析好。
从灌水的角度考虑就上面的步骤,有一些能灌水的,能扯上3万字。