相关系有诸多概念,同时相关系与因果性是一个大问题。目前的机器学习(ML)等等都是以此为基准展开的。相关性问题与因果性问题,几乎成了一个基本的哲学问题。
上面一篇论文的论证方式,整体的逻辑结构非常有特色。结合这篇文章分下面三个部分简单的描述一下。
相关性一般指的是两个(或者多个)随机变量(或随机向量)之间的(线性)相关性,它代表了两个变量之间的某种量化关系。
量化出来无非是相关或者不相关。
很显然这部分的基本操作(基操)如下
其中原始数据比较多是调查。
箭头上面 一般是用统计软件 stata 、spss等等 ,当然一些特殊情况需要专门编程。
以原来的论文为例子。
先对变量进行了描述。
并进行了一定的处理,(可以称之为规范,数据清洗),以适合统计软件识别。
上面是简单的原理描述。
上面是统计软件运行后的结果。
上面整个部分主要是以相关性为主的。
相关性与因果性不同。
相关性可以理解成重要性,要素跟要素两者之间的比较性的关系,与之对应的是无向图。
因果性则是要素跟要素之间的因果关系,导致关系,可达关系,与之对应的是有向图。
以例子中的论文为例。
开始假设了14个要素。
通过相关性分析后,发现10个要素是相关性强的。
那么这10个要素相互之间是怎么作用的?最终呈现什么样的因果层次结构?
这就可以通过ISM模型或者AISM模型来解释。
上面是由专家分析得到的原始关系矩阵
上面是自动计算的软件。
输入A后,可以自动的得到可拖拽的对抗层级拓扑图。
上面是对抗层次拓扑图展示的结果(这个图巨丑,画得太难看!!)
例子中采用的回归——AISM模型充分体现和反映人的思维过程,具有结构清晰、计算简便、结论直观、易于理 解、可信度高等特点,可以在类似的相关性研究与因果性研究中广泛运用。
相较于文字、表格、数学符号等方式,AISM 在结果呈现上非常直观且清晰,它把评价对象(要素)看成一个结点,将存在优劣(因果)关系的结点用有向线段标识,AISM 最终以有向拓扑层级图的方式呈现结点间的优劣(因果)关系,进而很容易得出评价对象的优劣(因果)。
习惯上把越优(结果要素)的结点放置于上面的层级,越劣(原因要素)的结点放置在越下的层级,最终按照层级的高低给出各个结点的排序,最上层的结点为帕累托最优集,最下层的为最劣集。层级从下至上形成由劣到优的帕累托系列。经典的 ISM 方法求解层级过程是采用从优到劣的方式求解,即先从帕累托最优到帕累托最劣的方式求解,从层级图上看,就是从上至下放置层级要素;而本文引入了与之对立的方法,即从下层开始放置要素的方式。这两种层级抽取的方式,得到的帕累托全系列可能并不一致。
总之,图形化的表达在结果呈现上非常直观且清晰,要远优于文字、表格、数学符号等方式。