这个问题可能比你想象的要复杂很多。当然如果放在中学数学的范围内又没那么复杂。下面我先在中学数学的框架内回答一下,然后再在测度论的基础上完整地回答一下。
高中数学范围内的回答:
因为条件概率是一个确定的数,而随机变量是一个随机的数。
这当然很不严谨。说的细致一点:给定事件A和B,条件概率 就可以求出来了,它是一个在0,1之间的实数。而随机变量是一个从样本空间(即某一个随机试验的所有可能的结果组成的空间)到实数的映射。由于一个给定的实数不是映射,所以条件概率不是随机变量。
完整的回答:
条件概率的严格定义其实并不那么简单,原因是“原始”的定义方式,即 , 只对概率大于0的事件B适用,但是一般地,我们希望也可以对概率为0的条件定义条件概率。比如我们有一个随机变量Y, 希望了解已知Y的取值的时候各种事件的概率。这当然是个直观上非常正常的问题,但是如果Y是连续型随机变量,那么问题就来了:对任意取值y, Y=y的概率都是0,这时候该怎么定义Y=y的情况下的条件概率?
答案是,和条件期望的严格定义一样,我们需要借助积分。具体来讲,我们有
定义,定理:令 为一个概率空间, 是一个子 域。则存在一个从 到 [0,1] 上的映射 , 满足:
此时的 被称为给定 的正则条件概率。
所以回到这个问题:注意到一个 可积函数本身就是一个随机变量。所以当你固定要求条件概率的事件而让条件(更准确地讲, )变化的时候,条件概率就是一个随机变量。其他理解方式下的条件概率都不是随机变量。
这个问题比看起来要困难,特别是题主还加上了“高中数学”的tag,而事实上很多数学系的本科生也不一定可以清楚地想明白这个问题.
首先我们指出随机变量的定义:
如果在脱离测度论的情况下,对随机变量的理解应该是:随机变量是样本空间上的实值函数.
在明确了随机变量的定义后,接下来我们来讲条件概率是个什么东西.事实上,条件期望是比条件概率更一般的对象,所以我们不妨先来看看条件期望的定义:
由条件期望的定义,我们可以清楚地看到 是一个随机变量.
如果我们取 为由 另一个定义在 上的随机变量 生成的 代数 ,那么 就是给定随机变量 的全部信息条件下 的条件期望.
特别地,如果 是示性函数,其中 ,那么我们可以记 ,它表示给定 的条件下 发生的概率,可以看到 是一个随机变量,这个随机变量的随机性体现在 本身的随机性上.于是当我们固定某个 时,这个随机变量就应该会取到某个确定的数,如果我们把这个数记为 ,则有
,
于是我们有 ,这也就是我们从高中开始就一直接触的条件概率的形式,这是一个数.但是这个数 是随机变量 的某个具体的取值.这样一来我们就可以看到通过严谨的测度论语言定义的条件期望与我们之前接触到的通过直观感受定义出来的条件期望的联系.
我们注意到 ,其中 ,于是取 ,我们可以记
进一步地,如果我们取 ,其中 是 生成的 代数,那么可以记 .
由此出发我们可以把测度论下定义的条件概率和我们在高中或者本科时候所学到的条件密度或者条件分布列联系起来.在联系上条件密度之后,我们可以再回过头考察一开始我们定义的条件期望和高中或者本科时学习到的条件期望的联系: