“深刻地理解”……由于我是非平衡统计物理背景,对随机过程的学习和理解是跟费曼路径积分掺在一起的。之前研究的核心是一种量子版本Fokker-Planck-Kolmogorov方程(演化的物理量不是转移概率,而是约化密度矩阵和辅助密度矩阵),既可以用费曼路径积分导出,也可以用随机过程的方式导出:借助Hubbard–Stratonovich变换,把感兴趣的自由度和随机场的自由度分离开来。对随机过程和费曼路径积分的深刻联系,题主感兴趣的话,可以往其中走走,比如参考这本书Path Integrals in Physics Volume I Stochastic Processes and Quantum Mechanics。
然后,我最近翻译的一篇文章正好有部分随机过程的创立历史,讲到了随机过程、Kolmogorov方程、伊藤形式等思想诞生的历史背景,现在搬过来分享,补充于其他答主极好的例子和讲解~。
下文选译自Shiryaev院士在1989年,为他的老师柯尔莫戈洛夫(Kolmogorov)写的长文《Kolmogorov:life and creative activities》,感谢Shiryaev院士允许我翻译他的著作。
文中名字,【安德烈·尼古拉耶维奇】即柯尔莫哥洛夫(有时也译作“柯尔莫戈洛夫”)。
1930年夏天,柯尔莫哥洛夫完成了他最杰出的概率工作之一,“ Uber die analytischen Methoden in der Wahrscheinlichkeitsrechnung” [K28],[PS-9],由此他奠定了马尔可夫过程一般理论的基础,揭示了该理论与整个概率论、常微分方程和偏微分方程以及数学物理之间的深刻关系。
柯尔莫哥洛夫在[K28]中说,其研究主题是连续时间过程。他特别强调了这一方面以及从中发展而来的方法的本质新颖性。
亚历山德罗夫和辛钦撰写的献给柯尔莫哥洛夫50岁生辰的文章中[6],评价了他的工作[K28]:
”在过去几十年里,人们很难找到可以比肩柯尔莫哥洛夫这项研究的工作,其对科学及其应用的进一步发展产生了根本意义。它开启的概率论的一个广博分支现已发展起来:即随机过程,它在研究和应用规模上已能与概率论分庭抗礼。柯尔莫哥洛夫的微分方程将马尔可夫过程纳为特殊情形,且数学上是完全严格的。之前物理学家在各种场景推导和使用的所有这些方程(Smoluchowski方程,Chapman方程,Fokker-Planck方程等)都缺乏严格的证明;柯尔莫哥洛夫提供了充分性的判据并阐明了使用条件。柯尔莫哥洛夫方程吸引了世界范围内理论家的广泛研究。该方程对理论的进一步发展和各种各样应用问题的数学发展至关重要。”
“分析方法”([K28]常被如此称呼)讨论的主要对象是从时间 状态 到时间 状态集合 的转移概率 , 。除却特定问题的边界情形, 满足一个基本方程,
现在称为Kolmogorov-Chapman方程(其表达了马尔可夫性)。
现在已知,在合适的条件下,人们可以构造马尔可夫过程 ,其条件概率 满足(15)式。在[K28][PS-9] 中,柯尔莫戈洛夫没有直接处理 的构造,而是从(15)推导了转移概率的微分方程。因此,他在尽可能的深度和广度上创建了一种新的分析方法——一种基于微分方程的手段,来处理遵从马尔科夫性质(15)式的连续时间随机过程的概率性质。
柯尔莫哥洛夫在他的“分析方法”中引入了“微分特征”(differential characteristics)的概念,对离散状态空间 和在实轴 上的连续扩散过程的情形都做了考量。
第一种情形,极限
充当了微分特征的角色。
第二种情况,对分布 假定具有密度
微分特征是如下极限
柯尔莫戈洛夫给出了这些极限的存在条件,并揭示了它们的真正实质: 是“瞬时均值”,而 是“瞬时方差“。
然后,柯尔莫戈洛夫在每种情况下都得出他著名的微分方程,即:
第一种,倒向微分方程
第二种,正向微分方程
方程(21)的形式曾由Planck和Fokker在扩散理论的工作中给出。
在[K28]中,柯尔莫戈洛夫讨论了这些方程解的存在性和唯一性、以及转移概率的可微性的问题。
柯尔莫戈洛夫(例如[K186]),费勒 [52]等人的论文继续讨论了这些问题。
由柯尔莫戈洛夫引入的微分特征(differential characteristics)概念,在马尔可夫过程半群方法的一般情况下得到进一步发展。该理论引入马尔可夫过程相对应半群的无穷小算子作为其微分特征,并给出了无穷小算子唯一确定转移函数的充要条件(Feller [55],Dynkin [46])。
如上所述,“分析方法”并未从马尔可夫过程的轨迹性质出发。 柯尔莫哥洛夫处理了转移概率及其微分特征。构造马尔可夫过程的一种强有力的方法是1940~1950年代发展起来的伊藤清 [81-85,87]随机微分方程(参见[86]和Gikhman [62-64})。 (Bernshtein[15]曾在1934年讨论了有限差分随机微分方程。)
伊藤清方法的要点是从最简单的维纳过程 , 来构造过程 作为如下随机微分方程的解:
。
伊藤直觉上相信,从时间 点 开始,过程 将局域地类似具有“漂移项” 和“扩散项” 的维纳过程。他还从“柯尔莫哥洛夫微分特征” 和 的本质出发,给出了构造马尔可夫扩散过程 的原创方法,其转移概率 满足柯尔莫戈洛夫方程。
至此,伊藤清首先为“随机微分方程”的概念赋予了精确的含义,接着提出了现已众所周知的适应过程(Adapted process)的随机积分。第二,通过使用逐次逼近,他证明了Lipschitz条件以及系数 和 随 的线性增长,确保了(22)式解的存在性和唯一性。第三,他确定了该解是马尔可夫过程。第四,运用他著名的“ 伊藤公式”,若 属于 类,则
他证明了马尔可夫过程的转移概率密度满足倒向柯尔莫戈洛夫方程。
1960年代和1970年代鞅方法崭露头角,尤其是Stroock和Varadhan [190,191]的工作发表后。它使人们能够在 和 相当弱的假设下,证明随机微分方程(22)式的所谓弱解的存在性和唯一性,这是在解决“分析方法”中提出的关于扩散(其 和 几乎不受实质性限制)的存在性问题征途上的一大进展。(另请参见[65,88, 114))。
“分析方法”以及1931年的另一篇论文“ Kine Verallgemeinerung des Laplace – Liapounoffschen Satzes” [K31],[PS-12]展示了如何使用微分方程研究转移概率,同时也提供了Laplace-Lyapunov-Lindeberg定理的全新证明,其思想基于:独立随机变量 (均值为0)的和序列 构成马尔可夫过程,且在适当归一条件下收敛到扩散过程。
通过这种方式,柯尔莫戈洛夫给出了一种构造如下概率的渐近展开的方法
。
他在[K31]也抛出了一个问题:“所有不等式 成立的概率是多少?”
实际上,(从现代角度来看)这是“不变性原理”的典型边界问题:
设有独立随机变量序列 (对所有 ), 。那么对足够平滑的边界 和 , ,下式在何种条件、以何种速度收敛:
其中 是标准维纳过程。柯尔莫戈洛夫证明,决定概率 的边界问题可以约化到某种形式,并给出下述量的渐进展开
其中,第一项即为 。
后来,普罗霍罗夫(Prokhorov,柯尔莫戈洛夫的弟子) [157]对于足够平滑的函数 ,获得了一个估计:
。
Skorokhod [182]在同分布有界随机变量的情形,通过“单一概率空间方法”(现在称为“强逼近”;参见例如Csérgo和Reéveész[36])获得了 的 估计。Nagaev [137]和Sakhanenko [163]将估计值精简为 ,消除了 和有界假设。(关于近年来概率 近似方法的发展,可参见Skorokhod [182],Borovkov [24,25],Komlos,Major和Tusnady [99],Stout [187],Csorgo和Revész[ 36]和Bingham[19]。)
从1930年6月到1931年3月,柯尔莫戈洛夫前往德法进行了为期9个月的学术休假。他与亚历山德罗夫一起在柏林逗留了三天,然后去了哥廷根。 柯尔莫哥洛夫在“追忆亚历山德罗夫” [K470]中写道:
“那时,哥廷根作为世界数学中心之一,是法国巴黎和美国普林斯顿的强劲对手,尽管长期工作人员非常有限,只有四位数学正教授:希尔伯特,柯朗(Courant),兰道和伯恩斯坦(希尔伯特66岁了并已退休离职;赫尔曼·外尔被邀请替补他的空缺)。 柯朗的许多年轻同事都只是助理。甚至已经被认为是现代抽象代数的主要人物的艾米·诺特(Emmy Noether)也没有教授头衔。她的学生范德瓦尔登(van der Waerden)和Deuring也只是助手。
“哥廷根数学主要围绕在希尔伯特、柯朗、兰道和诺特周围。这是一个非常友好的团体,亚历山德洛夫从未被视为陌生人……。我在哥廷根广泛交友:与柯朗及他的学生们讨论了极限定理,关于扩散过程作为离散随机过程的极限;与外尔讨论直觉逻辑;也与兰道讨论了函数论。”
柯尔莫哥洛夫然后到慕尼黑拜访了Carathéodory,科尔莫哥洛夫回忆[K470]:“他碰巧喜欢我在测度论方面的工作,并鼓励尽快发表,尽管他对我有关积分概念推广的工作不太感兴趣”。
在受到弗雷歇(Fréchet)的邀请后,柯尔莫哥洛夫和亚历山德罗夫决定到地中海地区的滨海萨纳里(距土伦不远)拜访他。他们途中一起工作(柯尔莫戈洛夫当时在研究概率论,亚历山德罗夫研究集合拓扑论),经过短暂的旅行(德国的巴伐利亚阿尔卑斯山,乌尔姆,弗莱堡以及法国的安纳西湖和马赛湖),抵达了滨海萨纳里。
“那时弗雷歇正在研究离散时间下各种类型和状态的马尔可夫链。我们与他讨论了最广泛情况下的所有马尔可夫问题。这种相当单调的生活(有时会因短暂远足而中断)持续了一个月,”安德烈·尼古拉耶维奇回忆说[K470]。在巴黎露面后,他继续前进:“……自然而然,我向老一辈数学家博雷尔和勒贝格询问他们对我工作的评价和建议。但不幸的是,我与他们的接触机会被迫减少到短暂访问。然而,事实证明,博雷尔(译者注:博雷尔既是数学家又是政治家)的干预对于延长我的法国签证至关重要:在前海军部长博雷尔签署了一封信之后,立即得到了许可。
本文节选自我翻译系列文章的第三篇,其他文章可参见我的专栏:柯尔莫戈洛夫的世界,关于现代概率轮的创立历史可见宋维凯HEOM:译作——老师柯尔莫戈洛夫的生平和工作(3):1930年代,现代概率论、随机过程的创立。柯尔莫戈洛夫生命的1930年代,是辉煌的十年:创立了现代概率论(包括公理化的横空出世和Chapman-Kolmogorov方程、随机过程等的奠基);1935年创立了代数拓扑的上同调;在泛函分析、近似理论、数理统计(kolmogorov-smirnov非参数统计)等领域也有多篇第一流的奠基性文章。
尝试答一个。
随机过程不随机,才是本质。
不随机的本质,是将变化作为边界的研究方法。
将变化作为边界的本质,是用封闭晶体封住研究对象,面对连续或者离散对象祭出组合封闭晶体。
封闭空间的本质,至少是二维,将抽象的过程具象成时间,将抽象的晶体具象成可积空间,因为不可积的空间没有密度。
时间和空间的的本质,在一个锥体中预测未来,但是时间、空间的切片会形成晶体反射与抵消,导致信息的损耗。
于是,抛一个硬币问结果是什么 与 抛一个初始态是花的硬币问结果是什么,是两个独立的时空。
随机变量 —(时间尺度叠加)—> 离散随机过程—(无穷维时间)—>连续随机过程;
随机变量—(空间尺度叠加)—> 有限维随机向量—(无穷维空间)—>随机测度(也就是一个随机的函数,这个函数刻画了测度的密度);
随机变量—(时间、空间无穷维化)—> 连续随机测度过程。