不是数学家。依我愚见,不等式不是目的,而是手段。当精确计算难以进行的时候,那么在某种程度上进行估计就是可以代替“等式”的手段,用以研究研究对象的性质。当然也有一些类似于高中数学的“凑某种结构”的情形,不过这种就比较技巧了。还有的是:不等式本身不是目的,而是一种刻画数学对象结构的方法。
下面举一些例子我觉得比较能作为"proof of concept",下文将隐去技术细节与严谨定义,尽可能只展示“能证明我上述观点的部分”,以免繁复的细节喧宾夺主。
第一个例子比较“计算机”。近似算法、随机算法。
不妨假设有某个算法 依据输入 来执行某项任务。如果要精确求解,那肯定是比较困难的。但是如果允许一定的误差,那事情就简单多了。例如 ,用 对于 进行近似。如果只能精确求解那估计很困难,但是如果允许一定的误差来近似,那事情就容易很多。事实上许多NP难的问题,你用一些近似算法或随机算法都可以将其松弛为P问题,例如半定规划(Semi-definite programming, SDP),可以该算法对NP难的MAX-CUT问题给出 0.87 近似,这在理论计算机领域是十分知名的。那么你这个算法究竟近似得效果如何?这当然需要通过不等式来衡量。依然是以SDP为例,它的很多近似结论可以由Grothendieck不等式导出。
如果以高中生比较熟悉的不等式为例,可以举这样一个例子:给定随机变量序列 满足 是独立同分布的Bernoulli随机变量(即 ),那么 的分布满足什么性质呢?这就可以如下考虑其尾重概率:
由马尔科夫不等式,得到 ,可以通过一些方法证明分子的上界,而后优化 ,最终得到 称为Hoeffding不等式。这样我们就可以给出一些算法的精度究竟如何。
我们看到:在这个过程中,对于高中生来说更容易见到的马尔科夫不等式(其实似乎也不容易见到),其实是作为工具来导出我们想要的数学对象的性质的,其本身并不是目的。只是最终数学对象(该算法)的性质(近似精度)是可以被不等式表达的(事实上也没有办法用等式),于是我们用这些不等式来作为工具得到最终的结果。
当然也有不等式本身就是目的 的情形,比如上述Hoeffding不等式也可以推广到非独立同分布的鞅情形,称为Azuma不等式,可以研究一类不等式最紧可以到什么地步?常数能是多少?这就比较类似于高中竞赛那种不等式放缩了,也是很有技巧的(当然不是竞赛的那种技巧)。再比如Sobolev嵌入的系数,在某些情形下似乎是有用的?(然而我并没有见过具体的使用这个系数的……)
计算机的例子比较应用,下面举纯数学的例子。
在巴拿赫空间理论中有一个伟大的理论称为Rademacher Type理论,它是用不等式定义的概念。巴拿赫空间是一种“元素具有长度概念”的空间(且满足其他性质,对于高中生只需要知道这种空间中的元素具有“长度”这一属性即可,元素 的长度记作 )。那么可以定义Rademacher Type:
若对于某些 ,存在常数 使得对于巴拿赫空间 中的任意向量组成的有限集合 成立有:
则使得上式成立的最小 记作 就称为巴拿赫空间 的Rademacher Type。其中 是独立同分布的Bernoulli随机变量。
在这个例子中,不等式是作为定义数学概念的工具,更深一层的:为什么要给一个巴拿赫空间提出一个“指标”?事实上是用不等式来使得某种不等式关系能够成立,这种不等式关系反映了数学研究对象(巴拿赫空间)的基本性质,用这个不等式,就可以“用数学表达式来刻画”这种性质,用来进行该巴拿赫空间的其他性质的研究。
以上是不等式的作用(应该是不全面的)。回到题主所说的几个具体的不等式。
切比雪夫不等式的本质是概率测度尾重与矩(范数)的关系,事实上在概率中基本上都是用尾重来做的,因为只要谈“尾重”(测度),那就有随机性;而谈矩(数学期望/范数),那就是确定的,我们还是更愿意谈论尾重,毕竟可以通过尾重,用马尔科夫/切比雪夫导出矩的性质(也就是说讨论尾重就暗含了矩的性质)。该不等式主要还是作为工具使用比较多。例如次高斯分布,是一类概率分布满足
的分布,其中 ,其任意 阶矩都满足 ,其中 表示是不等式成立,但并不关注前面具体的系数是多少(该系数与 相关)。这个性质就是由切比雪夫导出的。
柯西不等式是赫尔德不等式的特例,这在高中竞赛中很常见了,略去不表。
琴生不等式的本质是凸函数的刻画。凸性是一种很基础的性质。集合 若满足对于任意的 以及 且 有 则称 是凸集。例如在欧几里得空间上,凸集就是“没有坑”的几何体,比如球体、方体等。事实上凸集总可以由半空间的交得到(允许无穷多个半空间)。凸集这种数学对象的性质十分美好——你看,任意在凸体上连个线段,这个线段总是依然落在这个凸体内部,而不至于担心走着走着掉出去(比如你在球体中间掏个洞,这就不是凸体了,就很丑;比如你把像年画上娃娃的脸一样圆润饱满的玉石磕了个豁儿,那岂不是很丑?所以滴滴饱满的凸体还是性质好一些的)。有了数学对象,自然要考虑数学对象之间的变换,我们研究性质足够好的变换,什么叫性质好?这就引出了凸函数,而琴生不等式
正是用来刻画这种性质较好的变换的。这类似于我上面举的巴拿赫空间的Rademacher Type中不等式的用途,似乎如果使用琴生不等式来证明上面的观点更容易被高中生接收欸(但是我上面都打了一堆了懒得删)。
希望对于高中生有所帮助。如有typo或者gap请轻拍。上文中的英文皆是不知道怎么翻译。