对科学的可证伪性存在很多讨论,包括在知乎上也有不少这样的讨论。而我这次有点想从历史语言学的角度说一小部分。从题主简要的问题描述来看,题主对“可证伪性”的定义是有一定的了解的。不过为了回答的完整性,还是简短地说一下“可证伪性”究竟是怎么来的。
在归纳推理(inductive method)是主要科学研究方法的年代,Karl Popper对此产生了疑惑。他觉得归纳推理并不是解决问题的方法。主要原因是归纳法是对目前观测现象的总结,而我们能观测到的现象是有限的,我们永远无法确定下一个现象的出现是否与我们所归纳得出的经验相符。他在1963年的作品 Conjectures and Refutations[1]中明确说道:
Induction, i.e. inference based on many observations, is a myth. It is neither a psychological fact, nor a fact of ordinary life, nor one of scientific procedure.
归纳法,即以众多的观测为基础的推论,是无稽之谈。它并不是一个心理学上的事实,也不是普通生活中的事实,更不是科学研究的过程。
就比如尽人皆知的有名例子:欧洲人先前并不知道黑天鹅的存在,因为欧洲所有的天鹅都是白色的。于是我们就可以根据归纳法得出“所有天鹅都是白色”这一结论。但是,当欧洲人发现了澳大利亚以后,同时也发现了黑色的天鹅。从此“所有天鹅都是白色”的这一结论就被打破了。可见我们没有办法通过穷举一个现象去得出正确的结论,归纳法只能得出我们所期待的结论。因此完全依赖于归纳法进行研究,会让我们难以预见很多重要的问题。Popper认为我们需要另一种方法,即演绎法(deductive)。他说:
The actual procedure of science is to operate with conjectures: to jump to conclusions--often after one single observation
真正科学研究的过程是对猜想的处理:跳到结论——往往是在观察到一个现象后。
其实这就是在说,科学并不是一个已证实的事实/知识的集合,而是一个个猜想的集合,也蕴含了我们永远得不到完全正确答案的意味。既然是猜想,那么必然有一定的概率出错。科学家的任务并不是要去证明自己的猜想有多正确,而是应该去寻找猜想出错的解救方法。要得到这样的解救方法,我们就应该把能够否定这一猜想的所有情况都找出来,这就是证伪的过程。也就是说,我们根据少量现象的观测,提出相关猜想或者假说,需要让这些猜想/假说作出预测,如果它们所预测的现象新观测的现象验证了,那么它们就可以继续接受下一个考验,如果新的现象不支持这一猜想/假说,那么我们知道这么想是有问题的,需要修复我们的理论。对于Popper来说,可证伪性是科学区别于其它领域的分水岭。
从此,尽管在科学哲学界来来去去的讨论经久不绝,“可证伪性”还是站稳了脚跟,成为检验理论是否“科学”的重要标准。
历史语言学是第一个号称把语言学研究推向“科学”道路的学科,也是在Popper明确提出可证伪的思想之前就已经在使用演绎法进行研究的学科之一。不过,历史语言学在发展的过程中,也不乏有关科学哲学方面的担忧。1972年,Anthony Arlotto在其著作Introduction to Historical Linguistics[2]中开篇不久,就提到了历史语言学所面临的问题。
他说,语言学遇到的其中一个最重要的科学问题,就是语言学家无法从实验室中严格控制的实验中寻求答案。而且这段话中,也看得出他认为语言学中测试假说的方法在方法论上是不完美的。确实,如果说历史语言学中所构拟的原始语言的目的是一种实实在在的自然语言,那么我们将永远不可能用事实去证实它。
这就带出了一个问题,历史语言学上的“可证伪性”的范围究竟在哪里。我们是否非要回到过去录下原始语言,才算是有了证伪的材料呢?事实上,Bloomfield (1933)[3]曾经告诉我们:
The comparative method tells us, in principle, nothing about the acoustic shape of reconstructed forms; it identifies the phonemes in reconstructed forms merely as recurrent units.
历史比较法原则上不显示任何构拟形式的声学形状。它仅仅是在构拟形式中辨认出重复出现的单位,音位。
我曾经在一篇文章中也说过,我们所构拟的原始语言中,所有的特征可能并不是出现在同一时期的,我们看到的是一个带有时间跨度的语言压缩后的样子。这篇文章就在以下这个链接中:
也就是说,真实的原始语言发音在很大程度上不能构成历史语言学证伪的材料。即便有时光机把我们带回数千年前,我们录到的可能只是一个一个时间点的原始语,这些不同时间的原始语的集合很可能会有缺漏,有的音变和形态可能转瞬即逝,也可能会出现语言学家对当时语言不同的主观判断,有关构拟真实性的争论还是会继续下去。
我们需要从语料本身实现证伪。语料可以是现代的,也可以是过去的(如果存在古代记载的话)。当然,有用的语料也是可遇不可求的,所以需要一定的运气,需要运气这事儿是坏事,也是好事。
赫梯语的发现就是这么一个运气的体现。索绪尔提出了喉音理论(Laryngeal Theory)以后,直到他逝世,都没有在现有的印欧语中找到这个所谓的“喉音”。就是因为缺乏这样证据,很多语言学家并不认为喉音理论有多大的真实性,但是他们同时又十分矛盾地认为索绪尔的喉音理论是一个非常聪明的解决办法。于是,这个理论就一直被认为是“抖机灵”,直到赫梯语被发现,并由库里沃维治在其中找到了喉音的实体痕迹。有关索绪尔和库里沃维治的故事可以在以下两个链接中看到。
可是我们研究得越来越深,很多的假说都不大可能在文献中找到测试的资料,尤其是研究印欧语系以外的语言的专家,他们所研究的语言很可能根本没有任何文字记载。这个情况下,当我们提出一个假说时,就要想:我还缺什么样的形式或者词汇才能进一步让我的假说看起来更好?然后我们就要进一步调查期待找到这么一个形式。
我明年即将刊发的一篇文章中,我对绰斯甲语的一个元音交替进行了构拟。简单地说,我认为原始元音*ʊ不出现在末尾时,情况A会变成o,在情况B会变成æ。它出现在末尾时,会变成u。而我为“人” vɟú这个词构拟了*ʊ这个元音:*vɟʊ。然而,我在写这篇文章的时候,“人”这个词出现在非末尾时,只呈现了vɟæ-一种形式。虽然这一种形式已经足以让我构拟*ʊ,但是我还是十分希望出现vɟo-这一个非末尾形式,这样就可以更加证明我的构拟是正确的。同时,我还有点害怕,因为假设出现了其它元音,比如vɟə-或者vɟɑ-,那么我的构拟就要遭到证伪——不仅仅是这一个词构拟错了,而且整个体系都会被牵一发动全身,需要很多修正。幸运的是,这篇文章在被初步接受以后,我在之前没有处理的录音中发现了vɟo-这个形式,并与母语人确认,顿时放下了提着的心,因为这意味着至少我的构拟在这一步经受住了考验。这也有运气成分。假设这个语言中真的就没有保留vɟo-这个形式,那我的构拟就永远无法得到进一步的检验了。
可以想象,历史语言学中有相当一部分的假说,是运气不好,没有得到检验的机会的。就如Arlotto所说的,我们在很多情况下,只能被动等待检验的机会,而没有主动地寻求检验的方法。
不过,随着研究的手段越来越多,语言学家也在主动地寻找检验理论的方法。比如我以前介绍过的Bodt and List (2019)[4]就设计了别出心裁的实验去检验音变的准确性。他们先用现有的语料整理出音变的对应关系,然后用计算机逆预测出一系列当时没有调查到的词汇的形式。得到了这些计算机模拟的词汇以后,他们又回到了田野,拿着这些计算机模拟的词汇调查各个方言的母语人,最后发现大部分的词汇都被准确地模拟出来了。这个实验在以下的链接中介绍了:
下面,我们来思考一个问题。理论上,我们如果能找一个反例,就可以推翻一个假说。但是在实际操作上,是不是真的只需要一个反例呢?很可能不是这么简单。也许我们可以用一个广为人知的物理学事件作为事例讲一讲。我们知道,牛顿的万有引力定律一直到十九世纪初期都相安无事,可是十九世纪二十年代以后,天文学家发现天王星的运行轨迹用万有引力定律似乎算不出来。法国天文学家Alexis Bouvard在著作Table d'Uranus中写道[5]:
[il faut] laisser aux temps à venir le soin de faire connaître si la difficulté de conclure les deux systèmes tient réellement à l’inexactitude des observations anciennes, ou si elle dépend de quelque action étrangère ou inaperçue, qui aurait agi sur la planète.
应该让未来的学者研究发现我们现在遇到的难题是因为古代记载的错误,还是因为有什么星球以外的力量使然。
这大概间接赋予了后来的两位天文学家约翰·柯西·亚当斯(John Couch Adams)和奥本·勒维耶(Urbain Le Verrier)大胆假设的灵感。他们认为,天王星的运行轨道与计算结果不符,是因为有一颗尚未被发现的行星在影响它。终于在1846年,德国天文学家约翰·格弗里恩·伽勒(Johann Galle)在柏林观测到了这颗不为人知的行星,也就是海王星。他写了一封信给勒维耶,说:
Monsieur, la planète dont vous avez signalé la position réellement existe.
“先生,您所说的行星的位置是真实存在的。”
在这里我们要看到一个道理。牛顿的万有引力定律在海王星没被发现的时候,无法解释天王星的运行轨道。也就是说,天王星的轨道证伪了1846年之前的牛顿万有引力定律。可是,我们是不是应该因为天王星轨道的孤例,而完全推翻万有引力定律呢?这显然是不明智的做法。因为万有引力定律在之前取得了极大的成功,如果我们仅仅因为一个行星产生的问题就认为我们需要从地基开始建立新的理论,这完全是不合适的。我们应该思考两个问题:一、如果这个定律是错的,为什么它成功解释了之前这么多的问题?二、我们有没有方法解释它为什么会出错?
正如后来的索绪尔凭空构拟了喉音,亚当斯和勒维耶也凭空假设了一个新的行星,并预测了它的轨道。正如库里沃维治在赫梯语中发现了喉音,伽勒观测到了海王星——1846年,在太阳系中,万有引力定律仍旧成立。
我们要认识到证伪不是一蹴而就的事情。回到历史语言学,如果我们发现了一个反例,就要完全推翻音变无例外的基本假设,这显然是不理智的。因为我们没有考虑在这个不完美世界下会发生的各种因素,比如类推、借用等现象。而与许多人理解的不一样,历史语言学家实际上完全不满足于“音变无例外”的工作流程,他们更多的工作集中在解释例外——即不断地给自己找证伪的方法,并想办法修复自己的假说。经典的例子就是维尔纳定律对格林定律的补充,在这里我就不赘述了。
在更多的情况下,构拟不仅仅包含一个假设,而更多的是许许多多假说的集合。这些假说辅佐以现象,构成了构拟的一个个步骤。这也是独立学者David Prager Branner在给白沙的上古汉语构拟书评中所表达的一个观点[6]。白沙的科研习惯是非常好的,他们的构拟的每一步都是清清楚楚,就像搭积木一样,你可以清楚地看到每一块积木是如何搭建的,并抽出其中的一块,告诉他们这一块不应该这么放,或者应该扔掉。这是一个可以检验、测试、证伪的假说的集合,同时有了这样的一个集合,我们可以更有效地完善理论。
当我们认为可证伪性是简单粗暴的,当我们认为仅仅一个反例就能推翻整个理论,那么我们就成为了“朴素证伪主义者”。严肃的证伪过程必然是艰难的。Imre Lakatos就说了,一个理论T被证伪的条件是,当且仅当另一个理论T'被提出,并且T'具备以下特点[7]:
同时,因为某些目的而盲目证伪也是一个不好的习惯。之前在这个回答里感谢了庞光华老师就是这个原因,在不冷静、不客观的精神状态下对某一理论进行抨击很可能导致自取其辱的后果。
证伪是一个好东西,它确实是检验科学理论的好方法。但是我们不能把它看得太过简单,应该认识到证伪的难度不亚于理论的建立,你也需要非常良好的科研素质才可以做到。
从历史语言学的角度,我觉得提高可证伪性的空间还是比较大的。毕竟连Matisoff都认为自己的原始藏缅语是可证伪的[8]。目前也有很多语言学家(包括我所在的团队)致力于语言学研究过程的清晰化,这也是增加可证伪性的一个重要途径。随着更多的语言学学生受到更严谨的科学训练,以后的历史语言学将会是非常完整的学科。