这就是一个纯生物学,或者通过生信分析的祖源分析的事情了。
这事情可以通过去年华农的一篇nature的论文来解释。
关于论文的更多内容可以看我以前写的文章,关于“如何看待中方专家组称在蝙蝠和穿山甲中发现的冠状病毒相似度不足以使其成为新冠病毒的直接祖先?”这个问题,就看论文里的一个配图就好了。
这个图可以分为左上,右上,和下部三个大的结构来看。
先看右上,右上的图是系统发育树,或者叫进化树也行,是描述不同物种之间亲缘远近的。可以看到RaTG13与新冠病毒的亲缘最为接近,而穿山甲冠状病毒(pangolin-CoV)与他们的亲缘关系就远了一点。而且发现的蝙蝠冠状病毒的亲缘就更远了。所以从这个图我们可以看出,新冠病毒与穿山甲冠状病毒和蝙蝠携带的RaTG13的亲缘最近。
那么有多近呢?接下来看左上部分。
左上部分为新冠病毒,穿山甲冠状病毒和蝙蝠身上的3种冠状病毒全基因组序列对比,其中包括目前已知相似度最高的RaTG13,可以看到虽然他们的相似度很高,比如穿山甲冠状病毒与SARS-CoV-2和RaTG13非常相似,序列同一性在80%和98%之间(S基因除外)。但细微之处可以看出来,但在5'端与ZXC21和ZC45更相似。
也就是说,他们几个很相似,应该是有一定的亲缘关系。
如果只考虑穿山甲病毒的80%相似度,还低于其他几种蝙蝠携带的冠状病毒,那么为什么右上的发育树里会把穿山甲冠状病毒列的那么近呢?
这里边就需要看细分序列,也就是图片的下部分。
在1-914和1534-3825这两个核苷酸序列部分,新冠病毒是与RaTG13相似度非常高的。
但是在1312-1533这部分,新冠病毒与pangolin-CoV更高,尤其是pangolin-CoV的S蛋白的受体结合结构域(RBD)与SARS-CoV-2仅具有一个氨基酸差异。
也就是从不同蛋白构成的氨基酸序列来看,pangolin-CoV在其中某些关键位置上相似程度非常高。
所以华农的论文结论是,新冠病毒应该是穿山甲冠状病毒和一种类似于RaTG13的冠状病毒重组产生的。那为什么是类似RaTG13而不就是RaTG13呢?
从这个图可以看到,RaTG13与新冠病毒的相似度也有96.1%,那为什么RaTG13不会是新冠病毒的一个祖先呢?
包括《自然医学》《自然微生物》在内的多本期刊都发表过关于RaTG13与新冠病毒的关联,学界目前的认知是,RaTG13应该在40-70年前就与新冠病毒的祖先分家了,这样才能形成这么多差异位点。所以RaTG13只是被石正丽教授发现的众多的蝙蝠携带的冠状病毒中与新冠病毒序列最近接的一个病毒。它并不是新冠病毒的直接来源。
而这个来源在哪里?目前的猜测是往着东南亚地区,混杂着穿山甲冠状病毒与蝙蝠冠状病毒同时存在的雨林或者其他类似环境里。