这个问题本质上问的就是,怎么得出基因型和表型的对应关系的,出现一个表型(比如疾病),怎么知道是某基因型(比如某个基因突变)引起的。
这是属于典型的功能基因组学的研究范畴。
这种对应关系其实可以从不同的层面/水平进行研究。比如表型往往是新出现的,最简单的一种路线就是,对出现新表型的个体进行全基因组/全外显子测序,找出与参考基因组不同的序列/基因,这个时候,往往会找到很多这样的序列/基因(正常人也会有很多变异/突变),这时候就需要进行筛选。筛选一般是基于已有的对基因功能的研究(就是看突变的基因看起来像不像是导致这个表型的基因)。
筛选之后,需要做功能研究,这个包括体外蛋白互作、模式生物的体内功能研究。体外试验主要看从信号通路的角度是否可能是某基因变异引起的新表型;体内试验比如找个小鼠,将筛选出来的这个或几个基因进行敲除/敲低或者过表达,看会不会引起相应的表型,如果有,那很可能就是这个基因变异导致出现了新表型。
这样是不是就完美了呢?并不是。
要让这个研究彻底无懈可击,还需要在人群中进行验证。比如往往某表型的出现不仅出现在一个个体中,我们可以看出现了相同/类似表型的个体,是否也同样有相同/类似的基因突变,如果确实是这样,那可以说,这种对应关系就建立起来了。
很多这样的对应关系,就成为了其他功能基因组学研究的重要基础。因为细胞/人体不同基因之间的相互作用非常紧密又非常复杂,基因间往往形成一个复杂的信号调控网络来使细胞行使正常功能,通路的某个节点研究清楚了,也会对相邻、上下游节点的研究有帮助。
而通常,这种对应关系不是说每一个都能研究得这么彻底,比如有些复杂疾病可能由多个基因引起的,这样就需要更多研究和证据。所以说基因和疾病发生的关系,有时并没有完全清楚。
这个时候,我们就引入了证据级别这样的系统,就是说这个基因的突变和疾病的关系是强相关、弱相关,还是不相关,把这些根据相关性进行分类。目前在遗传病(胚系突变)、肿瘤(大部分是体细胞突变)等方面已经形成了相对成熟的体系。
比如ACMG/CAP/AMP就联合起来发了一个指南,推荐把一个胚系突变和遗传疾病的关系分为:致病、疑似致病、意义不明、可能良性、良性五个级别。
那肿瘤的体细胞突变怎么办?后来AMP/CAP/ACMG/ASCO这几家机构又联合起来发了个专门针对体细胞突变和肿瘤的关系解读的指南(叫Standards and Guidelines for the Interpretation and Reporting of Sequence Variants in Cancer:A Joint Consensus Recommendation of the Association for Molecular Pathology, American Society of Clinical Oncology, and College of American Pathologists),把基因突变分为I-IV共四类:分别是具有强临床意义的变异(I级,包括A和B两个亚分级)、具有潜在临床意义的变异(II级,包括C或D两个亚分级)、变异的临床意义不确定(III级)、良性或疑似良性相关的变异(IV级)。