有机化学、热力学稳定性、突变、自然选择、概率论。
看起来,大部分现存生物的遗传密码的密码子-氨基酸分配[1]不是完全随机的,而是自然选择塑造的,经过优化来产生一定限度之内的遗传多样性,并保护细胞免受蛋白质合成过程中最常发生的各种错误的影响。
- 表示相同氨基酸的多个密码子往往仅在第三个位置的核苷酸不同,因为这是细胞翻译机器最可能出错的地方。以谷氨酸为例,它由 GAG 和 GAA 指定。
- 三个核苷酸中有两个相同而指定不同氨基酸的密码子,指定的往往是具有相似的关键化学特性的氨基酸。于是,发生遗传错误后蛋白质还是能大致折叠成预期的样子,保留原本的功能或至少是部分功能。
Freeland 等学者计算比较了真实的遗传密码与随机分配密码在抵抗随机突变时的效果,确定现在生物使用的遗传密码胜过几乎所有的随机分配,但并不完美。它可能是局部最优的:
- 20 种常见的蛋白氨基酸比较均匀地分布在广泛的疏水性、大小和电负性值范围内,可能与目前的遗传密码建立了较为稳定的关系;
- 添加更多碱基可能让突变更难控制,后果不完全是积极的;
- 在漫长的进化时间尺度上,拥有额外的氨基酸可能允许生物以新的方式适应环境,但短期收益可能不足以让额外的氨基酸保留下来;
- 在同种生物的种群内部,“碱基的大幅增减”“蛋白氨基酸数量的大幅增减”这样涉及遗传密码的重大创新可能难以站稳脚跟。
三十二个遗传密码就能表示 20 种氨基酸,存在这样使用遗传密码的现代生物,而且有六百多种:
Duax, W. and Redlinski, j. (2014), A genetic code with only 32 codons in LUCA (569.1). The FASEB Journal, 28: 569.1. A genetic code with only 32 codons in LUCA (569.1)
比这更多的遗传密码提供的是冗余度。
学术界有一些研究人员认为地球上的早期细胞生命用的是 2 种碱基,在细胞系统变得更加复杂、DNA 的信息密度提高后演化出另外 2 种碱基。
英国生物化学家已经创造出可以读取四个核苷酸(而不是三个)组成的密码子的核糖体,其效率并没有像一些人猜测的那样特别地降低。
参考
- ^ 四种核苷酸碱基、三个核苷酸一组,可以组成 64 个密码子,每 1 到 6 个密码子指定最常用的 20 种蛋白氨基酸中的每一种,还有 3 个表示停止构建蛋白质。第二十一种蛋白氨基酸“硒半胱氨酸”、第二十二种蛋白氨基酸“吡咯赖氨酸”分别用通常的终止密码子 UGA 和 UAG 编码,出现在少数蛋白质中。许多生物使用非标准密码子。线粒体的遗传密码就有和标准遗传密码不同的地方,不同生物的线粒体还可以有不同的遗传密码。 支原体将 UGA 翻译为色氨酸。 纤毛虫将 UAG(有时候还有 UAA)翻译为谷氨酰胺,一些绿藻也有同样现象,也有纤毛虫将UGA翻译为半胱氨酸。 一些酵母菌会将 GUG 翻译为丝氨酸。 某些蛋白质会有 AUG 以外的起始密码子。