“大小”若指分子的长度,那许多物种的 DNA 分子长度远超历史上的估计值。这可能不是你想表达的。
三链、四链、特殊的小结构是出现了不少,但那些可能在遥远的太古就存在了。
人工制造的 DNA 分子机器可能会更符合你的要求。
单链 DNA 可以呈现环状、复杂的非螺旋状之类,复制叉上有局部解旋的 DNA,活细胞的端粒和一些启动子里存在 G 四联体[1][2]和 i-Motif[3][4]。按目前的推测,远古 RNA 世界里作为杂交链一部分的 DNA 或更混乱的化学分子汤里的 DNA 可能没有这些结构。
实验室里可以做出十字 DNA,自然条件下有没有局部使用十字 DNA 的生物目前还不清楚。
以下三种 DNA 双螺旋在地球生物的细胞里都可以见到,B-DNA 是活细胞内最常见的 DNA 双螺旋形式,A-DNA 多为脱水诱发、可以在耐环境的细菌·古菌和病毒身上找到,Z-DNA 偶尔可以在活细胞内出现。最初的不与 RNA 杂交的 DNA 链可能是 B-DNA 为主。
学术界有一些研究人员认为地球上的早期细胞生命只用了 2 种碱基,在细胞系统变得更加复杂、DNA 的信息密度提高后演化出另外 2 种碱基。
1977 年,苏联研究人员发现一种感染光合细菌的噬菌体的基因组中所有的 A 碱基都被 2-氨基腺嘌呤取代,该碱基后来被称为 Z[5]。
二十一世纪初,更多的研究人员在 200 多种噬菌体中发现了 Z 碱基,发现了一种制造 Z 碱基的酶,以及一种降解未结合在 DNA 链上的 A 核苷酸的酶。
- Z 碱基看起来是 A 碱基的化学修饰,是一个带有额外附件的腺嘌呤。其变化允许 Z 核苷酸与 T 核苷酸形成三重氢键,比将 AT 连接在一起的双键更稳定,可以抵抗细菌的 CRISPR。
- Z 碱基还可能影响 DNA 的其他物理特性,并表明一些被我们当做表观遗传的东西可能不仅如此。
要注意我们目前无法培养地球上的大部分微生物,根本就不知道还有多少不常见的碱基。如果某些微生物的核酸分子骨架发生了更大的变化,它可以变得连核酸都不是。
看起来,大部分现存生物的遗传密码的密码子-氨基酸分配[6]不是完全随机的,而是自然选择塑造的,经过优化来产生一定限度之内的遗传多样性,并保护细胞免受蛋白质合成过程中最常发生的各种错误的影响。
- 表示相同氨基酸的多个密码子往往仅在第三个位置的核苷酸不同,因为这是细胞翻译机器最可能出错的地方。以谷氨酸为例,它由 GAG 和 GAA 指定。
- 三个核苷酸中有两个相同而指定不同氨基酸的密码子,指定的往往是具有相似的关键化学特性的氨基酸。于是,发生遗传错误后蛋白质还是能大致折叠成预期的样子,保留原本的功能或至少是部分功能。
Freeland 等学者计算比较了真实的遗传密码与随机分配密码在抵抗随机突变时的效果,确定现在生物使用的遗传密码胜过几乎所有的随机分配,但并不完美。它可能是局部最优的:
- 20 种常见的蛋白氨基酸比较均匀地分布在广泛的疏水性、大小和电负性值范围内,可能与目前的遗传密码建立了较为稳定的关系;
- 添加更多碱基可能让突变更难控制,后果不完全是积极的;
- 在漫长的进化时间尺度上,拥有额外的氨基酸可能允许生物以新的方式适应环境,但短期收益可能不足以让额外的氨基酸保留下来;
- 在同种生物的种群内部,“碱基的大幅增减”“蛋白氨基酸数量的大幅增减”这样涉及遗传密码的重大创新可能难以站稳脚跟。
三十二个遗传密码就能表示 20 种氨基酸,存在这样使用遗传密码的现代生物,而且有六百多种,历史上大概更多:
Duax, W. and Redlinski, j. (2014), A genetic code with only 32 codons in LUCA (569.1). The FASEB Journal, 28: 569.1. A genetic code with only 32 codons in LUCA (569.1)
目前修改 DNA 的尝试:
通过在 DNA 中添加两种碱基,化学家弗洛伊德·罗梅斯伯格领导的研究人员将三位密码子的数量增加到 216 个。另有研究人员搞出了 8 种碱基的 DNA[7]。
Steven Benner 和他的同事制作了 12 种碱基的遗传密码表,尽管他们还没有将新的碱基对放入活细胞中。
哈佛大学著名遗传学家 George Church 多次成功地用生物体内冗余的密码子指定非标准氨基酸。可以参照:
- 将大肠杆菌的几个密码子重新分配到非标准氨基酸,从而让病毒无法利用这些密码子来劫持大肠杆菌的分子机器以复制自身。这些大肠杆菌不会被实验所用的大肠杆菌噬菌体感染[8]。
- 2019 年,该研究团队从头开始合成了大肠杆菌的完整基因组,替换了基因组中的一些密码子:用 AGC 和 AGT 替换了 TCG 和 TCA,用 TAA 取代了 TAG。
- 2021 年发表的是,该研究团队移除了大肠杆菌用来识别 TCG 和 TCA 密码子的 tRNA,从而让这些大肠杆菌不能正确制造含有这些密码子的病毒。
英国生物化学家创造出可以读取四个核苷酸(而不是三个)组成的密码子的核糖体,其效率并没有像一些人猜测的那样特别地降低。
参考
- ^ 同一条DNA单链上的4个G碱基,相邻之间成氢键形成的G四合体平面(G-tetrad)。这样的四合体平面反复出现,就会形成G四联体(G-quadruplex)。在平面的中间,通常还会存在一个阳离子(多为钾离子),帮助稳定结构。
- ^ DNA可不只有双螺旋结构 - 吴思涵的文章 - 知乎 https://zhuanlan.zhihu.com/p/36216255
- ^ 同一条DNA单链中的C碱基之间,两两形成氢键而成的结构
- ^ DNA可不只有双螺旋结构 - 吴思涵的文章 - 知乎 https://zhuanlan.zhihu.com/p/36216255
- ^ 通常, C 与 G 配对,T 与 A 配对。这种噬菌体则是 T 与 Z 配对。在基因转录期间,TZ 被当作 TA。
- ^ 四种核苷酸碱基、三个核苷酸一组,可以组成 64 个密码子,每 1 到 6 个密码子指定最常用的 20 种蛋白氨基酸中的每一种,还有 3 个表示停止构建蛋白质。第二十一种蛋白氨基酸“硒半胱氨酸”、第二十二种蛋白氨基酸“吡咯赖氨酸”分别用通常的终止密码子 UGA 和 UAG 编码,出现在少数蛋白质中。许多生物使用非标准密码子。线粒体的遗传密码就有和标准遗传密码不同的地方,不同生物的线粒体还可以有不同的遗传密码。 支原体将 UGA 翻译为色氨酸。 纤毛虫将 UAG(有时候还有 UAA)翻译为谷氨酰胺,一些绿藻也有同样现象,也有纤毛虫将UGA翻译为半胱氨酸。 一些酵母菌会将 GUG 翻译为丝氨酸。 某些蛋白质会有 AUG 以外的起始密码子。
- ^ 如何解读 2019年2月22日《科学》发表的合成生物学新突破「八碱基遗传系统Hachimoji」? - 孟凡康的回答 - 知乎 https://www.zhihu.com/question/313265388/answer/605701486
- ^ Sense codon reassignment enables viral resistance and encoded polymer synthesis BY WESLEY E. ROBERTSON, LOUISE F. H. FUNKE, DANIEL DE LA TORRE, JULIUS FREDENS, THOMAS S. ELLIOTT, MARTIN SPINCK, YONKA CHRISTOVA, DANIELE CERVETTINI, FRANZ L. BÖGE, KIM C. LIU, SALVADOR BUSE, SARAH MASLEN, GEORGE P. C. SALMOND, JASON W. CHIN SCIENCE04 JUN 2021 : 1057-1062