认为非编码 DNA 有功能的历史跟认为其无功能一样长。一部分非编码 DNA 有功能,大部分没有直接功能。
题目谈到的这项研究的结论不是题目里那样的。可以找更多这样的案例,但首先这项研究本身需要更多验证。
相关研究[1]对比了人和黑猩猩的神经祖细胞(fbNPC)发育成的类脑器官,发现七个锌指蛋白基因在人神经干细胞中大量表达、在黑猩猩神经干细胞中几乎不表达,调查其他细胞发现上述锌指蛋白中 ZNF138、ZNF248、ZNF558 的表达差异似乎局限在特定器官的特定发育阶段。然后他们重点关注 ZNF558。
ZNF558 基因可能起源于 1.05 亿年前,最初的功能可能是充当 LINE-1 转座子的抑制因子,后来在人体内的功能只有作为转录因子调节线粒体自噬相关的基因 SPATA18,在早期人类大脑发育过程中影响发育时间。一些较新的文献认为线粒体是神经干细胞命运决定和神经发生过程的核心。
实验数据经过统计,显示 ZNF558 基因的表达受其下游的可变数目串联重复序列(variable-numbertandemrepeat,VNTR)的大小调控,VNTR 的表观遗传操作可以关闭 ZNF558 来增加 SPATA18。
这是非常间接的机制,分子层面的原理研究得很不清楚,跟一些“科技新闻”试图暗示的“非编码 DNA 可能有许多重要的功能”不同。
本项目中使用的 fbNPC 和类器官模型系统概括了人类大脑发育的部分特征,但不能表示真实大脑也如此。为了验证这发现,研究人员调查了人胎儿组织,但找不到黑猩猩胎儿组织样本,无法验证真实的黑猩猩大脑发育中 ZNF558 表达的程度。他们的诱导多能干细胞(iPSC)建模依赖于 10 种以内的黑猩猩 iPSC 系,在个体差异方面也不能说多么有代表性。
2012 年,DNA 元件百科全书(ENCODE)项目的研究人员用宽泛的定义(生物化学功能,能转录成 RNA、能结合组蛋白、涉及脱氧核糖核酸酶Ⅰ等全都算“功能”)宣布人类基因组约 80% 的部分有功能,这之中大多数功能序列并不编码蛋白质。
2017 年,Dan Graur 的计算显示,人类基因组中至少 75% 的序列不应该有直接的功能。
Graur 综合考虑了物种传代过程中面临的有害突变的风险性、人类历史进程中已知的人口稳定度和繁殖率,在演化上为“本身并无作用”的序列找出作用: