百科问答小站 logo
百科问答小站 font logo



华大基因的产前基因检测技术 (NIFTY) 99.9%准确率是如何实现的?未来有望成为常规孕前检测项目吗? 第1页

  

user avatar   talich 网友的相关建议: 
      

这玩意,一个看你是检查什么病,一个是怎么说这个结果。

像 Trisomy 这样的,比如唐氏综合征这样的,第一型和第二型错误都可以到 0.1% 以下。

什么是第一型和第二型错误?套维基上的说明:

以利用驗孕棒驗孕為例,此時未懷孕為零假設。若用驗孕棒為一位未懷孕的女士驗孕,結果是已懷孕,這是第一型錯誤。若用驗孕棒為一位孕婦驗孕,結果是未懷孕,這是第二型錯誤。

把怀孕换成唐氏综合征,就是这个意思。如果说怀孕为阳性,未怀孕为阴性,一型错误也就常被称为是假阳性(False positive error),二型是假阴性(False negative error)。

准确率高是因为分类器简单。

学过模式识别的人都知道,设计分类器,有两个重要的部分,一个是正确的特征(feature),一个是对应的分类器。如果有正确的特征,很普通的分类器,也能做出很高质量的预测,根本不需要什么深度学习那种的。

唐氏综合征就是这样的例子,因为它的特征很明白:21 染色体多了一个。所以,如果有了染色体的信息,取一个阈值就完了。所以,特征提取这个困挠人的大难题,不存在了。(相比一下,我有朋友是做孕妇败血症的,大海捞针,那个就完全不一个量级的难度)

难点呢,在于信号的质量很差,噪音很高。因为,你想知道的,是婴儿的染色体信息,但是在母血里,是和大量母亲的染色体混杂的。所以,这差别给冲淡了。

但是,像唐氏综合征这样的,靶子很大,不是只有一个特征,整条染色体所有位点全是特征,所以,就可以用空间采样密度来换取高信噪比,把整个染色体上上下下采个遍。如果是测序,就是整条染色体全测过,分成很多段来算,最后取平均。

另一个难点呢,其实是在如何归一化样本,让产妇样本之间的可比性增加,就能保证分类器的普适性。

这一点上,做产前检查的优势,就在有大量的样本。每年孕妇多少人?相关公司收集个几万样本不是难事,从此可以得到比较可靠的原始数据归一化方法。

这样下来,像普通的唐氏综合征这样的,第一型和第二型的准确率,都比较高的。这里是做此类检查的 Sequenom 公司的广告(见

MaterniT21® PLUS NIPT

),其中 sensitivity(灵敏度)是真阳性,就是 1 - 假阴性,specificity(特异度) 是真阴性,是 1 - 假阳性:

但是对有些病,就难了。比如只是染色体局部出现倍增或缺失的,这样你就只有一小段染色体来获取特征。这个就是此类筛查的分辨率的问题。像唐氏这样整条染色体的倍增,需要的分辨率很低,成功率自然就高。印像中,现在孕期筛查的分辨率做到几百万个碱基对这样的,问题不大。再降到基因一级,就是几十万到几万,是当下的目标。

再一个问题,就是这准确率怎么呈现。

比如吧,假设灵敏度和特异度都高达 99.9%。有一万个孕妇待查。我们知道对于 35 岁的孕妇,唐氏,就是 21 染色体倍增的比例,是 1/185。就是说平均有 54 名孕妇有这个问题,99.9% 的准确率是说这些孕妇都能被查出来,同时,一万孕妇里,有 10 个人也会被误诊。就是说,总共会有 64 名被查出可能有唐氏的孕妇,其中真正有唐氏的机率(学名叫 positive predictive value)是 54/64 = 84%。你要接着做有更大流产风险的穿刺检查么?

相比之下,18 染色体倍增机率是 1/470。这样算下来,真正有病变的机率就降到了 68%。如果是 13 染色体倍增,机率是 1/1500,就降到 40%。

(上面这几个病的数据来自 GenomeWeb 文章:

Clinical Sequencing News

所以任何检查,都会有免责声明:No test is perfect.

大致如此。




  

相关话题

  微基因测量位点数量是60万,而23魔方能测70万个位点,能不能理解为23魔方有更高性价比? 
  沃森说黑人种低智有无基因学依据? 
  互联网基因检测跟三甲医院做的基因检测有什么区别? 
  微基因测量位点数量是60万,而23魔方能测70万个位点,能不能理解为23魔方有更高性价比? 
  大学生如何发扬革命道德,传承红色基因? 
  吕布的基因那么强,为什么曹操不留着他配种呢? 
  生物体内为什么每时每刻都会着发生基因突变?难道不能避免吗? 
  为什么总感觉DNA有种智慧设计的味道,更象一种编程语言,一定有人说是演化的结果,但是做个假设,如果? 
  癌症和艾滋哪个更厉害? 
  如何解读Cell上病毒样蛋白Arc在神经元间传递RNA的新发现?是否可能改变我们对记忆形成方式的理解? 

前一个讨论
物理学常量(例如光速)把量纲去除(如果有的话)都是有理数还是无理数?
下一个讨论
Windows 系统的硬件利用率是不是很差?





© 2024-11-24 - tinynew.org. All Rights Reserved.
© 2024-11-24 - tinynew.org. 保留所有权利