KEGG和DAVID是目前常用的信号通路查阅网站。大多数做pathway分析的,都会用到它们。
然而16年Nat Methods就有人比较过这些pathway分析网站:DAVID数据库更新慢,跟不上最新的pathway文献结果,导致预测pathway并不准确。KEGG早就停止数据库下载,更新也不及时。
这两家做pathway分析非常早,很出名,大家都爱用。可当时再怎么好的网站,无论从数据还是算法上,经过这么多年更新换代,已经被很多新网站超越了。
就好像一件以前很时髦的衣服,你不想扔,缝缝补补穿在身上,加入每一年的潮流元素,过了这么多年,还不如重新买件衣服。
这种事情在生物学网站工具里还挺多。
比如大家做基因敲除时,设计sgRNA爱用MIT自带的设计工具,这个工具完全靠blast序列比对,没有实验数据支持。
然而从13年到现在,很多研究组在细胞里随机设计sg,从不同sgRNA的基因敲除效率反推,知道更符合实验规律的sg设计原理,同时结合染色质开放还是沉默这些信息(染色质开放区,sgRNA更易结合),大大提高sgRNA敲基因的效率。
有段时间连MIT也出了更新版,和旧版同时存在,有人还在用MIT最初始的版本。
再比如我之前做同源基因比对,用到这个领域常用的orthoMCL,安装的时候简直吐血。这个软件是2013年出的,当时调用了blastp SQL等其他工具,而今其他工具都升级,orthoMCL却没升级,拿旧版的软件调用新版工具,非常酸爽。
后来问了专门做进化的,改用orthofinder。
回到这个问题。
KEGG这些工具对于学习粗浅pathway知识非常有用,但是很多信息已经老旧了,如果要准确了解知识,可以查最新的review;如果做pathway分析,用新一些的工具。
KEGG引文量确实高,因为它老牌它出名,大家爱引用它。一般研究,拿它就够用了,深入做哪条通路的话,还是找下review吧。
如果想比较各pathway工具优劣,可以参考2016年的这篇Nat Methods:Impact ofoutdated gene annotations on pathway enrichment analysis,可以从中挑选更适合自己的分析工具。