我院许忠能等发表论文指出转录组分析的一个误区
2020-02
文章来自:生命科学技术学院 阅读次数:1171
随着RNA测序(RNA-Seq)等技术的迅速发展与推广,转录组数据海量增长,这也可能使一些分析缺陷不断扩散。在分析大量已发表论文后,发现不少研究者忽视了实验中RNA生理动态变化过程(如RNA累积、RNA生理降解等)的影响。
很多实验要测定实验期间转录量或基因表达量,于是测定了处理组与对照组的RNA水平,得出基因表达上调或下调的结果,而基因表达上调往往被认为是基因表达增加或转录量增加,基因表达下调被认为是基因表达减少或转录量减少。然而,用一般RNA-Seq或荧光定量PCR等测出来的只是RNA现存量(RNA abundance),其数值上表示为:
RNA现存量 = 实验前RNA累积量 + 实验期间转录量 - 实验期间RNA降解量
如无其它条件限制,RNA现存量(既有完整的基因转录产物也包含被部分降解的RNA片断)往往与转录量不相关,而由此推导的分析也许会出现错误结果。例如,用RNA现存量进行基因差异表达(Differential expression)分析得到基因表达上调的结果(图1下左红实心圆),而实际上转录量却比对照组减少(图1下右绿实心圆)。又如,用RNA现存量进行基因共表达(Co-expression)网络分析(图2下左)会与用转录量的结果(图2下右)大相径庭。RNA生理动态变化也影响了对可变剪切(Alternative splicing)事件、新基因发现、基因融合(Gene fusion)事件、微RNA等的分析。
对实验中RNA生理动态变化过程影响的忽视可能是一些基因表达实验难以重复及进一步研究结果与基因表达实验结果不一致的原因之一。另外,其他生物分子的定量分析或许也出现相似的问题。
该论文发表在Briefings in Bioinformatics(影响因子:9.101)(Volume 20, Issue 5,September 2019, Pages 1725–1733), 生态学系许忠能副教授为第一作者和共同通讯作者,东京大学浅川修一教授为共同通讯作者。
图1 用火山图显示RNA生理动态变化对基因差异表达分析的影响
图2 基因网络显示RNA生理动态变化对基因共表达分析的影响
论文链接:https://academic.oup.com/bib/article/20/5/1725/5047383