长链非编码 RNAs(long non-coding RNAs,lncRNAs)是一类长度在200nt以上且不编码蛋白质的RNA,以带polyA尾和不带polyA尾两种形式广泛存在于各种生物体内,参与细胞内多种过程调控,具有跨物种的低保守性,组织特异性表达和丰度低等特点。
近年来的研究表明,lncRNA参与了X染色体沉默、基因组印记、染色质修饰、转录激活、转录干扰和核内运输等多种重要的调控过程,但绝大部分lncRNA的功能目前仍不清楚。应用高通量测序技术,研究人员能够快速获得与疾病或者特定生物学过程相关的lncRNA 并进行深入研究。
实验方案
测序策略:Illumina 平台 PE150
数据量:12G clean data
技术优势
(1)任意物种检测:相对传统芯片而言,无需预先设计特异性探针,因此无需了解物种基因或基因组信息,能够直接对任何物种进行最全面的转录组分析;
(2)分辨率高:可以检测转录本中单碱基的差异;
(3)检测范围广:从几个到数十万个拷贝精确计数,可同时鉴定正常和稀有的转录本;
(4)信息分析广:可以做基因差异表达分析、可变剪切、融合基因分析;新转录本预测及注释。
数据分析
标准信息分析
(1)数据过滤及质量评估
(2)核糖体RNA去除率计算
(3)比对参考基因组及统计
(4)基因表达水平分析
(5)基因表达差异及聚类分析
(6)差异基因KEGG生物通路富集分析(仅限于模式物种)
(7)差异基因GO功能富集分析(仅限于模式物种)
(8)已知mRNA表达量分析
(9)已知mRNA差异表达及聚类分析
(10)已知lncRNA表达量分析
(11)已知lncRNA差异表达及聚类分析
(12)预测新lncRNA
(13)新lncRNA鉴定和表达量分析
(14)新lncRNA差异表达及聚类分析
(15)新lncRNA家族分析
(16)SNP和InDel检测与注释
(17)生物学重复样品间相关性分析
(18)蛋白互作网络分析
(19)基因融合
(20)主成份分析(PCA)
(21)特征性差异表达基因分析
(22)lncRNA保守性分析
(23)可变剪切
高级分析
(1)已知mRNA-lncRNA共表达网络构建
(2)基因结构优化及优化基因的表达值计算
(3)eQTL分析
技术流程
案例分析
案例(1)瘦猪和肥胖猪组织中lncRNA的表达水平不同
该研究对猪的两个品种陆川和杜洛克的肝脏、肌肉和脂肪组织分别进行了lncRNA测序,共鉴定出4868个lncRNA转录本,其中3235个为新转录本,而且lncRNA和mRNA的表达模式是组织特异性的。脂肪组织中差异表达的lncRNA具有794个潜在的靶基因,这些靶基因富集到脂肪细胞因子信号通路、PI3k-Akt信号通路和钙离子信号通路。此外,差异表达的lncRNA位于13个脂肪相关的数量性状位点,其中包括65个QTL_ID。接着,分析了同一QTL_ID中的lncRNA和mRNA,并通过qPCR证实了其在两个QTL_ID中的共表达。该研究为两个猪品种脂肪代谢差异的分子机理提供了新的观点,为进一步研究lncRNA在肥胖发育中的调控作用奠定了重要基础。
图1 组织中lncRNA和mRNA的差异表达
图2 lncRNA和mRNA差异表达的热图
案例(2)长非编码RNA控制造血干细胞功能
造血干细胞(hematopoietic stem cell,HSC)具有独特的基因表达程序,能够自我更新和分化成各类成熟血细胞。长非编码RNA(lncRNA)已成为基因表达和细胞命运决定的重要调节因子,尽管它们在HSC中的功能尚不清楚。该研究对纯化的HSC进行lncRNA测序,鉴定出323个未注释的lncRNA。比较这些lncRNA在差异谱系中的表达显示159个lncRNA富集于HSC,其中一些可能是是HSC特异性的(LncHSC)。这些lncRNA基因与编码蛋白基因具有相似的表观遗传学特征,如通过DNA甲基化调节表达。敲低两种LncHSC对HSC自我更新和谱系定型产生了的不同影响。该研究结果表明,lncRNA在HSC调控中起重要作用,为HSC调控的遗传回路提供了一个新的思路。
图1 HSC特异的lncRNA的鉴定
参考文献
[1] Yu et al. Comparative analyses of long non-coding RNA in lean and obese pig. Oncotarget, 2017.
[2] Luo et al. Long non-coding RNAs control hematopoietic stem cell function. Cell Stem Cell, 2015.