ATAC+转录组联合分析怎么做?这里有套路!
2022-12-05 阅读数:2864
ATAC-seq全称为Assay for Transposase Accessible Chromatin with high-throughput sequencing,是一种利用转座酶研究染色质可进入性的高通量测序技术,该技术通过转座酶对某种特定时空下开放的核染色质区域进行切割,进而获得在该特定时空下基因组中所有活跃转录的调控序列。ATAC-seq凭借样本需求量低、建库流程简单成为表观基因组学研究的新宠。
在ChIP-seq技术兴起时,常见的文章套路会利用ChIP-seq技术与RNA-seq技术进行联合分析,从而更好的找到相关转录调控因子,而ATAC-seq与ChIP-seq都可以用来研究染色质调控区域中的分子调控机制,但ATAC-seq技术是否能够与RNA-seq技术进行联合分析,从而为染色质调控区域的相关研究提供更多的信息?近年有发表的相关文献表明,联合ATAC-seq技术以及RNA-seq技术进行数据分析,根据自身所关注的生物学问题,通过不同的分析策略和展现形式可以为染色质区域的分布和开放性研究提供新思路。
通过总结ATAC-seq与RNA-seq联合分析的文章发现,其中重要的部分是研究表观变化层面的变化与转录调控变化层面的变化是否有相关性,统计ATAC-seq与RNA-seq联合分析相关基因的数量以及相关表达情况,为关键基因的挖掘提供筛选集合,所以通过总结该类文献的研究思路发现,两个组学所反映不同层面的变化的相关性以及差异基因的筛选有两种类型:
首先分析基因表达与基因启动子ATAC-seq信号之间的显著相关性,用散点图来表示,然后根据基因的表达水平和启动子可及性将基因分组,形成四象限图,体现不同分组间的差异基因的数目。
在文章[1]中ATAC-seq与RNA-seq中差异基因的分组方法是依据ATAC-seq的reads在染色质启动子上的最大重叠数(可及性)高于数据的第70百分位,则基因被定义为高可达性(HA),如果覆盖低于第50百分位,则被定义为中低可达性(MA)的分类方法进行分组判断,然后根据每个基因的可达性和表达值,评估其是否可以被分配到四组:MA-ME(中低可达性和表达)、HA – He(高可达性和表达)、HA – ME(高可达性和中低表达)或MA-HE(中低可达性和高表达)(图一)。随后从HA-HE分组中挑选关键转录因子,主要根据显著富集的motif查看相应的基因以及功能(图二)。
图一 启动子可及性与基因表达密切相关
a为散点图显示启动子可及性和基因表达之间的强正相关。相关系数如红框所示;b根据启动子可及性和基因表达水平对基因进行分组。每组的基因数量在方框中显示。
图二 HA-ME基因分析,与对照相比,HA-ME基因启动子中富集的基序
整合ATAC-seq与RNA-seq数据,取ATAC-seq与RNA-seq之间差异基因的交集,根据生物学问题以及关注的关键基因选择共有的基因或者独有的基因集合进行研究。
在文章[2]中α细胞以及β细胞的放染色质区域,将这些可及染色质图谱与人类胰腺α细胞以及β细胞的RNA-seq数据相关联,以确定可能负责调节细胞类型特异性特征基因的顺调节元件(图三)查看相关基因的peak的位置以及富集情况去查找α细胞以及β细胞中的标记基因(图四)。
图三 胰腺α细胞以及β细胞ATAC-seq与RNA-seq中差异表达的基因比例情况
图四 胰腺α细胞以及β细胞中不同基因的peak的位置以及富集情况
染色质调控区域在许多疾病过程和胚胎发育中起着关键作用,所以表观遗传机制的研究十分重要,表观遗传涉及的范围非常广泛,包括DNA甲基化,组蛋白修饰,RNA的可变剪切,miRNA调控,转录调控,染色质可及性分析等。随着染色质免疫共沉淀芯片(ChIP-chip)技术的发展,大量的表观基因组分析技术已经出现,如ChIP-seq、DNase-seq、ATAC-seq等。近年来,越来越多的测序技术更新给研究带来极大的便利,与此同时不同技术的联合分析也越来越多,为不同的研究目的提供对应的参考。
总的来说,ATAC-seq与RNA-seq的联合分析重要的是如何从两种组学技术中挖掘相同或者不同的相关的差异表达基因,或者关注染色质开放性区域与转录调控层面的相关性,然后结合自身关注的生物学问题对挑选感兴趣的差异基因或者相关的生物学通路进行研究,有助于进一步了解表观遗传机制。
参考文献:
[1] Starks RR, Biswas A, Jain A, Tuteja G. Combined analysis of dissimilar promoter accessibility and gene expression profiles identifies tissue-specific genes and actively repressed networks. Epigenetics Chromatin. 2019 Feb 22;12(1):16.
[2] Ackermann AM, Wang Z, Schug J, Naji A, Kaestner KH. Integration of ATAC-seq and RNA-seq identifies human alpha cell and beta cell signature genes. Mol Metab. 2016 Jan 11;5(3):233-244.
[3] Merrill CB, Montgomery AB, Pabon MA, Shabalin AA, Rodan AR, Rothenfluh A. Harnessing changes in open chromatin determined by ATAC-seq to generate insulin-responsive reporter constructs. BMC Genomics. 2022 May 25;23(1):399.
[4] Li X, Chen Y, Fu C, Li H, Yang K, Bi J, Huo R. Characterization of epigenetic and transcriptional landscape in infantile hemangiomas with ATAC-seq and RNA-seq. Epigenomics. 2020 Jun;12(11):893-905.
[5] Wang L, Lv Q, Wu P, Luo S, Liu S, Chen X, Luo X. RNA-seq and ATAC-seq analysis of CD163+ macrophage-induced progestin-insensitive endometrial cancer cells. Cancer Med. 2022 Nov 14.
[6] Hu JL, Yierfulati G, Wang LL, Yang BY, Lv QY, Chen XJ. Identification of potential models for predicting progestin insensitivity in patients with endometrial atypical hyperplasia and endometrioid endometrial cancer based on ATAC-Seq and RNA-Seq integrated analysis. Front Genet. 2022 Aug 26;13:952083.