真核生物的染色质通常情况下以核小体为单位进行致密的折叠,不表现出转录活性,同时部分开放的染色质区域作为特异性反式作用因子和顺式作用元件与基因组DNA相互作用的活跃区域。这种由染色质的开放程度定义的染色质可接近性(Chromatin Accessibility)对细胞的基因的表达,DNA的复制和修复等生命活动产生重要的影响,并且时刻受到细胞的严格调控。因此检测特定时空状态下细胞染色质的开放程度(从关闭状态到半开放,从半开放到完全开放),是探索染色质结构重塑对生物的生长发育、疾病的发生发展影响的重要研究方向。
ATAC-seq(Assay for Transposase-Accessible Chromatin using sequencing)方法利用高灵敏度的转座酶(Transposase,Tn5)在寻找染色质上可接近位置的同时对染色质DNA进行片段化和接头连接,进而进行高通量测序。细胞需求量在50000个左右,更适合数量有限的临床和珍贵样本,实验操作上更方便快捷,是一种创新的单碱基分辨率的表观遗传学研究技术。目前该技术已被广泛应用于揭示染色质丰富的表观调控信息、不同状态下开放染色质的变化,以及多种疾病中开放染色质图谱的绘制等,同样适用于真核细胞重编程及单细胞染色质开放性的研究,在医学领域是重大疾病发病机制、药物作用机制、新药研发和生物标志物等研究的重要利器。
本期我们精选了5月份最新的应用ATAC-seq揭示染色质可及性的几篇高分文章,现将主要结果介绍如下:
星形胶质细胞对中枢神经系统的损伤和疾病作出反应,其反应性变化影响疾病的结果。这些变化包括差异表达基因(DEGs),其多样性和调控尚不清楚。这项Nature研究结合了生物学和信息学分析,包括RNA测序、蛋白检测、转座酶可及染色质高通量测序(ATAC-seq)和条件基因缺失,预测在小鼠和人类不同的中枢神经系统疾病中,差异性控制12000多个可能与星形胶质细胞反应相关的DEG的转录调控因子。与星形胶质细胞反应性相关的DEGs在各种疾病中表现出明显的异质性。转录调控因子也表现出疾病特异性差异,但在两个物种的多种疾病中,61个转录调控因子的核心组被确定为共同的。研究通过实验证明,DEG多样性是由转录调控因子之间的组合、特异性相互作用决定的。值得注意的是,在不同的疾病中,相同的反应性转录调控因子可以显著调节不同的DEG队列;不同疾病中转录调控因子对DNA结合基序(motif)的接近改变显著不同;而DEG的变化需要多种反应性转录调控因子。研究表明,通过调节反应性,转录调控因子可以从根本上改变疾病的结果,这意味着它们可以作为治疗靶点。本研究提供了可搜索的疾病相关的反应性星形胶质细胞DEGs及其预测的转录调控因子资源。该研究结果表明,星形胶质细胞反应性相关的转录变化是高度异质的,并通过特定背景下的组合转录调控相互作用,从大量潜在的DEG中定制。
在去势抵抗性前列腺癌(CRPC)中,雄激素受体(AR)依赖性的丧失导致临床上具有侵袭性的肿瘤,几乎没有治疗选择。这篇Science研究使用ATAC-seq、RNA-seq和DNA测序对22个类器官、6个患者来源的异种移植和12个细胞系进行了研究。研究人员确定了特征良好的AR依赖和神经内分泌亚型,以及两个AR阴性/低组:一个Wnt依赖亚型和一个由激活蛋白1 (AP-1)转录因子驱动的干细胞样(SCL)亚型。作者使用转录组特征对366例患者进行了分类,结果表明SCL是AR依赖型之后第二常见的CRPC亚型。这些数据表明,AP-1与YAP/TAZ和TEAD蛋白相互作用,以保持亚型特异性染色质可达性和转录组图谱。总之,这种分子分型揭示了药物的靶点,并可能指导治疗决策。
冠状动脉疾病(CAD)是一种复杂的炎症性疾病,涉及跨细胞类型的遗传影响。全基因组关联研究已经确定了超过200个与CAD相关的位点,其中大多数风险变异位于影响顺式调控元件的非编码DNA序列中。在本研究中,作者应用转座酶可接近染色质的单核分析方法,对41例不同阶段的CAD患者的冠状动脉段28316个核进行测序,发现了14个不同的细胞簇。在所有细胞中比对了320,000个可接近位点,确定了细胞类型特异性元件和转录因子,并对功能性CAD风险变异进行了优先排序。结果确定了平滑肌细胞过渡状态(例如纤维肌细胞)中的元件和功能变异,预测它们分别改变平滑肌细胞和巨噬细胞对MRAS (3q22)和LIPA (10q23)的特异性调控。研究进一步提名了关键的驱动转录因子,如PRDM16和TBX2。总之,单核图谱为解释冠心病风险连续体的调控机制提供了关键的一步。
最近,人类滋养细胞干细胞(hTSCs)的衍生为人类胎盘发育提供了一个可扩展的体外模型系统,但hTSC身份的分子调控因子迄今尚未得到系统的探索。这篇Nature Communications文章利用全基因组CRISPR-Cas9敲除筛选来全面识别hTSCs中必不可少的和限制生长的基因。通过相互参照我们的数据和在其他细胞类型中进行的类似遗传筛选的数据,以及早期人类胚胎的基因表达数据,结果定义了hTSC特异性和富集的调控因子。这包括已经建立的和之前未鉴定的滋养层调节因子,如ARID3A、GATA2和TEAD1(必需的),以及GCM1、PTPN14和TET2(生长限制)。对染色质可及性、基因表达和全基因组定位数据的综合分析表明,转录因子TEAD1调控hTSCs中许多滋养层调控因子的表达。在TEAD1缺失的情况下,hTSCs无法完成向绒毛外滋养层(EVT)细胞的忠实分化,而是偏向于向合胞体滋养层(STB)细胞分化,这表明该转录因子保护了hTSCs的双潜能谱系。总之,这项研究为解析人类胎盘发育和疾病的分子调控提供了有价值的资源。
随着年龄的增长,造血干细胞(HSCs)表现出相当大的细胞内在变化。本研究中,我们对老化造血干细胞及其下游祖细胞的转录组和染色质可及性进行了综合分析。随着年龄的增长,造血干细胞的染色质可及性优先发生改变,并随着分化而逐渐消失。老化的HSCs中差异开放可及区域(DARs)富集了增强子,并富集了STAT、ATF和CNC家族转录因子的结合基序,这些转录因子在响应外部应激时被激活。老化的HSCs中与开放DARs相关的基因基础表达水平显著高于年轻HSCs,在细胞因子刺激后,它们的表达达到显著更高的峰值,表明开放DARs有助于增强应激条件下的转录反应。然而,模仿感染的短期应激挑战不足以诱导年轻HSCs中染色质可及性的持续变化。这些结果表明,持续的和/或曾经暴露于外部应激可能是表观遗传刻在造血干细胞中,以增强其对外部刺激的反应。
RSAT(调控序列分析工具)能够检测和分析基因组序列中的顺式调控元件。该软件套件能够执行(1)从新motif发现(包括从基因组数据集,如ChIP-seq/ATAC-seq);(2)已知motif的基因组序列扫描;(3) motif分析(质量评估、比较和聚类);(4)调控变异分析和(5)比较基因组学。RSAT包括50个工具。提供6台公共网络服务器(包括1台教学服务器),满足不同生物群落的需求。RSAT的理念和创意是(1)根据用户需要,通过web表单、本地安装命令行和程序化web服务的多模式访问;(2)几乎支持任何基因组(动物、细菌、植物,总共超过10000个基因组直接访问)。自2018年NAR Web议题发行以来,我们开发了一个大型REST API,扩展了对额外基因组和外部motif收集的支持,增强了一些工具和Web表单,并开发了一种新的工具,使用motif扫描(网络交互)构建或完善基因调控网络。RSAT网站提供了广泛的文档、教程和发布的协议。RSAT代码是开源许可的,现在存储在GitHub上。RSAT可以在http://www.rsat.eu/上找到。
相关链接:
创新基因科技,成就科学梦想