咨询热线:400-065-6886
首页>>技术支持>>科研进展

回顾DNA甲基化百年研究历史


上海天昊生物 
 

1925年,5-甲基胞嘧啶首次在细菌中被报道。然而,几十年来,它的生物学重要性并不清楚。在最初的停滞之后,这种甲基化的碱基在生命的所有领域普遍存在,并显示出一系列基本的生物学功能。时至今日,我们已经掌握了建立、维持和去除DNA甲基化的关键因素的知识,并已经获得数量惊人且快速增长的碱基分辨率的甲基化图谱。尽管如此,关于DNA甲基化模式的精确作用和解释的一些基本细节仍在研究中。


 

近日,Trends in Genetics最新综述回顾了DNA甲基化研究领域,从它的开始到现在,重点是在哺乳动物系统中的发现,并为读者指出选择实验形成这一领域的基础。


图片



图片
 

20世纪之交,Walter Sutton(1902)和Theodore Boveri(1903)各自提出了遗传染色体理论,将孟德尔(1866)长期被忽视的基因行为和遗传规律与他们自己的减数分裂研究联系起来。这一最初有争议的理论在1910年的一篇论文之后得到了它的一位批评者的信任,即Thomas Hunt Morgan,其证明了黑腹果蝇的眼睛颜色是由X染色体上的基因遗传决定的,为支持这一理论提供了第一个决定性证据。Levene和Jacobs对核酸的研究表明,它们位于核苷酸的聚合物链中,对这些核酸组成的日益浓厚的兴趣为表观遗传学领域奠定了基础,其中DNA甲基化是一个核心角色。


【5mC在活细胞中的发现】这一时期内,多项研究在不同的物种和细胞中首次发现了5-甲基胞嘧啶,包括结核分枝杆菌(1925)、小牛胸腺(1948)、哺乳动物/昆虫/植物(1950)。1953年DNA双螺旋结构被报道之后,Sinsheimer在1954年发现5mC在DNA中不是随机分布的,而是在CpG二核苷酸中特异分布的。

【总结】为什么从最初的生物学发现到对5mC的研究进展如此之快要经过这么长的时间?一个显而易见的原因是它被发现的历史背景。1925年,我们还不知道核酸聚合物链携带遗传信息。1928年由Frederick Griffith转换实验、1944年的Avery-MacLeod-McCarty实验、第二次世界大战的结束、1952年Hershey-Chase实验和DNA双螺旋结构的发现帮助奠定必要的基础,使5mC在DNA中可能的相关性的探索变为现实。另外两个因素可能引起了一些最初的犹豫:其他组在他们的结核分枝杆菌DNA分离株中没有发现5mC,而Hotchkiss和Wyatt报道的5mC的低丰度似乎不符合5mC具有主要生物学功能的条件。另外,值得一提的是,在这些实验进展的同时,发育生物学家Conrad Waddington1942年创造了“epigenetics”(表观遗传学)这个词并于1957年发表了他广泛使用的表观遗传学图谱。然而,这些概念并没有与DNA甲基化联系起来,直到它的功能在随后的几十年变得更加清晰。


 

图片
 

分子生物学为从植物到哺乳动物的DNA甲基化研究奠定了基础。然而,对细菌中核酸甲基化的研究首先取得了重要进展。作为一种易于控制和丰富的模式生物,细菌为原核生物中的5mC生物学提供了重要的见解,从而为其在高等生物中的研究铺平了道路。


【细菌限制和修饰系统】这一时期内,Arber提出了限制和修饰系统(R-M系统),甲基化敏感的“限制酶”通过消化病毒的DNA来保护宿主免受病毒的入侵。细菌DNA免受这些限制酶的影响,因为它们的DNA以物种特异性DNA甲基化的形式发生修饰(1965)。

【细菌DNA复制中发生甲基化】Billen等人在细菌中发现DNA复制后甲基基团被添加到新生的DNA链上(1968)。

【大鼠组织中5mC和甲基转移酶活性】同样在1968年,胚胎和成年大鼠不同组织的核提取物中发现DNA甲基转移酶活性。

【总结】DNA甲基化的第一个生物学作用来自于对细菌免疫和DNA复制基础的研究,尽管尚不清楚这些功能是否会在高等生物中保守。一个关键的进展是基于酶在核酸聚合物中负责将甲基基团添加到胞嘧啶的发现。这表明DNA甲基化可以被调控,从而为特异性靶点修饰提供了途径特别是,5mC在啮齿类动物中可能的组织特异性作用很有趣,但数据太少,还不能得出更有意义的结论。


 

图片
 

一旦人们了解到,尽管5mC的含量相对较低,但它在细菌中确实具有生物学功能,DNA甲基化也可能在跨物种中发挥更普遍的调控作用的可能性就变得可信了。同许多领域一样,需要取得重要的技术进步,才能对这十年中出现的理论模型进行全面和详实的研究。


【更广泛的DNA甲基化定量】20世纪70年代初,Vanyushin对许多动物的不同细胞类型中存在的5mC水平进行了定量,包括海绵、软体动物、海胆、硬骨鱼、两栖动物、爬行动物和哺乳动物。

【DNA甲基化在基因表达中的作用】随着质谱甲基化分析报道的增多,一些研究小组推测5mC在高等生物中的可能作用,包括:(i)5mC可能在真核生物发育中不发挥作用;(ii)5mC可能引导DNA突变,当时被认为是转录变化所必需的;(iii)5mC可能作为转录激活因子。1975年,分别发表了三篇值得注意的综述,均为思考和研究DNA甲基化的生物学效应提供了独特的框架。虽然每一篇综述在其具体的、合理的机制上都有所不同,但他们都基本同意,5mC将在调节基因表达和协调发育方面发挥作用。

【5-aza和甲基化缺失】20世纪70年代末,一种名为5-aza5-氮杂胞苷)的化合物的研究与DNA甲基化领域发生了交叉,并最终为该领域提供了另一个重要的工具。5-aza是一种胞嘧啶核苷类似物,可结合到DNA和RNA中,在20世纪60年代末和70年代初被广泛用作诱变剂和抗癌药物。Friedman发现5-aza对大肠杆菌的处理降低了5mC而不是6mA水平,这表明除了其诱变特性,5-aza可能是5mC甲基转移酶的特异性抑制剂。一年后,Jones和Taylor将这些发现扩展到真核生物,报道5-aza降低了5mC,并推测它可能阻碍了沿着DNA的可能是进行性的甲基转移酶活性的进展。

【总结】20世纪70年代,关于DNA甲基化在基因调控中的作用的研究和假设模型都取得了显著进展。改进的5mC检测方法支持特定位点的甲基化分析,是该领域的主要加速器。对这些早期论文的仔细阅读揭示了需要强调的其他要点,包括无脊椎动物和脊椎动物之间基因组甲基化的整体差异,尽管其他结果如脊椎动物精子的低甲基化在其他人重复时并不正确。在这个十年结束时,该领域对物种内部和跨物种的DNA甲基化有了良好的评价,DNA甲基化作为基因表达的抑制因子已被普遍接受。


 

图片
 

20世纪70年代中期至80年代中期,在体外和体内克隆以及转基因技术方面取得的一些进展使一系列新的实验得以探索DNA甲基化的序列信息和功能作用。例如,将未甲基化和甲基化的DNA结构插入活细胞的可能性是这十年许多研究的基础。


【CpG岛(CGIs)的发现】虽然精子总体上高度甲基化,但在精子细胞中也可以看到类似于早期后生动物胚胎中发现的低甲基化延伸,这些延伸在组成性表达基因中也存在。Bird和同事随后发现,这些未甲基化的区域由富含CpG的DNA组成,并且在许多小鼠组织中都保持未甲基化。由于其对HpaII核酸酶消化的敏感性,最初被命名为HpaII微小片段,后来被推广为CGIs。

【第一个DNA甲基转移酶克隆】细菌甲基转移酶的克隆和蛋白测序为了解其催化结构域的进化保守性和功能提供了重要的线索。特别是对细菌酶M.HhaI的研究,阐明了甲基转移反应的化学性质,以及细菌甲基转移酶序列特异性的酶学研究。基于这一势头,一系列从哺乳动物组织中纯化和鉴定DNA甲基转移酶活性的研究导致Bestor及其同事在1988年成功克隆了鼠DNA甲基转移酶1(Dnmt1),这是首个哺乳动物DNA甲基转移酶。

【总结】20世纪80年代对DNA甲基化的总体分布和功能提供了重要的见解,包括CGIs的发现和对5mC在基因调控中的作用的进一步理解。十几种细菌和首个哺乳动物甲基转移酶的成功克隆和鉴定代表了另一个里程碑。尽管普遍的共识是5’启动子甲基化抑制转录,但这一规律的一些例外强调,仍需要进一步的研究来理解和解释DNA甲基化在特定环境中的作用。尽管在哺乳动物系统中有这些关键的进展,但值得注意的是,当时的主导模式生物包括酿酒酵母、果蝇和秀丽隐杆线虫,它们没有DNA甲基化,这可能解释了对5mC具有更广泛意义的一些遗留的担忧。


 

图片
 

20世纪90年代,我们对现象的分子理解取得了重大进展如基因组印记和X染色体失活。除此之外,这十年是特别值得注意的一系列研究发现、克隆、并敲除哺乳动物的甲基转移酶,揭示了它们在发育过程中的重要作用。与此同时,拟南芥作为一种强大的模式生物,在包括DNA甲基化在内的表观遗传学研究中获得了支持。

【DNA甲基转移酶的第一个晶体结构】1993年,Roberts实验室发表了第一个DNA甲基转移酶M.HhaI的晶体结构,其与甲基供体SAM的复合物分辨率为2.5埃。M.HhaI的核心结构是最小的甲基转移酶之一,主要由所有5mC甲基转移酶中保守的序列基序组成。
【哺乳动物新的Dnmts的发现与特征分析】Dnmt1 敲除细胞中残留的甲基化表明存在额外的甲基转移酶。前人研究表明,不同的细菌胞嘧啶甲基转移酶的催化结构域之间以及与DNMT1具有很大的同源性。因此,不同的研究小组利用同源性为基础的BLAST搜索,独立鉴定了其他真核生物DNA甲基转移酶。Dnmt2随后被排除为候选的新的甲基转移酶,因为它在胚胎干细胞(ESCs)中明显缺乏5mC甲基转移酶活性。然而,Dnmt3aDnmt3b能够以相同的效率将半甲基化和完全未甲基化底物的CpGs在体外进行甲基化,同时在小鼠ESCs中表现出高表达,而在体细胞中的表达通常较低。小鼠ESCs及其相应的敲除小鼠模型中Dnmt3a和b的单和双敲除表明,这些酶在胚胎发育过程中发挥着重要的和部分重叠的作用。
【总结】20世纪90年代,对哺乳动物和植物DNA甲基转移酶和具有甲基结合域的5mC阅读器的功能评估以及对转录抑制的研究被明确。基因组甲基化的重要作用,虽然还没有完全被理解,但帮助科学界对DNA甲基化产生了更广泛的兴趣。不幸的是,尽管有很多令人兴奋的事情,但关于DNA去甲基化是否发生以及如何发生的问题,在这个十年结束时仍然没有得到解决,尽管有许多尝试和出版物,但没有得出明确的机制。


 

图片
 

21世纪初,随着包括拟南芥、小鼠和人类在内的多个基因组组装草图的完成,生物科学发生了重大转变。这些基因组图谱反过来又使研究表观基因组的其他层面成为可能,并因此作为基础,使得在本十年末首次对单个基因调控的推论扩展到整个基因组的尺度。计算工具和更具成本效益的测序方法出现在这十年的后半段。1992年首次报道的亚硫酸氢盐测序技术成为了甲基化量化和定位的金标准。这些工具被迅速应用于生成第一个基因组范围的甲基化图谱(methylomes)。与此同时,甲基化阅读器、写入器和擦除器在基础生物学方面也有重大进展。

【DNMTs和组蛋白修饰的联系】2001年,Tamaru和Selker发现粗糙脉孢菌基因dim-5对于正常的DNA甲基化模式中是必需的,并显示它编码一种催化组蛋白3赖氨酸9(H3K9)甲基化的酶。用H3L9或H3R9部分取代H3K9导致5mC水平降低,表明H3K9的甲基化是某些DNA甲基化的上游所必需的。这导致了真核细胞Dnmts可能依赖于特定的组蛋白修饰作为辅助因子来指导其活性的想法。Jackson和同事随后证明了这一原理在植物中也成立,他们报道了拟南芥H3K9甲基转移酶KRYPTONITE是DNA甲基转移酶CMT3催化CpXpG甲基化所必需的。
【全基因组甲基化图:第一个甲基化组】2000年代中期,利用酶和抗体富集5mC,然后进行微阵列杂交,绘制了拟南芥基因组的第一张基因组范围甲基化图谱。虽然之前的拟南芥研究已经确定了重复序列和转座子的DNA甲基化,但基因组规模的图谱证实并扩展了这些发现。他们表明,基因的5’端大部分不存在CpG甲基化,而组成型表达的基因体区则广泛甲基化,以及相对CpG缺失。Henikoff和Jacobsen假设基因甲基化可能有助于沉默基因内的隐性启动子。在产生小干扰RNA和基因间非编码RNA区域的广泛甲基化表明,这些元件也可能受DNA甲基化控制。在这些植物研究的同时,BestorSchübeler实验室使用类似的基于富集的技术创建了第一个人类DNA甲基化的综合图谱。这些图谱加强了先前的工作,支持了启动子CGIs在正常人类细胞中主要是未甲基化的;然而,Schübeler实验室在一个结肠癌细胞系中发现CGIs的高甲基化,这与Bird实验室早期的观察结果一致。有趣的是,该细胞系在大的基因缺失区域和失活的X染色体上也显示出显著的低甲基化。
【启动子结构和功能】Saxonov和同事对人类基因组进行了计算分析,发现了两类启动子:低CpG (LCG,30%的启动子)和高CpG (HCG,70%的启动子)密度启动子。与LCG启动子相关的基因倾向于具有独立于启动子甲基化的转录潜能,而这些启动子大多是典型的甲基化。相反,大多数HCG启动子被发现是未甲基化的,即使它们的相关基因没有被转录。在HCG启动子确实发生甲基化的特定环境中,例如体细胞的生殖系基因,这种甲基化足以阻止转录。这些研究以及之前的工作进一步强调了大多数内源性启动子并不主要受甲基化调控,未甲基化的启动子富集了H3K4甲基化。结合2007年的DNMT结构和生物化学论文,这些研究有助于建立一个共识,即H3K4甲基化可能保护这些启动子免受DNMTs的影响。
【主动的DNA去甲基化】小鼠早期植入前胚胎的5mC免疫染色显示,在第一次卵裂分裂前,父本原核内5mC迅速丢失。相比之下,母本原核中的5mC信号在双细胞期之前基本稳定。重要的是,父本缺失5mC与DNA复制无关,这意味着在受精后的头几个小时内,一定有一种主动的机制在起作用。在这一发现之前和之后的十年里,已经有许多论文声称已经确定了这种去甲基化活性,但没有一篇论文得出了可靠和可重复的机制。最后,2009年的计算搜索指向TET1TET2TET3及其同源物。具体来说,TET1在哺乳动物细胞中催化5mC转化为5-羟甲基胞嘧啶(5hmC)。Kriaucionis和Heintz连续发表的研究也证明了5hmC在神经元中丰富,进一步加强了5hmC在主动去甲基化途径中的作用。尽管在后生动物、真菌和藻类中TET酶普遍具有保守性,但植物似乎更多地依赖DNA糖基化酶来去除甲基化,尤其是高度甲基化重复序列附近的基因。
【总结】这十年为DNA甲基化的全基因组分布提供了关键的见解,连同机制和结构上的进展,建立了一个更全面的DNA甲基化观点。这些努力使得在过去几十年里以较低分辨率单独建立的原则在整个基因组中得到推广,例如,通过证明5mC抑制CpG致密启动子的转录是充分的,而不是必需的。然而,大多数启动子实际上不受5mC调控的发现,促使研究范式从以启动子为中心的观点转变为一种更全面、整体的方法来理解DNA甲基化。重要的是,5mC与其他表观遗传修饰(如H3多肽赖氨酸4甲基化)的相互关联也越来越明显。寻找已久的去甲基化酶的发现是解释分化和正常发育过程中发生的DNA甲基化动力学的一个重要里程碑。


 

图片
 

在过去的几年中,已经发表了几篇全面的综述,涵盖了近十年来的最新发现。为了补充这一点,我们选择了一些实验进展进一步扩展了5mC的基本原理及其在基因组调控中的作用。测序技术的灵敏度、通量和可负担性的提高使一系列新的图谱研究成为可能,这些研究为许多新的见解提供了基础。


【DNA甲基化和转录因子(TFs)的相互作用】随着不同细胞类型的DNA甲基化组的分辨率不断提高,人们发现低甲基化的CpGs通常集中在与CGIs不重叠的短的区域。Schübeler及其同事对小鼠ESC和神经祖细胞中的低甲基化区域(LMRs)进行了更深入的研究,发现它们约占所有CpGs的4%,甲基化水平介于10%到50%之间。大多数LMRs在分化过程中丢失或重新获得,并富集各自细胞类型中表达的转录因子基序。早期研究表明,DNA甲基化直接影响单个TFs的结合。然而,DNA甲基化也改变了染色质的结构和可及性,这反过来可能影响TF的结合。计算预测表明,5mC对DNA形状有显著影响,这可能影响TF对目标序列的接近。为了量化这一效应,高通量体外筛选技术被开发出来,发现90%的研究中含有CpG基序的转录因子的亲和性受到DNA甲基化的影响,但只有很少的研究进一步在体内证明了这一点。

【重新的DNMTs的招募和靶向】与H3K4甲基化的屏蔽作用相反,一些研究发现H3K36的甲基化会招募DNMTs。2010年,发现重新的甲基转移酶中保守的PWWP结构域在体外与H3K36二甲基化和三甲基化相互作用,这种相互作用是DNMT3A在人类细胞中正确定位所必需的。几年后,Schübeler实验室发现,DNMT3AB通常都被招募到CpG密集区域,而DNMT3B则通过其PWWP域与H3K36me3相互作用,被特别招募到转录活跃的基因体内。Weinberg和他的同事随后发现DNMT3A被H3K36me2特异地招募到基因间区域。从小鼠ESCs中移除H3K36me2,将DNMT3A重新分配与H3K36me3标记区域结合。另一项研究报道,H3K36甲基转移酶、NSD1和SETD2在小鼠雄性和雌性生殖细胞的DNA甲基化图谱形成中发挥关键作用。这些研究表明,除非受到H3K4甲基化的保护,否则从头开始的甲基转移酶通常结合CpG丰富的区域,而H3K36甲基化将重新的DNMTs招募到额外的靶点,如积极转录的基因体。

随着基于Cas9的基因编辑工具的出现,Cas9识别特定基因组序列的能力被用来构建各种调控因子的靶向招募工具。第一代表观编辑工具包括催化失活的Cas9(dCas9)和DNMT3A或TET1的催化结构域的融合蛋白。这些系统旨在通过甲基化或去甲基化报告基因的启动子来控制它们的转录。使用SunTag系统将多个DNMT3A或TET1单元与dCas9融合,进一步提高了效率。然而,正如预期的那样,观察到了广泛的脱靶效应,需要进一步提高靶向特异性才能将催化活性限制在预期的靶点上。

【发育和疾病中整体甲基化变化】对5mC进行更全面的映射,改善了对高甲基化域(HMDs)和部分甲基化域(PMDs)的独特整体结构的描述。虽然PMDs可以在大多数健康细胞类型中检测到,但衰老、癌变和胚胎外组织中PMDs的甲基化水平均进一步降低。Zhou等人认为PMD的低甲基化程度与有丝分裂细胞的分裂次数有关。这些晚期复制区域的不完全甲基化可能导致生物生命过程中DNA甲基化的持续缺失,这一过程可能在肿瘤发展和进展过程中加速。

如前所述,早期胚胎外谱系和胎盘以及体细胞癌症,都有PMD甲基化的减少,但也表现出与H3K27me3抑制发育基因重叠的CpG丰富的结构域的特定甲基化获得,这些通常位于DNA甲基化谷(DMVs)中。一旦DNA甲基化图谱在早期外胚层中建立,甲基化在大多数情况下都是静态的,除了启动子区域外的CpGs集在分化过程中显示动态的甲基化变化。

【总结】利用测序技术绘制来自不同生物体的数百种细胞类型和发育阶段的甲基化组,对过去几十年的研究有了完善的见解,填补了一些重要的知识空白,并提供了5mC分布和动态的全面概述。结合结构研究,这导致了对DNMTs的招募和活性以及DNA甲基化对基因调控的影响的详细了解。其中一些基因是如何被机械翻译的,以及它在基因组的其他部分起什么作用,仍有待探索。


 

在这篇综述中,我们提供了DNA甲基化领域从开始到现在的时间顺序概述。这一历史视角突出了记录该领域所取得的创新和巨大进步的关键实验。它还有助于将过去经得起考验或受到挑战的假设置于本文中。该领域的许多核心概念是在20世纪90年代建立的,然而,最近的工作继续提供见解,包括一些意想不到的发现对这些已确立的观点增加了复杂性和细微差别。例如,另一种哺乳动物甲基转移酶Dnmt3c于2016年在男性生殖细胞中被发现,有几篇论文报道了典型维持甲基转移酶DNMT1的从头甲基化能力。另一个例子是在多能干细胞中发现了5mC在高甲基化体细胞增强子上的活跃转换,这一发现改变了DNA甲基化一旦确立,作为一种稳定传播的修饰,在连续的细胞分裂中保持静态的假设。此外,一些新的调控因子,包括QSER1和BANP已被报道在塑造哺乳动物甲基化图谱及其解释中发挥作用。此外,最近的两篇文章提供了证据,表明DNMT1可能直接与H3K9me3和H4K20me3相互作用,这是一种在ESCs中经常与H3K9me3同时发生的修饰。此外,DNMT3A被发现招募到被多梳抑制复合体1所催化的泛素化H2AK119所标记的区域,这种相互作用通常被更强的招募到H3K36me2所掩盖。随着在细菌中发现5mC的一个世纪的结束,该领域已经成熟,DNA甲基化现在经常被用作研究其他生物过程和疾病表型的工具。尽管如此,在我们能够声称对这种微小但重要且有影响的DNA化学修饰有了完全的理解之前,在未来的几年里仍有一些问题需要解决(这些问题,值得去看原文)。

 

 

18964693703

图片

,成就科学梦想

 
 




上海天昊生物科技有限公司 版权所有 沪ICP备18028200号-1
地址:上海市浦东新区康桥路787号9号楼 邮箱:techsupport@geneskies.com 电话:400-065-6886