人类全基因组测序(Whole Genome Sequencing, WGS)是利用高通量测序平台对人类不同个体或群体进行全基因组测序,并在个体或群体水平上进行生物信息分析。WGS可全面挖掘DNA水平的遗传变异,为筛选疾病的致病及易感基因,研究疾病遗传机制、人类进化和人类群体遗传学等提供重要信息。
• 家族性皮质肌阵挛性震颤癫痫(familial cortical myoclonic tremor with epilepsy, FCMTE)是一种成年起病,以皮质震颤和癫痫发作为核心症状的高外显率常染色体显性遗传病。
• 该疾病表现典型的遗传异质性,根据致病区域连锁定位可分为4种亚型: FCMTE1 (8q24, OMIM: 601068); FCMTE2 (2p11.1-q12.2, OMIM: 607876); FCMTE3 (5p15.31-p15.1, OMIM: 613608)和FCMTE4 (3q26.32–3q28, OMIM: 615127)。尚无肯定致病基因的报道。
• FCMTE1亚型仅在中国和日本有报道,本研究目的在于确定中国FCMTE1家系的致病基因。
• 临床样本:20个FCMTE家系;
• 研究手段:
• 连锁分析和单倍型分析(5个家系进行基因组SNP芯片分型检测;6个家系进行chr8: 104 863 833–134 036 685区域内STR分型);
• 选取先证者全外显子测序,没有发现可疑突变;
• 全基因组测序(8个患者;平均测序深度31.35X到57.77X,后续进行常规WGS数据分析,没有发现可疑突变,针对FCMTE1候选区域的多核苷酸重复序列ExpansionHunter特殊分析);
• PCR验证检测到的重复序列;
• 公共表达数据分析;
• 缩小FCMTE1致病区域的基因组范围
基于11个家系的连锁分析,获得的最大LOD值分布为1.64-3.77,都处于8q24区域(下表)。单倍型分析提示FCMTE1致病区域的最小范围在rs800532和D8S1112之间, 为包含21个基因的4.9M区域。
• 常规WGS分析未能在此区域检测到基因突变
• 重点关注4.9M区域内的多核苷酸重复序列扩增
研究者将233个重复motif(4.9M区域内检测到的多核苷酸重复序列),利用ExpansionHunter进行重复序列扩增挖掘。通过对比8名患者和9例对照的序列,研究者发现7名患者的SAMD12基因4号内含子都存在一个5核苷酸重复扩增序列(TTTTA)n,而9名对照全部未检测到。由于这个重复扩增序列比测序长度(150bp)还要长,研究者进一步分析了患者的未能成功进行基因组比对的序列。结果发现,在患者的Alu element和(TTTTA)n重复序列之间,存在另一个5核苷酸重复扩增序列(TTTCA)n,并且这个扩增序列在数据库尚无记录(UCSC Genome Bioinformatics)(下图为SAMD12基因4号内含子内(TTTCA)n突变碱基的示意图)。
• 确认(TTTCA)n插入序列可能是FCMTE1的致病原因
对11个家系的先证者进行长片段PCR和重复引物PCR,确认11个家系的先证者都携带(TTTCA)n插入序列。在另外9个未进行连锁分析的家系患者中,有7个家系通过重复引物PCR检测到了(TTTCA)n插入序列。对于携带这一突变的所有家系样本的重复引物PCR和长片段PCR结果,确定(TTTCA)n插入序列与疾病共分离;(TTTCA)n在患者中重复次数至少为105次;119个中国对照均不携带这种(TTTCA)n插入序列。
• (TTTTA)n和其他突变基本不可能是FCMTE1的致病原因
对于文章一开始发现的(TTTTA)n重复序列,研究者发现部分患者会在携带(TTTCA)n插入序列的染色体上携带这个重复序列,重复数为25–44,而部分对照携带的重复数能达到800。对于119例对照来源的238条8号染色体,这个(TTTTA)n重复序列重复数在11 到80+,其中3.36% (8/238) 的染色体携带的重复次数超过80;基于20个家系患者的编码区和剪切区一代测序,也未能找到任何其它突变。
• 基于FCMTE1家系的奠基者效应分析
基于5个有基因组SNP分型数据的家系,研究者针对(TTTCA)n附近5个连锁LD区域中的92个SNP进行奠基者效应分析。结果显示,这5个家系都携带含有(TTTCA)n的一个核心单倍型。这个单倍型在千人组计划中国人群的频率约为0.226(47/208)。进一步利用3个日本家系和5个家系共有的59个SNP进行奠基者效应分析,结果表明这个含有(TTTCA)n的核心单倍型为8个家系即中国人和日本人所共有。
• 携带(TTTCA)n插入序列的转录本表达情况
SAMD12基因在数据库中共有8种转录本,其中4个转录本覆盖(TTTCA)n插入序列所在位置。在脑组织表达数据库中,最长的转录本(覆盖(TTTCA)n插入序列位置)为主要表达转录本。
• 鉴定了SAMD12基因内含子区的五核苷酸(TTTCA)n重复插入为FCMTE1的致病突变。 FCMTE1致病突变的发现可以指导其他类型FCMTE致病基因的鉴定。随着测序技术和生物信息学工具的发展,我们应该更多地关注分子病因未知的神经退行性疾病的致病性重复扩增。
• 基于WGS数据的重复序列扩增突变挖掘,是本研究确定致病突变的关键。
• 这种重复序列扩增引发神经毒性的可能假设有三个:(i)扩增的RNA(pre-mRNA)聚集形成核RNA团簇,其隔离了关键的RNA结合蛋白并阻碍它们执行其正常功能; (ii)扩展的RNA可以不按常规翻译产生导致神经毒性的短肽;(iii)扩增可能导致相关基因功能的获得或丧失。
特别说明:这么精彩的文章,实际上还涉及到更加精彩和激烈的中日比拼。在2018年的4月,日本团队率先在NG发表了SAMD12基因内含子中的核苷酸重复序列扩增导致良性成人家族性肌阵挛癫痫(benign adult familial myoclonic epilepsy,BAFME)。因此,中国团队在时间上稍稍落后,最后将成果发表于《Brain》杂志。
特别感谢:
天昊生物特别感谢浙江大学医学院附属第二医院神经内科罗巍教授以及其课题组对天昊生物技术和服务的认可!天昊生物将长期致力于为分子生物学及医学遗传学领域的研究者提供高质量的科研策略咨询、实验技术服务和遗传数据分析,帮助广大科研人员获得更为优质的科研成果!