天昊生物助力客户解析多个物种的线粒体&叶绿体
在刚刚过去的2015年,天昊生物参与解析了多个物种的线粒体&叶绿体基因组,这其中包括多个动物物种的线粒体基因组(例如树形拱肩网蛾,短角异斑腿蝗)和多个植物物种的叶绿体基因组(例如药用植物盾叶薯蓣,树参等;草本植物万年青,白掌,掌叶大黄;观赏植物梳唇石斛)。这些工作不仅有助于获得多个动植物物种线粒体和叶绿体基因组序列,同时有助于进行多个近源物种的系统发育关系研究,并且可以为后续利用基因工程来改良作物的产量和重要化合物的含量提供理论依据。下面我们就由浅入深了解一下动植物线粒体&叶绿体基因组测序的相关知识以及动植物线粒体&叶绿体基因组测序经典文章。
技术简介
真核生物有两套遗传体系,即核基因组和细胞器基因组,动植物中的线粒体基因组,植物中的叶绿体基因组都是细胞器基因组。虽然线粒体和叶绿体有自己的遗传物质DNA及遗传信息传递和表达系统(RNA、核糖体等),并且能合成自己的部分蛋白质,但叶绿体和线粒体的蛋白质有一部分是细胞核基因控制,在细胞质的核糖体上合成,所以线粒体和叶绿体是半自主性细胞器。线粒体与叶绿体都是细胞内进行能量转换的场所,线粒体是细胞中制造能量的细胞器,叶绿体是绿色植物进行光合作用的
细胞器。
总之,线粒体DNA(mtDNA)因其独有的母系遗传模式和较高的突变频率, 已被广泛用于生物进化,群体结构,疾病诊断,法医等方面的研究。而叶绿体DNA(cpDNA)在揭示物种起源、生物进化及不同物种之间的亲缘关系等方面也具有很重要的作用。而二代测序可以简便快速、高通量获得线粒体/叶绿体DNA 序列信息,因此在进化生物学,疾病诊断和法医上具有十分重要的意义。
测序方案
生物信息分析
线粒体生物信息分析
-
• 对原始数据进行去除接头序列及低质量reads的处理
-
• 数据产出统计及测序数据质量评估
-
• 将测序数据和参考基因组序列进行比对,去除核基因组序列
-
• 线粒体基因组组装拼接
-
• 统计线粒体A/G/C/T 含量,AT 含量
-
• 对线粒体基因结构进行注释(蛋白编码基因、编码tRNA、rRNA 基因),包括基因大小、起始和终止密码子分布统计
-
• 通过和其它已测序物种的线粒体蛋白质编码基因进行比较,构建系统进化树
-
• 绘制线粒体基因组圈图
-
• 序列上传
-
• 其他个性化分析
叶绿体基因组信息分析
-
• 对原始数据进行去除接头序列及低质量reads的处理
-
• 数据产出统计及测序数据质量评估
-
• 将测序数据和参考基因组序列进行比对,去除核基因组序列
-
• 叶绿体基因组组装拼接
-
• 分析叶绿体4 个特征区段(IRA 、IRB、LSC、SSC)
-
• 统计叶绿体A/G/C/T 含量,AT 含量
-
• 对叶绿体基因结构进行注释(蛋白编码基因、编码tRNA、rRNA 基因)
-
• 绘制叶绿体基因组圈图
-
• 通过和其它已测序的物种叶绿体蛋白质编码基因进行比较,构建系统进化树
-
• 序列上传
-
• 其他个性化分析
文献解析
文章1:中国地方性蝗虫牯岭腹露蝗的线粒体全基因组测序
背景: 昆虫线粒体DNA(mtDNA)是一个典型的大小在14-18Kb,编码37个基因的环型分子。最近,高通量测序已成为一种获得线粒体基因组DNA的新方法,这种快速高效的技术不仅有利于线粒体基因组的系统构建,也推动了关于大量物种线粒体基因组文章的发表。牯岭腹露蝗是最常见的,并广泛分布在中国的一种地方性蝗虫,它能够对中国山毛榉和玉米造成严重破坏,当这两种植物不足时,它也会危害高粱、小麦和大米。牯岭腹露蝗的线粒体部分基因序列已被报到,但完整的线粒体基因组序列仍然没有被公布。
目的:利用高通量测序技术分析牯岭腹露蝗完整的线粒体基因组序列, 这将有助于补充蝗科昆虫完整线粒体基因组数据。
参考序列:北极翘尾蝗线粒体序列
结果:
1. 发现牯岭腹露蝗线粒体基因组大小为15,655bp,在大多数昆虫的大小范围内。
2. 发现其核苷酸组成是不对称的(A: 42.8%, C: 14.2%, G: 10.5%,T:32.6%),整个基因组的A+T含量为75.4%。
3. 序列编码37个典型基因(13个蛋白质编码基因,22个tRNA基因和2个rRNA基因)以及A+T富集区。
4. 有11,193bp在蛋白质编码区域,1472bp在tRNA,1314bp在大rRNA,851bp在小rRNA,777bp在 A+T富集区域。
5. 所有蛋白质编码基因以ATN作为起始密码子,同时它们中的大多数也以TAA作为终止密码子,但有两个例外情况使用TAG作为终止密码子(COX1和ND1)。
6. 22个 tRNAs大小在64-71bp,并且它们大多数在主链上。
7. A+T富集区域位于小rRNA和tRNA-Ile之间,这个区域的GC含量为13.8%。
8. 通过把测序数据中的COX1序列与先前报道的牯岭腹露蝗COX1序列进行比对,发现两者有98.8%相似度,这表明测序得到的数据可以代表牯岭腹露蝗的线粒体基因组序列。
参考文献: Yang R, Guan L, Xu SQ. Complete mitochondrial genome of the Chinese endemic grasshopperFruhstorferiola kulinga (Orthoptera: Acrididae: Podismini). Mitochondrial DNA. 2015, 29:1-2.
文章2:常绿植物树参的叶绿体全基因组测序
背景:树参是五加科常绿乔木或灌木物种,分布在中国,柬埔寨,老挝,泰国和越南。树参因具有重要的药用价值而广泛地受到人们的关注。叶绿体因基因组小, 编码区及非编码区进化速率的差异而越来越多地被用于系统发育研究;而且利用叶绿体基因工程来改良作物的产量及重要化合物的含量具有重要意义。
目的:利用高通量测序技术分析树参的叶绿体基因组序列
参考序列:西伯利亚人参刺五加叶绿体序列
结果:
1. 发现环形基因组的大小是156,687 bp。
2. 包含一对反向重复序列(IR)(每个大小为25880 bp),一个大的单拷贝(LSC)区域(大小为86680 bp)和一个小的单拷贝(SSC)区域(大小为18247 bp)。
3. 叶绿体基因组包含134个基因,其中89个蛋白质编码基因(81个PCG 类型),8个核糖体RNA基因(4个rRNA类型),和37个转运RNA 基因(30个tRNA类型)。
4. 在这些基因中, 16个基因有一个内含子, 2个基因有一对内含子。
5. 绝大多数基因类型有一个拷贝,而同时19个基因类型有两个拷贝。
6. 所有这19个基因型包含所有的rRNA 类型(4.5S, 5S, 16S,23S rRNA), 7个tRNA 类型(tRNA-Ala
(UGC) , -Arg
(ACG) ,-Asn
(GUU) , -His
(CAU) , -Ile
(GAU) , -Leu
(CAA) & -Val
(GAC) ), 8个PCG类型(ndhB, rpl2, rpl23, rps7, rps12, ycf1,ycf2, ycf15),并且这19个基因类型都位于反向重复序列(IR)区域内。
7. 总的来说,核苷酸组成是非对称的(30.7% A, 19.3% C, 18.7% G, 31.3% T),整个基因组的A+T含量为62%, LSC,SSC和IR区域的A+T含量分别为63.8%, 68.0% and 56.9%。
参考文献:Wang L, Du XJ, Li XF. The complete chloroplast genome sequence of the evergreen plant Dendropanax dentiger (Araliaceae). Mitochondrial DNA. 2015, 14:1-2.