CNV在动物研究中的案例分析1
英文题目:Identification of Copy Number Variations in Xiang and Kele Pigs
期刊名:PLOS ONE
发表时间:2016年2月
研究背景: 香猪和可乐猪是广为人知的中国地方猪品种,香猪又名“迷你猪”,香猪以体小早熟,肉味鲜,闻名全国,其中以贵州黔东南地区的从江香猪,剑白香猪,和广西的巴马香猪最为著名。可乐猪主要分布在贵州省威宁、赫章县是,此外还分布于毕节、水城、纳雍、盘县等地区,由于该猪种资源珍贵,地处乌蒙山区金沙江畔,为此便合称为“乌金猪”。总之,香猪和可乐猪都具有丰富的遗传资源和巨大的经济和科学价值。拷贝数变异(CNV)是基因组变异的重要形式之一,它对表型变异有着深远的影响。本文将通过发现CNV从而提供关于基因组变化的有意义信息,这对于未来评估CNVs和香猪,可乐猪重要表型之间的关联,从而最终保护这些稀有品种是非常有用的。
研究材料:98个香猪和22个可乐猪
研究平台:猪全基因组SNP分型芯片,qPCR
研究思路:使用猪全基因组SNP分型芯片进行检测———采用PennCNV算法检测CNV———聚集重叠的CNVs鉴定CNVRs———检索与CNVRs完全或部分重叠的基因———基因功能分析———与以前的CNV研究结果比较———香猪和可乐猪CNVRs的区别———香猪群体内的变化———qPCR验证CNVRs
研究结果:
全基因组CNV鉴定
使用猪全基因组SNP分型芯片(Illumina PorcineSNP60K BeadChip)对98个香猪和22个可乐猪进行分析,采用PennCNV算法检测CNV,在18对常染色体鉴定到401个CNV,在X染色体上鉴定到274 个CNV,平均每个个体鉴定到5.63个CNV。通过聚集重叠的CNVs,总共鉴定到172个候选CNV区域(CNVRs)(150个常染色体CNVRs和22个X染色体CNVRs),这些候选区域覆盖了猪全基因组的2.98%(80.41 Mb)。这些候选区域长度为3.19 kb-8175.26 kb,平均长度为467.53 kb。在这172个候选CNV区域(CNVRs)中,97个(56.40%) CNVRs 被称为获得事件,65 个(37.80%) 称为缺失事件,剩下的10个 CNVRs(5.81%) 被称为获得-缺失事件(即获得和缺失位于同一个区域)。这172 个CNVRs在18个常染色体和X染色体上不均匀分布(图1),33个CNVRs(19.19%)(最多)在野猪13号染色体被发现,3个CNVRs(1.74%)(最少)在野猪12号染色体被发现。
图1:香猪和可乐猪的CNV区域(CNVRs)分布,X轴的值代表在染色体上的位置,基于野猪10.2参考基因组。Y轴的值显示染色体数目。
候选基因和功能分析
使用Ensembl Genes 80 Database查询基因内容,共有660个与鉴定到的CNVRs完全或部分重叠的Ensembl genes被检索到。这些基因包括包括508个蛋白质编码基因(76.97%),76个假基因(11.51%),11个snoRNAs(1.67%),25个miRNAs(3.79%),28个snRNAs(4.24%),3个misc-RNAs,2个非编码基因,5个加工过的转录本,1个反义序列,和1个lincRNA。这些基因分布在103个(59.88%) CNVRs上,63个(36.62%)CNVRs至少包含或重叠2个基因。在这660个基因中491个被鉴定为获得事件,52个被鉴定为缺失事件,117个被鉴定为获得-缺失事件。
接下来对这660个基因进行GO和KEGG分析,因为猪的基因组注释是不完整的,所以把这些猪的Ensembl genes IDs转化成同源的人的Ensembl gene IDs,接着使用所有与猪基因组有同源关系的人类基因作为背景进行GO和KEGG分析。GO分析发现341个基因在34个GO terms中被富集,这些GO terms主要与感觉知觉、嗅觉受体的活性,认知,G蛋白偶联受体信号通路,性腺发育,细胞表面受体相关的信号通路,突触囊泡内吞作用,发育成熟,神经过程等功能相关(表1)。
表1: GO分析
接着分析了这些CNVRs 和已经发现的猪QTLs的相互关系,结果发现172个CNVRs包含或重叠7676个猪QTL,这些QTL影响很多猪表型,例如繁殖,生产,肉类品质,健康和发育。
与以前的CNV研究结果比较
把本次研究发现的CNVRs与以前的7篇CNV研究结果进行比较,结果发现有56.40%(97/172)的CNVRs与以前的研究结果相互重叠或完全一致,剩余的43.60%(75/172)CNVRs是新发现的。其中重叠度最大的是Wang et al的研究结果,这个研究使用porcinesnp60k芯片和penncnv CNV算法从来自6个中国本土品种(莱芜猪、五指山猪、陆川猪、通城猪、宁乡猪、巴马香猪),3个西方品种(长白猪、杜洛克猪、约克夏猪)和一个杂交品种(通城猪 x杜洛克猪)的302个个体中检测到348个CNVRs。
香猪和可乐猪CNVRs的区别
95个CNVRs(55个获得, 38个缺失,2个获得-缺失)只在香猪品种中被发现,而30个CNVRs(16个获得和14个缺失)只在可乐猪品种中被发现。从香猪品种平均得到0.97 个CNVRs,而从可乐猪品种平均得到1.07个CNVRs。在香猪品种所有染色体都能检测到CNVRs,而在可乐猪品种中的染色体SSC 6, SSC 8,SSC 17,SSC X都没检测到CNVRs。共计 327个Ensembl genes与香猪的CNVRs完全或部分重叠,而从可乐猪上只检索到44个特异 Ensembl genes。 GO分析表明香猪的这些CNVRs相关基因在复制、细胞形态、细胞内的离子平衡,ATP生物合成过程,及超氧化物歧化反应等被富集,而可乐猪的CNVRs相关基因则参与蛋白质修饰过程的吞噬和调节。通过聚类分析将研究中117个个体明显分为两类:可乐猪和香猪(图2)。
图2:基于发现的CNVR 信息的聚类分析。红色为可乐猪,蓝色为香猪。
香猪群体内的变化
拷贝数分布也揭示了香猪群体内水平上的变化,发现在这些CNVRs中,82个(47个获得,33个缺失,2个获得-缺失)只在具有大窝产仔数的香猪群体中被发现;与之对应,13个CNVRs(8个获得和5个缺失事件)只在具有小窝产仔数的香猪群体中是特异的的。具有大窝产仔数的香猪群体的CNVRs相关基因主要与嗅觉受体、细胞粘附、膜促蛋白、复制、细胞周期调控、嘌呤和嘧啶核苷酸代谢过程、ATP生物合成过程、以及骨骼肌组织发育相关,而具有小窝产仔数的香猪群体的CNVRs相关基因则不包括参与繁殖性状的基因,例如ADAMTS-1(参与正常的卵泡发育和排卵过程), AR(参与调控胎儿性分化和青春期性成熟),KIT(参与调控卵子发生和卵泡发育),这表明参与繁殖性状的基因在具有大窝产仔数和小窝产仔数的香猪群体中是不同的。
qPCR验证CNVRs
从172个CNVRs随机选择26个进行qPCR验证。这26个CNVR大小范围是10.44 kb-8175.26 kb,并且呈现不同的状态(13个获得,6个缺失,7个获得-缺失),所选的CNVRs有16个(61.54%)得到了定量PCR验证。4个CNVRs(CNVR-24, CNVR-35, CNVR-50, CNVR-106)和大约150个样本被用来做进一步CNVRs验证。CNVR-35在其中110个个体中得到验证,CNVR-50在其中93个个体中得到验证,CNVR-24在其中70个个体中得到验证,CNVR-106在其中92个个体中得到验证。