【科研小助手】全转录组的“四大RNA”名字都是咋起的?
曾经,京剧界有“四大名旦”,歌坛里有“四大天王”,电视剧中有“四大名捕”和“四朵花一样的男子(F4)”,他们的名字我们都耳熟能详,而今天在我们的全转录组测序中也有“四大RNA” — mRNA、miRNA、lncRNA和circRNA。你是否知道它们是怎么具体命名的?今天小编就跟你一起梳理一下。
mRNA一般命名规则
作为编码蛋白的RNA,在通常情况下其名称符号应为大写的拉丁字母或大写的拉丁字母和阿拉伯数字的组合,理想的符号应不超过6个字符,新的基因符号不能与已存在的基因符号重复。名称符号的第一个字符必须是字母, 随后的字符可以是字母或字母与数字的组合。在书写时应在同一行, 不允许在基因符号中使用上标或下标。不能使用罗马数字。在以前使用的符号中的罗马数字应改成相应的阿拉伯数字。应尽量做到简洁和特异, 并能传达基因的功能或特性。
除此之外,NCBI RefSeq (美国国立生物技术信息中心参考序列库) 给每条非冗余mRNA赋予一个NM编号,采用“NM_”作为开头,这样可以与其他序列比较好的区分。而其他序列也有自己的名字代号,比如基因组用“NC_”或者“AC_”开头,“NR_”表示不编码的RNA或假基因序列,“AF”开头表示克隆序列,“BC”开头表示模板序列等。
miRNA一般命名规则
miRNA作为一组由基因组编码的长度约20~23 nt的非编码RNA,它的序列及注释信息主要存储在miRBase这样的公共数据库中。一般的,miRNA成熟体简写成miR,再根据其物种名称以及被发现的先后顺序加上阿拉伯数字,如hsa-miR-134。
表1、常见物种名称及简写
如果是在确定命名规则之前发现的,则保留原来名字,如hsa-let-7等;对于高度同源的miRNA,在数字后加上英文小写字母(a,b,c,…),如hsa-miR-31a,hsa-miR-31b,hsa-miR-31c等;由不同染色体上的DNA序列转录加工而成的具有相同成熟体序列的miRNA,则在后面加上阿拉伯数字以示区分,如hsa-miR-129a-1和hsa-miR-129a-2。再就是很多名称后面有“-5p”或“-3p”,如hsa-miR-16b-5p和hsa-miR-16b-3p,则分别表明从hsa-mir-16b前体的5’端臂和3’端臂加工而来的。此外,动植物及病毒之间,以及miRNA前体等的命名格式会有些许的不同,也是需要值得注意的。
lncRNA一般命名规则
相比miRNA的命名,lncRNA的命名实际上更加没有统一的规则,因此lncRNA的命名可以说是五花八门了。比如lncRNA可以根据lncRNA的生物学功能、表达情况、与其他RNA分子的关系、与疾病的关系、位置信息或者在细胞内的定位等信息来命名,此外还有的直接用转录本的信息来命名,这样就很容易将lncRNA与mRNA混淆,因此目前在很多的报告中,lncRNA的名字前面通常用“lnc-”加以区分,后面可以为靶基因名称,后面还可以加有转录本序号等方法命名。
表2、差异lncRNA和差异miRNA相互作用分析结果展示(节选)
circRNA一般命名规则
circRNA是近几年研究越来越火热的一种非编辑RNA,它具有闭合环状结构,具有稳定性好,半衰期长,不被RNase降解等特性。circRNA的命名目前更没有一个统一的标准,通常在文章中借鉴miRNA和lncRNA的命名方式,用“circ”或者类似的标识加以区分。例如有circRNA的来源母基因命名的,如circPVT1、cir-ITCH等;也有以与miRNA的海绵效应关系来命名的,如ciRS-7;对于更多的新预测circRNA,则采用circ + ID号来命名,如hsa_circ_0010729、hsa-circ-0016347、circRNA_010567等等。
如何命名我们的RNA?
RNA研究领域发展很快,因此在命名上之前一直没有较为统一的方法,也造成了一种RNA多个名字的情况。随着研究的不断深入以及数据库的不断完备,我们研究的RNA的名字,会更加的规范。
像目前在人类基因命名方面,就有HUGO基因命名委员会(http://www.genenames.org/)(HGNC)具体负责对每个已知的人类基因指定正式名称和符号(名称的缩写)。
网址:http://www.genenames.org/
这个网站已经收录了40000多条经过认证的基因名称,包括了编码基因和各类非编码RNA等信息。为了保证名字的唯一性,强烈建议大家在发表新的基因名字时,首先到该网站进行搜索和注册。具体关于基因如何命名的信息,也可以参阅HGNC的指南
(http://www.genenames.org/about/guidelines)。
全转录组测序技术优势:
rRNA去除建库,保留了完整的RNA种类信息;
链特异性文库,可以保留转录本的链信息,更准确地检测反义RNA;
使用高通量测序,能够获得更加全面的RNA信息,包括低丰度的RNA;
通过测定的序列信息精确地分析不同类型RNA的表达丰度变化及其生物学功能;
整合分析同一样本中的多种类型RNA,明确这些RNA之间的共表达和调控关系。
天昊生物作为全转录组测序的优质服务提供商,期待这与您的合作!