Orginal Article

Characteristic analysis of the complete mitogenome of Plagiopsetta glossa and a possible mechanism for gene rearrangement

  • DONG Jiangxing , 1, 2 ,
  • SHI Wei 1 ,
  • KONG Xiaoyu , 1 ,
  • CHEN Shixi 1, 2
Expand
  • 1. CAS Key Laboratory of Tropical Marine Bio-resources and Ecology, South China Sea Institute of Oceanology, Guangzhou 510301, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
Corresponding author: KONG Xiaoyu. E-mail:

Received date: 2017-04-11

  Request revised date: 2017-05-25

  Online published: 2018-02-02

Supported by

National Natural Science Foundation of China (31471979, 30870283)

Copyright

热带海洋学报编辑部

Abstract

The family Samaridae in Pleuronectiformes consists of three genera, namely, Plagiopsetta, Samariscus and Samaris. Studies on mitochondrial genomes of Samaris cristatus and Samariscus latus showed that there exist differences in genomic rearrangement and gene number between this two species. To determine whether there are structural differences in the species of the genus Plagiopsetta, Plagiopsetta glossa were used as the representative species for this study, and the mitochondrial genomic characteristics of this species were compared with those of Samariscus and Samaris. The length of its mitogenome is 18,723 bp, and contains 39 genes, including 13 protein-coding genes, two rRNA genes, 24 tRNA genes, two control regions, one light strand replication origin, and 13 more interspaces. Compared with the typical mitogenome in teleosts, P. glossa and S. latus have two more genes of tRNA-Cys and tRNA-Tyr (S. cristatus only one more tRNA-Cys). Additionally, each of the three flatfish has an extra control region, but the gene orders of P. glossa and S. latus mitogenomes are the same. Six genes (tRNA-Cys1, tRNA-Tyr1, tRNA-Ser1, tRNA-Lys, tRNA-Arg, and tRNA-Ser2) from different locations are clustered together forming a gene cluster, and following by this genes cluster was ND5-ND6-Glu-Cytb-Thr, all those 11 genes have no gene order change in terms of typical mitogenome.

The model of Double Replications and Random Loss was used to analyze the possible rearrangement mechanism in P. glossa mitogenome. The characteristics of gene number, gene order and 13 more interspaces provided new evidence to support the applicability of this model. The results of this study not only enrich our scientific knowledge of mitogenomic features, but also provide more data for further study on mitochondrial evolution and phylogenetic analysis for flatfish.

Cite this article

DONG Jiangxing , SHI Wei , KONG Xiaoyu , CHEN Shixi . Characteristic analysis of the complete mitogenome of Plagiopsetta glossa and a possible mechanism for gene rearrangement[J]. Journal of Tropical Oceanography, 2018 , 37(1) : 1 -11 . DOI: 10.11978/2017041

鲽形目(Pleuronectiformes)鱼类是一类非常特殊的群体, 因为变态发育使得该类鱼类从双边对称的幼体逐渐变为拥有扁平身体的成体, 这一过程中伴随着眼睛从身体的两侧转移到头部的同一侧。按照Nelson (2006)的分类系统, 鲽形目分为14个科, 其中冠鲽科(Samaridae)包含斜鲽属(Plagiopsetta)、沙鲽属(Samariscus)、冠鲽属(Samaris) 3个属(Nelson, 2006)。
动物线粒体基因组长度一般在16~20kb之间, 通常包括编码13个蛋白的编码基因、22个tRNA基因、2个rRNA基因, 除了一个含有复制与转录起始元件的控制区(CR)和轻链复制起始位点(OL)外, 只有少量的基因间隔存在(Shadel et al, 1997; Boore, 1999)。尽管线粒体基因排列结构通常非常保守, 但基因重排现象在一些物种中不断被发现(Inoue et al, 2003; Verkuil et al, 2010; Chen et al, 2016; Guo, 2016; Xia et al, 2016; Mu et al, 2017)。龚理等(2013)对美国国家生物技术信息中心(NCBI)数据库中的1255种鱼类线粒体基因组全序列进行了总结, 发现有52种鱼的线粒体基因组发生了重排, 包括滑移(shuffling)、移位(translocation)和倒置(inversion) 3种类型, 共涉及15个目34个科。基因在同一条链上从一个位置移到相邻位置(一般不跨越蛋白基因)称为滑移; 基因从原始位置跨过几个基因(通常包括蛋白编码基因)转座到不同的位置称为移位; 基因从一条链编码转换到另外一条链编码称为倒置。迄今, 有4种模型解释重排现象的产生机制, 包括线粒体内的重组模型(Poulton et al, 1993; Lunt et al, 1997), 复制-随机丢失模型(Moritz et al, 1987; Arndt et al, 1998), 复制-非随机丢失模型(Lavrov et al, 2002)和tRNA基因错误起始引发的复制(Cantatore et al, 1987; Jacobs et al, 1989)。
目前在鲽形目线粒体基因组的研究中, 3种线粒体基因重排类型都有发现(Kong et al, 2009; Shi et al, 2016; Gong et al, 2016)。滑移和倒置现象同时在舌鳎科鱼类线粒体基因组中发现(Kong et al, 2009; LI Donghe et al, 2016; Yang et al, 2016), 例如在半滑舌鳎(Cynoglossus semilaevis)中发现了鱼类中第一个tRNA-Gln基因的倒置现象并伴随着tRNA-IletRNA-Gln之间的滑移(Kong et al, 2009)。移位现象在多种鲆鲽鱼类中也有发现, 例如在青缨鲆(Crossorhombus azureus)中, ND6和7个负链编码的tRNA基因发生移位并聚集在tRNA-ThrtRNA-Phe之间形成了一个基因簇(Shi et al, 2013); 在满月沙鲽(Samariscus latus)中, 则发现控制区的重复及其11个基因发生了移位现象(Shi et al, 2014); 东方无线鳎(Symphurus orientalis)的tRNA-ValtRNA-Met基因则移位到16S rRNA的末端(Shi et al, 2015)。
对于鲽形目中存在的重排现象, 除了复制-随机丢失模型可以解释东方无线鳎的线粒体基因重排现象之外(Shi et al, 2015), 另外3种模型都无法恰当地解释其他鲽形目鱼类线粒体基因的重排现象。因此, 我们提出了3种新的重排机制来解释上述鱼类中的线粒体基因重排现象: 用反向复制删除重复基因(inverse duplication and the deletion of redundant genes)模型来解释半滑舌鳎线粒体基因的重排现象(Kong et al, 2009); 二聚体基因组非随机丢失(dimer-mitogenome and non-random loss model, DMNR)模型来解释青缨鲆线粒体基因的重排现象(Shi et al, 2013); 双复制随机丢失(double replications and random loss, DRRL)模型来解释满月沙鲽线粒体基因的重排现象(Shi et al, 2014)。
随着鲽形目中鱼类线粒体研究的增多, 又发现了一些独特的现象, 比如舌鳎科和冠鲽科等已有线粒体序列中存在着不同的排列结构, 在舌鳎科的舌鳎属和须鳎属的线粒体基因组中都有滑移和倒置现象(Li Donghe et al, 2016; Yang et al, 2016); 而在无线鳎属中, 东方无线鳎(Symphurus orientalis)存在移位, 但黑颊无线鳎(Symphurus plagiusa)则没有出现重排现象(Shi et al, 2015)。在目前已经研究的冠鲽科中, 我们发现沙鲽属和冠鲽属的代表种类都存在重排且基因顺序相同, 但是基因的数量存在差异的现象, 而斜鲽属种类的线粒体基因组结构尚未见报道。故我们选取褐斜鲽(Plagiopsetta glossa)作为该属的代表种类, 测定其线粒体基因组全序列, 分析其基因组成及排列顺序, 明确冠鲽科线粒体基因组变化的特征, 以期丰富鲽形目鱼类的线粒体基因组数据, 为进一步对鲽形目鱼类线粒体基因组特征及系统关系研究提供科学依据。

1 材料与方法

1.1 实验材料

本实验用的1个褐斜鲽样品于2010年7月在泰国普吉岛采集, 该样品全长13cm。95%酒精固定后带回实验室保存备用。

1.2 DNA提取与PCR扩增

从鱼背部提取少量肌肉组织, 使用天根海洋动物基因组提取试剂盒(天根生化, 北京), 按照操作说明提取整个基因组DNA。根据已有鲽形目鱼类的基因序列特别是满月沙鲽(NC_024263)和冠鲽(NC_025903.1)比对结果, 在保守位点上设计了多对通用引物(表1)。PCR反应体系为: 2.5μL的10×缓冲液、2μL的MgCl2 (25mmol•L-1)、2μL的dNTP (2.5mmol•L-1)、正反引物各1μL (10μmol•L-1)、1μL的LA Taq酶(Takara)和1μL的模板DNA (30ng•L-1), 最后以灭菌双蒸水补足体系至25μL。反应条件为: 94℃预变性5min, 94℃变性1min, 50~55℃复性1min, 72℃延伸2.5min, 35个循环, 最后72℃延伸10min。PCR产物用1.0%的琼脂糖凝胶电泳检测, 利用纯化试剂盒(宝生物, 大连)纯化PCR产物, 纯化产物直接作为模板正反双向测序或进行克隆后再测序(英潍捷基公司, 上海), 选择测序峰图准确清晰的序列用于分析。
Tab. 1 The primers used for amplification in Plagiopsetta glossa mitogenomes

表1 扩增褐斜鲽线粒体全基因引物使用表

正向引物 序列(5′—3′) 反向引物 序列(5′—3′)
Z15 ATTAAAGCATAACHCTGAAGATGTTAAGAT F2753 TAGATAGAAACTGACCTGGATTACTCCGGT
Z2625 GTTTACGACCTCGATGTTGGATCAGGACAT F6746 GCGGTGGATTGTAGACCCATARACAGAGGT
Z-Ile AAGGRHYACTTTGATAGAG FND5-1180 ATRATNGCRTCYTTDGARWARAANCC
ZND5-1050 GCNATRCTNTTYYTNTGYTCNGGNTC F-Cytb TGNCCRATRAKVAYRWADGGRTSTTC
ZND6-210 GCHARNGCNRCHGARTANGCAAA FCOI-70 CCHACYATNCCDGCYCARGCMCCRAA
Z6468 CCACATCTDCTGCATGCAAAYCAYACACTT FATP6-495 AGRTGNCCNGCNGTBARRTTNGCNGT
ZATP-310 ACHTTYACNCCHACHACNCARCTNTC FND4-865 CCYATGTGVCYNACDGADGAGTADGC
Z10818 TTYGAAGCAGCCGCMTGATACTGACAYTT F13413 TAGCTGCTACTCGGATTTGCACCAAGAGT
Z13347 AAGGATAACAGCTCATCCGTTGGTCTTAGG F49 GGCCCATCTTAACATCTTC

1.3 数据分析

测序序列经BLAST (https://blast.ncbi.nlm.nih. gov/Blast.cgi)比对, 证明为目的片段。用软件CodonCode Alignerv3和BioEditv7 (Hall, 1999)将获得的基因片段序列拼接成一个完整的线粒体全基因组序列。然后, 通过在线软件tRNAscan-SE 2.0 (http://trna.ucsc.edu/tRNAscan-SE/citation.html)识别tRNA基因及其结构(Lowe et al, 1997)。蛋白编码基因与rRNA基因通过BLAST识别, 并用起始密码子和终止密码子所在的位置确定蛋白编码基因的长度, tRNA基因作为参考来确定rRNA边界范围。线粒体基因组的基因图谱由CGView生成(Stothard et al, 2005)。利用ClustalX 1.8.3 (Thompson et al, 1997)软件对褐斜鲽和其他7个鲽形目物种控制区序列进行多重比对, 辅以BioEditv 7软件进行手工校准, 识别其保守区域。

2 结果

2.1 基因组结构及重排特征

褐斜鲽线粒体基因组全长18723bp, 共39个基因: 13个蛋白基因、24个tRNA基因和2个rRNA基因, 2个控制区(CR1、CR2)和1个OL区。除了ND6和10个tRNA基因位于轻链(L链)外, 其他所有的基因都位于重链(H链)上(图1)。与经典鱼类线粒体结构相比, 褐斜鲽的线粒体基因不仅在数量上有变化并且在基因的排序上也发生了变化(表2图1)。
Fig. 1 Gene map of P. glossa mitogenomeand the features of gene rearrangement. (a) Gene map of P. glossa mitogenome; (b) the features of gene rearrangement. repeat region representes repeat sequence. Protein-coding genes are indicated by dark green boxes, rRNA by light green boxes, CRs (control region) and NC (non-coding region) by red boxes, and tRNA by white columns. The genes and their full names are listed in Tab. 2. Genes labeled above the diagram are encoded by the H-strand, and the others by the L-strand

图1 褐斜鲽(P. glossa)线粒体基因组结构信息(a)和基因组重排特征(b)
a和b中所有缩写的全名见表2; repeat region代表重复序列区; b中深绿色矩形框代表蛋白质, 浅绿矩形框代表核糖体基因(rRNA), 红色矩形框代表控制区(CR)和非编码区(NC), 白色柱形框代表转运核糖体基因(tRNA)并用缩写来表示。矩形或柱形框位于上方的表示基因是重链编码, 其他的是轻链编码

Tab. 2 Organization of P. glossa mitochondrial genome

表2 褐斜鲽线粒体基因组结构

基因 位置 长度 密码子 间隔区
起始 终止 bp aa 起始 终止 反密码子 编码链
Phe(F) 1 68 68 GAA H 0
12S 69 1019 951 H 0
Val(V) 1020 1091 72 TAC H 0
16S 1092 2814 1723 H 0
Leu1(L1) 2815 2888 74 TAA H 0
ND1 2889 3863 975 324 ATG TAA H 0
Ile(I) 3864 3935 72 GAT H 0
Gln(Q) 3934 4005 72 TTG L -2
CR1 4006 4898 893 H 0
Cys1(C1) 4899 4966 68 GCA L 0
Tyr1(Y1) 4967 5034 68 GTA L 0
Ser1(S1) 5176 5246 71 TGA L 141
Lys(K) 5309 5383 75 TTT H 62
Arg(R) 5418 5487 70 TCG H 34
Ser2(S2) 5549 5615 67 GCT H 61
ND5 5691 7529 1839 612 ATG TAA H 75
ND6 7526 8047 522 173 ATG TAG L -4
Glu(E) 8049 8117 69 TTC L 1
Cytb 8122 9262 1141 380 ATG T H 4
Thr(T) 9263 9333 71 TGT H 0
Met(M) 9341 9409 69 CAT H 7
ND2 9410 10456 1047 348 ATG TAG H 0
Trp(W) 10455 10524 70 TCA H -2
Ala(A) 10526 10593 68 TGC L 1
Asn(N) 10595 10667 73 GTT L 1
OL 10663 10706 44 L -5
COⅠ 10724 12274 1551 516 GTG TAA H 17
Asp(D) 12306 12373 68 GTC H 31
COⅡ 12381 13079 699 232 ATG AGA H 7
ATP8 13141 13308 168 55 ATG TAA H 61
ATP6 13299 13982 684 227 ATG TAA H -10
COⅢ 13982 14767 786 261 ATG TAA H -1
Gly(G) 14767 14836 70 TCC H -1
ND3 14837 15187 351 116 ATG TAA H 0
ND4L 15261 15557 297 98 ATG TAA H 73
ND4 15551 16924 1374 457 ATG AGA H -7
His(H) 16932 17000 69 GTG H 7
Leu2(L2) 17028 17100 73 TAG H 27
CR2 17101 17997 897 H 0
Cys2(C2) 17998 18065 68 GCA L 0
Tyr2(Y2) 18066 18133 68 GTA L 0
Pro(P) 18436 18506 71 TGG L 302
NC 18507 18723 217 H 0

注: 基因后括号中的字母代表该基因的缩写; 间隔区中的负值表示该基因与上边基因间的碱基重叠数; NC表示非编码区序列

在基因数量上, 蛋白质基因和2个rRNA没有变, 但多了1个CR1和2个tRNA。控制区重复形成了CR1和CR2, CR1位于tRNA-Gln之后, CR2位于tRNA-Leu2tRNA-Cys2之间(图1)。通常来说鱼类线粒体基因中可以识别22个tRNA。然而在褐斜鲽线粒体基因组中, 发现了24个tRNA, 在tRNA的5连体tRNA-Trp-Ala-Asn-Cys-Tyr区(即WANCY区)的两个相邻的tRNA基因tRNA-Cys-Tyr重复了一次, 最终形成了两份: tRNA-Cys1-Tyr1tRNA-Cys2-Tyr2, 前者位于CR1之后, 后者位于CR2之后(图1)。尽管一些错配可以发现, 但所有被识别的tRNA都可以形成典型的三叶草结构。因为复制产生的tRNA- Cys1tRNA-Cys2, tRNA-Tyr1tRNA-Tyr2序列完全相同, 它们形成的二级结构也是完全相同的。
在基因排序上则存在较多的移位现象(图1b)。不同位置的6个tRNA移位到CR1下游, 形成了1个六连体tRNA基因簇“tRNA-Cys1-Tyr1-Ser1-Lys- Arg-Ser2”, “ND5-ND6-Glu-Cytb-Thr”则位于六连体tRNA基因簇之后。这11个基因聚集在一起, 它们之间相对的排序没有发生变化。

2.2 控制区和轻链复制起点OL

褐斜鲽线粒体基因组中两个序列完全相同的控制区CR1和CR2长度都是893bp, 碱基组成为: T 30.1%, C 20.8%, A 33.5%, G 15.7%, A+T的含量为63.6%。通过将褐斜鲽的两个控制区和其他7种鲽形目鱼类的控制区序列相比较(图2), 识别了其控制区的保守结构, 包括终止相关序列TAS (terminal associated sequences)、中央保守区序列(central conserved sequence blocks, CSB) CSB-F、CSB-E、CSB-D、CSB-C、CSB-B、保守序列区序列(CSB-1、CSB-2、CSB-3)以及多聚T (Poly-T)结构。整个CR中没有发现串联重复序列。
Fig. 2 Aligned sequences of the control regions of P. glossa and seven other flatfish. CR1 and CR2: the two control regions in P. glossa mitogenome; Sla: Samariscus latus, NC_024263; Pol: Paralichthys olivaceus, NC_002386; Pco: Pleuronichthys cornutus NC_022445; Hhi: Hippoglossus hippoglossus, NC_009709; Hst: Hippoglossus stenolepis, NC_009710; Rhi: Reinhardtius hippoglossoides, NC_009711; Vmo: Verasper moseri, NC_008461. The shaded sequences represent the conservative blocks. TAS: terminal associated sequence; CSB: conserved sequence block

图2 褐斜鲽控制区和其他7种鲽形目鱼类的控制区序列特征比较
CR1和CR2: 褐斜鲽控制区; Sla: 满月沙鲽(Samariscus latus, NC_024263); Pol: 牙鲆(Paralichthys olivaceus, NC_002386); Pco: 角木叶鲽(Pleuronichthys cornutus, NC_022445); Hhi: 庸鲽(Hippoglossus hippoglossus, NC_009709); Hst: 狭鳞庸鲽(Hippoglossus stenolepis, NC_009710); Rhi: 马舌鲽(Reinhardtius hippoglossoides, NC_009711); Vmo: 条斑星鲽(Verasper moseri, NC_008461)。灰色阴影表示保守序列块。TAS: 终止相关序列; CSB: 保守序列块

和典型鱼类线粒体控制区相比(刘焕章, 2002; Wang et al, 2014), 褐斜鲽的TAS序列(5′-TATATATTTATGTA-3′)中保守序列模块由TACAT-ATGTA变为TATAT-ATGTA, 由于C变成了T而不再完全互补, 中央保守区的CSB-E中含有GTGGG保守序列, CSB-D在几乎所有的鱼类线粒体控制区中都可以被识别。保守序列区的CSB-1具有鱼类保守序列区中一般都存在的保守序列GACATA, CSB-2序列含有以TA间隔的两段多聚C, 这也是鲽形目CSB-2区的共有特征, CSB-3序列在鲽形目中也比较保守。
经典线粒体基因组中, OL位于WANCY区的tRNA-AsntRNA-Cys之间, 在褐斜鲽的基因组中, tRNA-Cys1-Tyr1发生移位, 导致其他3个基因tRNA-Trp-Ala-Asn的下游变成了COⅠ基因比较分析发现在tRNA-Cys1-Tyr1与上游CR1间和tRNA- Cys2-Tyr2与上游CR2间均没有非编码序列, 可以确定OL并不在此处, 而在tRNA-AsnCOⅠ基因之间有57bp的非编码序列, 因此我们对包括tRNA-Asn基因和非编码间隔区的序列与鲽形目其他物种OL (Wang et al, 2014)相应位置的序列进行比对, 发现有明显的相似性, 推测褐斜鲽OL序列的位置就在这段非编码序列中。在其形成的二级结构中, 环区含有10个碱基组成, 茎区长12bp, 茎区G-C碱基含量为75%; 在褐斜鲽OL序列中发现的保守序列模块为5′-CGGGG-3′, 这与大多数鱼类OL的保守模块5′-GCCGG-3′有所差别。

2.3 重排机制

通过比较鲽形目线粒体序列中发生重排的种类, 发现褐斜鲽线粒体基因组的基因数量和排列顺序与满月沙鲽完全相同, 经分析我们认为褐斜鲽线粒体基因组重排现象也可以用双复制随机丢失模型(DRRL)来解释(图3)。依据该模型, 褐斜鲽原始祖先线粒体基因组拥有正常的37个基因和一个控制区CR (图3a); 控制区首先复制形成CRⅠ和CRⅡ, 其中CRⅠ转位到tRNA-Gln(Q)和tRNA-Met(M)之间, 随后从CRⅠ中的复制起点OH开始第一次线粒体复制(replication 1, 图3b), 当复制越过CRⅡ处的复制起点OH时, 第二次复制事件(replication 2)起始, 两次复制都在接近OH处终止(图3c), 两次复制的结果导致两个控制区之间的基因产生了重复, 包括29个基因的重复和CRⅡ的复制产生了CRⅢ (图3d); 然后, 其中一个重复的基因发生了消失或退化(图3e), 其中M1-ND21-W1-A1-N1基因簇完全消失, 其他基因则退化成了长短不同的13个间隔区(图3f); 最后, CRI-C1-Y1和其后间隔区1的前41bp非编码序列复制后产生CR2-C2-Y2和间隔区18的前41bp非编码序列, 复制片段转位到tRNA-Leu2tRNA-Pro之间形成最终基因组型(图3g、3h)。
Fig. 3 The inferred mechanism of gene rearrangement from the ancestral gene order to that of P. glossa mitogenome based on the DRRL model. Protein-coding genes and rRNA are indicated by boxes, and tRNA genes are indicated by columns. Genes labeled above the diagram are encoded by the H-strand, and the others, by the L-strand. OH indicates the origin of replication for the H-strand; the direction of replication is shown by arrows. The dark boxes indicate the control regions (CRs), noncoding region (NC) and intergenic spacers. (a) The ancestral mitogenome with 37 genes and one CR. (b) The ancestral CR was duplicated to CRⅠ and CRⅡ, and then CRⅠ was translocated to the position between tRNA-Q and tRNA-M. A first mitochondrial replication event (RP1) was initiated at OH. (c) After RP1 passed through OH, secondary replication (RP2) began at OH. Both replications terminated close to the site of OH. (d) The duplication of 29 genes and one CR yielded by double replications. (e) One of each copied gene pair was lost randomly. Dark gray boxes indicate degenerated genes. The italic lines indicate the positions of intergenetic spaces from the degenerated genes. The numbers marked by prime indicate the order of the intergenetic spaces in genenome. (f) The order of genes, CRs and intergenic spaces after the loss of several genes. (g) The mitogenome of P. glossa was formed after CRⅠ-tRNA-C1-Y1 and the first 41 bp of Non-coding sequence 1 duplicated and translocated to the position between tRNA-L2 and tRNA-P. (h) The positions and lengths of intergenic spacers of P. glossa. The number in black shaded boxes indicate the intergenic spacer order in mitogenome. The numbers in the boxes above and below represent the length of the intergenic spacers. The boxes above the diagram indicate the sites of intergenic spacers same as the typical one in teleosts; the others are only in P. glossa

图3 应用双复制随机丢失模型推测的褐斜鲽线粒体基因重排过程
a. 具有37个基因和一个CR的祖先型线粒体基因组; b. CR复制产生CRⅠ和CRⅡ, CRⅠ转座到tRNA-QtRNA-M之间。第一次复制从OH开始; c. 当第一次复制通过OH时第二次复制开始。两次复制都在接近OH处终止; d. 两次复制链接后形成的基因组, 包括29个基因的重复和CRⅡ复制产生了CRⅢ; e. 重复的一个基因发生丢失或退化形成间隔序列。浅灰底矩框形代表消失或退化的基因, e和f之间的斜线指示基因退化后形成的间隔区的位置, 斜线上带撇的阿拉伯数字代表间隔区在基因组中的位置顺序; f. 重排后基因排序及间隔区位置; g. CRⅠ-C1-Y1和其后前41bp非编码序列共同复制和转座到tRNA-L2tRNA-P之间后形成的最终基因组型; h. 线粒体基因组的间隔子位置及大小。黑色框内的阿拉伯数字代表间隔区在基因组中的顺序, 图中上方框或下方框内的数字代表相应的间隔子长度, 上方的框代表和典型鱼类基因组中相同位置的间隔子, 下方的为本种特有的间隔子。矩形框代表蛋白质和rRNA基因, 柱形框代表tRNA基因, 黑底矩形代表控制区(CRs)、非编码区(NC)和间隔区。矩形或柱形框位于上方的表示基因是H编码的, 其他的是L链编码的。OH表示H-链的复制起点, 复制方向用箭头表示

间隔区: 除了控制区, 在褐斜鲽线粒体基因组中有19处间隔区, 用数字标记为1~19 (图3h), 长度在1~302bp之间, 总长度为1169bp, 占整个线粒体基因组的6.24%。通过与未发生重排的鲽形目鱼类线粒体基因间隔区相比较, 间隔子6、7、9、10、13、16是正常的间隔子, 而其他13个间隔子为该种类特有, 长度(除间隔子8外)都在25bp以上, 其中9个间隔子长度超过了50bp, 2个间隔子长度超过200bp。比较这些间隔区序列的特征发现, 间隔区1 (位于tRNA-Tyr1tRNA-Ser1之间)中有3.2个13bp串联重复序列(重复单元为TATATATATATAT), 间隔区18中(位于tRNA-Tyr2tRNA-Pro之间)有13.8个14bp串联重复(重复单元为TATGTAATATATAA), 并且这两个间隔区的前41bp序列是相同的(图3h)。

3 讨论

3.1 冠鲽科线粒体基因组的重排特征比较

褐斜鲽的线粒体基因组中存在基因重排现象, 不仅排列顺序有变化, 并且基因数量也比鱼类典型线粒体基因组有增加, 有2个控制区和24个tRNA基因。这些变异与冠鲽科中的满月沙鲽(NC_024263)和冠鲽(NC_025903)的基因组相比基本相同。除了3个种类都有2个控制区外, tRNA基因的数量存在两种类型: 褐斜鲽和满月沙鲽都有24个tRNA基因, 而冠鲽只有23个tRNA基因, 缺乏tRNA-Tyr1基因。在基因排序上3个种类是相同的(不考虑冠鲽缺乏tRNA-Tyr1基因), 包括OL的位置也都位于tRNA-AsnCOⅠ之间以及存在19个位置一样的间隔区(Shi et al, 2014), 比经典的基因组多了13个间隔区。
尽管鱼类线粒体基因组比较保守, 鱼类基因组重排现象仍有报道, 但基因数量变化比较少见。而在蛋白质中, 仅有ND6基因在鳄头冰鱼(Champsocephalus gunnari)线粒体基因组中存在重复, 其他蛋白质和rRNA中都没有发现重复现象存在。除了目前冠鲽科鱼类中发现了tRNA-CysRNA-Tyr两个tRNA基因的重复外, 两个tRNA基因的重复还在鳄头冰鱼(C. gunnari)的tRNA-GlutRNA-pro (Lin et al, 2012)与侧纹南极鱼(Pleuragramma antarctica)的tRNA-ThrtRNA-Pro (Lee et al, 2015)中存在。除此之外, 1个tRNA基因的重复在11种鱼类中发现, 例如斑点九棘鲈(Cephalopholis argus)中的tRNA-Asp (Zhuang et al, 2013)、宽头深海鼠鳕(Bathygadus antrodes)中的tRNA-Leu (Satoh et al, 2006)、镰鲳(Pampus echinogaster)的tRNA-Met (Li Yuan et al, 2016)和扁嘴副带腭鱼(Parachaenichthys charcoti)的tRNA-Pro (Oh et al, 2016)。
控制区的重复比基因的重复更为常见, 目前已经发现在21种鱼类中存在重复现象, 包括Lee等(2001)在花斑溪鳉(Rivulus marmoratus)中发现了鱼类首例线粒体控制区的重复。在奈脱瓦鲽(Poecilopsetta natalensis)中存在3个控制区(实验室数据)。
综上所述, 在鱼类线粒体基因重排过程中, 不仅位置发生重排, 并且基因的数量在极少种类中也发生了变化, 除了在本研究的冠鲽科中发现相同基因数量变化的现象外, 其他种类基因数量的变化都是个别种类的独特现象。

3.2 褐斜鲽线粒体基因重排现象为DRRL模型提供证据

Shi等(2014)在研究满月沙鲽基因序列特征后提出DRRL模型, 我们应用DRRL模型推测褐斜鲽线粒体基因重排的过程, 可以看出该机制很好地解释了褐斜鲽线粒体基因重排现象的产生, 这为该模型提供了新的证据。
之前研究表明, 尽管舌鳎科重排方式与褐斜鲽不一样, 但在这些鲽形目鱼类中观察到间隔子与退化基因位置的一一对应关系, 认为是作为支持其相应的重排机制强有力的证据(Shi et al, 2015)。在褐斜鲽线粒体基因组中, 由于基因重排导致了比经典鱼类的线粒体基因型多了13个间隔区, 而经典线粒体基因组的结构紧凑, 除控制区和OL外, 基因间的间隔并不多, 且普遍很短, 因此, 褐斜鲽重排产生的这些间隔区不论从数量还是位置都为DRRL模型提供了更加详细的过程依据。
在满月沙鲽和褐斜鲽线粒体基因组中, 都有两个完全相同的CR-C-Y (即CR1-C1-Y1和CR2-C2-Y2)。通过序列比对及产生过程的比较分析, 认为CR2- C2-Y2是通过CR1-C1-Y1基因拷贝并转移到tRNA- Leu2tRNA-Pro之间的。在褐斜鲽线粒体基因组中, 比对发现CR1-C1-Y1之后间隔区1的前41bp和CR2-C2-Y2之后间隔区18的前41bp序列是相同, 但满月沙鲽间隔区1和18完全没有相同的序列。从基因组重排产生的推测过程中可以看出, 间隔子1°和18°演化生成间隔子1和18都是不同基因独立退化的过程, 能独自衍生出相同41bp非编码区序列的可能性非常小, 因此, 我们推测应该有多于CR1-C1-Y1的序列或至少多余41bp的片段被复制并转座, 从而导致间隔子18是由两部分组成: 一部分是由ND52-ND62-E2-CytB2-T2基因簇退化而成的间隔子18°演化而来, 另一部分则包含了间隔区1前41bp复制过程中产生非编码区序列。
由于线粒体的简约性, 随着时间的积累, 重复的基因会退化直至完全消失, 而具体发生退化的基因的位置则取决于哪一个基因首先积累了突变而使得该基因失去功能, 在复制随机丢失模型中, 间隔子通常被认为是基因退化的遗迹。在褐斜鲽线粒体基因组中重复的CRs-C-Y-41bp片段拥有完全相同的序列, 比较其他12个间隔子的退化程度, 我们推测CRs-C-Y-41bp片段的复制过程发生在基因组重排之后, 并且该拷贝事件发生在较近时期内。
统计已有的鲽形目线粒体基因组数据(73个), 发现重排集中在舌鳎科、冠鲽科、鲆科和瓦鲽科(共31个数据): 舌鳎科中舌鳎属(11个)和须鳎属(3个)鱼类都有tRNA-Gln基因倒置、控制区转座及在tRNA-IletRNA-Gln之间滑移的现象, 在无线鳎属(2个)中黑颊无线鳎没有重排, 东方无线鳎tRNA-ValtRNA-Met基因则移位到了16S rRNA基因末端; 冠鲽科斜鲽属(1个)和满月沙鲽属(1个)控制区重复及tRNA-Cys-Tyr发生重复, 不同位置的11个基因聚集在一起, 这些基因的相对位置没有发生变化, 冠鲽属(1个)除了缺乏一个重复的tRNA-Tyr外, 其他与沙鲽属、斜鲽属相同; 鲆科(11个)中, 缨鲆(3个) ND6及7个L链编码tRNA基因聚集在一起形成了全新的排序; 而其他属线粒体基因组(8个)除tRNA-Asp位置不同外其他和缨鲆属特征相同; 瓦鲽科(1个)含有3个控制区, ND2-Trp-Ala基因簇及tRNA-Tyr发生移位并聚集在了一起。如上所述, 鲆科(Shi et al, 2013; Gong et al, 2016)、舌鳎科(Kong et al, 2009; Shi et al, 2015)和冠鲽科中都有一个科内有多种不同的线粒体结构的现象, 充分显示了鲽形目鱼类线粒体基因组不仅有不同的重排类型, 并且在分类单元上也存在非常丰富的多样性特征, 使得该类鱼类成为很好的研究对象。扩充鲽形目鱼类线粒体基因组数据, 对其基因重复、重排现象、重排产生机制等问题的研究, 对于了解基因排序的进化机理、以重排信息作为分子标记, 探索鲽形目系统演化的可能性、甚至是线粒体基因组是如何复制及究竟是否存在重组等热点问题都有着重要的作用。

The authors have declared that no competing interests exist.

[1]
龚理, 时伟, 司李真, 等, 2013. 鱼类线粒体DNA重排研究进展[J]. 动物学研究, 34(6): 666-673.

GONG LI, SHI WEI, SI LIZHEN, et al, 2013. Rearrangement of mitochondrial genome in fishes[J]. Zoological Research, 34(6): 666-673 (in Chinese with English abstract).

[2]
刘焕章, 2002. 鱼类线粒体DNA控制区的结构和进化: 以鳑鲏鱼类为例[J]. 自然科学进展, 12(3): 266-270.

LIU HUANZHANG, 2002. The structure and evolution of the mtDNA control region in fish: taking example for Acheilognathinae[J]. Progress in Natural Science, 12(3): 266-270 (in Chinese).

[3]
ARNDT A, SMITH M J, 1998. Mitochondrial gene rearrangement in the sea cucumber genus Cucumaria[J]. Molecular Biology and Evolution, 15(8): 1009-1016.

[4]
BOORE J L, 1999. Animal mitochondrial genomes[J]. Nucleic Acids Research, 27(8): 1767-1780.

[5]
CANTATORE P, GADALETA M N, ROBERTI M, et al, 1987. Duplication and remoulding of tRNA genes during the evolutionary rearrangement of mitochondrial genomes[J]. Nature, 329(6142): 853-855.

[6]
CHEN PENGYAN, ZHENG BOYING, LIU JINGXIAN, et al, 2016. Next-generation sequencing of two mitochondrial genomes from family pompilidae (Hymenoptera: Vespoidea) reveal novel patterns of gene arrangement[J]. International Journal of Molecular Sciences, 17(10): 1641.

[7]
GONG LI, SHI WEI, YANG MIN, et al, 2016. Novel gene arrangement in the mitochondrial genome of Bothus myriaster (Pleuronectiformes: Bothidae): evidence for the Dimer- Mitogenome and Non-random Loss model[J]. Mitochondrial DNA Part A, 27(5): 3089-3092.

[8]
GUO AIJIANG, 2016. The complete mitochondrial genome of the tapeworm Cladotaenia vulturi (Cestoda: Paruterinidae): gene arrangement and phylogenetic relationships with other cestodes[J]. Parasites & Vectors, 9(1): 475.

[9]
HALL T A, 1999. BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT[J]. Nucleic Acids Symposium Series, 41(2): 95-98.

[10]
INOUE J G, MIYA M, TSUKAMOTO K, et al, 2003. Evolution of the deep-sea gulper eel mitochondrial genomes: large-scale gene rearrangements originated within the eels[J]. Molecular Biology and Evolution, 20(11): 1917-1924.

[11]
JACOBS H T, HERBERT E R, RANKINE J, 1989. Sea urchin egg mitochondrial DNA contains a short displacement loop (D-loop) in the replication origin region[J]. Nucleic Acids Research, 17(22): 8949-8965.

[12]
KONG XIAOYU, DONG XIAOLI, ZHANG YANCHUN, et al, 2009. A novel rearrangement in the mitochondrial genome of tongue sole, Cynoglossus semilaevis: control region translocation and a tRNA gene inversion[J]. Genome, 52(12): 975-984.

[13]
LAVROV D V, BOORE J L, BROWN W M, 2002, Complete mtDNA sequences of two millipedes suggest a new model for mitochondrial gene rearrangements: duplication and nonrandom loss[J]. Molecular Biology and Evolution, 19(2): 163-169.

[14]
LEE J, LEE H, LEE J, et al, 2015. Complete mitochondrial genome of the Antarctic silverfish, Pleuragramma antarcticum (Perciformes, Nototheniidae)[J]. Mitochondrial DNA, 26(6): 885-886.

[15]
LEE J S, MIYA M, LEE Y S, et al, 2001. The complete DNA sequence of the mitochondrial genome of the self-fertilizing fish Rivulus marmoratus (Cyprinodontiformes, Rivulidae) and the first description of duplication of a control region in fish[J]. Gene, 280(1/2): 1-7.

[16]
LI DONGHE, SHI WEI, GONG LI, et al, 2016. The complete mitochondrial genome of Paraplagusia blochii (Pleuronectiformes: Cynoglossidae)[J]. Mitochondrial DNA Part A, 27(1): 92-93.

[17]
LI YUAN, SONG NA, LIN LONGSHAN, et al, 2016. The complete mitochondrial genome of Pampus echinogaster (Perciformes: Stromateidae)[J]. Mitochondrial DNA Part A, 27(1): 289-290.

[18]
LIN CHUYIN, LIN WENWEN, KAO H W, 2012. The complete mitochondrial genome of the mackerel icefish, Champsocephalus gunnari (Actinopterygii: Channichthyidae), with reference to the evolution of mitochondrial genomes in Antarctic notothenioids[J]. Zoological Journal of the Linnean Society, 165(3): 521-533.

[19]
LOWE T M, EDDY S R, 1997. tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence[J]. Nucleic Acids Research, 25(5): 955-964.

[20]
LUNT D H, HYMAN B C, 1997. Animal mitochondrial DNA recombination[J]. Nature, 387(6630): 247.

[21]
MORITZ C, BROWN W M, 1987. Tandem duplications in animal mitochondrial DNAS: variation in incidence and gene content among lizards[J]. Proceedings of the National Academy of Sciences of the United States of America, 84(20): 7183-7187.

[22]
MU XIDONG, YANG YEXIN, LIU YI, et al, 2017. The complete mitochondrial genomes of two freshwater snails provide new protein-coding gene rearrangement models and phylogenetic implications[J]. Parasites & Vectors, 10: 11.

[23]
NELSON J S, 2006. Fishes of the word[M]. 4th ed. Portland, OR: John Wiley & Sons, Inc.: 442-451.

[24]
OH J S, KANG S, AHN D H, et al, 2016. Complete mitochondrial genome of the Antarctic dragonfish, Parachaenichthys charcoti (Notothenioidei: Bathydraconidae)[J]. Mitochondrial DNA Part A, 27(5): 3151-3152.

[25]
POULTON J, DEADMAN M E, BINDOFF L, et al, 1993. Families of mtDNA-rearrangements can be detected in patients with mtDNA deletions: duplications may be a transient intermediate form[J]. Human Molecular Genetics, 2(1): 23-30.

[26]
SATOH T P, MIYA M, ENDO H, et al, 2006. Round and pointed-head grenadier fishes (Actinopterygii: Gadiformes) represent a single sister group: evidence from the complete mitochondrial genome sequences[J]. Molecular Phylogenetics and Evolution, 40(1): 129-138.

[27]
SHADEL G S, CLAYTON D A, 1997. Mitochondrial DNA maintenance in vertebrates[J]. Annual Review of Biochemistry, 66: 409-435.

[28]
SHI WEI, DONG XIAOLI, WANG ZHONHMING, et al, 2013. Complete mitogenome sequences of four flatfishes (Pleuronectiformes) reveal a novel gene arrangement of L-strand coding genes[J]. BMC Evolutionary Biology, 13: 173.

[29]
SHI WEI, MIAO XIANGUANG, KONG XIAOYU, 2014. A novel model of double replications and random loss accounts for rearrangements in the Mitogenome of Samariscus latus (Teleostei: Pleuronectiformes)[J]. BMC Genomics, 15: 352.

[30]
SHI WEI, GONG LI, WANG SHUYING, et al, 2015. Tandem Duplication and Random Loss for mitogenome rearrangement in Symphurus (Teleost: Pleuronectiformes)[J]. BMC Genomics, 16: 355.

[31]
SHI WEI, GONG LI, KONG XIAOYU, 2016. The complete mitochondrial genome sequence of Cynoglossus abbreviatus (Pleuronectiformes: Cynoglossidae) with control region translocation and tRNA-Gln gene inversion[J]. Mitochondrial DNA Part A, 27(3): 2157-2158.

[32]
STOTHARD P, WISHART D S, 2005. Circular genome visualization and exploration using CGView[J]. Bioinformatics, 21(4): 537-539.

[33]
THOMPSON J D, GIBSON T J, PLEWNIAK F, et al, 1997. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools[J]. Nucleic Acids Research, 25(24): 4876-4882.

[34]
VERKUIL Y I, PIERSMA T, BAKER A J, 2010. A novel mitochondrial gene order in shorebirds (Scolopacidae, Charadriiformes)[J]. Molecular Phylogenetics and Evolution, 57(1): 411-416.

[35]
WANG SHUYING, SHI WEI, MIAO XIANGUANG, et al, 2014. Complete mitochondrial genome sequences of three rhombosoleid fishes and comparative analyses with other flatfishes (Pleuronectiformes)[J]. Zoological Studies, 53: 80.

[36]
XIA YUN, ZHENG YUCHI, MURPHY R W, et al, 2016. Intraspecific rearrangement of mitochondrial genome suggests the prevalence of the tandem duplication-random loss (TDLR) mechanism in Quasipaa boulengeri[J]. BMC Genomics, 17: 965.

[37]
YANG MIN, SHI WEI, MIAO XIANGUANG, et al, 2016. The complete mitochondrial genome of Cynoglossus puncticeps (Pleuronectiformes: Cynoglossidae)[J]. Mitochondrial DNA Part A, 27(2): 1233-1234.

[38]
ZHUANG XUAN, QU MENG, ZHANG XIANG, et al, 2013. A comprehensive description and evolutionary analysis of 22 grouper (Perciformes, Epinephelidae) mitochondrial genomes with emphasis on two novel genome organizations[J]. PLoS One, 8(8): e73561.

Outlines

/