CN110714063A - 一种基于线粒体全基因组对台湾东风螺系统发育分析方法 - Google Patents

一种基于线粒体全基因组对台湾东风螺系统发育分析方法 Download PDF

Info

Publication number
CN110714063A
CN110714063A CN201910974636.9A CN201910974636A CN110714063A CN 110714063 A CN110714063 A CN 110714063A CN 201910974636 A CN201910974636 A CN 201910974636A CN 110714063 A CN110714063 A CN 110714063A
Authority
CN
China
Prior art keywords
dna
mitochondrial
genome
sequencing
bay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910974636.9A
Other languages
English (en)
Inventor
叶莹莹
许中天
冯鉴童
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Ocean University ZJOU
Original Assignee
Zhejiang Ocean University ZJOU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Ocean University ZJOU filed Critical Zhejiang Ocean University ZJOU
Priority to CN201910974636.9A priority Critical patent/CN110714063A/zh
Publication of CN110714063A publication Critical patent/CN110714063A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于线粒体全基因组对台湾东风螺系统发育分析方法,涉及台湾东风螺系统发育分析领域,包括以下步骤:1)样本采集:采集台湾东风螺提取线粒体基因组DNA;2)将线粒体基因组DNA打断、纯化后构建DNA测序文库;3)获得DNA簇;4)对螺线粒体基因组DNA测序;5)与其他已知序列的东风螺进行比较,随后对编码蛋白基因基因注释;6)将台湾东风螺线粒体基因组DNA的每个基因的核苷酸序列及其推导的氨基酸序列与其他新腹足目物种的进行比对,并将其串联起来进行系统发育分析,本发明基于线粒体全基因组对台湾东风螺系统发育进行分析,得到了完整的台湾东风螺线粒体全基因组数据,进行系统发育进行分析方便有效。

Description

一种基于线粒体全基因组对台湾东风螺系统发育分析方法
技术领域
本发明涉及台湾东风螺系统发育分析领域,尤其涉及一种基于线粒体全基因组对台湾东风螺系统发育分析方法。
背景技术
台湾东风螺(Babylonia formosae)属于软体动物门,腹足纲,蛾螺科,东风螺属。蛾螺科的分类与种系发生关系到目前为止主要还是依靠贝壳以及厣的形态特征。但是由于贝壳表面的雕刻、颜色以及厣的形态易受到环境因素的影响,存在较大的不稳定性,再加上相似种类的趋同进化,使得蛾螺科种类的贝壳趋于简单化,因此并不能提供足够的可辨别特征,所以单纯依靠这贝壳及厣的形态进行分类常常会导致分类上的错误和混乱。蛾螺科种类的亲缘关系复杂,其分类地位仍具有很大争议。
发明内容
本发明是为了克服目前运用形态学方法对蛾螺科物种台湾东风螺系统的分类与种系发生关系时,由于贝壳表面的雕刻、颜色以及厣的形态易受到环境因素的影响,存在较大的不稳定性,再加上相似种类的趋同进化,使得蛾螺科种类的贝壳趋于简单化,因此并不能提供足够的可辨别特征,导致单纯依靠这贝壳及厣的形态进行分类常常会导致分类上的错误和混乱等问题,提出了一种基于线粒体全基因组对台湾东风螺系统发育分析方法。
为了实现上述目的,本发明采用以下技术方案:
一种基于线粒体全基因组对台湾东风螺系统发育分析方法,包括以下步骤:
1)样本采集:采集台湾东风螺,采用盐析法从肌肉组织中提取线粒体基因组DNA,冷冻保存;
2)将线粒体基因组DNA打断、纯化后构建DNA测序文库;
3)将线粒体基因组DNA打断成片段,获得DNA簇;
4)采用高通量测序法对台湾东风螺线粒体基因组DNA进行测序;
5)将台湾东风螺线粒体基因组DNA与其他已知序列的东风螺进行比较,随后对编码蛋白基因基因注释;
6)将台湾东风螺线粒体基因组DNA的每个基因的核苷酸序列及其推导的氨基酸序列与其他新腹足目物种的进行比对,并将其串联起来进行系统发育分析。
线粒体基因组DNA因其具有分子小、结构简单、演化快速、群体内稳定性高、母系遗传、无重组、检测方便,进行系统发育分析效果较好。绝大多数动物线粒体基因组是共价闭合的双链DNA分子,分子量较小,一般介于14-19kb之间,基因的排列紧密,无内含子,基因间隔常少于10bp,甚至有些基因间存在重叠现象致使这些基因没有完全的终止密码子[14],同时这也使得mtDNA具有非常高的编码效率。尽管动物mtDNA的长度差别较大,但是线粒体基因数量却基本相同,正常情况下包含13个蛋白质编码基因,22个t RNA基因和2个r RNA基因以及控制基因复制和转录的控制区。2个rRNA基因包括12S r RNA和16S rRNA,13个蛋白质编码基因包括2个ATP酶亚单位(ATP6和ATP8),3个细胞色素氧化酶亚单位(COI,COII和COIII),细胞色素b和7个NADH还原酶复合体亚单位(ND1,ND2,ND3,ND4,ND4L,ND5,ND6)。少数种类在基因组成上存在变化:绣球海葵的线粒体基因组中只包含2个tRNA基因;双壳纲贝类一些物种线粒体基因组缺失了ATP8基因,如菲律宾蛤仔(Venerupis Philippinarum),中华文蛤(Meretrix petechialis)等。
线粒体基因组与核基因组DNA相比具有分子量小、结构简单、母系遗传等特点,成为生物多样性、群体遗传学与系统进化研究中的重要分子标记,同时线粒体全基因组序列成为系统发育分析确立分类地位的重要手段。近年来,线粒体基因组的研究发展速度很快,已提交的软体动物线粒体基因组有大约1/5为双壳类。
系统进化研究、遗传多样性分析及种类鉴定等方面。
作为优选,步骤1)中的盐析法步骤如下:取15-20mg台湾东风螺肌肉组织,加入400-500ul裂解液,加入10-15ul Protein K,翻转,55-60℃下水浴12-14h,随后加入300ul,浓度为6M的NaCl溶液,充分涡旋,置于4℃,10000-12000rcf下离心,取上清液,加入等体积异丙醇,翻转,冷冻存放,随后离心弃上清液,沉淀洗涤后在45-55℃的烘箱中烘干,加入50-60ul纯水后,用琼脂糖凝胶电泳检测基因组DNA。
本发明使用裂解液及蛋白酶溶解台湾东风螺肌肉组织中的线粒体基因组DNA,随后使用NaCl溶液能够更好地析出除DNA以外的蛋白质和杂质,取得含有线粒体基因组DNA的上清液后,加入的异丙醇更易于固定DNA。
作为优选,步骤2)中测序文库构建步骤依次为:DNA末端修复、3’端加A,连接测序接头,琼脂糖凝胶电泳法回收目的片段,对目的片段进行PCR扩增,构建得到IlluminaPE文库测序文库。
作为优选,步骤3)中获得DNA簇的方法为:将基因组DNA打断成100-200bp的片段,连接到固相基质上,经过Bst聚合酶延伸和甲酸胺变性的桥PCR循环,生成大量的DNA簇。
而本发明中每个DNA簇中约有1000个相同序列的DNA片段。
作为优选,步骤2)及步骤3)中DNA打断方法为:将基因组DNA置于80-100W下的超声波中超声2-4s,重复3-5次,间隔为5-10s。
在该超声条件下基因组DNA打断效果较好。
作为优选,步骤4)中采用IlluminaHiSeqTM平台进行测序,并在测序时加入荧光标记并结合了可逆终止剂的dNTP,测序完成后,对所有测序reads的碱基分布和质量波动进行统计。
加入荧光标记并结合了可逆终止剂的dNTP,DNA簇与单链扩增产物的通用序列杂交,由于终止剂的作用,DNA聚合酶每次循环只延伸一个dNTP。每次延伸所产生的光信号被标准的微阵列光学检测系统分析测序,下一次循环中把终止剂和荧光标记基团裂解掉,然后继续延伸dNTP,完成边合成边测序技术。Illumina HiSeq X Ten测序得到的原始图像数据经过Base Calling转化为序列数据,结果以FASTQ文件格式来存储。FASTQ文件为最原始的数据文件,文件包含测序reads的序列信息以及测序质量信息。利用生物信息统计学方法,对所有测序reads的碱基分布和质量波动进行统计,从宏观上可以直观的反映出测序样本的测序质量和文库构建质量。由于原始测序数据中会包含测序接头序列、低质量读段、N率较高序列及长度过短序列的数据。因此,为保证后续生物信息分析的准确性,首先对原始测序数据进行过滤,从而得到高质量的测序数据(clean data)。
作为优选,步骤5)中将台湾东风螺线粒体基因组DNA与泥东风螺进行比较,并通过BLAST搜索在NCBI数据库中进行鉴定;随后通过选择无脊椎动物线粒体遗传密码,利用NCBIORFFinder对编码蛋白基因进行注释。
将台湾东风螺线粒体基因组DNA与泥东风螺进行比较,用以确保台湾东风螺线粒体基因组DNA序列正确。基因注释后,通过与其他蛾螺科物种的比较,确定了起始密码子和终止密码子。使用MEGA 7.0计算密码子使用量。使用MITOS Web-Server验证tRNA基因的识别。rRNA基因是根据邻近tRNA基因的位置和与其他蛾螺科物种的比较确定的。计算链不对称的公式为:AT-skew=(A%-T%)/(A%+T%);GC-skew=(G%-C%)/(G%+C%)。利用在线线粒体可视化工具Organellar genome DRAW绘制线粒体基因组DNA图谱。
作为优选,步骤6)系统发育分析前使用NOVOPlasty拼接软件对测序读段序列进行多次迭代的拼接。
进行多次迭代的拼接,以确保获得最优的组装结果。
作为优选,步骤6)中从GenBank下载新腹足目物种的完整线粒体核苷酸序列,利用MEGA7.0对每个基因的核苷酸序列及其推导的氨基酸序列分别进行比对,并将所有物种线粒体基因组蛋白质氨基酸序列串联起来构成数据集,基于该数据集,采用NJ法和ML法构建新腹足目系统进化树,进行系统发育分析。
因此,本发明具有如下有益效果:本发明基于线粒体全基因组对台湾东风螺系统发育进行分析,得到了完整的台湾东风螺线粒体全基因组数据,进行系统发育进行分析方便有效。
附图说明
图1是本发明台湾东风螺线粒体基因组DNA环装图。
图2是本发明台湾东风螺及其他新腹足目线粒体基因组基因含量组成。
图3是本发明新腹足目代表笋螺科代表物种的tRNA二级结构。
图4是本发明台湾东风螺的tRNA二级结构。
图5是本发明台湾东风螺线粒体基因组DNA基因重排图。
图6是本发明基于13个PCG基因根据(NJ)法和最大似然(ML)方法构建的新腹足目系统进化树。
具体实施方式
下面结合具体实施方式对本发明做进一步的描述。
实施例1:一种基于线粒体全基因组对台湾东风螺系统发育分析方法,包括以下步骤:
1)样本采集:采集台湾东风螺,取17mg台湾东风螺肌肉组织,加入450ul裂解液,加入13ul Protein K,翻转,57℃下水浴13h,随后加入300ul,浓度为6M的NaCl溶液,充分涡旋,置于4℃,11000rcf下离心,取上清液,加入等体积异丙醇,翻转,冷冻存放,随后离心弃上清液,沉淀洗涤后在50℃的烘箱中烘干,加入55ul纯水后,用琼脂糖凝胶电泳检测基因组DNA;随后将肌肉组织中提取线粒体基因组DNA,冷冻在-25℃下冷冻保存;
2)将线粒体基因组DNA置于90W下的超声波中超声3s,重复4次,间隔为7s进行打断,纯化后依次进行DNA末端修复、3’端加A,连接测序接头,琼脂糖凝胶电泳法回收目的片段,对目的片段进行PCR扩增,构建得到IlluminaPE文库测序文库;
3)将线粒体基因组DNA置于90W下的超声波中超声3s,重复4次,间隔为7s打断成100-200bp的片段,连接到固相基质上,经过Bst聚合酶延伸和甲酸胺变性的桥PCR循环,生成大量的DNA簇;
4)采用高通量测序法对台湾东风螺线粒体基因组DNA进行测序,测序前对建好的文库进行质检,质检合格后采用IlluminaHiSeqTM平台测序;测序时在测序时加入荧光标记并结合了可逆终止剂的dNTP,测序完成后,对所有测序reads的碱基分布和质量波动进行统计;
5)将台湾东风螺线粒体基因组DNA与与泥东风螺(B.lutosa)(KF897830.1)进行比较,随后通过选择无脊椎动物线粒体遗传密码,利用NCBIORFFinder对编码蛋白基因进行注释;
6)利用NOVOPlasty拼接软件对台湾东风螺线粒体基因组DNA的测序读段序列进行多次迭代的拼接,得到最优的组装结果,随后从GenBank下载23种新腹足目物种的完整线粒体核苷酸序列,利用MEGA7.0,采用缺损设置对24个线粒体基因组中13个线粒体编码蛋白的氨基酸序列进行比对,并将其串联起来构成数据集,随后应用ClustalX1.83、Mega4.0以及数据集,采用NJ法和ML法构建新腹足目系统进化树,进行系统发育分析。
实施例2:一种基于线粒体全基因组对台湾东风螺系统发育分析方法,包括以下步骤:
1)样本采集:采集台湾东风螺,取15mg台湾东风螺肌肉组织,加入400ul裂解液,加入10ul Protein K,翻转,60℃下水浴12h,随后加入300ul,浓度为6M的NaCl溶液,充分涡旋,置于4℃,10000rcf下离心,取上清液,加入等体积异丙醇,翻转,冷冻存放,随后离心弃上清液,沉淀洗涤后在45℃的烘箱中烘干,加入50ul纯水后,用琼脂糖凝胶电泳检测基因组DNA;随后将肌肉组织中提取线粒体基因组DNA,冷冻在-30℃下冷冻保存;
2)将线粒体基因组DNA置于80W下的超声波中超声2s,重复5次,间隔为5s进行打断,纯化后依次进行DNA末端修复、3’端加A,连接测序接头,琼脂糖凝胶电泳法回收目的片段,对目的片段进行PCR扩增,构建得到IlluminaPE文库测序文库;
3)将线粒体基因组DNA置于80W下的超声波中超声2s,重复5次,间隔为5s打断成100-200bp的片段,连接到固相基质上,经过Bst聚合酶延伸和甲酸胺变性的桥PCR循环,生成大量的DNA簇;
4)采用高通量测序法对台湾东风螺线粒体基因组DNA进行测序,测序前对建好的文库进行质检,质检合格后采用IlluminaHiSeqTM平台测序;测序时在测序时加入荧光标记并结合了可逆终止剂的dNTP,测序完成后,对所有测序reads的碱基分布和质量波动进行统计;
5)将台湾东风螺线粒体基因组DNA与与泥东风螺(B.lutosa)(KF897830.1)进行比较,随后通过选择无脊椎动物线粒体遗传密码,利用NCBIORFFinder对编码蛋白基因进行注释;
6)利用NOVOPlasty拼接软件对台湾东风螺线粒体基因组DNA的测序读段序列进行多次迭代的拼接,得到最优的组装结果,随后从GenBank下载23种新腹足目物种的完整线粒体核苷酸序列,利用MEGA7.0,采用缺损设置对24个线粒体基因组中13个线粒体编码蛋白的氨基酸序列进行比对,并将其串联起来构成数据集,随后应用ClustalX1.83、Mega4.0以及数据集,采用NJ法和ML法构建新腹足目系统进化树,进行系统发育分析。
实施例3:一种基于线粒体全基因组对台湾东风螺系统发育分析方法,包括以下步骤:
1)样本采集:采集台湾东风螺,取20mg台湾东风螺肌肉组织,加入500ul裂解液,加入15ulProtein K,翻转,55℃下水浴14h,随后加入300ul,浓度为6M的NaCl溶液,充分涡旋,置于4℃,12000rcf下离心,取上清液,加入等体积异丙醇,翻转,冷冻存放,随后离心弃上清液,沉淀洗涤后在55℃的烘箱中烘干,加入60ul纯水后,用琼脂糖凝胶电泳检测基因组DNA;随后将肌肉组织中提取线粒体基因组DNA,冷冻在-15℃下冷冻保存;
2)将线粒体基因组DNA置于100W下的超声波中超声4s,重复3次,间隔为10s进行打断,纯化后依次进行DNA末端修复、3’端加A,连接测序接头,琼脂糖凝胶电泳法回收目的片段,对目的片段进行PCR扩增,构建得到IlluminaPE文库测序文库;
3)将线粒体基因组DNA置于100W下的超声波中超声4s,重复3次,间隔为10s打断成100-200bp的片段,连接到固相基质上,经过Bst聚合酶延伸和甲酸胺变性的桥PCR循环,生成大量的DNA簇;
4)采用高通量测序法对台湾东风螺线粒体基因组DNA进行测序,测序前对建好的文库进行质检,质检合格后采用IlluminaHiSeqTM平台测序;测序时在测序时加入荧光标记并结合了可逆终止剂的dNTP,测序完成后,对所有测序reads的碱基分布和质量波动进行统计;
5)将台湾东风螺线粒体基因组DNA与与泥东风螺(B.lutosa)(KF897830.1)进行比较,随后通过选择无脊椎动物线粒体遗传密码,利用NCBIORFFinder对编码蛋白基因进行注释;
6)利用NOVOPlasty拼接软件对台湾东风螺线粒体基因组DNA的测序读段序列进行多次迭代的拼接,得到最优的组装结果,随后从GenBank下载23种新腹足目物种的完整线粒体核苷酸序列,利用MEGA7.0,采用缺损设置对24个线粒体基因组中13个线粒体编码蛋白的氨基酸序列进行比对,并将其串联起来构成数据集,随后应用ClustalX1.83、Mega4.0以及数据集,采用NJ法和ML法构建新腹足目系统进化树,进行系统发育分析。
实施例1分析结果如下。
表1:本发明所用24新腹足目物种名单
Figure BDA0002233201650000071
台湾东风螺线粒体基因组DNA谱图如图1所示,图中可知,台湾东风螺线粒体基因组DNA全序列长度为16,211bp(GenBank登录号为MK577482.1),与大部分已知的腹足纲动物线粒体长度相当。整个线粒体基因组编码37个基因(2个rRNA基因、22个tRNA基因和13个蛋白质编码基因),除了几个tRNA基因(trnM、trnY、trnC、trnW、trnQ、trnG、trnE、trnT)由L链编码外,所有的基因都由H链编码。并且,13个蛋白编码基因均分布在重链上,与新腹足目各科现有的线粒体全基因组中蛋白编码基因分布结果一致。
如图2所示,台湾东风螺mtDNA(A+T)碱基比例为65.41%,表现出明显的AT偏向。编码区占整个mtDNA的66.6%,非编码区总长3,764bp分布于线粒体基因组的24个区域,占总长的23.2%,其中最长的非编码区长922bp,为控制区(ControlRegion)。就蛋白质编码基因而言,在mtDNA中,ATG并不是唯一的起始密码子,台湾东风螺线粒体基因组中,COI、COII、COIII、ATP6、ATP8、ND1、ND2、ND3、Cytb、ND4和ND4L以ATG作为起始密码子,然而ND5和ND6则以ATT为起始密码子,台湾东风螺mtDNA包含两类终止密码子,分别是TAA和TAG。台湾东风螺mtDNA共编码5,404个氨基酸序列,在全部的蛋白质编码基因中,A+T碱基含量为65.41%,与Oxymerisdimidiata接近。DNA序列中碱基使用的偏好可以用一个值来衡量,即偏度。偏度是即碱基A比T或G比C的相对数量,它们的值可以分别通过(A%-T%)/(A%+T%)and(G%-C%)/(G%+C%)计算得到。台湾东风螺线粒体基因组的13个蛋白编码基因的GC偏度并非全部为典型的正值,ATP6、ATP8、ND2、ND4、ND4L、ND5、ND6、和Cytb的GC偏度为负值;而AT偏度则几乎全为负值。ND4的GC偏度值最低(GCskew=-0.17597),其余12个蛋白编码基因的GC偏度在-0.160到0.222之间。这表明台湾东风螺线粒体蛋白质编码基因在碱基使用上,相对于G来说更倾向于使用C,相对于A来说更倾向于使用T,这种结果在其他新腹足目的贝类中已经测序得到的线粒体全基因组中也得到了验证。
相对于其它科的物种,遗传差异较大的新腹足目中的笋螺科代表物种(O.dimidiata)(如图3所示),与本发明得到的台湾东风螺(如图4所示)两种线粒体tRNA基因序列及二级结构特征进行了比较,根据线粒体tRNA二级结构模型(K-N模型)将测序结果排列成茎环结构,台湾东风螺mtDNA编码22个tRNA,长度在65bp到70bp之间,全部能够折叠成典型的三叶草结构。本发明中的两种物种的线粒体tRNA基因中,台湾东风螺除tRNASer(S2)、trnF、trnK外,均具有标准的线粒体tRNA二级结构,tRNASer(AGY)具有缺少D茎的特殊三叶草结构,trnF、trnK具有缺少TC环的特殊三叶草结构;而笋螺科代表物种(O.dimidiata)除tRNASer(S2),均具有标准的线粒体tRNA二级结构。tRNASer(S2)具有缺少D茎的特殊三叶草结构;此外,在两种物种线粒体tRNA二级结构中:AA茎包含6~7个碱基对,D茎、AC茎和T茎包含3~5个碱基对;T-AA茎之间无间隔,AA-D,D-AC,AC-T茎之间分别有2个,1个,3~6个碱基。图中可以看出在新腹足目的2个科水平上存在大量的插入、突变和缺失,物种间碱基组成相似,但蛾螺科代表物种(台湾东风螺)与较为原始的新腹足目代表笋螺科代表物种(O.dimidiata)相比,tRNA二级结构发生较大变化,这个可能反映了蛾螺科在进化过程中的处于一种进化状态。通过比较这些tRNA基因序列和二级结构差异,发现核苷酸变异主要出现在环区,且存在插入缺失。茎区相对保守,其中一些变异如双链的互补性碱基突变、G-U配对等对于维系tRNA二级结构的稳定性非常重要。比较物种间tRNA基因二级结构发现,部分tRNA基因中的核苷酸插入和缺失特征在科水平具有共同衍征,提示这些特征对于新腹足目系统发育关系具有较高的参考价值。
目前,已经测定线粒体基因组全序列的的新腹足目物种34科中仅有11个科,本发明通过GenBank数据库下载到已发布的10个科(分别是:Acteonidae、Babyloniidae、Cancellariidae、Columbellidae、Conidae、Muricidae、Nassariidae、Olividae、Terebridae、Volutidae)以及结合本发明中得到的蛾螺科代表物种代表台湾东风螺的线粒体全基因组对新腹足目物种线粒体基因组重排进行探讨(如图5所示)。通过数据处理与结果分析,在整个新腹足目已发布的11个科线粒体全基因组数据中,台湾东风螺(蛾螺科代表)其在线粒体基因组基因排列顺序除了与笋螺科物种存在明显区别外,与剩余的其它8个科物种在基因排列顺序一致,因此,本发明挑选了基因排列顺序具有较大差别的笋螺科物种代表(O.dimidiata)结合本发明得到的台湾东风螺线粒体全基因组做基因重排系统进化分析。由图5可以得出:台湾东风螺13个编码蛋白基因基因和2个rRNA排列顺序与软体动物门祖先基因排列顺序一致,但是,不同的是,台湾东风螺所有编码蛋白基因均由H链编码,与蛾螺科其它物种基因编码结果一致;同时,与原始新腹足目物种代表笋螺科物种代表(O.dimidiata)相比,台湾东风螺(B.formosae)大部分基因基因顺序保持一致,唯一不同的是,在台湾东风螺这个物种中,存在着一个trnD基因和基因簇(rrnL-L1-L2-nad1-P-nad6-cob-S2)发生了倒置事件。说明了台湾东风螺在整个新腹足目的进化历史中,相比于原始祖先,发生了进化事件。整个线粒体基因组基因排列顺序具有较大的区别,在新腹足目的大多数科中,大多数物种存在所有的大部分的mt基因全由H链编码,因此,在进化过程中,这种不对称的基因复制和转录增加了重排的几率。
新腹足目的物种已测出线粒体全基因组序列的共11科。从Genebank上下载各科线粒体全基因组序列并将所有物种线粒体基因组的13个蛋白质氨基酸序列分别连接起来构成数据集,应用ClustalX1.83和Mega4.0,基于上述数据集,采用NJ法和ML法构建新腹足目系统进化树。基于ML法和NJ法构建的进化树拓扑结构类似,如图6所示,所有物种分成6支,Buccinidae先后和Olividae以及Muricidae聚为一支;Babyloniidae和Nassariidae聚为一支;Conidae自聚为一支;Cancellariidae、Columbellidae、Volutidae的三个物种聚为一支,但置信度仅为低,低于可取的置信度,分析原因,可能是因为Cancellariidae、Columbellidae、Volutidae已测得物种线粒体的数量太少的原因置信度为100;然后Acteonidae和Terebridae各自聚为一支,成为外群物种。本发明中,通过新腹足目各科物种线粒体全基因组13个编码蛋白数据构建系统进化分析结果与线粒体基因排列顺利角度,以及tRNA二级结构的改变对物种进化之间的关系探讨整个新腹足目系统发育关系一致,均表明了,在目前已测序发布的整个新腹足目物种中,与原始新腹足目代表笋螺科物种(O.dimidiata)相比,蛾螺科物种台湾东风螺与大多数科一样,在进化史上可以作为新腹足目的一个相对进化物种,提供较为遗传材料。

Claims (9)

1.一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,包括以下步骤:
1)样本采集:采集台湾东风螺,采用盐析法从肌肉组织中提取线粒体基因组DNA,冷冻保存;
2)将线粒体基因组DNA打断、纯化后构建DNA测序文库;
3)将线粒体基因组DNA打断成片段,获得DNA簇;
4)采用高通量测序法对台湾东风螺线粒体基因组DNA进行测序;
5)将台湾东风螺线粒体基因组DNA与其他已知序列的东风螺进行比较,随后对编码蛋白基因基因注释;
6)将台湾东风螺线粒体基因组DNA的每个基因的核苷酸序列及其推导的氨基酸序列与其他新腹足目物种的进行比对,并将其串联起来进行系统发育分析。
2.根据权利要求1所述的一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,步骤1)中的盐析法步骤如下:取15-20mg台湾东风螺肌肉组织,加入400-500ul裂解液,加入10-15ul Protein K,翻转,55-60℃下水浴12-14h,随后加入300ul,浓度为6M的NaCl溶液,充分涡旋,置于4℃,10000-12000 rcf下离心,取上清液,加入等体积异丙醇,翻转,冷冻存放,随后离心弃上清液,沉淀洗涤后在45 -55℃的烘箱中烘干,加入50-60ul纯水后,用琼脂糖凝胶电泳检测基因组DNA。
3.根据权利要求1所述的一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,步骤2)中测序文库构建步骤依次为:DNA 末端修复、3’端加A,连接测序接头,琼脂糖凝胶电泳法回收目的片段,对目的片段进行PCR 扩增,构建得到Illumina PE 文库测序文库。
4.根据权利要求1所述的一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,步骤3)中获得DNA簇的方法为:将基因组DNA打断成100-200bp的片段,连接到固相基质上,经过 Bst 聚合酶延伸和甲酸胺变性的桥PCR循环,生成大量的 DNA簇。
5.根据权利要求1所述的一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,步骤2)及步骤3)中DNA打断方法为:将基因组DNA置于80-100W下的超声波中超声2-4s,重复3-5次,间隔为5-10s。
6.根据权利要求1所述的一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,步骤4)中采用Illumina HiSeq TM 平台进行测序,并在测序时加入荧光标记并结合了可逆终止剂的 dNTP,测序完成后,对所有测序reads 的碱基分布和质量波动进行统计。
7.根据权利要求1所述的一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,步骤5)中将台湾东风螺线粒体基因组DNA与泥东风螺进行比较,并通过BLAST搜索在NCBI数据库中进行鉴定;随后通过选择无脊椎动物线粒体遗传密码,利用NCBI ORFFinder对编码蛋白基因进行注释。
8.根据权利要求1所述的一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,步骤6)系统发育分析前使用NOVOPlasty拼接软件对测序读段序列进行多次迭代的拼接。
9.根据权利要求1所述的一种基于线粒体全基因组对台湾东风螺系统发育分析方法,其特征在于,步骤6)中从GenBank下载新腹足目物种的完整线粒体核苷酸序列,利用MEGA7.0对每个基因的核苷酸序列及其推导的氨基酸序列分别进行比对,并将所有物种线粒体基因组蛋白质氨基酸序列串联起来构成数据集,基于该数据集,采用 NJ 法和 ML 法构建新腹足目系统进化树,进行系统发育分析。
CN201910974636.9A 2019-10-14 2019-10-14 一种基于线粒体全基因组对台湾东风螺系统发育分析方法 Pending CN110714063A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910974636.9A CN110714063A (zh) 2019-10-14 2019-10-14 一种基于线粒体全基因组对台湾东风螺系统发育分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910974636.9A CN110714063A (zh) 2019-10-14 2019-10-14 一种基于线粒体全基因组对台湾东风螺系统发育分析方法

Publications (1)

Publication Number Publication Date
CN110714063A true CN110714063A (zh) 2020-01-21

Family

ID=69211633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910974636.9A Pending CN110714063A (zh) 2019-10-14 2019-10-14 一种基于线粒体全基因组对台湾东风螺系统发育分析方法

Country Status (1)

Country Link
CN (1) CN110714063A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112802554A (zh) * 2021-01-28 2021-05-14 中国科学院成都生物研究所 一种基于二代数据的动物线粒体基因组组装方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103898103A (zh) * 2014-03-12 2014-07-02 湖南农业大学 泥东风螺线粒体全基因组序列及其扩增引物
CN109280700A (zh) * 2018-09-17 2019-01-29 上海海洋大学 精确测定中华绒螯蟹线粒体全基因组序列的方法
CN110106257A (zh) * 2019-05-08 2019-08-09 绵阳师范学院 乌鸫系统发育树的构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103898103A (zh) * 2014-03-12 2014-07-02 湖南农业大学 泥东风螺线粒体全基因组序列及其扩增引物
CN109280700A (zh) * 2018-09-17 2019-01-29 上海海洋大学 精确测定中华绒螯蟹线粒体全基因组序列的方法
CN110106257A (zh) * 2019-05-08 2019-08-09 绵阳师范学院 乌鸫系统发育树的构建方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
J ANTONIO BAEZA: "The complete mitochondrial genome of the Caribbean spiny lobster Panulirus argus", 《SCI REP.》 *
S M ALJANABI,I MARTINEZ: "universal and rapid salt-extraction of high quality genomic DNA for PCR-based techniques", 《NUCLEIC ACIDS RES.》 *
王焓谕: "六种天牛线粒体全基因组测定和分析", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *
苏天凤等: "2种东风螺线粒体基因序列多态性研究", 《中国水产科学》 *
陈菲等: "东风螺属的系统发育研究", 《第一届海峡两岸海洋生物多样性研讨会文集》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112802554A (zh) * 2021-01-28 2021-05-14 中国科学院成都生物研究所 一种基于二代数据的动物线粒体基因组组装方法
CN112802554B (zh) * 2021-01-28 2023-09-22 中国科学院成都生物研究所 一种基于二代数据的动物线粒体基因组组装方法

Similar Documents

Publication Publication Date Title
Franchini et al. Transcriptome characterization of the South African abalone Haliotis midae using sequencing-by-synthesis
Li et al. The complete mitochondrial genome of the damsel bug Alloeorhynchus bakeri (Hemiptera: Nabidae)
CN1900318B (zh) 石斑鱼类线粒体基因组高变异区扩增引物及其设计方法
CN113789391A (zh) 一种仿刺参育种全基因组50k snp芯片及应用
Gjerde Characterisation of full-length mitochondrial copies and partial nuclear copies (numts) of the cytochrome b and cytochrome c oxidase subunit I genes of Toxoplasma gondii, Neospora caninum, Hammondia heydorni and Hammondia triffittae (Apicomplexa: Sarcocystidae)
Wang et al. A chromosome-level reference genome of Ensete glaucum gives insight into diversity and chromosomal and repetitive sequence evolution in the Musaceae
Li et al. Complete mitochondrial genomes of three Oxya grasshoppers (Orthoptera) and their implications for phylogenetic reconstruction
CN103740729A (zh) 一种虾夷扇贝生长性状相关的snp位点及其检测和应用
Jespersen et al. Impact of genome reduction in microsporidia
Sun et al. Another blow to the conserved gene order in Annelida: evidence from mitochondrial genomes of the calcareous tubeworm genus Hydroides
Wang et al. Complete mtDNA of the Meretrix lamarckii (Bivalvia: Veneridae) and molecular identification of suspected M. lamarckii based on the whole mitochondrial genome
Uda et al. Complete mitochondrial genomes of the Japanese pink coral (Corallium elatius) and the Mediterranean red coral (Corallium rubrum): a reevaluation of the phylogeny of the family Coralliidae based on molecular data
KR101493978B1 (ko) 콩 품종인식을 위한 Indel 마커
CN115820685A (zh) 一种柑橘CsGSTF1基因及其应用
CN110714063A (zh) 一种基于线粒体全基因组对台湾东风螺系统发育分析方法
Bej et al. Complete mitochondrial genome sequence of Catla catla and its phylogenetic consideration
WO2018024671A1 (en) Methods for removal of adaptor dimers from nucleic acid sequencing preparations
Wu et al. A unique tRNA gene family and a novel, highly expressed ORF in the mitochondrial genome of the silver-lip pearl oyster, Pinctada maxima (Bivalvia: Pteriidae)
CN101736007A (zh) 哲罗鲑线粒体全基因组序列及其扩增引物
Zhu et al. Complete mitochodrial genome of the crab spider Ebrechtella tricuspidata (Araneae: Thomisidae): A novel tRNA rearrangement and phylogenetic implications for Araneae
Zhang et al. Mitochondrial genome of Episesarma lafondii (Brachyura: Sesarmidae) and comparison with other sesarmid crabs
CN105154526B (zh) 日本黄姑鱼线粒体全基因组序列的扩增引物及其扩增方法
CN113046427A (zh) 一种鸡线粒体基因组高通量测序及其结构特征分析的方法
An et al. Integrative taxonomy of the subfamily Orbioninae (Crustacea: Isopoda) based on mitochondrial and nuclear data with evidence that supports Epicaridea as a suborder
Lu et al. Complete mitogenomes and phylogenetic relationships of Haemaphysalis nepalensis and Haemaphysalis yeni

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200121