CN114395630A - 基于高通量测序寄生虱线粒体基因组组装的方法和应用 - Google Patents

基于高通量测序寄生虱线粒体基因组组装的方法和应用 Download PDF

Info

Publication number
CN114395630A
CN114395630A CN202110171393.2A CN202110171393A CN114395630A CN 114395630 A CN114395630 A CN 114395630A CN 202110171393 A CN202110171393 A CN 202110171393A CN 114395630 A CN114395630 A CN 114395630A
Authority
CN
China
Prior art keywords
sequence
gene
parasitic lice
genome
rrns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110171393.2A
Other languages
English (en)
Inventor
刘国华
聂瑜
符意甜
张瑜
邓园萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Agricultural University
Original Assignee
Hunan Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Agricultural University filed Critical Hunan Agricultural University
Priority to CN202110171393.2A priority Critical patent/CN114395630A/zh
Publication of CN114395630A publication Critical patent/CN114395630A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明为基于高通量测序寄生虱线粒体基因组组装的方法和应用,属于生物信息学技术领域,使用两对引物对寄生虱的全基因组DNA进行扩增和测序,得cox1和rrnS基因部分保守序列;再对全基因组DNA测定浓度后构建成对末端基因组DNA文库,高通量测序,处理后产生了2GB数据;根据cox1和rrnS基因部分保守序列对2GB数据进行重新组装重叠群,直至重叠群的两端重叠后进行多重序列比对,鉴定出保守的非编码区序列并将其作为比对Illumina序列数据集的参考,直至寄生虱线粒体组被全部组装。本方案操作简便,成本低速度快,准确性高,组装后的线粒体基因组通过BLAST进行校准,长片段PCR法进行验证,解决了寄生虱线粒体基因组的组装与注释的难题。

Description

基于高通量测序寄生虱线粒体基因组组装的方法和应用
技术领域
本发明属于生物信息学技术领域,具体涉及基于高通量测序寄生虱线粒体基因组组装方法和应用。
背景技术
传统线粒体基因组测序技术主要是基于PCR扩增产物的Sanger测序方法,针对已知线粒体基因的突变位点设计引物,进行PCR扩增直接测序。其中通过长PCR产物结合引物步移法(primer walking)是目前小规模线粒体基因组测序的常用方法。
线粒体对于大多数真核细胞和生物的生存至关重要。由于这一重要功能,线粒体基因组在深度进化范围内具有非常稳定的结构。因此,线粒体基因组已成为使用频率最高的分子标记之一,被广泛应用于进化、系统发育、种群遗传结构、生物地理学及物种分类鉴定等领域的研究。虱目的线粒体基因组存在高度的重排和裂化,使虱子的线粒体组学研究提高了难度。不利于虱子分子系统学,种群遗传学的研究。
寄生虱线粒体基因组裂化是指,线粒体基因组由一个完整的大环裂化为若干个小环。我们在以前的研究中观察到,每个mt微小染色体都有一个不同的编码区,但有一个保守的非编码区。
昆虫的传统线粒体基因组测序技术主要是基于PCR扩增产物的Sanger测序方法,其中通过长PCR产物结合引物步移法(primer walking)是目前小规模线粒体基因组测序的常用方法。但由于虱目缺乏通用引物信息,使得扩增线粒体基因组部分片段变得困难。而其线粒体基因组中特殊的结构,如重复序列、高A+T含量和二级结构也会导致扩增的失败。后随着生物技术的发展,测序成本不断降低以及高通量技术的发展,高通量技术也被广泛应用于虱目的线粒体基因组全序列研究。但是,由于虱目的线粒体基因组的高度重排和裂化,其线粒体的组装和注释成了新的技术难点。
发明内容
本发明的目的在,基于高通量法的情况下,提供一种解决虱目线粒体基因组因重排和分裂而难以组装和应用的方法,以解决上述背景技术中虱目的线粒体组装和注释难度大的技术问题。
为了解决上述技术问题,本发明提供技术方案包括以下六个步骤:
(1)根据DNasy组织试剂盒(Promega,Madison,USA)说明书,从待测寄生虱中提取全基因组DNA。
(2)利用引物对cox1和rrnS基因的扩增和测序。双向测序后分别得到一对正链和负链,将相对应的正链与负链的反向互补链进行对比,得到一段完全重合的序列,此序列即为cox1和rrnS相对保守的序列。
(3)使用Qubit荧光计测定DNA浓度。
(4)用MiSeq/HiSeq PE300(Illumina,San Diego,CA,USA)构建成对末端基因组DNA文库(350bp插入),用于高通量测序,收集的原始读数以FASTQ格式输出。通过删除适配器读取、冗余读取和富含‘N’的读取来过滤原始读取;最后,对此寄生虱产生了2GB cleandata(256bp的对端读取)。
(5)根据cox1和rrnS相对保守的序列,使用Geneious 11.1.5从Illumina序列读数中重新组装重叠群;组装参数为:最小重叠识别率99%,最小重叠150bp。运算至重叠群的两端重叠,表示线粒体基因组排列最终呈一个环形。
(6)将两个扩增出来的序列,用软件Clustalx进行对比,可得到一段相似或者相同的序列,此序列为保守的非编码区序列。鉴定出保守的非编码区序列,并将其作为比对Illumina序列数据集的参考,用上述方法进行运算组装,直至寄生虱线粒体基因组被全部组装完成。基于高通量测序寄生虱线粒体基因组组装的方法的应用,应用为:(1)寄生虱的分子分类与鉴定;(2)物种起源与系统进化。
一种基于高通量测序寄生虱线粒体基因组组装的方法的应用,所述应用为:寄生虱的种类鉴定。
与现有技术相比,本方案具有以下优点:
本方案操作简便,成本低速度快,准确性高。基于高通量法,结合我们之前的研究,根据寄生虱线粒体的特征和规律,即每个mt微小染色体都有一个不同的编码区,但有一个保守的非编码区。据此特征逐一组装虱目的微小线粒体,直到虱目线粒体全基因组被完全组装。组装后的线粒体基因组通过BLAST进行校准,长PCR法进行验证,完美的解决了寄生虱线粒体基因组的组装与注释的难题。
附图说明
图1为本发明线粒体基因组组装的技术流程图。
图2为寄生虱线粒体基因组组装注释后第一种结构图。
图3为寄生虱线粒体基因组组装注释后第二种结构图。
图4为寄生虱线粒体基因组分裂环PCR验证。
图5为寄生虱线粒体基因组大环分段PCR验证。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1寄生虱线粒体基因组组装(组装流程见图1)
一、采集虫体样本,显微镜下观察拍照,并进行初步的形态学鉴定,随后用70%酒精封存虫体,并放入-40℃保存。同时记录样本信息,包括:时间,地点,宿主信息等。
二、从酒精中取出待检虫体样本,用双蒸水洗涤虫体3-5遍,使虫体尽可能的少酒精残留。根据DNasy组织试剂盒(Promega,Madison,USA)说明书,提取待测寄生虱全基因组DNA。提取好的DNA如近期要用可置于4℃保存,如超过一个星期不用,-20℃保存。
三、利用通用引物mtd6(5′-gga gga ttt gga aat tga tta gtt cc-3′),mtd11(5′-act gta aat ata tga tga gct ca-3′),对cox1进行PCR扩增和测序;利用引物12SA(5′-tac tat gtt acg act tat-3′),12SB(5′-aaa cta gga tta gat acc c-3′)对rrnS基因PCR扩增和测序。
四、根据Qubit荧光计的使用说明书,设立标准曲线,选择double-stranded DNA(ds DNA)模式。测定所提样本的DNA浓度。
五、用MiSeq/HiSeq PE300(Illumina,San Diego,CA,USA)构建成对末端基因组DNA文库(350bp插入),用于高通量测序,收集的原始读数以FASTQ格式输出。通过删除适配器读取、冗余读取和富含‘N’的读取来过滤原始读数。最后,对此寄生虱产生了2GB cleandata(256bp的对端读取)。
六、根据cox1和rrnS相对保守的序列,使用Geneious 11.1.5从Illumina序列读数中重新组装重叠群。导入相对保守的序列,与数据库中序列(250bp)进行对比,前后各最小重叠150bp,最小重叠识别率99%,这样,每次运算能够扩增出200bp(前后各100bp)的未知序列,准确性为99%。不断重复运算扩增,直至重叠群的两端重叠,线粒体基因组排列最终呈一个环形。
七、将两个扩增出来的序列,用软件Clustalx进行对比。鉴定出保守的非编码区序列,并将其作为比对Illumina序列数据集的参考,用上述方法进行运算组装,直至寄生虱线粒体基因组被全部组装完成,线粒体基因组结构图见图2和图3。
实施例2应用
一、对已经组装序列在NCBI上进行BLAST校准,根据已经组装的序列,用软件Premier5.0设计引物,进行PCR验证。PCR产物进行琼脂糖凝胶电泳,根据Maker确定每对引物所扩增出的序列长度,与此前被组装的序列长度进行对比验证。验证结果见图4和图5。
二、使用同属寄生虱线粒体基因组的全序列,用软件Clustalx将其中的基因逐个与新组装序列进行对比,确定序列中基因的大概位置。在NCBI的ORF finder上将序列进行扫描,找出蛋白编码的基因的位置。使用Arwen和程序tRNAscan-SE,扫描出tRNA基因的大概位置,并根据tRNA的二级结构图来手动调整并确定tRNA基因位置。将以上3项结果分别进行两两验证,确定基因组中全部基因的位置。
三、用软件MEGA 6.0将已经确定蛋白编码基因的核苷酸序列转化FASTQ格式,再在软件MEGA 6.0中导入,推导出其氨基酸序列。
四、在NCBI数据库中进行BLAST搜索各个基因的核苷酸序列和氨基酸序列,用以鉴定蛋白质编码基因和rRNA基因。
五、形态学结合宿主信息对寄生虱进行初步的种类鉴定,利用组装注释好的寄生虱线粒体基因组在NCBI上进行同源性对比,对初步的种类鉴定的结果进行验证。以阐明该寄生虱的分类地位。
六、将组装注释好的寄生虱线粒体基因组与NCBI上其他已经解码寄生虱线粒体基因组,构建系统发育树,进行系统发育关系分析,以阐明寄生虱的进化关系。
序列表
<110> 湖南农业大学
<120> 基于高通量测序寄生虱线粒体基因组组装的方法和应用
<141> 2021-02-02
<160> 4
<170> SIPOSequenceListing 1.0
<210> 2
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ggaggatttg gaaattgatt agttcc 26
<210> 2
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
actgtaaata tatgatgagc tca 23
<210> 3
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tactatgtta cgacttat 18
<210> 4
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aaactaggat tagataccc 19

Claims (8)

1.基于高通量测序寄生虱线粒体基因组组装的方法,其特征在于,所述方法包括以下步骤:
(1)提取寄生虱的全基因组DNA;
(2)以步骤(1)中全基因组DNA为模板,使用cox1基因的通用引物对cox1基因PCR进行扩增和测序,使用rrnS基因的通用引物对rrnS基因进行PCR扩增和测序,得cox1和rrnS基因部分保守序列;
(3)对步骤(1)的全基因组DNA样本构建成对末端基因组DNA文库,高通量测序得原始读数后,将原始读数进行删除适配器读取、冗余读取和富含‘N’的读取来过滤原始读数,得处理后的数据序列;
(4)导入步骤(2)中得到的cox1和rrnS基因部分保守序列,对步骤(3)中的处理后数据序列重新组装重叠群,直至重叠群的两端重叠,得两个扩增出来的序列;
(5)将步骤(4)中两个扩增出来的序列,进行多重序列对比,鉴定出保守的非编码区序列,并将其作为比对步骤(3)的数据序列的参考,进行运算组装,得到所述寄生虱线粒体基因组。
2.根据权利要求1所述的方法,其特征在于,在步骤(2)中cox1基因的通用引物包括第一条引物为mtd6和第二条引物为mtd11,mtd6的DNA序列为SEQ ID NO:1所示,mtd11的DNA序列为SEQ ID NO:2所示。
3.根据权利要求1或2所述的方法,其特征在于,在步骤(2)中rrnS基因的通用引物包括第一条引物为12SA和第二条引物为12SB,12SA的DNA序列为SEQ ID NO:3所示,12SB的DNA序列为SEQ ID NO:4所示。
4.根据权利要求1所述的方法,其特征在于,在步骤(1)前,对采集的寄生虱样本进行显微镜下观察拍照,并进行初步的形态学鉴定,随后用70%酒精封存虫体,并放入-40℃保存,同时记录样本信息,包括:时间,地点,宿主信息等。
5.根据权利要求1所述的方法,其特征在于,在步骤(1)采用DNasy组织试剂盒提取寄生虱的全基因组DNA。
6.根据权利要求1所述的方法,其特征在于,在步骤(3)中构建末端基因组DNA文库采用MiSeq或HiSeq PE300平台。
7.根据权利要求1所述的方法,其特征在于,在步骤(4)中组装重叠群采用最小重叠识别率99%,最小重叠150bp。
8.一种如权利要求1所述的基于高通量测序寄生虱线粒体基因组组装的方法的应用,其特征在于,所述应用为:对寄生虱的种类鉴定。
CN202110171393.2A 2021-02-04 2021-02-04 基于高通量测序寄生虱线粒体基因组组装的方法和应用 Pending CN114395630A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110171393.2A CN114395630A (zh) 2021-02-04 2021-02-04 基于高通量测序寄生虱线粒体基因组组装的方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110171393.2A CN114395630A (zh) 2021-02-04 2021-02-04 基于高通量测序寄生虱线粒体基因组组装的方法和应用

Publications (1)

Publication Number Publication Date
CN114395630A true CN114395630A (zh) 2022-04-26

Family

ID=81225961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110171393.2A Pending CN114395630A (zh) 2021-02-04 2021-02-04 基于高通量测序寄生虱线粒体基因组组装的方法和应用

Country Status (1)

Country Link
CN (1) CN114395630A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117133351A (zh) * 2023-10-24 2023-11-28 江西师范大学 一种优化的线粒体基因重排量化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117133351A (zh) * 2023-10-24 2023-11-28 江西师范大学 一种优化的线粒体基因重排量化方法
CN117133351B (zh) * 2023-10-24 2024-01-23 江西师范大学 一种优化的线粒体基因重排量化方法

Similar Documents

Publication Publication Date Title
Jamy et al. Long‐read metabarcoding of the eukaryotic rDNA operon to phylogenetically and taxonomically resolve environmental diversity
EP3051450A1 (en) Method of typing nucleic acid or amino acid sequences based on sequence analysis
CN107475449A (zh) 一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法
Méndez-García et al. Metagenomic protocols and strategies
Murchie et al. Pleistocene mitogenomes reconstructed from the environmental DNA of permafrost sediments
Houghton et al. Development of a workflow for identification of nuclear genotyping markers for Cyclospora cayetanensis
CN111197050B (zh) 桑树拟干枯病病原菌的核糖体rna基因及其应用
CN113481311A (zh) 用于鉴定布鲁氏菌疫苗株m5的snp分子标记及其应用
CN111549146A (zh) 一种两栖动物线粒体通用宏条形码扩增引物及其应用方法
CN115662516A (zh) 一种基于二代测序技术的高通量预测噬菌体宿主的分析方法
CN114395630A (zh) 基于高通量测序寄生虱线粒体基因组组装的方法和应用
Kinjo et al. An efficient strategy developed for next-generation sequencing of endosymbiont genomes performed using crude DNA isolated from host tissues: a case study of Blattabacterium cuenoti inhabiting the fat bodies of cockroaches
CN108486121B (zh) 一种刺螫库蠓的特异dna序列及其分子鉴定方法
CN108823327B (zh) 樟树全基因组ssr分子标记及其制备方法和应用
CN106086193A (zh) 一种基于indel‑snp连锁关系分析混合样本dna的方法
Shmuely et al. Poorly conserved ORFs in the genome of the archaea Halobacterium sp. NRC-1 correspond to expressed proteins
Gao et al. Characterization of UV sex chromosomes and synteny-guided phylogenomic resolution of subgenomes in Bryopsida mosses
Kirdat et al. Complete genome sequences of phytoplasma strains in group 16SrII associated with Parthenium phyllody in India
CN107354151A (zh) 基于梅花鹿全基因组开发的str分子标记及其应用
Lapidus Genome sequence databases (overview): sequencing and assembly
Maestri Development of novel bioinformatic pipelines for MinION-based DNA barcoding
Charon et al. Consensus statement from the first RdRp Summit: advancing RNA virus discovery at scale across communities
Rigou et al. Pithoviruses are invaded by repeats that contribute to their evolution and divergence from cedratviruses
Ohta et al. DNA metabarcoding workflow utilizing nanopore long-read sequencing and consensus generation for rapid identification of fungal taxa with high phylogenetic resolution
CN112802554B (zh) 一种基于二代数据的动物线粒体基因组组装方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination