CN110305945A - 一种基于二代测序技术的游离线粒体dna突变检测技术 - Google Patents

一种基于二代测序技术的游离线粒体dna突变检测技术 Download PDF

Info

Publication number
CN110305945A
CN110305945A CN201910616177.7A CN201910616177A CN110305945A CN 110305945 A CN110305945 A CN 110305945A CN 201910616177 A CN201910616177 A CN 201910616177A CN 110305945 A CN110305945 A CN 110305945A
Authority
CN
China
Prior art keywords
mtdna
free
sequencing
mitochondrial dna
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910616177.7A
Other languages
English (en)
Inventor
邢金良
刘洋
尹纯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fourth Military Medical University FMMU
Original Assignee
Fourth Military Medical University FMMU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fourth Military Medical University FMMU filed Critical Fourth Military Medical University FMMU
Priority to CN201910616177.7A priority Critical patent/CN110305945A/zh
Publication of CN110305945A publication Critical patent/CN110305945A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于二代测序技术的游离线粒体DNA突变检测技术,主要包括以下步骤:1)制备cfDNA单链测序文库,2)mtDNA捕获,3)数据分析。本发明与现有技术相比的优点在于:针对游离mtDNA片段化程度高,突变频率低的特征,在NGS中富集游离mtDNA序列信息,解决其低频突变检测假阳性问题,克服NUMT对于突变检测的干扰,实现游离线粒体DNA突变的精准检测。

Description

一种基于二代测序技术的游离线粒体DNA突变检测技术
技术领域
本发明涉及生物医学技术领域,具体是指一种基于二代测序技术的游离线粒体DNA突变检测技术。
背景技术
作为传统手段最有力的互补,液体活检技术在新型标志物临床检测应用中取得了突破性进展。其中,游离DNA检测成为目前最受关注也是发展最为迅猛的液体活检手段。线粒体DNA(mtDNA)拷贝数多,平均每个细胞中mtDNA的拷贝数可达103;基因组小,人类mtDNA全长仅有16,569bp,测序产生的数据量小,进而检测快速、成本低;突变率高,由于mtDNA常存在于高水平活性氧的环境下,同时缺少组蛋白保护和有效的DNA修复系统,因此其突变频率较核基因组高10倍左右;与多种疾病的预防、诊断、治疗及预后关系密切。因此,游离mtDNA突变的精准检测作为新型标志物具有独特优势。
实时定量PCR、数字PCR(dPCR)以及测序技术被广泛用于mtDNA突变检测。但前两种技术通量较低,且只能检测已知变异,测序技术可同时检测多个基因、多种类型的未知突变,有着其他技术难以比拟的优势。在测序技术中,Sanger测序技术成本高,且无法准确检测低频突变。单分子测序的高错误率干扰mtDNA突变检测的准确性。与之相比,基于二代测序(NGS)的mtDNA突变检测技术已经相对成熟,能够实现mtDNA的超深度测序,提高突变检测的灵敏度,极大地降低检测成本。但是,由于游离mtDNA突变频率低以及片段化程度高的特点,常规的mtDNA靶向测序在游离mtDNA精准检测中仍面临挑战。
发明内容
本发明要解决的技术问题是克服以上技术缺陷,提供一种基于二代测序技术的游离线粒体DNA突变检测技术,针对游离mtDNA片段化程度高,突变频率低的特征,在NGS中富集游离mtDNA序列信息,解决其低频突变检测假阳性问题,克服NUMT对于突变检测的干扰,实现游离线粒体DNA突变的精准检测。
为解决上述技术问题,本发明提供的技术方案为:一种基于二代测序技术的游离线粒体DNA突变检测技术,主要包括以下步骤:
1)制备cfDNA单链测序文库:将提取的cfDNA片段末端去磷酸化并变性为单链;利用DNA连接酶在cfDNA片段的两侧末端连接接头,接头含有12bp的随机碱基序列;通过引物延伸,将单链DNA文库变成双链文库。
2)mtDNA捕获:利用三对引物扩增mtDNA片段,并将PCR产物等摩尔混合后打断到150bp,制备生物素标记的杂交捕获探针;按照探针与模板800:1摩尔比的含量进行捕获并测序。
3)数据分析:对测序数据进行质控,利用BWA-mem软件将质控后的clean data比对至人类参考基因组hg19上,最后提取比对到线粒体参考基因组rCRS的数据进行突变位点分析。
本发明与现有技术相比的优点在于:提取血浆中的游离DNA(cfDNA)后采用单链建库的方法构建全基因组测序文库,并在测序文库两端加入12bp随机碱基序列的分子标签(UMI)。制备mtDNA捕获探针随后通过杂交捕获,富集mtDNA文库,并完成上机测序。最后,利用生物信息学技术分析测序数据,准确检测出游离mtDNA突变,充分利用改进的单链建库技术克服了游离mtDNA片段化程度高的问题,能够在cfDNA测序文库构建过程中更多地富集游离mtDNA。通过在游离mtDNA测序文库中引入分子标签,克服了PCR扩增和测序错误导致的假阳性问题,显著提高了游离mtDNA低频突变检测的准确性。通过优化游离mtDNA测序数据的生物信息学分析流程,进一步提高了mtDNA比对率,克服了核基因组线粒体假基因(NUMT)对于突变检测的干扰。最终,本发明提供了一种经济有效的游离线粒体DNA突变检测技术。
附图说明
图1是本发明一种基于二代测序技术的游离线粒体DNA突变检测技术的流程图。
图2是本发明一种基于二代测序技术的游离线粒体DNA突变检测技术生物信息学分析流程图。
图3是本发明一种基于二代测序技术的游离线粒体DNA突变检测技术单链建库与双链建库的对比图。
图4是本发明一种基于二代测序技术的游离线粒体DNA突变检测技术对于游离mtDNA分析结果
图5是本发明一种基于二代测序技术的游离线粒体DNA突变检测技术对于游离mtDNA突变检测结果。
具体实施方式
下面结合附图对本发明做进一步的详细说明。
一种基于二代测序技术的游离线粒体DNA突变检测技术,主要包括以下步骤:
1)制备cfDNA单链测序文库:将提取的cfDNA片段末端去磷酸化并变性为单链;利用DNA连接酶在cfDNA片段的两侧末端连接接头,接头含有12bp的随机碱基序列;通过引物延伸,将单链DNA文库变成双链文库,将cfDNA片段变为单链进行测序文库构建能够富集短于150bp片段,有利于增加游离mtDNA在全基因组文库中的比例;利用12bp的UMI可以消除PCR和测序错误造成的假阳性。
2)mtDNA捕获:经过摸索,我们优化了探针长度以及杂交捕获过程中探针用量,利用三对引物扩增mtDNA片段,并将PCR产物等摩尔混合后打断到150bp,制备生物素标记的杂交捕获探针;按照探针与模板800:1摩尔比的含量进行捕获并测序,提高了游离mtDNA捕获特异性。
3)数据分析:对测序数据进行质控,利用BWA-mem软件将质控后的clean data比对至人类参考基因组hg19上,最后提取比对到线粒体参考基因组rCRS的数据进行突变位点分析,调整测序数据的过滤条件,进一步提高游离mtDNA序列所占比例;在测序reads的mapping过程中,创新性的先与人类参考基因组hg19进行比对,再单独提取比对至线粒体参考基因组rCRS,有效的减少了核基因组中线粒体假基因(NUMT)对突变检测的影响。
本发明在具体实施时,整个实验流程为图1所示,具体操作步骤如下:
1、制备游离DNA单链测序文库:
1)去磷酸化和变性,在冰上配置如下反应体系:
PCR反应条件为37℃,10min;95℃2min:PCR完成后,将管快速转移到冰浴3分钟。
2)连接接头,在冰上配置如下反应体系:
将上述体系进行60℃180min孵育,孵育完成后加入stop solution 2μl。
3)使用贝克曼库尔特的Ampure bead进行纯化,洗脱体积为69μl。
4)进行PCR程序,95℃1min后,立即冰浴2min。配制如下体系:
进行PCR程序,20℃40min后,加入10ul EDTA(0.5M)。
5)对上述反应产物进行纯化,随后进行PCR扩增,反应条件如下:
2、mtDNA捕获:
1)PCR扩增
利用3对引物序列扩增线粒体基因组。PCR反应体系如下:
PCR反应条件:
2)将上一步骤中的PCR产物等摩尔混合后,打断为150bp的DNA片段。
3)打断产物经95℃变性后,加入4μl Biotin-high prime,37℃孵育过夜。产物纯化后即为mtDNA捕获探针。
4)捕获测序
将上述制备的全基因组文库(每个样品400ng)与上述捕获探针混合用于杂交。探针的使用量与mtDNA的含量摩尔比为800:1。杂交完成后,将其加入到具有链霉亲和素化磁珠的结合缓冲液中,进一步洗去杂质。最后,洗脱并PCR扩增mtDNA文库。获得的捕获文库用illumina HiSeq PE150进行测序。
3、数据分析:
测序数据生物信息学分析流程见附图2。首先对测序数据进行质控,质控条件为:①去除接头污染的Reads(Reads中接头污染的碱基数大于100bp)②去除低质量的Reads③去除含N比例大于5%的Reads。将完成数据质控的clean data比对到人类参考基因组hg19上,然后对比对得到的结果文件进行排序和去重复(去除PCR重复序列),接下来利用GATK软件进行局部重比对,目的是将比对过程中所发现的潜在Indel(序列插入或者序列删除)的区域进行重新校正。用GATK完成局部重比对后,利用Samtools生成pileup文件。然后提取上一步得到的结果文件中比对到线粒体参考基因组rCRS的reads,在此基础上利用以下标准定义mtDNA突变:①该位点测序深度≥100×;②最小等位频率≥0.1%;③每条链上携带突变的reads≥3。
如附图3和4所示,本发明比较了10例样本单链建库和双链建库结果。使用单链建库方法,检测到更多的mtDNA,显示单链建库可以富集更多的mtDNA,符合目前文献中关于单链建库方法的报道。
如附图5所示,通过分析10例肝癌血浆样本的游离mtDNA突变,我们检测到异质性位点数与同质性位点数平均值分别为12.3与26.2,符合我们对于线粒体DNA突变的认知。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (1)

1.一种基于二代测序技术的游离线粒体DNA突变检测技术,其特征在于:主要包括以下步骤:
1)制备cfDNA单链测序文库:将提取的cfDNA片段末端去磷酸化并变性为单链;利用DNA连接酶在cfDNA片段的两侧末端连接接头,接头含有12bp的随机碱基序列;通过引物延伸,将单链DNA文库变成双链文库。
2)mtDNA捕获:利用三对引物扩增mtDNA片段,并将PCR产物等摩尔混合后打断到150bp,制备生物素标记的杂交捕获探针;按照探针与模板800:1摩尔比的含量进行捕获并测序。
3)数据分析:对测序数据进行质控,利用BWA-mem软件将质控后的clean data比对至人类参考基因组hg19上,最后提取比对到线粒体参考基因组rCRS的数据进行突变位点分析。
CN201910616177.7A 2019-07-09 2019-07-09 一种基于二代测序技术的游离线粒体dna突变检测技术 Pending CN110305945A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910616177.7A CN110305945A (zh) 2019-07-09 2019-07-09 一种基于二代测序技术的游离线粒体dna突变检测技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910616177.7A CN110305945A (zh) 2019-07-09 2019-07-09 一种基于二代测序技术的游离线粒体dna突变检测技术

Publications (1)

Publication Number Publication Date
CN110305945A true CN110305945A (zh) 2019-10-08

Family

ID=68079950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910616177.7A Pending CN110305945A (zh) 2019-07-09 2019-07-09 一种基于二代测序技术的游离线粒体dna突变检测技术

Country Status (1)

Country Link
CN (1) CN110305945A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112687339A (zh) * 2021-01-21 2021-04-20 深圳吉因加医学检验实验室 一种统计血浆dna片段测序数据中序列错误的方法和装置
CN115896240A (zh) * 2022-11-02 2023-04-04 南京市妇幼保健院 一种构建线粒体基因组测序文库的方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104278022A (zh) * 2014-09-12 2015-01-14 中国人民解放军第四军医大学 一种dna捕获探针的制备方法及应用
CN105602936A (zh) * 2015-11-18 2016-05-25 中国人民解放军第四军医大学 一种双barcode二代测序文库的构建方法
CN106834275A (zh) * 2017-02-22 2017-06-13 天津诺禾医学检验所有限公司 ctDNA超低频突变检测文库的构建方法、试剂盒及文库检测数据的分析方法
US20180119216A1 (en) * 2016-10-28 2018-05-03 Grail, Inc. Methods for single-stranded nucleic acid library preparation
CN108866174A (zh) * 2017-12-25 2018-11-23 厦门基源医疗科技有限公司 一种循环肿瘤dna低频突变的检测方法
WO2019055819A1 (en) * 2017-09-14 2019-03-21 Grail, Inc. METHODS FOR PREPARING A SEQUENCING LIBRARY FROM SINGLE STRANDED DNA
CN109536579A (zh) * 2018-11-05 2019-03-29 深圳市艾斯基因科技有限公司 单链测序文库的构建方法及其应用
CN109797197A (zh) * 2019-02-11 2019-05-24 杭州纽安津生物科技有限公司 一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104278022A (zh) * 2014-09-12 2015-01-14 中国人民解放军第四军医大学 一种dna捕获探针的制备方法及应用
CN105602936A (zh) * 2015-11-18 2016-05-25 中国人民解放军第四军医大学 一种双barcode二代测序文库的构建方法
US20180119216A1 (en) * 2016-10-28 2018-05-03 Grail, Inc. Methods for single-stranded nucleic acid library preparation
CN106834275A (zh) * 2017-02-22 2017-06-13 天津诺禾医学检验所有限公司 ctDNA超低频突变检测文库的构建方法、试剂盒及文库检测数据的分析方法
WO2019055819A1 (en) * 2017-09-14 2019-03-21 Grail, Inc. METHODS FOR PREPARING A SEQUENCING LIBRARY FROM SINGLE STRANDED DNA
CN108866174A (zh) * 2017-12-25 2018-11-23 厦门基源医疗科技有限公司 一种循环肿瘤dna低频突变的检测方法
CN109536579A (zh) * 2018-11-05 2019-03-29 深圳市艾斯基因科技有限公司 单链测序文库的构建方法及其应用
CN109797197A (zh) * 2019-02-11 2019-05-24 杭州纽安津生物科技有限公司 一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YIN等: ""NGS-based profiling reveals a critical contributing role of somatic D-loop mtDNA mutations in HBV-related hepatocarcinogenesis"", 《ANNALS OF ONCOLOGY》 *
李薇薇等: "基于新一代测序技术的mtDNA突变检测方法学的建立", 《现代生物医学进展》 *
翟玉龙等: "一种新的线粒体基因组DNA捕获探针的制备及初步应用", 《现代生物医学进展》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112687339A (zh) * 2021-01-21 2021-04-20 深圳吉因加医学检验实验室 一种统计血浆dna片段测序数据中序列错误的方法和装置
CN115896240A (zh) * 2022-11-02 2023-04-04 南京市妇幼保健院 一种构建线粒体基因组测序文库的方法

Similar Documents

Publication Publication Date Title
CN108753967B (zh) 一种用于肝癌检测的基因集及其panel检测设计方法
KR102628878B1 (ko) 메틸롬 분석을 이용한 암 검출 및 분류
Smadbeck et al. C opy number variant analysis using genome‐wide mate‐pair sequencing
CN107475375A (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
CN106544407A (zh) 确定受体cfDNA样本中供体来源cfDNA比例的方法
CN106715711A (zh) 确定探针序列的方法和基因组结构变异的检测方法
CN110211633B (zh) Mgmt基因启动子甲基化的检测方法、测序数据的处理方法及处理装置
US20210156863A1 (en) Cancer detection, classification, prognostication, therapy prediction and therapy monitoring using methylome analysis
CN115064211B (zh) 一种基于全基因组甲基化测序的ctDNA预测方法及装置
CN105930690A (zh) 一种全外显子组测序数据分析方法
He et al. Assessing the impact of data preprocessing on analyzing next generation sequencing data
CN110305945A (zh) 一种基于二代测序技术的游离线粒体dna突变检测技术
CN115094142B (zh) 用于诊断肺肠型腺癌的甲基化标志物
CN110527714B (zh) 用于检测hpv在宿主基因组的整合位点的方法
Revollo et al. Spectrum of benzo [a] pyrene-induced mutations in the Pig-a gene of L5178YTk+/− cells identified with next generation sequencing
CN106480212A (zh) 一种用于检测肝癌易感性的试剂盒及其snp标志物
CN116716397A (zh) 检测dmd基因变异的方法及装置和探针、试剂盒
CN105803054A (zh) 试剂盒及其在检测唇腭裂相关基因中的用途
Tsui et al. Extracting allelic read counts from 250,000 human sequencing runs in Sequence Read Archive
CN110970091A (zh) 标签质控的方法及装置
Yadav et al. Next-Generation sequencing transforming clinical practice and precision medicine
Shiraishi et al. Precise characterization of somatic complex structural variations from paired long-read sequencing data with nanomonsv
CN109680054A (zh) 一种低频dna突变的检测方法
CN105603081B (zh) 一种非诊断目的的肠道微生物定性与定量的检测方法
CN110241191A (zh) 一种基于NGS同时检测mtDNA拷贝数和突变的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191008

RJ01 Rejection of invention patent application after publication