CN104694384B - 线粒体dna拷贝数变异性的检测装置 - Google Patents

线粒体dna拷贝数变异性的检测装置 Download PDF

Info

Publication number
CN104694384B
CN104694384B CN201510126196.3A CN201510126196A CN104694384B CN 104694384 B CN104694384 B CN 104694384B CN 201510126196 A CN201510126196 A CN 201510126196A CN 104694384 B CN104694384 B CN 104694384B
Authority
CN
China
Prior art keywords
sample
sequencing
dna
dna copy
copy number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510126196.3A
Other languages
English (en)
Other versions
CN104694384A (zh
Inventor
曾丰波
杨功达
陈昌岳
韩继臣
张祥林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI MAJORBIO PHARM TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI MAJORBIO PHARM TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI MAJORBIO PHARM TECHNOLOGY Co Ltd filed Critical SHANGHAI MAJORBIO PHARM TECHNOLOGY Co Ltd
Priority to CN201510126196.3A priority Critical patent/CN104694384B/zh
Publication of CN104694384A publication Critical patent/CN104694384A/zh
Application granted granted Critical
Publication of CN104694384B publication Critical patent/CN104694384B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及医学检测技术领域,公开了一种线粒体DNA拷贝数变异性的检测装置,包括:测序单元,对待检者血浆样本中的游离DNA进行全基因组测序;计算单元,将待检样本的测序结果比对到人类参考基因组上,计算待检样本的线粒体DNA拷贝指数;比较判断单元,将待检样本的线粒体DNA拷贝指数与预先设定的诊断界限值比较,判断待检样本是否存在线粒体DNA拷贝数变异性,并可进一步判断待检者罹患癌症的风险。本发明的检测装置将分子生物学测序技术与生物信息分析技术结合,通过对血液中游离DNA进行的全基因组测序,达到对线粒体DNA拷贝数异常情况的识别,由此来判断待检者是否罹患癌症,实现了对癌症的早期无创筛查。

Description

线粒体DNA拷贝数变异性的检测装置
技术领域
本发明涉及医学检测技术领域,特别涉及一种可检测线粒体DNA拷贝数变异性、进而应用于癌症早期诊断筛查的装置。
背景技术
癌症是恶性肿瘤的统称,癌细胞的特点是无限制、无止境地增生,使患者体内的营养物质被大量消耗;癌细胞释放出多种毒素,使人体产生一系列症状;癌细胞还可转移到全身各处生长繁殖,导致人体消瘦、无力、贫血、食欲不振、发热,最终还可破坏组织、器官的结构和功能,引起坏死出血合并感染,患者最终由于器官功能衰竭而死亡。
目前虽然已出现了通过检测基因的突变位点,用来指导用药以及作为癌症早筛的标准,但是该方法主要的应用是发现癌症病人中肿瘤组织的突变情况,以便进行个性化治疗;但不同癌症病人基因突变位点不一样,突变的频率也有差异,很难确定癌症的判别标准,所以使用这个技术用于癌症的筛查特异性和准确率不高。
人体血液中存在大量游离的DNA(cfDNA,cell free DNA),它们主要来自体细胞的凋亡、坏死或主动释放。目前已知癌症病人的cfDNA含量显著高于正常人,平均约为正常人的三倍以上。癌症病人的cfDNA中有一部分来自于肿瘤组织,这部分DNA也被成为ctDNA(circulating tumor DNA),在癌症发展的早期就能检测到。线粒体DNA(chrM)在头颈部肿瘤、结直肠癌、卵巢癌、前列腺癌、子宫内膜癌以及食管鳞癌中表现为升高,而在胃癌、乳腺癌、Ewing’s肉瘤、肝细胞癌、非小细胞肺癌和肾细胞癌中则表现为拷贝数降低。更为重要的是,线粒体DNA含量的变化还与某些肿瘤的恶性转化、肿瘤进展、转移以及预后密切相关。目前已报道的对于线粒体DNA的定量PCR技术存在以下不足之处:(1)只截取chrM的一段作为chrM整体的指标,随机误差大;(2)只能作为独立指标,无法和样品内其他DNA含量进行对照分析;(3)采用模型拟合的方法进行定量,影响因素很多,不同模型,不同实验流程产生的结果不一致;(4)对chrM的测量单位的定义不确定。
发明内容
本发明的目的在于提供一种基于分子生物学测序技术,对血液中的游离DNA进行全基因组测序,通过识别线粒体DNA拷贝数的异常情况来判断受检者罹患癌症的风险的检测装置。
为解决上述技术问题,本发明的实施方式所提供的线粒体DNA拷贝数变异性的检测装置包括:测序单元,其对待检者血浆样本中的游离DNA进行全基因组测序,得到待检样本的测序结果;计算单元,其将待检样本的测序结果比对到人类参考基因组上,计算待检样本的线粒体DNA拷贝指数;比较判断单元,其将待检样本的线粒体DNA拷贝指数与预先设定的诊断界限值进行比较,判断待检样本是否存在线粒体DNA拷贝数变异性。
进一步地,由于线粒体DNA含量的变化与肿瘤的恶性转化、肿瘤进展、转移以及预后密切相关,因而比较判断单元还可进一步根据待检样本是否存在线粒体DNA拷贝数变异性,判断待检者罹患癌症的风险。
上述线粒体DNA拷贝数变异性的检测装置将分子生物学测序技术与生物信息分析技术相结合,可实现对癌症的早期诊断。使用该装置进行癌症筛查时,只需抽取检测对象的血液样本,从血浆中抽提游离的DNA作为待检样本;通过装置中的测序单元对游离DNA进行全基因组测序、然后通过装置中的计算单元将测序结果比对到人类参考基因组上,计算得到待检样本的线粒体DNA拷贝指数;通过比较判断单元将待检样本的线粒体DNA拷贝指数与预先设定的诊断界限值进行比较,来判断待检样本是否存在线粒体DNA拷贝数变异性,进而判别待检者是否处于癌症高危状态,从而实现癌症的早期无创筛查或治疗效果评估。由于几乎所有的恶性实体瘤都存在线粒体DNA拷贝数变异,通过将分子生物学测序结果序列比对到人类参考基因组的线粒体DNA上的测序条数情况,即可以反映线粒体DNA拷贝数的异常情况。线粒体DNA拷贝数的异常也是判断良性和恶性肿瘤的重要指标,所以本发明的实施方式所提供的线粒体DNA拷贝数变异性的检测装置既具备癌症的特异性(在各类疾病中只有恶性肿瘤存在线粒体DNA拷贝数异常),也具备对各类癌症的通用性(几乎所有的癌症都存在线粒体DNA拷贝数异常)。
一方面,作为一种对线粒体DNA拷贝数的定量装置,本发明的实施方式所提供的该种检测装置在对线粒体DNA拷贝数的定量方式上具备以下特点:首先,对线粒体DNA的定量检测将线粒体DNA作为整体进行计数,随机误差小,具有较高的稳定性。其次,本发明的装置对线粒体DNA的检测方法为全基因组测序中的一个统计指标,随着研究的加深,可以将其与癌症的各种相关基因进行更深入的相关分析,使检测结果具有横向可比性。再次,本发明的检测装置中所使用的计算方法为精确的定量方法,只需计数,读数即可,不存在模型拟合导致不同模型结论不一致的情况,其检测结果具有较高的准确性。
另一方面,作为一种癌症的筛查检测装置,本发明的实施方式所提供的该种检测装置在对癌症的早期筛查方面还具备以下特点:(1)无创:通过抽血来进行检测,对受检者的身体没有伤害,整个检查过程几乎没有痛苦;(2)早期筛查:利用该装置能比影像诊断早几个月发现肿瘤组织;(3)适用面广:能够发现几乎所有的实体瘤;(4)准确率和灵敏度高:基于DNA序列水平进行检测,不易发生误诊;(5)实时监控:游离DNA(cfDNA)在体内的半衰期为16分钟至1小时,因此本装置的检测结果还能作为肿瘤术后或治疗效果评估的实时指标;(6)由于不同癌症的线粒体DNA拷贝数变异不一致,本发明的实施方式中所做的线粒体DNA拷贝数还可能成为一种癌症的分型指标。
具体地,本发明的实施方式所提供的线粒体DNA拷贝数变异性的检测装置中,待检样本的线粒体DNA拷贝指数为:待检样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值Mt或以Mt为单变量的单调函数值,且:Mt=nt(chrM)/len(chrM)/nt(chrN)/len(chrN),其中:nt(chrM)为待检样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数,len(chrM)为人类参考基因组的线粒体DNA的长度(DNA的长度一般为取定的染色体的bp(basepair)碱基数),nt(chrN)为待检样本的测序结果比对到人类参考基因组的核内DNA上的测序条数,len(chrN)为人类参考基因组的核内DNA的长度。核内DNA的选择可以为多种,例如可选择常染色体DNA、或者常染色体DNA+性染色体DNA;甚至是取一组特定的panel,分别代表线粒体和细胞核内的DNA的拷贝数。值得补充说明的是,本发明的实施方式所提出的上述指标,即线粒体DNA拷贝数和核内DNA拷贝数的相对比值,其单位为1,理论上可以兼容用panel或者qPCR得到的对应数值结果。
此外,以Mt为单变量的单调函数值例如可以为Mt的自然对数值lnMt、Mt n(n>1)等,取决于所采用的统计方法的不同。当然,在上述对待检样本的线粒体DNA拷贝指数的计算过程中,还可以有各种变换或替代方案,例如线粒体DNA可以选择线粒体上的一个或几个区间作为计算指标,核内DNA也可以选择某一个或几个区间作为计算指标,均可以实现本发明的目的。
进一步地,本发明的实施方式所提供的线粒体DNA拷贝数变异性的检测装置中,比较判断单元中的诊断界限值通过下述方法得出:
(1)取一组健康人群血浆中的游离DNA作为对照样本群,以测序单元相同的装置对该对照样本群进行全基因组测序,计算每个对照样本的线粒体DNA拷贝指数,对照样本的线粒体DNA拷贝指数为对照样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值MH或以MH为单变量的单调函数值,且:MH=nH(chrM)/len(chrM)/nH(chrN)/len(chrN),其中:nH(chrM)为对照样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数,len(chrM)为人类参考基因组的线粒体DNA的长度,nH(chrN)为对照样本的测序结果比对到人类参考基因组的核内DNA上的测序条数,len(chrN)为人类参考基因组的核内DNA的长度。
(2)取一组癌症患者血浆中的游离DNA作为癌症样本群,以测序单元相同的装置对癌症样本群进行全基因组测序,分别计算每个癌症样本的线粒体DNA拷贝指数,癌症样本的线粒体DNA拷贝指数为癌症样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值MC或以MC为单变量的单调函数值,且:MC=nC(chrM)/len(chrM)/nC(chrN)/len(chrN),其中:nC(chrM)为癌症样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数,len(chrM)为人类参考基因组的线粒体DNA的长度,nC(chrN)为癌症样本的测序结果比对到人类参考基因组的核内DNA上的测序条数,len(chrN)为人类参考基因组的核内DNA的长度。
(3)对上述对照样本的线粒体DNA拷贝指数和癌症样本的线粒体DNA拷贝指数分别进行统计、然后进行显著性检测,绘制受试者工作特征曲线(ROC曲线),并从ROC曲线上得到线粒体DNA拷贝指数的诊断界限值。具体来说,显著性检测的方法例如可以为常规的t.test。在ROC曲线上,最靠近左上角的ROC曲线的点是以此为阈值得到假阳性和假阴性的累积最少的点,可以选择该阈值为诊断界限值,并以此值为中心构建模糊区。
此外,在进行诊断界限值的确定过程中,以MH为单变量的单调函数值也可以有多种选择,例如可以为MH的自然对数值lnMH或MH n(n>1)等;以MC为单变量的单调函数值也可以有多种选择,例如可以为MC的自然对数值lnMC或MC n(n>1)等。当然,对MH和MC取单变量的单调函数值的计算方法需要与装置的计算单元中计算待检样本的线粒体DNA拷贝指数的方法相同,以此保证诊断界限值的适用性。
优选地,上述确定诊断界限值的方法中,步骤(3)中对所述对照样本的线粒体DNA拷贝指数和癌症样本的线粒体DNA拷贝指数进行统计之后,可先进行正态性检验的步骤,确认符合正态分布再后进行显著性检测。做正态性检验的方法可以使用R语言中的shapiro.test。具体举例来说,如果MH和MC的数据经检验后被证实符合正态性分布,则对MH和MC进一步使用t.test进行显著性检测,并绘制ROC曲线,从ROC曲线上得出针对线粒体DNA拷贝数M的诊断界限值。但是,如果在对MH和MC的数据进行正态性检验的结果显示其不符合正态性分布,则进一步对MH和MC的函数值进行正态性检验,例如可分别对MH和MC取自然对数值,在验证lnMH和lnMC符合正态性分布之后,对lnMH和lnMC进一步使用t.test进行显著性检测,并绘制ROC曲线,从ROC曲线上得出针对线粒体DNA拷贝数lnM的诊断界限值。当然,线粒体DNA拷贝值数除了可以为线粒体DNA拷贝数本身及其对数值之外,还可有其他替代和变换;对统计指标进行正态性检测和显著性检测所使用的方法也可以选择其他的统计方法替代。
本发明的实施方式所提供的线粒体DNA拷贝数变异性的检测装置,测序单元中用于对基因组DNA进行全基因组测序的模块可以是高通量测序模块、也可以是基因芯片模块。当用于全基因组测序的模块为高通量测序模块时,该高通量测序模块可进一步包括建库试剂盒和高通量测序试剂盒;该高通量测序模块对待检血浆样本中的游离DNA进行全基因组高通量测序。本装置中的高通量测序模块可选择适于各种高通量测序技术平台的建库试剂盒和高通量测序试剂盒,例如Illumina、454、Life Technolnies和PacBio等主流或其它高通量测序平台。
此外,也可以用基因芯片测序来代替高通量测序,以实现本发明的检测目的。当测序单元包括基因芯片模块时,该基因芯片模块进一步包括基因芯片和杂交信号检测器;该基因芯片模块对待检血浆样本中的游离DNA进行杂交测序,并检测每个基因组窗口的杂交信号强弱值,根据杂交信号强弱值定量出比对到线粒体DNA、核内DNA上的测序条数。其中,上述的杂交信号可以为荧光信号,则杂交信号检测器为荧光信号检测器。高通量测序技术或基因芯片技术都可实现本发明的目的,相比之下,基因芯片模块的成本更低,但高通量测序模块的检测准确率较高。
优选地,本发明的实施方式所提供的线粒体DNA拷贝数变异性的检测装置的测序单元中,还包括质检模块和/或数据优化模块,质检模块用于在对待检者血浆中的游离DNA进行全基因组测序之前,进行DNA浓度和片段大小的质检。而数据优化模块,用于对全基因组测序数据进行优化处理,例如将经过质检流程的测序条数与人类参考基因组进行比对时,设定单位序列允许错配个数、是否只留unique序列等。上述增设质检模块和/或数据优化模块的目的,均是希望提高测序数据用于后续的计算和统计分析过程中的准确性和可靠性。
此外,本发明的实施方式所提供的线粒体DNA拷贝数变异性的检测装置,还可以进一步包含样本制备单元,其用于从待检者静脉抽取外周血,并分离得到血浆中的游离DNA。上述的样本制备单元可包含静脉采血针、真空采血管、血液抗凝剂EDTA、血细胞保护剂和血浆游离DNA纯化试剂盒。样本制备单元的增设,可使本发明的线粒体DNA拷贝数不稳定性的检测装置在结构组成和功能上更为完整全面。
综上所述,本发明的实施方式提供了一种线粒体DNA拷贝数变异性的检测装置,并首次提出了一个用来筛查癌症的理想指标:线粒体DNA拷贝数变异性。本装置基于分子生物学测序技术和后续的生物信息学分析,通过检测血浆中线粒体DNA拷贝数变异,用来判别待检者罹患癌症的风险。只要是符合本筛查装置的检测流程(通过抽血、检测血液中的游离DNA,以线粒体DNA拷贝数与核内DNA拷贝数的相对比值为指标,来识别是否有癌症发生),无论是否采用高通量测序技术或基因芯片技术、是否采用本专利描述的生物信息学分析方法中用到的参数,都应该受到本专利的保护。
附图说明
图1是实施例2中对lnM值做显著性检测所绘制的ROC曲线图;
图2是实施例2中对lnM值的分组箱图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
实施例1 一种线粒体DNA拷贝数变异性的检测装置
本实施例涉及一种线粒体DNA拷贝数变异性的检测装置的结构组成,该装置包括样本制备单元、测序单元、计算单元和比较判断单元,其中:
样本制备单元包括一次性静脉采血针、一次性真空采血管、血液抗凝剂EDTA、血细胞保护剂、血浆游离DNA纯化试剂盒,该样本制备单元用于从待检者静脉抽取外周血,并分离得到其血浆中的游离DNA。
测序单元包括质检模块、高通量测序模块以及数据优化模块,且高通量测序模块进一步包括建库试剂盒和高通量测序试剂盒。质检模块用于在对样本制备单元所提供的待检者血浆中的游离DNA进行全基因组测序之前,进行DNA浓度和片段大小的质检;高通量测序模块用于对待检者血浆中的游离DNA进行全基因组高通量测序,得到高通量测序结果序列;数据优化模块用于对高通量测序数据进行优化。
计算单元,其将待检样本的测序结果比对到人类参考基因组上,并根据下式计算待检样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值Mt
Mt=nt(chrM)/len(chrM)/nt(chrN)/len(chrN),
其中:nt(chrM)为待检样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数;len(chrM)为人类参考基因组的线粒体DNA的长度,len(chrM)在本实施方式中取值16569bp;nt(chrN)为待检样本的测序结果比对到人类参考基因组的常染色体上的测序条数;len(chrN)为人类参考基因组的常染色体的长度,len(chrN)在本实施方式中取值2756335119bp。本实施例中的计算单元还进一步根据待检样本的线粒体DNA拷贝数Mt计算其自然对数值lnMt
比较判断单元,其将上述计算单元计算得到的待检样本的线粒体DNA拷贝数Mt或其自然对数值lnMt与预先设定的诊断界限值进行比较,判断待检样本是否存在线粒体DNA拷贝数变异性,进一步给出待检者罹患癌症的风险。本实施例中,对lnMt预先设定了诊断界限值3.046(本实施例中该诊断界限值的确定详见下述实施例2),理论上,如待检样本的lnMt值大于3.046,则可初步判断待检样本存在线粒体DNA拷贝数变异性;如待检样本的lnMt值小于3.046,则可初步判断待检样本不存在线粒体DNA拷贝数变异性。
为适于临床实际应用,本实施方式中还进一步以诊断界限值3.046为中心,以95%置信区间的取值原则构建了诊断模糊区(1.62~3.17),即:当待检样本的lnMt值在1.62~3.17范围之间,则暂不给出是否存在线粒体DNA拷贝数变异性的确定判断;当待检样本的lnMt值在3.17以上,则判定存在线粒体DNA拷贝数变异性,并可进一步给出待检者很可能罹患癌症的诊断结果;当待检样本的lnMt值在1.62以下,则判定不存在线粒体DNA拷贝数变异性,并可进一步给出待检者未罹患癌症的诊断结果。
实施例2 实施例1的检测装置中的诊断界限值的确定方法
本发明上述实施例1所提供的线粒体DNA拷贝数变异性的检测装置中,比较判断单元所预先设定的的诊断界限值3.046的得出方法:
(1)取一组(31名)健康人群血浆中的游离DNA作为对照样本群,以本发明实施例1中的测序单元相同的装置和方法对这些对照样本进行全基因组测序,每个对照样本得到至少20M的测序条数,将测序结果比对到人类参考基因组上,计算每个对照样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值MH以及MH的自然对数值lnMH
MH=nH(chrM)/len(chrM)/nH(chrN)/len(chrN),
其中:nH(chrM)为对照样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数,len(chrM)为人类参考基因组的线粒体DNA的长度,nH(chrN)为对照样本的测序结果比对到人类参考基因组的常染色体上的测序条数,len(chrN)为人类参考基因组的常染色体的长度;须与实施例1中一样,len(chrM)在本实施方式中同样取值16569bp;len(chrN)在本实施方式中同样取值2756335119bp。31个健康人群对照样本的线粒体DNA拷贝指数的数据(样本编号S1~S31)如下表1所示。
表1:对照样本(健康人群)的线粒体DNA拷贝指数数据表
样本 nH(chrM) nH(chrN) MH ln(MH) 分组
S1 283.03 23430925 2.009457 0.697865 对照样本
S2 105.04 15186968 1.150587 0.140272 对照样本
S3 317.04 19415104 2.716502 0.999345 对照样本
S4 342.57 23015637 2.476065 0.906671 对照样本
S5 170.01 24001213 1.178357 0.164121 对照样本
S6 172.01 18065209 1.583968 0.459933 对照样本
S7 185.54 10319720 2.990924 1.095582 对照样本
S8 220.04 12450191 2.940095 1.078442 对照样本
S9 23 1671649 2.288856 0.828052 对照样本
S10 1643.66 10984260 24.89298 3.214586 对照样本
S11 126 7104305 2.950426 1.081949 对照样本
S12 224.52 6398366 5.83743 1.764291 对照样本
S13 92 4889195 3.130301 1.141129 对照样本
S14 201 10826294 3.088531 1.127696 对照样本
S15 281.55 6349329 7.376722 1.998329 对照样本
S16 294.03 4615895 10.59672 2.360544 对照样本
S17 148 7820376 3.148254 1.146848 对照样本
S18 212.53 13130439 2.69263 0.990519 对照样本
S19 271.91 14799201 3.056488 1.117266 对照样本
S20 829.82 18927397 7.293378 1.986967 对照样本
S21 1026.21 24631559 6.930747 1.935968 对照样本
S22 451.37 10060335 7.463731 2.010055 对照样本
S23 480.49 13361186 5.982395 1.788821 对照样本
S24 136.19 17062457 1.32782 0.283539 对照样本
S25 98.94 16541738 0.995008 -0.005 对照样本
S26 468.21 18179693 4.284399 1.45498 对照样本
S27 1785.06 14160666 20.97031 3.043108 对照样本
S28 336.63 17460094 3.207318 1.165435 对照样本
S29 360.59 16282350 3.684108 1.304028 对照样本
S30 315.73 16071635 3.268071 1.1842 对照样本
S31 346.37 4247058 13.56712 2.607649 对照样本
(2)取一组(16名)癌症患者血浆中的游离DNA作为癌症样本群,也以本发明上述实施例1中的测序单元相同的装置和方法对癌症样本群进行全基因组测序,每个癌症样本得到至少20M的测序条数,将测序结果比对到人类参考基因组上,计算每个癌症样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值MC以及MC的对数值lnMC
MC=nC(chrM)/len(chrM)/nC(chrN)/len(chrN),
其中:nC(chrM)为癌症样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数,len(chrM)为人类参考基因组的线粒体DNA的长度,nC(chrN)为癌症样本的测序结果比对到人类参考基因组的常染色体上的测序条数,len(chrN)为人类参考基因组的常染色体的长度;须与实施例1中一样,len(chrM)在本实施方式中同样取值16569bp;len(chrN)在本实施方式中同样取值2756335119bp。16个癌症样本的线粒体拷贝指数的数据(样本编号S32~S47)如下表2所示。
表2:癌症样本的线粒体DNA拷贝指数数据表
样本 nC(chrM) nC(chrN) MC ln(MC) 分组
S32 977.2 7706704.5 21.09358862 3.048969137 癌症样本
S33 4641.3 14236292.92 54.23485035 3.993323697 癌症样本
S34 7776.69 20386132.63 63.45935628 4.150399642 癌症样本
S35 993.11 20138588.03 8.203592094 2.104572119 癌症样本
S36 3708.87 24789867.6 24.88875224 3.214415984 癌症样本
S37 3948.83 24676984 26.62024686 3.281672086 癌症样本
S38 2509.12 12018041.99 34.73149164 3.547646816 癌症样本
S39 3256.04 9361473.81 57.86037253 4.058032738 癌症样本
S40 5435.36 6265944.44 144.3037094 4.971920171 癌症样本
S41 6176.66 11597886.51 88.59527526 4.48407853 癌症样本
S42 4923.39 18049860.88 45.37598869 3.814983082 癌症样本
S43 3679.14 20313357.6 30.13008249 3.405524091 癌症样本
S44 329.54 18683445.48 2.934180922 1.076428342 癌症样本
S45 10127.95 6567635.43 256.5359489 5.547268806 癌症样本
S46 3206.5 4088927.53 130.4540455 4.871021023 癌症样本
S47 9623.66 14382850.2 111.3091931 4.712311853 癌症样本
(3)对上述MH、MC以lnMH、lnMC使用R语言中的shapiro.test进行正态检测。结果如下表3所示:
表3:正态检测结果
样本组 shapiro.test(M) shapiro.test(ln(M))
对照样本 6.2e-07 0.137
癌症样本 0.0067 0.593
结论,M未通过正态检测,采取ln(M)作为后续的统计指标。
对lnMH、lnMC使用t.test作显著性差异分析,结果如下表4所示:
表4:显著性检验结果
样本组 假设 p-value
对照样本 ln(M)<2.3 7.748e-08
癌症样本 ln(M)>3 0.00752
根据显著性检测的结果绘制ROC曲线,如附图1所示。从ROC曲线上可以看到:灵敏度和特异性的极值是不可兼得的。当取特异性为1时,灵敏度的最高值为0.75,当灵敏度为1时,特异性的最高值为0.3。在ROC曲线上标出的值为灵敏度和特异性乘积的极值。(特异性表示阴性的检出率,为1,表示阴性检出率为100%,即所有阴性都被正确检出为阴性;灵敏度为1表示阳性的检出率,为1,表示阳性的检出率为100%,即所有阳性都被正确检出为阳性)。附图1中标注的点是灵敏度和特异性乘积的极值点。本实施例中,我们选择3.046为lnM的诊断界限值,还进一步以诊断界限值3.046为中心,以95%置信区间的取值原则构建了诊断模糊区(1.62~3.17),对ln M的分组箱图如附图2所示。
实施例3 采用实施例1的检测装置进行癌症筛查的试验例
本实施例涉及采用实施例1的线粒体DNA拷贝数变异性的检测装置进行癌症筛查的试验例。
1.使用检测装置中的样本制备单元分别抽取5名受检者的静脉血5ml,分离血浆,并从血浆中提取游离的DNA片段,作为待检样本:
分离血浆的方法:将5ml静脉血在1000rpm/min条件下离心10分钟,将上层血浆取出后在8000rpm/min条件下再离心10分钟,并吸取上层血浆进行DNA抽提;
提取游离的DNA片段采用:凯杰公司的DNA抽提试剂盒QIAamp DNA Blood MiniKit(cat.no.51104)进行。
2.使用质检模块对待检样本的DNA片段进行浓度和片段大小的质检:
质检标准:用TBS380对抽提后的DNA进行定量,总量达到5ng的样本为合格样本。用Agilent 2100 Bioanalyzer对抽提后的DNA进行片段大小质检,在180bp处有峰的样品为合格样品。
3.使用高通量测序模块对质检合格的DNA进行高通量测序,每个样品得到至少20M的reads数,高通量测序步骤简述如下:
建库步骤:
将提取的DNA末端补平并进行5’端磷酸化:将DNA 32μl、NEXTflex End Repair &Adenylation Buffer Mix 15μl、NEXTflex End Repair & Adenylation Enzyme Mix 3μl混合后,在22℃温浴20分钟(试剂为Bioo Scientific的样本准备试剂盒NEXTflex RapidDNA Sequencing Kit提供)。温浴后72℃20min灭活酶。
末端悬A:接着在体系中继续加入NEXTflex Ligation Enzyme Mix 2.5ul和NEXTflex DNA Barcode Adapter(0.6μM)2.5μl,混匀,22℃孵育15min(试剂为BiooScientific的样本准备试剂盒NEXTflex Rapid DNA Sequencing Kit提供)。温浴后采用AMPure XP beads(由Beckman公司提供)纯化DNA连接产物。
文库富集:将36ul DNA连接产物,12μlNEXTflex PCR Master Mix和2ul NEXTflexPrimer Mix混合后,进行14轮PCR循环,98℃ 2minutes后,98℃ 30s,65℃ 30s,72℃ 60s,最后72℃ 4℃(试剂为Bioo Scientific的样本准备试剂盒NEXTflex Rapid DNASequencing Kit提供)。采用琼脂糖电泳方式筛选文库大小,使用QIAquick GelExtraction Kit(货号:28706)回收文库,即制得可供测序的文库。
文库质控:取1μl文库样品,借助Promega公司的QuantiFluorTM-ST荧光定量系统,用dsDNA定量试剂盒(dsDNA Quantitation Reagent)进行浓度检测,3ng起始建库。
高通量测序步骤:
将建得的文库配合使用高通量测序试剂盒SE50在IlluminaHiSeq 2500测序平台上进行高通量测序,得到高通量测序结果。
4.使用数据优化模块将高通量测序数据进行质检和优化;将经过质检优化的reads数与人类参考基因组进行比对,每50bp的序列容错2个mismatches;
5.计算单元将将待检样本的测序结果序列比对到人类参考基因组上,使用下式计算待检样本的线粒体DNA拷贝指数:
表5:待检样本的线粒体DNA拷贝指数数据表
样本 nt(chrM) nt(chrN) Mt ln(Mt) 分组
T1 7776.69 20386132 63.459356 4.150399 待检样本
T2 126 7104305 2.950426 1.081949 待检样本
T3 294.03 4615895 10.59672 2.360544 待检样本
T4 3256.04 9361473 57.860372 4.058032 待检样本
T5 185.54 10319720 2.990924 1.095582 待检样本
6.比较判断单元在获取到计算单元计算出的待检样本的线粒体DNA拷贝指数之后,将lnMt的数值与诊断界限值(3.046)及其诊断模糊区域(1.62~3.17)进行比较,得出待检样本是否存在线粒体DNA拷贝数变异性、以及是否罹患癌症的结论:T1和T4的lnMt的值大于3.17,判断该待检者存在线粒体DNA拷贝数不稳定性,很有可能罹患癌症;T2和T5的lnMt值小于1.62,判断该待检者不存在线粒体DNA拷贝数不稳定性,未罹患癌症病;而T3的lnMt值在诊断界限值的附近,介于诊断模糊区域(1.62~3.17)内,则暂不做出是否存在线粒体DNA拷贝数不稳定性的结论。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (8)

1.一种线粒体DNA拷贝数变异性的检测装置,其特征在于,包括:
测序单元,其对待检者血浆样本中的游离DNA进行全基因组测序,得到待检样本的测序结果;
计算单元,其将待检样本的测序结果比对到人类参考基因组上,计算待检样本的线粒体DNA拷贝指数;
比较判断单元,其将待检样本的线粒体DNA拷贝指数与预先设定的诊断界限值进行比较,判断待检样本是否存在线粒体DNA拷贝数变异性;所述比较判断单元还根据待检样本是否存在线粒体DNA拷贝数变异性,得出待检者罹患癌症的风险;
所述待检样本的线粒体DNA拷贝指数为:待检样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值Mt或以所述Mt为单变量的单调函数值,且:
Mt=nt(chrM)/len(chrM)/nt(chrN)/len(chrN),
其中:nt(chrM)为待检样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数,len(chrM)为人类参考基因组的线粒体DNA的长度,nt(chrN)为待检样本的测序结果比对到人类参考基因组的核内DNA上的测序条数,len(chrN)为人类参考基因组的核内DNA的长度。
2.根据权利要求1所述的线粒体DNA拷贝数变异性的检测装置,其特征在于,所述以Mt为单变量的单调函数值为Mt的自然对数值lnMt或Mt n(n>1)。
3.根据权利要求1所述的线粒体DNA拷贝数变异性的检测装置,其特征在于,所述比较判断单元中的诊断界限值通过下述方法得出:
(1)取一组健康人群血浆中的游离DNA作为对照样本群,以所述测序单元相同的装置对所述对照样本群进行全基因组测序,计算每个对照样本的线粒体DNA拷贝指数,所述对照样本的线粒体DNA拷贝指数为对照样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值MH或以所述MH为单变量的单调函数值,且:
MH=nH(chrM)/len(chrM)/nH(chrN)/len(chrN),
其中:nH(chrM)为对照样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数,len(chrM)为人类参考基因组的线粒体DNA的长度,nH(chrN)为对照样本的测序结果比对到人类参考基因组的核内DNA上的测序条数,len(chrN)为人类参考基因组的核内DNA的长度;
(2)取一组癌症患者血浆中的游离DNA作为癌症样本群,以所述测序单元相同的装置对所述癌症样本群进行全基因组测序,分别计算每个癌症样本的线粒体DNA拷贝指数,所述癌症样本的线粒体DNA拷贝指数为癌症样本的线粒体DNA拷贝数和核内DNA拷贝数的相对比值MC或以所述MC为单变量的单调函数值,且:
MC=nC(chrM)/len(chrM)/nC(chrN)/len(chrN),
其中:nC(chrM)为癌症样本的测序结果比对到人类参考基因组的线粒体DNA上的测序条数,len(chrM)为人类参考基因组的线粒体DNA的长度,nC(chrN)为癌症样本的测序结果比对到人类参考基因组的核内DNA上的测序条数,len(chrN)为人类参考基因组的核内DNA的长度;
(3)对上述对照样本的线粒体DNA拷贝指数和癌症样本的线粒体DNA拷贝指数分别进行统计、然后进行显著性检测,绘制ROC曲线,并从ROC曲线上得到所述诊断界限值。
4.根据权利要求3所述的线粒体DNA拷贝数变异性的检测装置,其特征在于,所述以MH为单变量的单调函数值为MH的自然对数值lnMH或MH n(n>1);所述以MC为单变量的单调函数值为MC的自然对数值lnMC或MC n(n>1)。
5.根据权利要求3所述的线粒体DNA拷贝数变异性的检测装置,其特征在于,步骤(3)中对所述对照样本的线粒体DNA拷贝指数和癌症样本的线粒体DNA拷贝指数分别进行统计之后,先进行正态性检验的步骤,确认符合正态分布再后进行所述显著性检测。
6.根据权利要求1所述的线粒体DNA拷贝数变异性的检测装置,其特征在于,所述测序单元包含高通量测序模块或基因芯片模块。
7.根据权利要求1所述的线粒体DNA拷贝数变异性的检测装置,其特征在于,所述测序单元还包括质检模块和/或数据优化模块:所述质检模块用于在进行全基因组测序之前,对血浆样本中的游离DNA进行DNA浓度和片段大小的质检;所述数据优化模块,用于对全基因组测序数据进行优化处理。
8.根据权利要求1所述的线粒体DNA拷贝数变异性的检测装置,其特征在于,还包括样本制备单元,其用于从待检者静脉抽取外周血,并提取血浆中的游离DNA片段。
CN201510126196.3A 2015-03-20 2015-03-20 线粒体dna拷贝数变异性的检测装置 Active CN104694384B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510126196.3A CN104694384B (zh) 2015-03-20 2015-03-20 线粒体dna拷贝数变异性的检测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510126196.3A CN104694384B (zh) 2015-03-20 2015-03-20 线粒体dna拷贝数变异性的检测装置

Publications (2)

Publication Number Publication Date
CN104694384A CN104694384A (zh) 2015-06-10
CN104694384B true CN104694384B (zh) 2017-02-08

Family

ID=53341944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510126196.3A Active CN104694384B (zh) 2015-03-20 2015-03-20 线粒体dna拷贝数变异性的检测装置

Country Status (1)

Country Link
CN (1) CN104694384B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11242559B2 (en) * 2015-01-13 2022-02-08 The Chinese University Of Hong Kong Method of nuclear DNA and mitochondrial DNA analysis
CN105760712B (zh) * 2016-03-01 2019-03-26 西安电子科技大学 一种基于新一代测序的拷贝数变异检测方法
CN106951737B (zh) * 2016-11-18 2019-06-14 南方医科大学 一种检测流产组织dna拷贝数变异和嵌合体的方法
CN108733974B (zh) * 2017-04-21 2021-12-17 胤安国际(辽宁)基因科技股份有限公司 一种基于高通量测序的线粒体序列拼接及拷贝数测定的方法
CN109390039B (zh) * 2017-08-11 2020-10-16 深圳华大基因股份有限公司 一种统计dna拷贝数信息的方法、装置及存储介质
CN112908411B (zh) * 2021-01-12 2024-05-14 广州市金域转化医学研究院有限公司 一种线粒体变异位点数据库及其建立方法和应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102597272A (zh) * 2009-11-12 2012-07-18 艾索特里克斯遗传实验室有限责任公司 基因座的拷贝数分析
CN102952877A (zh) * 2012-08-06 2013-03-06 深圳华大基因研究院 检测α珠蛋白基因拷贝数的方法和系统
WO2013149385A1 (zh) * 2012-04-05 2013-10-10 深圳华大基因健康科技有限公司 一种拷贝数变异检测方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102597272A (zh) * 2009-11-12 2012-07-18 艾索特里克斯遗传实验室有限责任公司 基因座的拷贝数分析
WO2013149385A1 (zh) * 2012-04-05 2013-10-10 深圳华大基因健康科技有限公司 一种拷贝数变异检测方法和系统
CN102952877A (zh) * 2012-08-06 2013-03-06 深圳华大基因研究院 检测α珠蛋白基因拷贝数的方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙懿等.荧光定量PCR精确检测人胚胎干细胞线粒体DNA拷贝数方法的建立.《中国细胞生物学学报》.2012,第34卷(第7期),全文. *
线粒体DNA 拷贝数的研究新进展;20141231;《分子生物医学》;20141231;第20卷(第24期);摘要 *

Also Published As

Publication number Publication date
CN104694384A (zh) 2015-06-10

Similar Documents

Publication Publication Date Title
CN104694384B (zh) 线粒体dna拷贝数变异性的检测装置
CN104560697A (zh) 一种基因组拷贝数不稳定性的检测装置
Bratulic et al. The translational status of cancer liquid biopsies
JP2022521492A (ja) 相同組換え欠損を推定するための統合された機械学習フレームワーク
CN105219844B (zh) 一种筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型
CN108138233A (zh) Dna混合物中组织的单倍型的甲基化模式分析
WO2014160645A2 (en) Neuroendocrine tumors
CN102939389A (zh) 基于体细胞获得性重排的诊断方法
CN105779434A (zh) 试剂盒及其用途
CN105779435A (zh) 试剂盒及其用途
CN105603101A (zh) 检测8个miRNA表达量的系统在制备诊断或辅助诊断肝细胞癌产品中的应用
CN109616198A (zh) 仅用于肝癌单一癌种筛查的特异甲基化检测位点组合的选取方法
US20230257826A1 (en) Methods for predicting prostate cancer and uses thereof
US20240002949A1 (en) Panel of mirna biomarkers for diagnosis of ovarian cancer, method for in vitro diagnosis of ovarian cancer, uses of panel of mirna biomarkers for in vitro diagnosis of ovarian cancer and test for in vitro diagnosis of ovarian cancer
CN105779432A (zh) 试剂盒及其用途
CN114990215A (zh) microRNA生物标志物在肺癌诊断或预测预后中的应用
CN109628600A (zh) 一种用于早期乳腺癌诊断的生物标志物
Li et al. Analysis of the prognostic value and gene expression mechanism of SHOX2 in lung adenocarcinoma
CN110004229A (zh) 多基因作为egfr单克隆抗体类药物耐药标志物的应用
CN105779433A (zh) 试剂盒及其用途
WO2022156610A1 (zh) 基于基因检测判断肝癌药物敏感性和远期预后的预测工具及其应用
Hobbs et al. Biostatistics and bioinformatics in clinical trials
KR102161511B1 (ko) 담도암 진단용 바이오마커의 추출 방법, 이를 위한 컴퓨팅 장치, 담도암 진단용 바이오마커 및 이를 포함하는 담도암 진단 장치
CN105505934B (zh) M5型急性髓系白血病相关的特异miRNA及其应用
CN111172285A (zh) 用于胰腺癌早期诊断和/或预后监测的miRNA组及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Zeng Fengbo

Inventor after: Yang Gongda

Inventor after: Chen Changyue

Inventor after: Han Jichen

Inventor after: Zhang Xianglin

Inventor before: Zeng Fengbo

Inventor before: Yang Gongda

Inventor before: Chen Changyue

Inventor before: Han Jichen

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Han Jichen

Inventor after: Zhang Xianglin

Inventor after: Zeng Fengbo

Inventor after: Yang Gongda

Inventor after: Chen Changyue

Inventor before: Zeng Fengbo

Inventor before: Yang Gongda

Inventor before: Chen Changyue

Inventor before: Han Jichen

Inventor before: Zhang Xianglin

CB03 Change of inventor or designer information