CN104232777B - 同时确定胎儿核酸含量和染色体非整倍性的方法及装置 - Google Patents

同时确定胎儿核酸含量和染色体非整倍性的方法及装置 Download PDF

Info

Publication number
CN104232777B
CN104232777B CN201410484128.XA CN201410484128A CN104232777B CN 104232777 B CN104232777 B CN 104232777B CN 201410484128 A CN201410484128 A CN 201410484128A CN 104232777 B CN104232777 B CN 104232777B
Authority
CN
China
Prior art keywords
dna
section
nucleic acid
unit
variation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410484128.XA
Other languages
English (en)
Other versions
CN104232777A (zh
Inventor
袁媛
刘涛
曹飞
郭俊甫
王垚燊
吴仁花
阿叁
杨玲
易鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN BGI TECHNOLOGY CO., LTD.
Tianjin Huada medical laboratory Co., Ltd.
BGI Shenzhen Co Ltd
Original Assignee
TIANJIN BGI TECHNOLOGY Co Ltd
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN BGI TECHNOLOGY Co Ltd, BGI Shenzhen Co Ltd filed Critical TIANJIN BGI TECHNOLOGY Co Ltd
Priority to CN201410484128.XA priority Critical patent/CN104232777B/zh
Publication of CN104232777A publication Critical patent/CN104232777A/zh
Priority to HK15102367.4A priority patent/HK1201886A1/zh
Application granted granted Critical
Publication of CN104232777B publication Critical patent/CN104232777B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Abstract

本发明提供了确定孕妇体液样本中胎儿核酸含量的方法、同时确定孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息的方法、检测孕妇体液样本中胎儿核酸变异的非诊断方法及各自的装置,所说的确定孕妇体液样本中胎儿核酸含量的方法包括:获取孕妇体液样本;从样本中提取第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;对至少一部分的第一DNA和至少一部分的第二DNA测序以获得第一读段和第二读段,第一读段和第二读段中包含多个多态性位点;将第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;依据比对结果中的第一读段中支持筛选出的多态性位点的读段数目,确定样本中的胎儿核酸含量。

Description

同时确定胎儿核酸含量和染色体非整倍性的方法及装置
技术领域
本发明属于生物医学领域,特别地,涉及确定孕妇样本中的胎儿核酸含量的方法、同时确定孕妇样本中胎儿核酸含量和染色体变异的方法、检测孕妇体液样本中胎儿核酸变异的方法及各装置。
背景技术
出生缺陷指的是婴儿在出生前发生的身体结构、功能或代谢异常。目前,全世界已经发现7000多种遗传或半遗传性出生缺陷疾病。根据2001美国MARCH OF DMES(MOD)基金会报告显示,排在前5位的严重遗传或半遗传性出生缺陷分别是心血管缺陷、神经管畸形、血红蛋白疾病(地中海贫血和镰状细胞性贫血)、唐氏综合征和葡萄糖-6-磷酸酶脱氢酶(G6PD)缺乏症。这5种疾病约占全部出生缺陷的25%[U.S.Department of Health AndHuman Services,Centers for Disease Control and Prevention.Centers for BirthDefects Research and Prevention[R].Atlanta:CDC.2003;Hsu L YF.Prenataldiagnosis of chromosomal abnormalities through amniocentesis.InMilunsky Aed.Genetic Disorders and the Fetus:diagnosis,prevention,and treatment.4thed.Baltimore:Johns Hop-kins University Press,1998:179]。
染色体异常是最常见的导致出生缺陷的遗传因素,其发生率随着母亲年龄的增高而上升。国外的统计资料表明,在每150个新生儿中就有一个染色体异常患者。临床上较常见的常染色体非整倍体有21-三体综合征(Down综合征,DS),18-三体综合征,13-三体综合征,性染色体非整倍体有Klinefelter综合征,Turner综合征,XYY综合征,X三体综合征等。这四种常见染色体异常占所有染色体异常的65%一80%,且占出生后染色体异常导致出生缺陷的85%一95%。其中21-三体综合征是最常见的常染色体非整倍体病,在新生儿中发病率约为1/600-1/1000,占小儿三体型染色体病的70%-80%。根据2003年的资料测算,我国每年新出生的唐氏综合征生命周期的总经济负担超过100亿元。针对这四种常见染色体异常的研究、检测、辅助筛查、筛查和及时诊断,能够起到降低出生缺陷的发生,提高出生人口素质的作用。
随着近年来,母体外周血中发现的胎儿游离DNA[Lo YM,CorbettaN,ChamberlainPF,et al.Presence of fetal DNA inmaternal plasma and serum.Lancet 1997;350(9560):485–487],RNA[Ferguson-Smith,M.A.Placental mRNA inmaternal plasma:prospects for fetal screen-ing.Proc.Natl.Acad.Sci.USA 100,4360–4362(2003)]及胎儿细胞[Bischoff,F.Z.,Sinacori,M.K.,Dang,D.D.,Marquez-Do,D.,Horne,C.,Lewis,D.E.,&Simpson,J.L.(2002).Cell-free fetal DNA and intact fetal cells inmaternal blood circulation:implications for first and second trimester non-invasive prenatal diagnosis.Human reproduction update,8(6),493–500.]为无创产前诊断提供新的可能。基于孕妇外周血中胎儿游离DNA及二代测序的胎儿染色体非整倍性无创基因检测技术现阶段主要定位于21、18、13三体及部分性染色体异常的产前筛查。相较于传统的血清学筛查方法,该方法检出率可达98%,其假阳性率仅为0.2%或更低。该方法在国际国内得到了普遍的认可,提供了一种新型的染色体非整倍体产前辅助筛查及诊断模式。然而由于早孕期母体外周血浆中的胎儿游离DNA含量相对偏低,可能存在检出率偏低的问题,因此目前无创产前检测非整倍体的技术主要针对16孕周之后的孕妇群体提供服务。
高灵敏度、高特异性的无创产前筛查技术能够最大限度的预防漏检、错检,减少不必要的有创性产前诊断,减轻临床诊断压力,避免不必要的流产。目前,仍缺乏一种适用于在大规模人群对特定一种或几种单基因病相关基因进行检测的技术。也缺乏在早孕期(16孕周之前)的非整倍体与单基因病的同步筛查方法。
发明内容
一方面,本发明提供一种确定孕妇体液样本中胎儿核酸含量的方法,该方法包括:(1)获得孕妇体液样本;(2)从(1)中的样本提取第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;(3)对(2)中至少一部分的第一DNA测序以获得第一读段,对(2)中至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点;(4)将(3)的第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出(3)中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;(5)依据(4)中的比对结果中的第一读段中支持(4)中筛选出的多态性位点的读段数目,确定所述孕妇体液样本中胎儿核酸含量。所说的孕妇体液样本可以来源于孕妇外周血、孕妇尿液等。
本发明还提供了一种同时确定孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息的方法,该方法包括:(1)获得孕妇体液样本;(2)从(1)中的样本提取第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;(3)对(2)中至少一部分的第一DNA测序以获得第一读段,对(2)中至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点;(4)将(3)的第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出(3)中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;(5)依据(4)中的比对结果中的第一读段中支持(4)中筛选出的多态性位点的读段数目,同时确定所述孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息。所说的孕妇体液样本可以来源于孕妇外周血、孕妇尿液等。所说的胎儿染色体变异信息包括胎儿染色体非整倍性、染色体部分非整倍性、CNV等。
另一方面,本发明提供了一种检测孕妇体液样本中胎儿核酸变异的方法,所述核酸变异包括SNP、剪切位点突变、CNV和染色体非整倍性的至少一种,所述方法包括:利用本发明一方面的确定孕妇体液样本中胎儿核酸含量的方法确定孕妇体液样本中胎儿核酸含量;基于所述胎儿核酸含量确定所述胎儿核酸变异检测所需的最低数据量;对第一DNA进行测序,获得不小于所述最低数据量的测序数据;基于所述测序数据,检测所述胎儿核酸变异。该方法可以实现利用一次实验获得最低数据量对多种核酸变异类型的同时准确检测。当胎儿核酸含量大于等于4%,所述最低数据量为0.18Gbp;当胎儿核酸含量为3%~4%,所述最低数据量为0.54Gbp。
再一方面,本发明提供了一种确定孕妇体液样本中胎儿核酸含量的装置,该装置能够用于执行本发明一方面提供的确定孕妇体液样本中胎儿核酸含量的方法的部分或所有步骤,该装置包括:A1.样本获取单元,用以获取孕妇体液样本;B1.核酸提取单元,与A1单元连接,用于提取样本中的第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;C1.测序单元,与B1单元连接,用于对至少一部分的第一DNA测序以获得第一读段,对至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点;D1.比对筛选单元,与C1单元连接,接收B1单元的数据,用于实现将第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出C1中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;E1.核酸含量确定单元,与D1单元连接,接收D1单元的数据,用于依据获自D1的比对结果中的第一读段中支持D1中筛选出的多态性位点的读段数目,确定所述孕妇体液样本中胎儿核酸含量。
又一方面,本发明提供了一种同时确定孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息的装置,在该装置中,能够执行本发明一方面提供的同时确定孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息的方法的全部或部分步骤,该装置包括:A2.样本获取单元,用以获取孕妇体液样本;B2.核酸提取单元,与A2单元连接,用于提取样本中的第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;C2.测序单元,与B2单元连接,用于对至少一部分的第一DNA测序以获得第一读段,对至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点;D2.比对筛选单元,与C2单元连接,接收B2单元的数据,用于实现将第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出C2中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;E2.核酸含量和变异确定单元,与D2单元连接,接收D2单元的数据,用于依据获自D2的比对结果中的第一读段中支持D2中筛选出的多态性位点的读段数目,同时确定所述孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息。
本发明还提供了一种检测孕妇体液样本中胎儿核酸变异的装置,利用该装置能够执行或实现本发明一方面的检测孕妇体液样本中胎儿核酸变异的方法的部分或所有步骤,该装置包括:胎儿核酸含量确定单元,所述胎儿核酸含量的确定是通过本发明一方面的确定孕妇体液样本中胎儿核酸含量的方法进行的,获得胎儿核酸含量;最低数据量确定单元,与所述胎儿核酸含量确定单元连接,用于基于所述胎儿核酸含量确定所述胎儿核酸变异检测所需的最低数据量;测序单元,与所述最低数据量确定单元连接,用于对第一DNA进行测序,获得不小于所述最低数据量的测序数据,所述第一DNA获自所述孕妇体液样本,所述第一DNA为母体和胎儿DNA混合物;变异检测单元,与所述测序单元连接,接收来自所述测序单元的测序数据,基于所述测序数据,检测所述胎儿核酸变异。
本发明的上述方法和/或装置适合于在早孕期(16孕周之前,特别是8-12孕周)对产前人群中进行大规模地同时对胎儿非整倍体患病风险及单基因病患病风险进行预测或辅助筛查。本发明的方法和/装置能够在早孕期抽血孕妇外周血,通过离心实现血浆及血细胞的分离,通过血浆DNA实现对胎儿非整倍体的检测,通过孕妇血细胞实现对孕妇SNP检测、对孕妇单基因病携带情况的筛查,并根据孕妇单基因病致病基因携带情况,确定是否对其丈夫进行携带者筛查,以确定胎儿某种单基因病的患病风险。能够实现利用一次实验获得最低数据量对多种核酸变异类型的同时准确检测。
利用本发明的上述方法和/或装置能够实现早孕期的基于胎儿游离DNA的无创产前非整倍体检测和/或辅助筛查。本发明的方法和/或装置还能通过胎儿游离DN定量获得最低要求的数据量进行无创产前检测非整倍体,实现早孕期的无创非整倍体检测。本发明的方法和/或装置还能基于目标区域捕获的高通量测序用于大量样品的大规模筛查,目前目标区域捕获检测技术多使用于单碱基突变、以及一些小片段碱基的插入及缺失检测,而对于涉及大片段缺失,如缺失型alpha地中海贫血,缺失DMD等仍需通过QPCR,gap-PCR等技术进行检测。因使用目标区域捕获无法实现对已知致病突变的完全准确唯一覆盖,而通过多种技术结合使用则存在费时费力的问题。本发明方法和/或装置通过探针设计及信息分析方法的改进,实现通过目标区域捕获同时检测点突变、小片段插入缺失、常见缺失型致病突变以及染色体非整倍性的检测。检测快速准确,适用于产前检测或者辅助产前检测。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明的一个具体实施方式中的基于孕妇外周血样本检测胎儿非整倍体、胎儿SNP基因型和孕妇SNP基因型的流程图;
图2是本发明的一个具体实施方式中的确定孕妇体液样本中胎儿核酸含量的装置示意图。
具体实施方式
根据本发明的一个实施方式,提供了一种确定孕妇体液样本中胎儿核酸含量的方法,该方法包括:(1)获得孕妇体液样本;(2)从(1)中的样本提取第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;(3)对(2)中至少一部分的第一DNA测序以获得第一读段,对(2)中至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点;(4)将(3)的第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出(3)中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;(5)依据(4)中的比对结果中的第一读段中支持(4)中筛选出的多态性位点的读段数目,确定所述孕妇体液样本中胎儿核酸含量。在本发明的一个具体实施方式中,所述孕妇体液样本来源于孕妇外周血和孕妇尿液的至少一种。孕妇体液样本比如孕妇外周血,包含孕妇的红细胞、白细胞,血浆或血清中包含孕妇及胎儿的游离核酸混合物即为第一DNA,第二DNA来源于孕妇红细胞、白细胞基因组。所以,若是获得孕妇血液样本,还包括对血液样本进行处理,获得血清/血浆和母体细胞,分别提取核酸。
在本发明的一个具体实施方式中,多态性位点为在群体中次等位基因频率不小于0.4的SNP。群体为不少于30个人样本,可以利用已公开的千人基因组数据获得上述SNP,也可以对多个人样本进行测定识别出SNP,挑选出次等位基因频率不小于0.4的SNP,这些高次等位基因频率的SNP杂合率高,利于基于少量数据中挑出胎儿不同于母体的基因型,利于胎儿的SNP检测和确定混合核酸中的胎儿核酸含量。
在本发明的一个具体实施方式,(4)中筛选出的多态性位点的基因型组合为:(i)在第二DNA中只有纯合基因型、而在第一DNA中存在纯合和杂合基因型,或者(ii)在第二DNA中只有杂合基因型、而在第一DNA中存在纯合和杂合基因型。当(4)中的多态性位点的基因型组合为(i)时,(5)中胎儿核酸含量的确定公式为f=2d/(c+d),当(4)中的多态性位点的基因型组合为(ii)时,(5)中胎儿核酸含量的确定公式为f=(c-d)/(c+d),其中,c为第一读段中支持纯合基因型的读段的数目,d为第一读段中支持杂合基因型的读段的数目。
根据本发明的另一个实施方式,提供了一种同时确定孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息的方法,该方法包括:(1)获得孕妇体液样本;(2)从(1)中的样本提取第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;(3)对(2)中至少一部分的第一DNA测序以获得第一读段,对(2)中至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点;(4)将(3)的第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出(3)中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;(5)依据(4)中的比对结果中的第一读段中支持(4)中筛选出的多态性位点的读段数目,同时确定所述孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息。在本发明的一个具体实施方式中,孕妇体液样本来源于孕妇外周血和孕妇尿液的至少一种,胎儿染色体变异包括胎儿整条染色体非整倍性变异、胎儿染色体部分非整倍性变异,部分非整倍性变异包括CNV、片段的插入缺失等。
在本发明的一个具体实施方式中,所说的多态性位点为在群体中次等位基因频率不小于0.4的SNP;所说的群体,为包含不少于30个人样本,可以利用已公开的千人基因组数据获得上述SNP,也可以对多个人样本进行测定识别出SNP,挑选出次等位基因频率不小于0.4的SNP,这些高次等位基因频率的SNP杂合率高,利于基于少量数据中挑出胎儿不同于母体的基因型,利于胎儿的SNP检测、确定混合核酸中的胎儿核酸含量和胎儿染色体非整倍性检测。
在本发明的一个具体实施方式中,(4)中筛选出的多态性位点的基因型组合为:(i)在第二DNA中只有纯合基因型、而在第一DNA中存在纯合和杂合基因型,或者(ii)在第二DNA中只有杂合基因型、而在第一DNA中存在纯合和杂合基因型,当(4)中的多态性位点的基因型组合为(i)时,(5)中胎儿核酸含量的确定公式为f=2d/(c+d),当(4)中的多态性位点的基因型组合为(ii)时,(5)中胎儿核酸含量的确定公式为f=(c-d)/(c+d),其中,c为第一读段中支持纯合基因型的读段的数目,d为第一读段中支持杂合基因型的读段的数目。
在本发明的一个具体实施方式中,(5)中胎儿染色体变异信息的确定包括:依据(4)中的比对结果中的第一读段中支持(4)中筛选出的多态性位点的读段数目,计算所述多态性位点的测序深度;利用全部或部分(4)中筛选出的位于同一染色体的多态性位点的测序深度,和/或所述多态性位点所在染色体的全部或部分区域的GC含量对所述多态性位点的测序深度进行校正,获得所述多态性位点的相对测序深度;将所述相对测序深度与正常对照样本同样位点的相对测序深度比较,二者具有显著性差异则确定所述多态性位点区域存在变异。
在本发明的一个具体实施方式中,(5)中胎儿染色体变异信息的确定,还包括:依据(4)中的比对结果中的第一读段中的有固定距离关系的成对读段的两个读段在参考序列上的距离,确定所述变异的类型,以L表示一对成对读段中的两个读段的固定距离,以L’表示该对成对读段中的两个读段在参考序列上的距离,当L’>L,则判定所述变异是缺失变异,当L’<L,则判定所述变异为插入变异;其中,所述有固定距离关系的成对读段来自一个测序文库的两端,所述测序文库的构建包含于(3)中的测序;在本发明的一个具体实施方式中,因实际建库时,获得的文库的大小通常不是一个固定数值而是处于一数值范围,比如建库时没有精确切胶或以其它方式纯化获得一固定大小的文库,这样,比如预构建的文库大小为500bp,最后获得的文库大小通常处于300-900bp,所以,更佳地,当L’≥2L,判定所述变异是缺失变异,当L’≤0.2L,判定所述变异为插入变异,检测更准确。
在本发明的一个具体实施方式中,(5)中胎儿染色体变异信息的确定,还包括:依据(4)中的比对结果中的第一读段中的不完全比对到参考序列上的所述多态性位点区域的读段信息,确定所述变异的精确位置和大小。确定所述变异的精确位置和大小包括:截取所述比对结果中的第一读段中的不完全比对到参考序列上的所述多态性位点区域的读段的不能比对上的部分,将截取的部分定义为一个割裂片段;将割裂片段比对到参考序列,获得割裂片段在参考序列上的位置;基于割裂片段在参考序列上的位置和该割裂片段所属读段在参考序列上的位置、以及所述两个位置在参考序列上的距离,确定所述变异的精确位置和大小。在本发明的一个具体实施方式中,覆盖了变异发生边界(断点)的包含割裂片断的割裂读段(soft clip reads),在比对过程中,割裂reads中主要的一部分会被正确比对上,另一部分同样具有高测序质量的序列,被标记为割裂片段(soft clip),用于进一步的数据分析。在利用这些割裂reads进行变异发生位置的精确检测之前,对这些割裂读段进行过滤,使得留下来的割裂读段的平均质量高于5、N的数目小于reads总长度的0.05、错配(mismatch)的个数不超过主要比对上的部分的0.05、并且soft clip部分的长度大于25bp。这样过滤进行割裂reads的质量控制可以保证割裂reads的主要比对的位置的准确性,而设置soft clip序列的长度使其不会太短,能使得soft clip部分的二次比对位置更加可信。
根据本发明的另一个实施方式,提供了一种检测孕妇体液样本中胎儿核酸变异的方法,所述核酸变异包括SNP、剪切位点突变、CNV和染色体非整倍性的至少一种,所述方法包括:利用本发明一方面的方法确定孕妇体液样本中胎儿核酸含量;基于所述胎儿核酸含量确定所述胎儿核酸变异检测所需的最低数据量;对第一DNA进行测序,获得不小于所述最低数据量的测序数据;基于所述测序数据,检测所述胎儿核酸变异。
在本发明的一个具体实施方式中,确定检测所需的最低数据量,包括:当胎儿核酸含量大于等于4%,所述最低数据量为0.18Gbp;当胎儿核酸含量为3%~4%,所述最低数据量为0.54Gbp。利用本发明一方面得方法确定胎儿核酸含量,当胎儿核酸含量低于3%,建议仍旧使用高深度测序获得大量数据并且开发其它数据处理方法以保证检测高准确率。
在本发明的一个具体实施方式中,所说的胎儿核酸变异检测包括检测以下基因的外显子区域的SNP:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、ATP7B、GAA和PKHD1。进一步地,还包括检测以下基因的外显子的上下游各10bp区域中的剪切位点突变:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、ATP7B、GAA和PKHD1。这些基因区域为典型遗传病发生相关区域。
根据本发明的再一个实施方式,提供了一种确定孕妇体液样本中胎儿核酸含量的装置,如图2所示,该装置包括:A1.样本获取单元,用以获取孕妇体液样本;B1.核酸提取单元,与A1单元连接,用于提取样本中的第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;C1.测序单元,与B1单元连接,用于对至少一部分的第一DNA测序以获得第一读段,对至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点;D1.比对筛选单元,与C1单元连接,接收B1单元的数据,用于实现将第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出C1中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;E1.核酸含量确定单元,与D1单元连接,接收D1单元的数据,用于依据获自D1的比对结果中的第一读段中支持D1中筛选出的多态性位点的读段数目,确定所述孕妇体液样本中胎儿核酸含量。该装置能够用于执行本发明一个实施方式中提供的确定孕妇体液样本中胎儿核酸含量的方法的部分或所有步骤,关于本发明一个实施方式中的确定孕妇体液样本中胎儿核酸含量的方法的优点及特征的描述,仍旧适用于该装置,在此不再赘述。
根据本发明的再一个实施方式,提供了一种同时确定孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息的装置,该装置包括:A2.样本获取单元,用以获取孕妇体液样本;B2.核酸提取单元,与A2单元连接,用于提取样本中的第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;C2.测序单元,与B2单元连接,用于对至少一部分的第一DNA测序以获得第一读段,对至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点;D2.比对筛选单元,与C2单元连接,接收B2单元的数据,用于实现将第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出C2中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;E2.核酸含量和变异确定单元,与D2单元连接,接收D2单元的数据,用于依据获自D2的比对结果中的第一读段中支持D2中筛选出的多态性位点的读段数目,同时确定所述孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息。该装置能够用于执行本发明一个实施方式中提供的同时确定孕妇体液样本中胎儿核酸含量和染色变异信息的方法的部分或所有步骤,关于本发明一个实施方式中的同时确定孕妇体液样本中胎儿核酸含量和染色体变异的方法的优点及特征的描述,仍旧适用于该装置,在此不再赘述。
根据本发明的再一个实施方式,提供了一种检测孕妇体液样本中胎儿核酸变异的装置,该装置包括:胎儿核酸含量确定单元,所述胎儿核酸含量的确定是通过本发明一方面提供的确定孕妇体液样本中胎儿核酸含量的方法进行的,获得胎儿核酸含量;最低数据量确定单元,与所述胎儿核酸含量确定单元连接,用于基于所述胎儿核酸含量确定所述胎儿核酸变异检测所需的最低数据量;测序单元,与所述最低数据量确定单元连接,用于对第一DNA进行测序,获得不小于所述最低数据量的测序数据,所述第一DNA获自所述孕妇体液样本,所述第一DNA为母体和胎儿DNA混合物;变异检测单元,与所述测序单元连接,接收来自所述测序单元的测序数据,基于所述测序数据,检测所述胎儿核酸变异。该装置能够用于执行本发明一个实施方式中提供的检测孕妇体液样本中胎儿核酸变异的方法的部分或所有步骤,关于本发明一个实施方式中的检测孕妇体液样本中胎儿核酸变异的方法的优点及特征的描述,仍旧适用于该装置,在此不再赘述。
本发明的实施方式中的方法和/或装置将胎儿DNA含量测定方法引入到变异检测中,使得可以在怀孕早期同步筛查孕妇单基因携带情况、胎儿SNP变异情况以及胎儿染色体非整倍性检测提供了可能。本发明提供了一种高效的、适于人群大规模使用的SNP或单基因病携带筛查的方法/装置。利用本发明的方法或装置,可以通过目标区域捕获同时实现点突变及拷贝数变异的检测,增加了目标区域捕获所能检出的致病突变类型,覆盖突变范围更广,减少了所需补充的实验种类。更适合于人群大规模检测使用,更适应于产前检测或者辅助产前检测。可以利用本发明的方法或装置,将单基因病检测引入到产前阶段,进一步丰富了可在产前进行检测的出生缺陷的种类,为早期预防出生缺陷提供了更多的可能。
在本发明中的“变异”、“核酸变异”、“基因变异”、“染色体变异”可通用,本发明中的“SNP”、“CNV”、“插入缺失”(indel)、“染色体非整倍性”、“剪切位点突变”同通常定义,但本发明中对各种变异的大小不作特别限定,这样这几种变异之间有的有交叉,比如SNP为单核酸突变,包括单核苷酸的插入和/或缺失,这样与插入缺失变异概念有交叉;又比如,CNV为拷贝数变异,当重复/缺失的为整条染色体时,即属于染色体异倍体。这些类型变异的大小交叉并不妨碍本领域人员通过上述描述执行实现本发明的方法和/或装置并且达到所描述的结果。
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。需要说明的是在本文中所使用的术语“第一”、“第二”等仅用于方便描述目的,而不能理解为指示或暗示相对重要性,也不能理解为之间有先后顺序关系。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
除另有交待,以下实施例中涉及的试剂及仪器,都是常规市售产品,比如购自Illumina公司。
实施例一:胎儿核酸含量确定
图1是基于一孕妇外周血样本检测胎儿非整倍体及孕妇SNP基因型、判断孕妇单基因病相关突变携带情况的流程图。图1流程可用于在早孕期进行胎儿非整倍体性及单基因病致病基因风险预测。该流程方法通过在早孕期(孕8-12周)采集孕妇外周血,通过两步离心法实现血浆与血细胞的分离。通过微量DNA提取技术实现血浆游离DNA的提取。使用血浆分离后剩余的血细胞直接提取孕妇DNA,或通过富集白细胞提取孕妇白细胞DNA。通过对血浆游离DNA进行高通量测序文库的构建,取部分文库DNA进行目标区域捕获检测,以确定相应样品血浆DNA中胎儿DNA的含量。根据胎儿DNA含量检测结果,确定血浆DNA测序文库所需的测序深度。通过对血浆DNA目标区域捕获测序或者全基因组低覆盖度测序数据的分析,得到胎儿染色体非整倍性的信息。同时,通过对孕妇白细胞DNA进行常见隐性遗传病待检区域的目标区域捕获测序,实现对孕妇单基因病携带情况的检测。根据孕妇血细胞DNA或白细胞DNA的检测结果,确定胎儿是否有携带某种致病突变的风险。若孕妇不携带相应致病突变,则表明胎儿患病风险较低。若孕妇携带了相应的隐性遗传病的致病突变,则需对孕妇的丈夫进行相同基因的隐性遗传病致病突变的检测,若其丈夫相同基因不携带致病突变,则胎儿患病风险低。若其丈夫相同基因携带致病突变,则胎儿患病风险较高。
胎儿非整倍体的检测流程是血浆及孕妇血细胞提取DNA后,分别将DNA进行加上带有样品识别标签的测序接头。对加接头后的DNA进行PCR扩增。取部分DNA进行目标区域捕获测序,所用捕获方法可以为液相捕获也可以使用固相捕获的方式。捕获区域为人群中杂合率高的SNP位点(minor allele frequency,MAF在0.4~0.5之间),平均每条染色体分布至少100个需捕获的SNP位点。通过对血浆游离DNA目标区域捕获文库及孕妇血细胞DNA目标区域捕获文库的的高通量测序,利用获得的数据对血浆DNA中胎儿DNA含量进行估计。根据胎儿DNA含量,确定使用孕妇血浆DNA进行胎儿染色体非整倍体性检测时,所要达到的整体的测序深度。测序按照常规测序方法进行,测序平台可选择如Hiseq2000、Hiseq2500、Miseq和单分子测序平台等等,根据测序量的不同和样本数,可以灵活选择合适的测序平台,依据所选测序平台构建适合该平台的测序文库。
具体的检测流程如下:
采集孕妇5ml外周血(样本来自天津市妇幼保健院),将采血管(内装有全血)置于离心机内,在4℃条件下以1600g离心10min,离心结束后将上清(血浆)平均分装到多个置于冰盒上且已编号的2.0mL的EP管中。将8.1分离好的血浆置于离心机内,在4℃条件下以16000g离心10min,以去除残余细胞,离心结束后在冰盒上将上清转入新的已编号2.0mL EP管中,得到孕妇血浆。
通过微量DNA提取技术提取血浆游离DNA,使用TIANamp Micro DNA Kit(DP316)基因组DNA提取试剂盒,具体操作见操作手册(www.tiangen.com)。
在血浆游离DNA模板两端加上接头,并通过PCR对所得DNA片段进行扩增,并同时给各样品加上唯一识别序列用于区分不同的样品。最终获得高通量测序文库。
通过目标区域特异探针对血浆游离DNA文库中特定的SNP位点进行捕获富集。所选用的SNP位点为可用于胎儿DNA含量测定的SNP位点。该SNP类位点人群中杂合率高的SNP位点(minor allele frequency,MAF在0.4~0.5之间),平均每条染色体可以分布100个需捕获的SNP位点。后续可以依据这些SNP检测染色体非整倍性。
同时对孕妇外周血细胞所提取DNA构建文库进行相同的SNP位点的目标区域捕获富集。
对血浆游离DNA及孕妇外周血细胞DNA目标区域捕获测序文库进行高通量测序。测序平台可选择如Hiseq2000,或者Hiseq2500,Miseq或单分子测序平台等等,根据测序量的不同和样本数,可以灵活选择合适的测序平台。
选择孕妇外周血细胞DNA测序为纯合,而在血浆中出现与孕妇外周血细胞DNA不同的基因型的SNP位点进行血浆中胎儿DNA含量的估计。假设某一SNP位点孕妇外周血DNA测序数据为AA,而血浆游离DNA测序结果显示该位点存在a基因型,若支持A的测序reads数为c,支持a的测序reads数为d,则血浆游离DNA中胎儿DNA含量为f=2d/(c+d)。
实施例二:胎儿SNP基因型及单基因病风险判断、胎儿染色体变异检测
根据上述胎儿DNA含量,选定相应的低覆盖度测序乘数及相应的生物信息分析方法。对未经目标区域捕获的血浆DNA来源的测序文库文库进行全基因组低覆盖的测序,并进行胎儿非整倍性判断。对于胎儿DNA含量在4%以上的血浆样品,测序数据量需0.18Gbp,对于胎儿DNA含量在3-4%的样品,测序数据量需达0.54Gbp,对胎儿DNA含量不足3%的不进行分析。
根据所选的测序平台,在这边使用的Illumina Hiseq2000,通过孕妇白细胞提取DNA,打断成小片段DNA后,将DNA进行加上带有样品识别标签的测序接头。通过PCR进行DNA扩增。将DNA进行芯片捕获,该芯片上覆盖有相应的单基因病相关基因的目标区域捕获探针,可以和DNA进行目标区域捕获,探针芯片可以定制,比如向Agilent公司或NimbleGen公司定制,也可自己设计合成。捕获到的目的DNA进行PCR富集后,按照常规测序方法进行测序。具体的检测流程如下:
a)采集孕妇5ml外周血,通过两步离心法,分离血浆与血细胞
b)通过孕妇白细胞提取孕妇DNA
c)将样本DNA超声打断成100-200bp小片段
d)文库构建:在小片段DNA模板两端加接头,并通过PCR进行扩增,并同时给样品加上唯一识别序列,同时实现测序所需序列的添加
e)目标区域文库:通过目标区域特异探针捕获富集待测单基因病的关键基因区域。该实施例种芯片设计的基因涵盖了常见高发的几种单基因病关键区域,如表1所示,探针覆盖范围为各基因的外显子区以及外显子向内含子区域延伸30bp的区域,这边,延伸30bp是为了捕获相应区域使得可以获得相应区域的数据以及检测到外显子正负10bp内发生的剪切突变,其中,对于地中海贫血基因,还在常见的alpha地中海贫血缺失型所涉及的断裂点,以及beta地中海贫血缺失型所涉及的断裂点附近设计捕获探针,如表2。针对CYP21A2基因,除去捕获外显子区域外,还在已报道的重组位点处设计捕获探针,位置如表3所示。
f)目标区域捕获文库上机测序,各样品总体测序深度300-500X。本实验采用hiseq2000PE101+8+101(双末端测序,reads长度101bp,标签长度8bp)程序进行上机测序。
表1 疾病名称及基因
序号 疾病 基因
1 地中海贫血(α、β) HBA1、HBA2、HBB
2 镰形细胞贫血症 HBB
3 遗传性耳聋 GJB2、SLC26A4
4 脊肌萎缩症 SMN1
5 进行性肌营养不良 DMD
6 半乳糖血症 GALT
7 苯丙酮尿症 PAH
8 血友病(甲型、乙型) F8、F9
9 肝豆状核变性 ATP7B
10 糖原累积病(2型) GAA
11 隐性多囊肾 PKHD1
表2 常见缺失型地中海贫血断点捕获区域
类型 染色体(Chr) 起始位置(start) 终止位置(end)
Beta地贫
Gγ+(Aγδβ)0 11 5191148 5270051
(SEA)-HPFH 11 5222878 5250288
YunnaneseGγ(Aγδβ)0 11 5180696 5271217
Cantonese Gγ(Aγδβ)0 11 5240000 5271087
Cantonese Gγ(Aγδβ)0 11 5246696 5271087
Taiwanese 11 5247493 5248849
Lepore-Boston-Washington 11 5247800 5255214
alpha地贫
__THAI 16 199800 233300
FIL 16 200820 232670
SEA 16 215400 234700
α4.2 16 219,498~219,817 223,755~224,074
α3.7 16 223300 227103
表3 CYP21A2缺失型重组位点捕获区域
类型 染色体(Chr) 起始位置(start) 终止位置(end)
CH-1 chr6 32006910 32007203
CH-2 chr6 32007325 32007574
CH-3 chr6 32008198 32008312
CH-5 chr6 32007966 32008198
CH-6 chr6 32006858 32006910
CH-7 chr6 32007593 32007966
CH-8 chr6 32008312 32008538
CH-4 chr6 32006337 32006633
CH-9 chr6 32006797 32006804
TNXA/TNXB-1 chr6 32009385 32009634
TNXA/TNXB-2 chr6 32011678-32011716 32013627
TNXA/TNXB-3 chr6 32013627 32013899
g)测序后获得的原始数据由Illuminabasecalling Software 1.7进行处理,经过过滤去污染、使用SOAPaligner 2.20(Li R,Li Y,Kristiansen K,et al,SOAP:shortoligonucleotide alignment program.Bioinformatics 2008,24(5):713-714;Li R,YuC,Li Y,ea al,SOAP2:an improved ultrafast tool for short readalignment.Bioinformatics 2009,25(15):1966-1967.)比对参考基因组,获得唯一比对到基因组上的唯一读段(Unique mapped reads)。靶区域的基因型由SOAPsnp(Li R,Li Y,Fang X,Yang H,et al,SNP detection for massively parallel whole-genomeresequencing.Genome Res 2009,19(6):1124-1132.)确定。
h)通过对某一段区域内测序读段(reads)的深度变化判断相应区段内是否存在拷贝数变异。该方法适用于一个或多个外显子,乃至整个基因的缺失的检测。基因组上的一段区域发生缺失或者重复后,会在测序深度上产生明显的变化。重复了N次的序列(本身就是基因组上重复的序列的除外)深度会变为正常2拷贝时的大约N/2倍,而杂合缺失和纯合缺失则分别变为大约1/2倍和接近0,根据这一特性,在对测序深度的信号进行GC修正后,再利用样本间的深度相关性,可以用算法将深度信号发生异常的区间识别出来,并做相应的拷贝数预测和可信度评估。比如,依据血浆DNA测序比对结果中的支持所选的SNP的读段数目,计算SNP的测序深度;利用全部或部分位于同一染色体的SNP筛选出的多态性位点的测序深度,和/或所述多态性位点所在染色体的全部或部分区域(目标区域)的GC含量对所述多态性位点的测序深度进行校正,获得所述多态性位点的相对测序深度;将所述相对测序深度与正常对照样本同样位点的相对测序深度比较,二者具有显著性差异则确定该SNP位点区域存在变异。正常对照样本同样位点的相对测序深度的确定过程可以参考待测样本进行,可以预先获得或者与待测样本同时建库测序获得。
依据血浆测序数据比对结果中的混合核酸测定序列(读段)中的有固定距离关系的成对读段的两个读段在参考序列上的距离,确定CNV的类型,以L表示一对成对读段中的两个读段的固定距离,以L’表示该对成对读段中的两个读段在参考序列上的距离,当L’>L,则判定所述变异是缺失变异,当L’<L,则判定所述变异为插入变异;其中,所述有固定距离关系的成对读段来自一个测序文库的两端,比如通过双末端测序获得,一对reads之间的距离为文库构建时插入片段的大小。而在实际建库时,获得的文库的大小通常不是一个固定数值而是处于一数值范围,比如建库时没有精确切胶或以其它方式纯化获得一固定大小的文库,这样,比如预构建的文库大小为500bp,最后获得的文库大小通常处于300-900bp,所以,更佳地,当L’≥2L,判定所述变异是缺失变异,当L’≤0.2L,判定所述变异为插入变异,检测更准确。以缺失型的检测为例,以插入片段500bp大小文库为例,若一个片段两端reads,比对到基因组上,发现其基因组距离大于1k,则表明发生了缺失。
此外,还使用割裂reads(soft clip reads)进行检测,当reads本身覆盖到发生SV(结构变异)的断点时,reads本身的序列以断点为界被分为二段,并且对于同一个SV,当有呈不同断开情况的reads支持在同一个断点上。
在实验测序得到的reads在比对过程中,这样的read会被明显的被识别为2部分,其中主要的一部分记为正确比对的部分,二段的另一部分通常是没法比对上的,但却具有较高的质量值。将未比对上的reads的部分(soft clip部分)取出来单独分析,在基于softclip reads长度,测序质量等等过滤条件下,挑选出高可信的soft clip reads。在试验测序中覆盖了断点(变异发生的边界)的soft clip reads,在比对过程中,其中主要的一部分会被正确比对上,另一部分同样具有高测序质量的序列,会被标记为soft clip,用于进一步的数据分析。通过一定的质量控制,例如看PE reads的插入长度是否位于合理范围,比如基本为预期文库的大小即为正常。在此,取soft clip reads的平均质量高于5,N的数目小于该reads长度的0.05,错配(mismatch)的个数不超过主要比对上的部分的0.05,并且softclip部分的长度大于25bp的割裂reads。质量控制可以保证割裂reads的主要比对的位置的准确性,而设置soft clip序列的长度使其不会太短,能使得soft clip部分的二次比对位置更加可信。将其重新比对得到的断开处的比对位置和原始soft clip reads的断点位置进行分析和统计,就可以检出SV发生的具体情况。对于缺失的检出可以直接给出精确的位置和长度,对于重复结合CNV结果的判断可以精确判断发生重复的长度,位置和重复类型。将这种reads中soft clip的序列,单独提取出来进行二次比对,通过对比二次比对得到的位置和主要部分比对上的位置,就可以得到缺失、或者重复的断点。再通过一定的缺失、重复长度和支持数的控制(与测序量有关),就可以给出较可信的精确断点位置,在结合CNV结果,就可以得到发生缺失、重复的位置、长度、类型。
对soap比对中发现的某一reads不同部分比对到基因组不同位置,且该两段区域间距远大于文库理论的插入片段的reads进行分析,以判断是否存在序列缺失的突变,特别适用于缺失型alpha地中海贫血,缺失型beta地中海贫血以及CYP21A2基因缺失的检测。
该实施例通过在非整倍体检测实验流程中,引入目标区域捕获特异SNP位点,通过母胎差异的SNP位点实现对血浆DNA中胎儿来源的DNA含量的统计,并以此为基础,进一步确定相应样品所需的测序乘数及分析方法,从而实现可在早孕期低胎儿DNA含量的情况下,通过孕妇外周血浆实现无创产前非整倍体检测,从而为与早孕期同步进行孕妇单基因病携带情况筛查提供了实施可能。而在单基因病携带情况筛查方面,则结合了探针设计方式及相应的生物信息分析流程,实现通过目标区域捕获快速检测单基因病关键基因区域的点突变及拷贝数变化信息,实现快速、高效、高突变覆盖的单基因携带者筛查。通过对无创产前非整倍体检测及单基因携带者筛查技术的优化调整结合,实现于早孕期一次抽血,同步对胎儿非整倍体及单基因病患病风险进行预测。
i)测序后的数据经过处理,用本领域内技术人员开发的胎儿DNA含量估计方法对其含量进行计算。并采取相对应的信息分析流程对血浆游离DNA低覆盖度测序结果进行分析,获得胎儿是否存在染色体非整倍体。同时利用开发的点突变及拷贝数变异检测流程对孕妇是否携带单基因病致病基因进行检测。检测结果如表4和表5所示。
表4 孕12周血浆游离DNA胎儿非整倍体检测
样本信息 21染色体 18染色体 13染色体 随访结果
1-外周血浆DNA 正常 正常 正常 正常
2-外周血浆DNA 正常 正常 正常 正常
表5 血细胞DNA用于单基因病携带者筛查

Claims (2)

1.同时确定孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息的装置,包括:
A2.样本获取单元,用以获取孕妇体液样本;
B2.核酸提取单元,与A2单元连接,用于提取样本中的第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA;
C2.测序单元,与B2单元连接,用于对至少一部分的第一DNA测序以获得第一读段,对至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点,所述第一读段中包含有固定距离关系的成对读段,所述有固定距离关系的成对读段来自同一个测序文库的两端;
D2.比对筛选单元,与C2单元连接,接收B2单元的数据,用于实现将第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出C2中的多态性位点中在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点;
E2.核酸含量和变异确定单元,与D2单元连接,接收D2单元的数据,用于依据获自D2的比对结果中的第一读段中支持D2中筛选出的多态性位点的读段数目,同时确定所述孕妇体液样本中胎儿核酸含量和胎儿染色体变异信息,所述胎儿染色体变异信息包括插入缺失,其中包括进行,
依据D2单元中的比对结果中的第一读段中支持D2单元中筛选出的多态性位点的读段数目,计算胎儿核酸含量和所述多态性位点的测序深度,
利用全部或部分D2单元中筛选出的位于同一染色体的多态性位点的测序深度,和/或所述多态性位点所在染色体的全部或部分区域的GC含量对所述多态性位点的测序深度进行校正,获得所述多态性位点的相对测序深度,
将所述相对测序深度与正常对照样本同样位点的相对测序深度比较,二者具有显著性差异则确定所述多态性位点区域存在变异,还包括进行,
依据D2单元中的比对结果中的第一读段中的有固定距离关系的成对读段的两个读段在参考序列上的距离,确定所述变异的类型,以L表示一对成对读段中的两个读段的固定距离,以L’表示该对成对读段中的两个读段在参考序列上的距离,
当L’>L,则判定所述变异是缺失变异,
当L’<L,则判定所述变异为插入变异。
2.检测孕妇体液样本中胎儿核酸变异的装置,包括:
胎儿核酸含量确定单元,用于确定所述胎儿核酸含量,其中包括进行,
获得所述孕妇体液样本,
从所述孕妇体液样本中提取第一DNA和第二DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母体基因组DNA,
对至少一部分的第一DNA测序以获得第一读段,对至少一部分的第二DNA进行测序以获得第二读段,所述第一读段和所述第二读段中包含多个多态性位点,
将第一读段和第二读段分别与参考序列比对,基于获得的比对结果,筛选出在第二DNA只有一种基因型并且在第一DNA有两种基因型的多态性位点,
依据所述比对结果中的第一读段中支持筛选出的多态性位点的读段数目,确定所述孕妇体液样本中胎儿核酸含量;
最低数据量确定单元,与所述胎儿核酸含量确定单元连接,用于基于所述胎儿核酸含量确定所述胎儿核酸变异检测所需的最低数据量;
测序单元,与所述最低数据量确定单元连接,用于对第一DNA进行测序,获得不小于所述最低数据量的测序数据,所述第一DNA获自所述孕妇体液样本,所述第一DNA为母体和胎儿DNA混合物,所述测序数据包含有固定距离关系的成对读段,所述有固定距离关系的成对读段来自同一个测序文库的两端;
变异检测单元,与所述测序单元连接,接收来自所述测序单元的测序数据,基于所述测序数据,检测所述胎儿核酸变异,所述胎儿核酸变异包括插入缺失,其中包括进行,
依据所述测序单元中的测序数据支持筛选出的多态性位点的读段数目,计算所述多态性位点的测序深度,
利用全部或部分所述胎儿核酸含量确定单元中筛选出的位于同一染色体的多态性位点的测序深度,和/或所述多态性位点所在染色体的全部或部分区域的GC含量对所述多态性位点的测序深度进行校正,获得所述多态性位点的相对测序深度,
将所述相对测序深度与正常对照样本同样位点的相对测序深度比较,二者具有显著性差异则确定所述多态性位点区域存在变异,还包括进行,
依据所述测序单元中的测序数据中的有固定距离关系的成对读段的两个读段在参考序列上的距离,确定所述变异的类型,以L表示一对成对读段中的两个读段的固定距离,以L’表示该对成对读段中的两个读段在参考序列上的距离,
当L’>L,则判定所述变异是缺失变异,
当L’<L,则判定所述变异为插入变异。
CN201410484128.XA 2014-09-19 2014-09-19 同时确定胎儿核酸含量和染色体非整倍性的方法及装置 Active CN104232777B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410484128.XA CN104232777B (zh) 2014-09-19 2014-09-19 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
HK15102367.4A HK1201886A1 (zh) 2014-09-19 2015-03-09 同時確定胎兒核酸含量和染色體非整倍性的方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410484128.XA CN104232777B (zh) 2014-09-19 2014-09-19 同时确定胎儿核酸含量和染色体非整倍性的方法及装置

Publications (2)

Publication Number Publication Date
CN104232777A CN104232777A (zh) 2014-12-24
CN104232777B true CN104232777B (zh) 2016-08-24

Family

ID=52221667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410484128.XA Active CN104232777B (zh) 2014-09-19 2014-09-19 同时确定胎儿核酸含量和染色体非整倍性的方法及装置

Country Status (2)

Country Link
CN (1) CN104232777B (zh)
HK (1) HK1201886A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105803054A (zh) * 2014-12-31 2016-07-27 天津华大基因科技有限公司 试剂盒及其在检测唇腭裂相关基因中的用途
CN107109324B (zh) * 2015-01-16 2019-11-08 深圳华大基因股份有限公司 确定胎儿核酸含量的方法和装置
US10319463B2 (en) * 2015-01-23 2019-06-11 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations
CN104789466B (zh) * 2015-05-06 2018-03-13 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置
US10395759B2 (en) * 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
CN104951671B (zh) * 2015-06-10 2017-09-19 东莞博奥木华基因科技有限公司 基于单样本外周血检测胎儿染色体非整倍性的装置
CN106544407B (zh) * 2015-09-18 2019-11-08 广州华大基因医学检验所有限公司 确定受体cfDNA样本中供体来源cfDNA比例的方法
CN106701897A (zh) * 2015-11-12 2017-05-24 深圳华大基因研究院 同时检测基因点突变、插入/缺失和cnv的方法及设备
CN106190775A (zh) * 2016-08-08 2016-12-07 合肥安为康医学检验有限公司 胎儿dna无创检测设备
CN108277267B (zh) * 2016-12-29 2019-08-13 安诺优达基因科技(北京)有限公司 检测基因突变的装置和用于对孕妇和胎儿的基因型进行分型的试剂盒
CN106939334B (zh) * 2017-01-13 2021-01-08 天昊生物医药科技(苏州)有限公司 一种孕妇血浆中胎儿dna含量的检测方法
CN106755486A (zh) * 2017-01-19 2017-05-31 人和未来生物科技(长沙)有限公司 无创产前胎儿β 型地贫基因突变检测文库构建方法、检测方法和试剂盒
CN106755485A (zh) * 2017-01-19 2017-05-31 人和未来生物科技(长沙)有限公司 无创产前胎儿α 型地贫基因突变检测文库构建方法、检测方法和试剂盒
WO2020113577A1 (zh) * 2018-12-07 2020-06-11 深圳华大生命科学研究院 一种靶基因文库的构建方法、检测装置及其应用
CN109584959B (zh) * 2018-12-27 2020-10-27 北京优迅医学检验实验室有限公司 测序深度的矫正方法及装置
DK3916105T3 (da) * 2019-08-14 2023-04-17 Bgi Genomics Co Ltd Fremgangsmåde og indretning til bestemmelse af en føtal nukleinsyrekoncentration i blodet af en gravid kvinde
CN111091868B (zh) * 2019-12-23 2020-09-25 江苏先声医学诊断有限公司 一种染色体非整倍体的分析方法及系统
AU2019480813A1 (en) * 2019-12-31 2021-12-16 Bgi Clinical Laboratories (Shenzhen) Co., Ltd. Methods for determining chromosome aneuploidy and constructing classification model, and device
CN114945685A (zh) * 2020-01-17 2022-08-26 深圳华大生命科学研究院 确定胎儿核酸浓度的方法以及胎儿基因分型方法
CN111139297B (zh) * 2020-04-02 2020-07-03 北京大学第三医院(北京大学第三临床医学院) 用于dmd的植入前胚胎遗传学诊断和产前诊断的试剂盒
WO2023010242A1 (zh) * 2021-08-02 2023-02-09 深圳华大生命科学研究院 估计无创产前基因检测数据中胎儿核酸浓度的方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103384725A (zh) * 2010-12-23 2013-11-06 塞昆纳姆股份有限公司 胎儿遗传变异的检测
WO2014132244A1 (en) * 2013-02-28 2014-09-04 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103384725A (zh) * 2010-12-23 2013-11-06 塞昆纳姆股份有限公司 胎儿遗传变异的检测
WO2014132244A1 (en) * 2013-02-28 2014-09-04 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing

Also Published As

Publication number Publication date
HK1201886A1 (zh) 2015-09-11
CN104232777A (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
CN104232777B (zh) 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
Ulirsch et al. The genetic landscape of Diamond-Blackfan anemia
CN104232778B (zh) 同时确定胎儿单体型及染色体非整倍性的方法及装置
CN104221022B (zh) 一种拷贝数变异检测方法和系统
CN106544407B (zh) 确定受体cfDNA样本中供体来源cfDNA比例的方法
CN105392894B (zh) 确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质
CN104531883B (zh) Pkd1基因突变的检测试剂盒及检测方法
EP3026124A1 (en) Non-invasive method for detecting a fetal chromosomal aneuploidy
CN106834502A (zh) 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法
JP2017176181A (ja) 胎児の染色体異数性の診断
CN104846089B (zh) 一种孕妇外周血中胎儿游离dna比例的定量方法
CN105555970B (zh) 同时进行单体型分析和染色体非整倍性检测的方法和系统
HUE030510T2 (hu) Magzati kromoszómális aneuploidia diagnosztizálása genomszekvenálás alkalmazásával
CN106834490A (zh) 一种鉴定胚胎平衡易位断裂点和平衡易位携带状态的方法
CN112126677B (zh) 耳聋单倍型基因突变无创检测方法
CN107541561B (zh) 提高母体外周血中胎儿游离dna浓度的试剂盒、装置及方法
TR201815541T4 (tr) Fetüslü gebe bir dişi denekten alınan bir biyolojik numunenin analiz yöntemi.
CN108604258B (zh) 染色体异常判断方法
CN105648045A (zh) 确定胎儿目标区域单体型的方法和装置
EP4128244A1 (en) Determining tumor fraction for a sample based on methyl binding domain calibration data
CN111508561B (zh) 同源序列和同源序列中串联重复序列的检测方法、计算机可读介质和应用
CN116287204A (zh) 检测特征基因的突变情况在制备静脉血栓栓塞症风险检测产品中的应用
CN106282195A (zh) 基因突变体及其应用
CN108060227A (zh) 一种检测pah基因突变的扩增引物、试剂盒及其检测方法
CN104232649A (zh) 基因突变体及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1201886

Country of ref document: HK

CB02 Change of applicant information

Address after: 300308, room 101, building 3, 201, airport business park, 80 Ring Road North Airport Economic Zone, Tianjin Binhai New Area

Applicant after: TIANJIN BGI TECHNOLOGY CO., LTD.

Applicant after: BGI SHENZHEN CO LTD

Address before: 300308, room 101, building 3, 201, airport business park, 80 Ring Road North Airport Economic Zone, Tianjin Binhai New Area

Applicant before: TIANJIN BGI TECHNOLOGY CO., LTD.

Applicant before: Shenzhen BGI Medicine Co., Ltd.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1201886

Country of ref document: HK

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181022

Address after: Room 201-1, Building 3, East District, Airport Business Park, No. 80 Huanbei Road, Free Trade Zone (Airport Economic Zone) of Tianjin Binhai New Area, 300308

Co-patentee after: TIANJIN BGI TECHNOLOGY CO., LTD.

Patentee after: Tianjin Huada medical laboratory Co., Ltd.

Co-patentee after: BGI SHENZHEN CO LTD

Address before: 300308 Tianjin Binhai New Area Airport Economic Zone, 80 North Road business park east 3, building 101, 201.

Co-patentee before: BGI SHENZHEN CO LTD

Patentee before: TIANJIN BGI TECHNOLOGY CO., LTD.