CN111951890A - 染色体和单基因病同步产前筛查的方法、试剂盒和分析系统 - Google Patents

染色体和单基因病同步产前筛查的方法、试剂盒和分析系统 Download PDF

Info

Publication number
CN111951890A
CN111951890A CN202010815673.8A CN202010815673A CN111951890A CN 111951890 A CN111951890 A CN 111951890A CN 202010815673 A CN202010815673 A CN 202010815673A CN 111951890 A CN111951890 A CN 111951890A
Authority
CN
China
Prior art keywords
fetus
chromosome
fetal
snp
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010815673.8A
Other languages
English (en)
Other versions
CN111951890B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bohao Yuntian Intelligent Manufacturing Beijing Technology Co Ltd
Beijing Bohao Yuntian Technology Co ltd
Original Assignee
Bohao Yuntian Intelligent Manufacturing Beijing Technology Co Ltd
Beijing Bohao Yuntian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bohao Yuntian Intelligent Manufacturing Beijing Technology Co Ltd, Beijing Bohao Yuntian Technology Co ltd filed Critical Bohao Yuntian Intelligent Manufacturing Beijing Technology Co Ltd
Priority to CN202010815673.8A priority Critical patent/CN111951890B/zh
Publication of CN111951890A publication Critical patent/CN111951890A/zh
Priority to AU2021323854A priority patent/AU2021323854A1/en
Priority to EP21855607.4A priority patent/EP4200857A1/en
Priority to GB2302027.4A priority patent/GB2615204A/en
Priority to PCT/CN2021/112314 priority patent/WO2022033557A1/en
Application granted granted Critical
Publication of CN111951890B publication Critical patent/CN111951890B/zh
Priority to US17/938,570 priority patent/US20230272473A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种用于胎儿染色体拷贝数变异、胎儿染色体微缺失/微重复、和/或显性单基因突变的无创产前筛查的检测方法、试剂盒、及其系统。以及本发明还提供了一种靶向捕获探针的设计方法,所述方法用于胎儿无创产前筛查。与现有的无创产前筛查检测方法相比,能够扩大临床基因检测适用范围、提高检测准确性。

Description

染色体和单基因病同步产前筛查的方法、试剂盒和分析系统
技术领域
本发明提供涉及一种用于胎儿染色体拷贝数变异、胎儿染色体微缺失/微重复、和/或显性单基因突变的无创产前筛查的检测方法、试剂盒、及其系统,以及一种用于胎儿无创产前筛查的靶向捕获探针的设计方法。
背景技术
出生缺陷是指胎儿在母体子宫内的生长发育异常,导致出生时已存在的先天性缺陷。我国人口众多,每年新增出生缺陷的人数约为90万,出生缺陷的发生率约为5.6%[1]。出生缺陷是造成婴幼儿死亡和残疾的主要原因,已成为影响人民群众健康水平的重大公共卫生问题,社会和经济负担沉重。
遗传因素是造成出生缺陷的重要原因,染色体异常和单基因遗传病均可引起多种类型的出生缺陷。染色体异常主要是拷贝数异常和结构性异常,最常见的拷贝数异常是染色体非整倍体异常,出生时发病率约为1/160[2]。染色体非整倍体是指染色体数目与二倍体基因组(46、XX或46、XY)之间的差异,通常是一条染色体的冗余或缺失。临床上最常见的染色体非整倍体遗传病包括21号染色体(T21,唐氏综合征)、18号染色体(T18,爱德华综合征)和13号染色体(T13,帕托综合征),这些遗传病常导致胎儿结构异常、多器官畸形和发育障碍,死亡率和致残率较高,目前尚无有效治疗方法。染色体结构异常主要有微缺失(microdeletion)和微重复(microduplication),常见的有22q11.2、1p36、5q缺失综合征等[2]。
根据上述染色体非整倍体的情况,孕期筛查和产前诊断是预防和控制出生缺陷的有效手段。传统的筛查方式包括血清学检查和影像学检查,即通过检测孕期不同阶段母体血清中各种生物标志物水平的变化,结合超声影像学观察,评估胎儿遗传缺陷的风险,并通过胎盘绒毛膜取样(CVS)或羊水穿刺术确定产前诊断[3]。这些方法的缺点是血清学检查灵敏度不高(约69-96%),对上述3种三体综合征的假阳性率较高(约5%)[4]。另外,产前诊断虽然具有较高的敏感性和特异性,但属于侵入性检查,可能会给胎儿带来一定的流产风险(约0.5-1%)[2]。因此,研究开发新型的无创性筛查技术,在不增加妊娠风险的前提下,进一步提高分析方法的灵敏度和特异性,特别是减少现有技术在大规模临床应用过程中因技术的局限性而造成的假阳性和假阴性检测结果,是我们提高染色体异常疾病产前筛查临床效果的重点科研和临床研究方向。
孕期母体血浆中胎儿游离DNA(cfDNA)的发现,推动了无创产前筛查(NIPS)技术的发展及其临床应用[5]。自2011年起,NIPS作为一种产前筛查检测方法在全国范围内向孕妇提供,其敏感性和特异性以及临床验证性已通过数十万份临床样本的验证[6]。目前普遍认为,胎儿游离DNA来源于胎儿胎盘组织中的凋亡细胞,在母体外周血中的浓度随时间的变化而变化,产后迅速被母体清除[7,8]。由于胎儿游离DNA中含有胎儿的遗传信息,因此可以通过适当的检测方法(定量PCR、数字PCR、高通量测序等)来筛查染色体异常,获得胎儿遗传缺陷的风险,而且其无创性也可以避免孕妇流产的风险。目前已广泛应用于染色体非整倍体无创产前筛查(NIPS),可在孕早期(9-12周)进行,以母体外周血为样本,取样方法简单、安全,对T21、T18、T13等染色体非整倍体检测具有较高的灵敏度(约97-99%)和较低的假阳性率(<0.1%),已被临床实践广泛验证和认可[9-13]。目前主流的NIPS检测方法主要是基于下一代测序(NGS),利用大规模并行测序(massively parallel sequencing)的原理,分析样本中母体和胎儿DNA片段的读数(reads)深度,WGS通过测定目标染色体上的读数与相应的二倍体参考染色体上的读数之比来确定胎儿目标染色体的数量。虽然该方法可以有效地检测到T21、T18和T13等常见的染色体非整倍体,以及一些大片段的微缺失/微重复,但WGS方法在实际检测中对胎儿DNA游离的比例(尤其是对女性胎儿)的定量不准确,可能会对有效样本的解读产生偏差,影响检测的可靠性。此外,低深度测序WGS方法对染色体小片段的微缺失/微重复的灵敏度较低,无法检测三倍体、消失双胎综合征等。此外,由于无法识别常见的母体低丰度的嵌合体(如45X),临床上常出现假阳性结果[14]。
根据实验原理和数据分析算法的不同,采用NGS技术的胎儿游离DNA染色体非整倍体检测方法有两种。除上述基于低深度全基因组测序(WGS)的方法外,还有基于靶向测序的单核苷酸多态性(SNP)方法[15]。本发明采用基于SNP靶向高深度测序基因分型(SNP-靶向高深度测序基因分型)的定量分析方法对NIPS进行定量分析,显示出其相对于WGS方法的优势(见下表)。该方法的特点是利用母体基因型信息和SNP群体频率估计的父体基因型来构建染色体拷贝数变异引起的可能的胎儿正常或异常基因型,该方法的特点是利用母体基因型信息和SNP群体频率估计的父体基因型来构建可能的胎儿正常或异常基因型。然后将每个SNP位点的理论预测值MAF(minor allele fraction)与实际血浆游离DNA测量值进行比较,计算出每个胎儿基因型的概率。由于该方法只考察每个SNP位点的游离DNA的MAF的定量变异来推导出可能的胎儿基因型,因此不需要像WGS的NIPS那样使用二倍体参比染色体,从而简化了试验操作和分析要求。但是,目前的SNP方法是基于多倍体PCR,这种扩增技术对于高片段游离DNA的分析容易出现ADO(等位基因缺失),因此需要同时分析约20000个SNP位点,以提高染色体拷贝数定量的信噪比[14]。
WGS方法通过全基因组测序获取所有染色体的测序数据(读数),利用非整倍体特异性算法检测目标染色体的读数相对增减,检测游离DNA中的胎儿源比例(fetalfraction,FF),通过读数分布和量化统计计算出染色体数目异常(三体或单体)的风险概率。相比之下,SNP方法并不对所有的染色体进行全染色体测序,而是只对基因组中一定数量的多态位点进行定量基因分型,通过测量不同来源(胎儿或母体)游离DNA对基因型信号贡献的差异,计算出FF和非整倍体的风险概率。对于每个SNP位点,胎儿基因组的贡献(例如,C/C,C为100%)在一定程度上影响母体基因组中的等位基因平衡(例如,C/T,C为50%),因此,胎儿的基因型与母体的基因型不同,FF为10%,在该等位基因位点上孕妇外周血中游离DNA平衡的C移位从50%到55%。因此,SNP方法可以通过分析基因组不同区域的数千个SNP位点,根据其等位基因的平衡偏移,推断出非整倍体的风险概率。对于这两种方法,其最终目的是通过特定染色体或基因组区域的读数或SNP位点的等位基因平衡来计算拷贝数变异。
目前,WGS方法(如Illumina)[16]和SNP方法(如Natera)[17]在国际上得到了广泛的应用,而在我国,目前临床应用的几乎都是WGS方法[18,19]。在实际应用中,WGS方法有很多局限性,其灵敏度和特异性受胎儿游离DNA百分比的限制,对微缺失/微重复检测灵敏度低,双胎妊娠和双胎单胎存活率难以检测等。另外,WGS法需要更多的测序数据,成本较高,而SNP法由于是基因分型的靶向测序,可以避免在非靶点染色体上进行不必要的测序读数。对诸如22q11.2del综合征缺失片段在0.5-3Mb以内的染色体微缺失/微重复疾病,可以根据特定染色体区域设计靶向富集扩增引物对目标染色体定向测序分析,实现更高的检测效率[20]。
[1]中华人民共和国卫生部.《中国出生缺陷防治报告》.2012.
[2]Nussbaum RL,Mclnnes RR,Willard HF.Thompson&Thompson Genetics inMedicine.8th ed.Philadelphia:Saunders/Elsevier;2015.
[3]Santorum M1,Wright D2,Syngelaki A1,Karagioti N1,NicolaidesKH.Accuracy of first-trimester combined test in screening for trisomies 21,18and 13.Ultrasound Obstet Gynecol.2017 Jun;49(6):714-720.
[4]Committee on Practice Bulletins-Obstetrics,Committee on Genetics,and the Society for Maternal-Fetal Medicine.Practice Bulletin No.163:Screening for Fetal Aneuploidy.Obstet Gynecol.2016 May;127(5):e123-37.
[5]Lo YM,Corbetta N,Chamberlain PF,Rai V,Sargent IL,Redman CW,etal.Presence of fetal DNA in maternal plasma and serum.Lancet 1997;350(9076):485-7.
[6]Zhang H,Gao Y,Jiang F,Fu M,Yuan Y,et al.Non-invasive prenataltesting for trisomies 21,18 and 13:clinical experience from 146,958pregnancies.Ultrasound Obstet Gynecol.2015 May;45(5):530-8.
[7]Lo YM,Tein MS,Lau TK,Haines CJ,Leung TN,Poon PM,et al.Quantitativeanalysis of fetal DNA in maternal plasma and serum:implications fbrnoninvasive prenatal diagnosis.Am J Hum Genet 1998;62(4):768-75.
[8]Lo YM,Zhang J,Leung TN,Lau TK,Chang AM,Hjelm NM.Rapid clearance offetal DNA from maternal plasma.Am J Hum Genet 1999;64(1):218-24.
[9]Costa JM,Benachi A,Gautier E.New strategy for prenatal diagnosisof X-linked disorders.N Engl J Med 2002;346(19):1502.
[10]Lo YM,Hjelm NM,Fidler C,Sargent IL,Murphy MF,Chamberlain PF,etal.Prenatal diagnosis of fetal RhD status by molecular analysis of maternalplasma.N Engl J Med 1998;339(24):1734-8.
[11]Chiu RW,Lau TK,Leung TN,Chow KC,Chui DH,Lo YM.Prenatal exclusionof beta thalassaemia major by examination of maternal plasma.Lancet 2002;360(9338):998-1000.
[12]Gil MM,Accurti V,Santacruz B,Plaha MN,Nicolaides KH.Analysis ofcell-free DNA in maternal blood in screening for aneuploidies:updated meta-analysis.Ultrasound Obstet Gynecol 2017;50:302-14.
[13]Srinivasan A,Bianchi DW,Huang H,Sehnert AJ,Rava RP.Noninvasivedetection of fetal subchromosome abnormalities via deep sequencing ofmaternal plasma.Am J Hum Genet 2013;92(2):167-76.
[14]Artieri CG,Haverty C,Evans EA,Goldberg JD,Haque IS.Noninvasiveprenatal screening at low fetal fraction:comparing whole-genome sequencingand single-nucleotide polymorphism methods.Prenat Diagn.2017 May;37(5):482-490.
[15]Chitty LS,Lo YM.Noninvasive Prenatal Screening for GeneticDiseases Using Massively Parallel Sequencing of Maternal Plasma DNA.ColdSpring Harb Perspect Med.2015 Jul 17;5(9):a023085.
[16]Fan HC,Blumenfeld YJ,Chitkara U,Hudgins L,Quake SR.Noninvasivediagnosis of fetal aneuploidy by shotgun sequencing DNA from maternalblood.Proc Natl Acad Sci USA 2008;105:16266-71.
[17]Zimmermann B,Hill M,Gemelos G,Demko Z,Banjevic M,Baner J,etal.Noninvasive prenatal aneuploidy testing of chromosomes 13,18,21,X,and Y,using targeted sequencing of polymorphic loci.Prenat Diagn 2012;32:1233-41.
[18]Xu L,Huang H,Lin N,Wang Y,He D,et al.Non-invasive cell-free fetalDNA testing for aneuploidy:multicenter study of 31 515 singleton pregnanciesin southeastern China.Ultrasound Obstet Gynecol.2020 Feb;55(2):242-247.
[19]Xue Y,Zhao G,Li H,Zhang Q,Lu J,et al.Non-invasive prenataltesting to detect chromosome aneuploidies in 57,204 pregnancies.MolCytogenet.2019 Jun 20;12:29.
[20]Martin K,lyengar S,Kalyan A,Lan C,Simon AL,Stosic M,Kobara K,RaviH,Truong T,Ryan A,Demko ZP,Benn P.Clin Genet.2018 Feb;93(2):293-300.
发明目的
本方法采用定制的寡核苷酸探针协同等位基因靶标富集(coordinative allele-aware target enrichment,COATE)可以降低捕获探针对基因组范围内等位基因座内和不同基因座之间液相杂交动力学偏差,大幅提高对目标区域捕获效率和均一性,以实现准确的染色体和基因突变的同步定量分析。在胎儿染色体拷贝数检测方面,我们利用下一代测序(NGS)对捕获的靶区的母体和胎儿单核苷酸多态性(SNPs)进行定量分析。我们还利用统计学方法将游离DNA的多个指标(游离DNA长度、靶区测序深度和等位基因突变率)与不同的疾病危险因素(母体基因型和可能的疾病遗传/发生模式)进行整合,实现对不同亲本、不同染色体片段大小和不同细胞遗传机制的染色体和基因变异的多维分析。利用cfDNA测序对NIPS的分析方法有两种。(1)全基因组低深度随机测序法(WGS法)和(2)高深度靶向测序法(TS法),WGS法通过测定靶向染色体上的读数与相应的二倍体参考染色体上的读数之比来确定胎儿靶向染色体的数目。由于WGS法对测序DNA片段的染色体来源没有选择性,而21、18和13号染色体仅占人类基因组的7.85%,因此需要测序数百万个片段,以保证21、18和13号染色体的足够的染色体数,才能得到准确的结果。而高深度靶向测序法的特点是利用母体基因型信息和SNP群体频率估计的父体基因型,构建数十种可能的胎儿正常或异常基因型。然后将每个SNP位点的理论预测值MAF(minor allele fraction)与实际血浆测量结果进行比较,计算出每个假设的相对概率。该方法只考虑可能的胎儿基因型,不需要使用二倍体参考染色体。本发明的创新点在于运用COATE技术选择特定靶区染色体的某一区域进行靶区捕获探针设计。与以往的基于SNP分析的多重PCR的NIPS相比,本发明选择较少的位点进行测序分析,可以更有效地分析人类常见的染色体非整倍体、微缺失疾病。此外,本发明同时选取了人类常见的单基因显性遗传病的基因编码区,包括FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC、MECP2等基因作为探针,同时检测染色体非整倍体和单基因突变的过程,可以有效地检测出常见的显性单基因疾病。单基因突变探针的设计可选用目标捕获探针设计和订购工具软件,如https://www.idtdna.com/site/order/ ngs/%3F等。
选取目标染色体(chr1-22,chrX,chrY)和较常见的染色体微小缺失/重复疾病(影响0.5Mb以上大小的CNV区域)的SNP位点进行探针设计。对于任何胎儿变异,无论是单核苷酸或染色体变异,只要胎儿和母体基因型不完全相同,都可以在母体血浆中检测到。在NGS中,这种可检测性取决于胎儿游离DNA百分比(胎儿DNA占母体血浆总cfDNA的百分比)和测序深度。虽然全基因组低深度测序可以用来检测某些非双倍体,但这种方法并不适用于较小染色体拷贝数变异或基因水平的遗传变异。为检测母体血浆中所有的胎儿遗传变异可以采用靶向富集方法,包括探针杂交或PCR扩增目标区域进行定向的高深度测序。因为使用DNA寡核苷酸的液相杂交法不需要特定区域的引物,这样在富集高度片段化的cfDNA中具有较少的等位基因突变脱靶(allele drop-out)的优势。然而,探针寡核苷酸对不同个体的靶区有不同的杂交热力学,因为即使是靶区和探针之间的一个非互补碱基也可能导致不同的杂交热力学。这就产生了一个问题,即基于NGS的检测依赖于准确的基因分型和双等位基因百分比(allele fraction)的量化,以实现NIPS中的拷贝数变异的检测。在NGS中,当采样(DNA输入)和测序(测序深度)足够时,一个种系杂合子变异(germline heterozygousvariant)的中心等位基因百分比(CAF,central allele fraction)应为50%。然而,使用目前的NGS技术,在整倍体样本中测得的CAF并不总是完全50%,这是由于不同位点特异性杂交动力学所引入的不可避免的试验误差引起的[14]。如果测得的整倍体CAF误差过大,会掩盖孕妇血浆中胎儿中的基因拷贝数变异引起的AF变化。当传统的探针设计基于参考序列时,我们发现在>2,000个等位基因位点中,CAFs始终低于50.0%,范围为43.1-49.4%。这样的系统性偏差表明,由于探针通常基于参考等位基因(通常是maior allele)设计,因此探针和带突变(minor allele)的目标区域之间的杂交效率略低。在本发明中,我们针对目标染色体非整倍体、微缺失/微重复、单基因的靶标区域等位基因的探针进行了协调性设计(COATE),抑制了等位基因杂交动力学的偏向性。
我们采用COATE方法可以计算探针与参考和突变等位基因在内的靶标的杂交退火温度差(ΔTm)。在任何给定的单核苷酸双等位基因位点中,有四种探针(-A-、-G-、-C-、-T-),其中两种探针与参考或突变等位基因互补,另两种探针对参考或突变等位基因不互补。与传统的探针设计不同的是,我们的探针组合并不要求与参考基因组序列或突变序列互补,这些探针可以和也可以不和参考或突变等位基因互补,只需要探针对捕获区的参考基因序列(野生型)和突变序列(突变型)的ΔTm最小即可。
其中所述SNP位点在人群中分布相对较高的等位基因称为野生型(B),在人群中分布相对较低的等位基因称为突变型(A),纯合野生基因型为BB,纯合突变基因型为AA,杂合基因型为AB。这些探针的序列选取遵循以下原则:在参考基因组序列的每100个核苷酸中,该探针序列除了含有最多达10个核苷酸的不同外,其他核苷酸序列与参考基因组序列相同。为了获得核苷酸序列与参考基因组序列至少90%同一性的多核苷酸,参考基因组序列中多达10%的核苷酸可被其他核苷酸替代或缺失;或可将一些核苷酸插入到参考序列中,其中插入的核苷酸可多达参考序列之总核苷酸的10%;或在一些探针中,存在缺失、插入和替换的组合,其中所述缺失、插入和替换的核苷酸多达参考序列之总核苷酸的10%。参考序列的这些缺失、插入和替换可发生在参考核苷酸序列的5’或3’末端位置,或在这些末端位置之间的任意地方,它们或单独散在于参考序列的核苷酸中,或以一个或多个邻近的组存在于参考序列中。
本发明建立的检测方法具有创新性:
以对母体血浆游离DNA进行测序为手段的NIPS有两种分析方法:低深度全基因组测序(WGS)方法和高深度靶向测序的单核苷酸多态性(SNP)方法。WGS方法通过测量目标染色体的读数与对应的二倍体参考染色体的读数之比来确定胎儿目标染色体的倍数,由于WGS在测序的DNA片段的染色体来源中不是选择性的,并且21、18和13号染色体仅代表人类基因组的7.85%,因此有必要对数百万个片段进行测序,以确保足够的21、18和13号染色体计数以获得高可信度的结果。SNP方法则仅对目标染色体的部分标志性区域基因座定向分析,因此与WGS方法相比,所需的DNA测序量可以大幅降低。该方法根据母体基因型信息和由SNP人群频率计算的父亲基因型,并以此构建可能的胎儿正常或不正常的基因型。然后将每个SNP位点的MAF(minor allele fraction)的理论预计值与实际血浆测量值进行比较,并计算每个假设的相对可能性。该方法仅考虑可能的胎儿基因型,不需要像WGS法使用二倍体参考染色体,降低了实验操作和数据分析的要求。目前SNP法是基于多重PCR技术,这种扩增技术对于分析高度片段化游离DNA容易产生等位基因缺失(ADO,allele drop-out),所以需要同时分析数万个SNP位点以提高对染色体拷贝数定量的信噪比。针对这一问题,本方法利用创新的液相杂交技术选择性地捕获多态性位点进行测序,回避了使用区域特异性扩增引物,降低了ADO发生概率。而且本技术对目标区的SNP是通过采用定制的寡核苷酸探针设计(协同等位基因靶标富集),可以降低捕获探针对基因组范围内等位基因座内和不同基因座之间液相杂交动力学偏差,提高对目标区域高捕获效率和均一性,实现准确的染色体定量分析。基于以上的创新技术,本方法相对于此前基于多重PCR的SNP分析法的位点数大幅减少,只需对2320个SNP位点进行测序分析就可以实现对常见染色体非整倍体、微缺失/微重复疾病的高效率检测。
本产品是基于杂交捕获法无创检测产品同步检测染色体非整倍体、微缺失/微重复和显性单基因疾病,相较于传统的NIPS,同时检测疾病的类型更为全面;
本产品是基于SNP的杂交捕获法无创检测产品,相较于WGS法检测,受干扰因素影响较少,如不受GC含量比例影响、不受考察胎儿母亲基因型、不受同批次内其它样本干扰;
本产品是基于SNP的杂交捕获法无创检测产品,相较于基于SNP的多重PCR法,所需SNP位点更少。
发明内容
本发明第一方面提供了一种用于胎儿无创产前筛查的检测方法;
本发明第二方面还提供了一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法;
本发明第三方面提供了一种用于胎儿无创产前筛查的靶向捕获探针的设计方法;
本发明第四方面提供了一种用于胎儿无创产前筛查的检测试剂盒;
本发明第五方面提供了一种用于胎儿无创产前筛查的设备;
本发明第六方面提供了一种用于胎儿无创产前筛查的计算机可读存储介质;
本发明第七方面提供了一种用于胎儿无创产前筛查的系统;
本发明第八方面提供了靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针。
本发明第一方面提供了一种用于胎儿无创产前筛查的检测方法,或本发明第八方面提供了靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,用于胎儿无创产前筛查的检测方法包括以下步骤:
(1)检测和计算胎儿游离核酸百分比(ff);
(2)在待检测染色体中选择一个或多个SNP位点,其中所述SNP位点在人群中分布相对较高的等位基因称为野生型(B),在人群中分布相对较低的等位基因称为突变型(A),纯合野生基因型为BB,纯合突变基因型为AA,杂合基因型为AB;
优选地,在人群中分布相对较高的等位基因为:与人类基因组组装版本hg38的参考基因组序列相同的等位基因B;在人群中分布相对较低的等位基因为:与人类基因组组装版本hg38的参考基因组序列不同的等位基因A;
(3)使用针对所述一个或多个SNP位点的靶向捕获探针捕获母体外周血游离DNA(cfDNA),扩增后进行测序,测得等位基因A的读数NA,以及该位点的测序深度N;
优选地,等位基因A为突变型基因,等位基因A的读数NA指代突变型等位基因A的读数;等位基因B为野生型基因,等位基因B的读数NB指代野生型等位基因B的读数;该位点的测序深度N为等位基因A的读数NA与等位基因B的读数NB之和;
优选地,胎儿游离核酸是通过母体外周血游离核酸的检测获得的,其中母体外周血游离核酸的检测包括对母亲自身的游离核酸以及胎儿的游离核酸的检测;
(4)计算胎儿在各SNP位点可能为染色体拷贝数正常或不同拷贝数异常情况的概率;根据每一个SNP位点实测到cfDNA的突变基因型百分比(A%)、胎儿游离核酸百分比(ff)和母亲在此位点的基因型,分别计算胎儿是整倍体或者非整倍体的概率值;同一染色体所有有效SNP位点概率总和最大值为胎儿判读的核型;
优选地,所述有效SNP位点为胎儿与母亲基因型不完全相同的所有SNP位点;
计算的胎儿核型H包括:D(二倍体型,disomy)、MI(母源三体综合症I型,maternaltrisomy type I)、MII(母源三体综合症II型,maternal trisomy type II)、PI(父源三体综合症I型,paternal trisomy type I)、PII(父源三体综合症II型,paternal trisomytype II)、LM(母源微缺失,maternal deletion)和LP(父源微缺失,paternal deletion);
胎儿在各SNP位点的核型概率是通过π加权的有条件贝塔二项式分布概率的线性组合并取对数得出,计算公式为:
Figure BDA0002632233670000111
i为第i个有效SNP位点;
N为该SNP位点的测序深度;pAi是胎儿为整倍体或非整倍体在不同基因座上突变型的下一代测序(NGS)读数百分比的期望值;在胎儿为不同核型时,pAi在不同基因座H上的基因型不同,其期望值也各不相同,具体不同基因座H的pAi见表1;
表1:不同核型胎儿突变基因型期望中心频率计算
Figure BDA0002632233670000112
Figure BDA0002632233670000121
ffc为胎儿是非整倍体时的矫正胎儿百分比;
胎儿为三体时:ffc=1.5ff/(1+0.5ff)=3ff/(2+ff);胎儿为染色体缺失时:ffc=0.5ff/(1-0.5ff)=ff/(2-ff)
α是pAi根据在测序中实际值选取的离散参数;因其受实验条件的影响实测值会偏离期望值;使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β=α/pAi-α
加权系数πk的计算根据胎儿不同的核型计算:
Figure BDA0002632233670000122
其中PATk∈{AA,AB,BB},p(PATk)根据Hardy-Weinberg公式计算,该SNP位点的人群频率为p:
p(AA)=p×p
p(AB)=2×p×(1-p)
p(BB)=(1-p)×(1-p)
优选地,该SNP位点的人群频率p来自公共数据库,更优选地,选自千人基因组数据库;
p(FET)是胎儿的可能基因型,其受父亲和母亲基因型影响,在胎儿为整倍体或非整倍体时,p(FET)按照孟德尔遗传规律计算,见表2;
表2:胎儿基因型概率计算
Figure BDA0002632233670000123
Figure BDA0002632233670000131
Figure BDA0002632233670000141
母亲基因型的计算:NA/N≤0.2母亲基因型为BB;0.3<NA/N<0.8母亲基因型为AB;NA/N≥0.8母亲基因型为AA
(5)胎儿染色体拷贝数变异的计算
在精子或者卵子产生过程中,如果被考察的某条染色体没有发生减数分裂同源重组,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure BDA0002632233670000142
H∈{MI,MII,PI,PII,LM,LP}
LD是该位点在整倍体核型下的概率值;
LH是该位点在非整倍体核型下的概率值;
M为该染色体有效SNP位点个数;
当此值小于检测阈值时,染色体倍数异常为阳性,所述检测阈值用已知产前诊断结果的孕妇血浆样本和人工混合的阳性与阴性参考品样品的检测结果确定,具体到不同的非整倍体类型,阴性样本和阳性样本的检测阈值见表3;
表3:阴性样本和阳性样本的检测阈值表
核型 阳性 阴性 灰区
MI <-10 >-4 [-10,-4]
MII <-5 >+5 [-5,+5]
PI <-20 >-10 [-20,-10]
PII <-20 >-10 [-20,-10]
LM <-10 >-5 [-10,-5]
LP <-10 >-5 [-10,-5]
所述方法为一种用于染色体拷贝数的检测方法。
在一个实施方案中,前述本发明用于胎儿无创产前筛查的检测方法中,其中,用于胎儿无创产前筛查的检测方法的步骤(5)为:
(5)胎儿染色体微缺失/微重复的计算
在精子或者卵子产生过程中,如果被考察的某条染色体发生部分缺失或者部分重复,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure BDA0002632233670000151
H∈{MI,MII,PI,PII,LM,LP},0<b1,b2<M
b1和b2是染色体发生微缺失/微重复的起始和终止位置;
当此值小于检测阈值时,染色体倍数异常为阳性,所述检测阈值用已知产前诊断结果的孕妇血浆样本和人工混合的阳性与阴性参考品样品的检测结果确定,阴性样本和阳性样本的检测阈值见表3;所述方法为一种用于染色体微缺失/微重复的检测方法;
或(5)显性单基因突变的计算
显性单基因突变出现在母亲是纯合野生型BB的区域,根据A的读数NA,位点的测序深度N,胎儿游离核酸百分比ff,和进行贝塔二项分布拟合计算出A读数来自胎儿的概率,并将此概率与系统噪音概率进行比较,其中:
在某个基因座上,母亲为纯和野生型BB时,胎儿来自父亲或者是新发突变的概率为:
ΔL=log(beta-binom(pAi,N,α,β1))
-log(beta-binom(e,N,α,β2))
优选地,pAi=ff/2,
ΔL=log(beta-binom(ff/2,N,α,β1))
-log(beta-binom(e,N,α,β2))
N是该位点的测序深度;
ff是胎儿游离核酸百分比;
α是根据在胎儿游离DNA中来自于父亲的等位基因实际测值选取的离散参数,因其受实验条件的影响实测值会偏离期望值,使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β1=2×α/ff-α;
e是该位点的系统错误率,系统错误率是该位点在已知的阴性标本中的突变基因型的比例;α是系统噪音实测得的离散参数,确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β2=α/e-α
当ΔL大于检测阈值时,其中,所述检测阈值为1,基因突变为阳性,所述方法为一种用于显性单基因突变的检测方法。
本发明中所使用的log表示e为底的对数值,其中log(x)表示自然对数,其基值为e。
在一个实施方案中,前述本发明用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,用于胎儿无创产前筛查的检测方法还包括:胎儿染色体拷贝数变异的计算、胎儿染色体微缺失/微重复的计算、显性单基因突变的计算的一个或多个组合;
所述胎儿染色体微缺失/微重复的计算为:
在精子或者卵子产生过程中,如果被考察的某条染色体发生部分缺失或者部分重复,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure BDA0002632233670000171
H∈{MI,MII,PI,PII,LM,LP},0<b1,b2<M
b1和b2是染色体发生微缺失/微重复的起始和终止位置;
当此值小于检测阈值时,染色体倍数异常为阳性,所述检测阈值用已知产前诊断结果的孕妇血浆样本和人工混合的阳性与阴性参考品样品的检测结果确定,阴性样本和阳性样本的检测阈值见表3;
所述显性单基因突变的计算为:
显性单基因突变出现在母亲是纯合野生型BB的区域,根据A的读数NA,位点的测序深度N,胎儿游离核酸百分比ff,和进行贝塔二项分布拟合计算出A读数来自胎儿的概率,并将此概率与系统噪音概率进行比较,其中:
在某个基因座上,母亲为纯和野生型BB时,胎儿来自父亲或者是新发突变的概率为:
ΔL=log(beta-binom(ff/2,N,α,β1))
-log(beta-binom(e,N,α,β2))
N是该位点的测序深度;
ff是胎儿游离核酸百分比;
α是根据在胎儿游离DNA中来自于父亲的等位基因实际测值选取的离散参数,因其受实验条件的影响实测值会偏离期望值,使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000:
β1=2×α/ff-α;
e是该位点的系统错误率,系统错误率是该位点在已知的阴性标本中的突变基因型的比例;α是系统噪音实测得的离散参数,确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β2=α/e-α
当ΔL大于检测阈值时,其中,所述检测阈值为1,基因突变为阳性,所述方法为一种用于胎儿染色体拷贝数变异、胎儿染色体微缺失/微重复、和/或显性单基因突变的检测方法。
在一个实施方案中,前述本发明用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,用于胎儿无创产前筛查的检测方法包括:胎儿染色体拷贝数变异的计算;或胎儿染色体微缺失/微重复的计算;或显性单基因突变的计算;或胎儿染色体拷贝数变异的计算以及胎儿染色体微缺失/微重复的计算;或胎儿染色体拷贝数变异的计算,以及显性单基因突变的计算;或胎儿染色体微缺失/微重复的计算,以及显性单基因突变的计算;或胎儿染色体拷贝数变异的计算,胎儿染色体微缺失/微重复的计算,以及显性单基因突变的计算,所述方法为一种用于胎儿染色体拷贝数变异、胎儿染色体微缺失/微重复、和/或显性单基因突变的检测方法。
在本发明提供的方法中,检测出的基因突变仅是一个中间结果,并不能由此直接判断胎儿是否患有特定疾病。对于符合检测阈值的基因突变,还需要进行进一步的临床数据解读。因此,本发明提供的检测方法不用于疾病诊断。
在一个实施方案中,前述本发明的用于无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,本发明不对计算胎儿游离核酸百分比(ff)的方法作出任何限制,可以通过本领域普通技术人员熟知任何方法进行检测和计算。
在一个优选的实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,所述步骤(1)检测和计算胎儿游离核酸百分比(ff),
其包括以下步骤:
当母亲是纯合野生型BB时,胎儿的基因型可能为BB或者BA,对于胎儿为BA的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点A的读数比例中值ffBB计算;对于母亲是纯合变异型AA的时候,胎儿的基因型可能为AA或者AB,对于胎儿为AB的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点B的读数比例中值ffAA计算;胎儿游离核酸百分比(ff)的计算为:
ff=(ffAA+ffBB)/2
优选地,检测和计算胎儿游离核酸百分比时,选定任意染色体的位点;
更优选地,选定人类基因组拷贝数很少改变的位点;
进一步优选地,选定人类基因组拷贝数很少改变的位点,这些位点为包括或不包括染色体13,18,21,22,X和Y中的位点。
在一个优选的实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,待检测的SNP位点是待检测染色体中选择的一个或多个SNP位点,是包含SNP位点的所有染色体中的一个或多个;优选地,所述待检测的SNP位点是染色体13,18,21,22,X和Y中的一个或多个。
在一个实施方案中,前述本发明用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,针对父母生殖细胞产生过程中可能发生一次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000191
Figure BDA0002632233670000192
H1,H2∈{MI,MII,PI,PII}当上述两个计算结果之一小于表3的检测阈值时,染色体倍数异常为阳性,阴性样本和阳性样本的检测阈值见表3。
在一个实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,针对父母生殖细胞产生过程中可能发生一次或者两次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000201
Figure BDA0002632233670000202
H1,H2∈{MI,MII,PI,PII},
b1和b2是染色体发生重组的计算位置,当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性,阴性样本和阳性样本的检测阈值见表3。
在一个实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2。
在一个实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,待检测染色体中的一个或多个SNP位点的选择是,根据人类基因组序列组装版本hg38优先考虑结构简单,GC百分比接近40-60%的位点。
优选地,所述SNP位点的人群频率基于1000G、gnomAD公共数据库选择接近0.3-0.7的位点,这些位点包括染色体1-22,X和Y中的共计至少2320个SNP位点。
所用公共数据库的网址如下所示:
人类基因组hg38:
https://hgdownload.cse.ucsc.edu/goldenpath/hg38/chromosomes/
1000G:https://www.internationalgenome.org/data/
gnomAD:https://gnomad.broadinstitute.org/
在一个实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述步骤(3)中使用的靶向捕获探针使用以下靶向捕获探针的设计方法获得,所述方法包括以下步骤:
(1)确定目标SNP位点;
(2)对于每一个靶向捕获的SNP位点,根据所述SNP位点设计四种探针,四种探针在所述SNP位点上分别被设计为-A-、-G-、-C-、-T-;
(3)对于每一个靶向捕获的SNP位点,分别计算出四种探针和两种靶标序列结合的退火温度(Tm),所述两种靶标序列分别带有两种不同的单核苷酸多态性;并依此计算出所述四种探针和两种靶标序列结合的退火温度的差值(ΔTm);根据计算结果,选择四种探针中ΔTm最低的探针,确定为该位点的最优探针。
在一个优选的实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述靶向捕获探针的设计方法中,所述两种靶标序列分别为作为野生型的参考基因序列和作为突变型的突变基因序列;其中,四种探针和作为野生型的参考基因序列结合的Tm值分别为:Tma、Tmg、Tmc、Tmt,四种探针和作为突变型的突变基因序列结合的Tm值分别为:Tma’、Tmg’、Tmc’、Tmt’,四种探针和两种靶标序列结合的ΔTm值分别为:|Tma-Tma’|、|Tmg-Tmg’|、|Tmc-Tmc’|、|Tmt-Tmt’|。
在一个优选的实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述靶向捕获探针的设计方法中,采用最近邻模型和阳离子校正计算探针退火温度(Tm),探针退火温度的计算公式为:
Figure BDA0002632233670000221
ΔH表示所有邻近碱基对的标准焓变的和,ΔS表示所有邻近碱基对的标准熵变的和,R为摩耳气体常量,CT表示引物的浓度,[Na+]表示溶液中单价钠离子浓度。
在更优选的实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述靶向捕获探针的设计方法中,步骤(2)为对于每一个靶向捕获的SNP位点,根据所述SNP位点设计四种探针,四种探针在所述SNP位点上分别被设计为-A-、-G-、-C-、-T-,其他位置与目标序列完全互补。
在更优选的实施方案中,前述本发明的用于胎儿无创产前筛查的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述探针的长度为100-200bp;优选地,所述探针的长度为100-190bp、或100-180bp、或100-170bp、或100-160bp、或100-150bp、或100-140bp、或100-130bp、或100-120bp、或110-200bp、或110-190bp、或110-180bp、或110-170bp、或110-160bp、或110-150b p、或110-140bp、或110-130bp、或110-120bp;进一步地,所述探针的长度为100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp。
本发明第二方面还提供了一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,所述方法为非诊断目的,或本发明第八方面提供了靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其包括以下方法步骤:
(1)检测和计算胎儿游离核酸百分比(ff);
(2)在待检测染色体中选择一个或多个SNP位点,其中所述SNP位点在人群中分布相对较高的等位基因称为野生型(B),在人群中分布相对较低的等位基因称为突变型(A),纯合野生基因型为BB,纯合突变基因型为AA,杂合基因型为AB;
优选地,在人群中分布相对较高的等位基因为:与人类基因组组装版本hg38的参考基因组序列相同的等位基因B;在人群中分布相对较低的等位基因为:与人类基因组组装版本hg38的参考基因组序列不同的等位基因A;
(3)使用针对所述一个或多个SNP位点的靶向捕获探针捕获母体外周血游离DNA(cfDNA),扩增后进行测序,测得等位基因A的读数NA,以及该位点的测序深度N;
优选地,等位基因A为突变型基因,等位基因A的读数NA指代突变型等位基因A的读数;等位基因B为野生型基因,等位基因B的读数NB指代野生型等位基因B的读数;该位点的测序深度N为等位基因A的读数NA与等位基因B的读数NB之和;优选地,胎儿游离核酸是通过母体外周血游离核酸的检测获得的,其中母体外周血游离核酸的检测包括对母亲自身的游离核酸以及胎儿的游离核酸的检测;
(4)计算胎儿在各SNP位点可能为染色体拷贝数正常或不同拷贝数异常情况的概率;根据每一个SNP位点实测到cfDNA的突变基因型百分比(A%)、胎儿游离核酸百分比(ff)和母亲在此位点的基因型,分别计算胎儿是整倍体或者非整倍体的概率值;同一染色体所有有效SNP位点概率总和最大值为胎儿判读的核型;
优选地,所述有效SNP位点为胎儿与母亲基因型不完全相同的所有SNP位点;
计算的胎儿核型H包括:D(二倍体型,disomy)、MI(母源三体综合症I型,maternaltrisomy type I)、MII(母源三体综合症II型,maternal trisomy type II)、PI(父源三体综合症I型,paternal trisomy type I)、PII(父源三体综合症II型,paternal trisomytype II)、LM(母源微缺失,maternal deletion)和LP(父源微缺失,paternal deletion);
胎儿在各SNP位点的核型概率是通过π加权的有条件贝塔二项式分布概率的线性组合并取对数得出,计算公式为:
Figure BDA0002632233670000241
i为第i个有效SNP位点;
N为该SNP位点的测序深度;pAi是胎儿为整倍体或非整倍体在不同基因座上突变型的下一代测序(NGS)读数百分比的期望值;在胎儿为不同核型时,pAi在不同基因座H上的基因型不同,其期望值也各不相同,具体不同基因座H的pAi见表1;
α是pAi根据在测序中实际值选取的离散参数;因其受实验条件的影响实测值会偏离期望值;使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β=α/pAi-α
加权系数πk的计算根据胎儿不同的核型计算:
Figure BDA0002632233670000242
其中PATk∈{AA,AB,BB},p(PATk)根据Hardy-Weinberg公式计算,该SNP位点的人群频率为p:
p(AA)=p×p
p(AB)=2×p×(1-p)
p(BB)=(1-p)×(1-p)
优选地,该SNP位点的人群频率p来自公共数据库,更优选地,选自千人基因组数据库;
p(FET)是胎儿的可能基因型,其受父亲和母亲基因型影响,在胎儿为整倍体或非整倍体时,p(FET)按照孟德尔遗传规律计算,见表2;
(5)胎儿染色体拷贝数变异的计算
在精子或者卵子产生过程中,如果被考察的某条染色体没有发生减数分裂同源重组,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure BDA0002632233670000251
H∈{MI,MII,PI,PII,LM,LP}
LD是该位点在整倍体核型下的概率值;
LH是该位点在非整倍体核型下的概率值;
M为该染色体有效SNP位点个数;
当此值小于表3的检测阈值时,染色体倍数异常为阳性,所述检测阈值用已知产前诊断结果的孕妇血浆样本和人工混合的阳性与阴性参考品样品的检测结果确定,具体到不同的非整倍体类型,阴性样本和阳性样本的检测阈值见表3;所述方法为一种用于染色体拷贝数的检测方法。
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法中,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述方法的步骤(5)为:
(5)胎儿染色体微缺失/微重复的计算
在精子或者卵子产生过程中,如果被考察的某条染色体发生部分缺失或者部分重复,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure BDA0002632233670000252
H∈{MI,MII,PI,PII,LM,LP},0<b1,b2<M
b1和b2是染色体发生微缺失/微重复的起始和终止位置;
当此值小于检测阈值时,染色体倍数异常为阳性,所述检测阈值用已知产前诊断结果的孕妇血浆样本和人工混合的阳性与阴性参考品样品的检测结果确定,阴性样本和阳性样本的检测阈值见表3;所述方法为一种用于染色体微缺失/微重复的检测方法;
或(5)显性单基因突变的计算
显性单基因突变出现在母亲是纯合野生型BB的区域,根据A的读数NA,位点的测序深度N,胎儿游离核酸百分比ff,和进行贝塔二项分布拟合计算出A读数来自胎儿的概率,并将此概率与系统噪音概率进行比较,其中:
在某个基因座上,母亲为纯和野生型BB时,胎儿来自父亲或者是新发突变的概率为:
ΔL=log(beta-binom(pAi,N,α,β1))
-log(beta-binom(e,N,α,β2))
优选地,pAi=ff/2,
ΔL=log(beta-binom(ff/2,N,α,β1))
-log(beta-binom(e,N,α,β2))
N是该位点的测序深度;
ff是胎儿游离核酸百分比;
α是根据在胎儿游离DNA中来自于父亲的等位基因实际测值选取的离散参数,因其受实验条件的影响实测值会偏离期望值,使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β1=2×α/ff-α;
e是该位点的系统错误率,系统错误率是该位点在已知的阴性标本中的突变基因型的比例;α是系统噪音实测得的离散参数,确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β2=α/e-α
当ΔL大于检测阈值时,其中,所述检测阈值为1,基因突变为阳性,所述方法为一种用于显性单基因突变的检测方法。
本发明中所使用的log表示e为底的对数值,其中log(x)表示自然对数,其基值为e。
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,还包括:胎儿染色体拷贝数变异的计算、胎儿染色体微缺失/微重复的计算、显性单基因突变的计算的一个或多个组合;
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,包括:胎儿染色体拷贝数变异的计算;或胎儿染色体微缺失/微重复的计算;或显性单基因突变的计算;或胎儿染色体拷贝数变异的计算,以及胎儿染色体微缺失/微重复的计算;或胎儿染色体拷贝数变异的计算,以及显性单基因突变的计算;或胎儿染色体微缺失/微重复的计算,以及显性单基因突变的计算;或胎儿染色体拷贝数变异的计算,胎儿染色体微缺失/微重复的计算,以及显性单基因突变的计算。
在本发明提供的方法中,检测出的基因突变仅是一个中间结果,并不能由此直接判断胎儿是否患有特定疾病。对于符合检测阈值的基因突变,还需要进行进一步的临床数据解读。因此,本发明提供的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,不用于疾病诊断,为非诊断目的的。
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,本发明不对计算胎儿游离核酸百分比(ff)的方法作出任何限制,可以通过本领域普通技术人员熟知任何方法进行检测和计算。
在一个优选的实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,所述步骤(1)检测和计算胎儿游离核酸百分比(ff),
其包括以下步骤:
当母亲是纯合野生型BB时,胎儿的基因型可能为BB或者BA,对于胎儿为BA的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点A的读数比例中值ffBB计算;对于母亲是纯合变异型AA的时候,胎儿的基因型可能为AA或者AB,对于胎儿为AB的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点B的读数比例中值ffAA计算;胎儿游离核酸百分比(ff)的计算为:
ff=(ffAA+ffBB)/2
优选地,检测和计算胎儿游离核酸百分比时,选定任意染色体的位点;
更优选地,选定人类基因组拷贝数很少改变的位点;
进一步优选地,选定人类基因组拷贝数很少改变的位点,这些位点为包括或不包括染色体13,18,21,22,X和Y中的位点。
在一个优选的实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,待检测的SNP位点是待检测染色体中选择的一个或多个SNP位点,是包含SNP位点的所有染色体中的一个或多个;优选地,所述待检测的SNP位点是染色体13,18,21,22,X和Y中的一个或多个。
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,针对父母生殖细胞产生过程中可能发生一次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000281
Figure BDA0002632233670000282
H1,H2∈{MI,MII,PI,PII}当上述两个计算结果之一小于表3的检测阈值时,染色体倍数异常为阳性,阴性样本和阳性样本的检测阈值见表3。
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,针对父母生殖细胞产生过程中可能发生一次或者两次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000291
Figure BDA0002632233670000292
H1,H2∈{MI,MII,PI,PII},
b1和b2是染色体发生重组的计算位置,当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性,阴性样本和阳性样本的检测阈值见表3。
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2。
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,待检测染色体中的一个或多个SNP位点的选择是,根据人类基因组序列组装版本hg38优先考虑结构简单,GC百分比接近40-60%的位点。
优选地,所述SNP位点的人群频率基于1000G、gnomAD公共数据库选择接近0.3-0.7的位点,这些位点包括染色体1-22,X和Y中的共计至少2320个SNP位点。
所用公共数据库的网址如下所示:
人类基因组hg38:
https://hgdownload.cse.ucsc.edu/goldenpath/hg38/chromosomes/
1000G:https://www.internationalgenome.org/data/
gnomAD:https://gnomad.broadinstitute.org/
在一个实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述步骤(3)中使用的靶向捕获探针使用以下靶向捕获探针的设计方法获得,所述方法包括以下步骤:
(1)确定目标SNP位点;
(2)对于每一个靶向捕获的SNP位点,根据所述SNP位点设计四种探针,四种探针在所述SNP位点上分别被设计为-A-、-G-、-C-、-T-;
(3)对于每一个靶向捕获的SNP位点,分别计算出四种探针和两种靶标序列结合的退火温度(Tm),所述两种靶标序列分别带有两种不同的单核苷酸多态性;并依此计算出所述四种探针和两种靶标序列结合的退火温度的差值(ΔTm);根据计算结果,选择四种探针中ΔTm最低的探针,确定为该位点的最优探针。
在一个优选的实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述靶向捕获探针的设计方法中,所述两种靶标序列分别为作为野生型的参考基因序列和作为突变型的突变基因序列;其中,四种探针和作为野生型的参考基因序列结合的Tm值分别为:Tma、Tmg、Tmc、Tmt,四种探针和作为突变型的突变基因序列结合的Tm值分别为:Tma’、Tmg’、Tmc’、Tmt’,四种探针和两种靶标序列结合的ΔTm值分别为:|Tma-Tma’|、|Tmg-Tmg’|、|Tmc-Tmc’|、|Tmt-Tmt’|。
在一个优选的实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述靶向捕获探针的设计方法中,采用最近邻模型和阳离子校正计算探针退火温度(Tm),探针退火温度的计算公式为:
Figure BDA0002632233670000311
ΔH表示所有邻近碱基对的标准焓变的和,ΔS表示所有邻近碱基对的标准熵变的和,R为摩耳气体常量,CT表示引物的浓度,[Na+]表示溶液中单价钠离子浓度。
在更优选的实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述靶向捕获探针的设计方法中,步骤(2)为对于每一个靶向捕获的SNP位点,根据所述SNP位点设计四种探针,四种探针在所述SNP位点上分别被设计为-A-、-G-、-C-、-T-,其他位置与目标序列完全互补。
在更优选的实施方案中,前述本发明的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法,或前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中,所述探针的长度为100-200bp;优选地,所述探针的长度为100-190bp、或100-180bp、或100-170bp、或100-160bp、或100-150bp、或100-140bp、或100-130bp、或100-120bp、或110-200bp、或110-190bp、或110-180bp、或110-170bp、或110-160bp、或110-150bp、或110-140bp、或110-130bp、或110-120bp;进一步地,所述探针的长度为100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp。
本发明第三方面提供了一种用于胎儿无创产前筛查的靶向捕获探针的设计方法,其包括以下步骤:
(1)确定目标SNP位点;
(2)对于每一个靶向捕获的SNP位点,根据所述SNP位点设计四种探针,四种探针在所述SNP位点上分别被设计为-A-、-G-、-C-、-T-;
(3)对于每一个靶向捕获的SNP位点,分别计算出四种探针和两种靶标序列结合的退火温度(Tm),所述两种靶标序列分别带有两种不同的单核苷酸多态性;并依此计算出所述四种探针和两种靶标序列结合的退火温度的差值(ΔTm);根据计算结果,选择四种探针中ΔTm最低的探针,确定为该位点的最优探针。
在一个优选的实施方案中,本发明提供一种用于胎儿无创产前筛查的靶向捕获探针的设计方法,其中,所述两种靶标序列分别为作为野生型的参考基因序列和作为突变型的突变基因序列;其中,四种探针和作为野生型的参考基因序列结合的Tm值分别为:Tma、Tmg、Tmc、Tmt,四种探针和作为突变型的突变基因序列结合的Tm值分别为:Tma’、Tmg’、Tmc’、Tmt’,四种探针和两种靶标序列结合的ΔTm值分别为:|Tma-Tma’|、|Tmg-Tmg’|、|Tmc-Tmc’|、|Tmt-Tmt’|。
在另一个优选的实施方案中,本发明提供一种用于胎儿无创产前筛查的靶向捕获探针的设计方法,其中,采用最近邻模型和阳离子校正计算探针退火温度(Tm),探针退火温度的计算公式为:
ΔH表示所有邻近碱基对的标准焓变的和,ΔS表示所有邻近碱基对的标准熵变的和,R为摩耳气体常量,CT表示引物的浓度,[Na+]表示溶液中单价钠离子浓度。
在另一个优选的实施方案中,本发明提供一种用于胎儿无创产前筛查的靶向捕获探针的设计方法,其中,步骤(2)为对于每一个靶向捕获的SNP位点,根据所述SNP位点设计四种探针,四种探针在所述SNP位点上分别被设计为-A-、-G-、-C-、-T-,其他位置与目标序列完全互补。
在另一个优选的实施方案中,本发明提供一种用于胎儿无创产前筛查的靶向捕获探针的设计方法,其中,选择四种探针中ΔTm最低的探针是:选择针对作为野生型的参考基因序列和作为突变型的突变基因序列的ΔTm最小的探针。
在另一个优选的实施方案中,本发明提供一种用于胎儿无创产前筛查的靶向捕获探针的设计方法,其中,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2,所述靶向捕获探针根据前述发明中任一个所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备。
在更优选的实施方案中,本发明提供一种用于胎儿无创产前筛查的靶向捕获探针的设计方法,其中,所述探针的长度为100-200bp;优选地,所述探针的长度为100-190bp、或100-180bp、或100-170bp、或100-160bp、或100-150bp、或100-140bp、或100-130bp、或100-120bp、或110-200bp、或110-190bp、或110-180bp、或110-170bp、或110-160bp、或110-150bp、或110-140bp、或110-130bp、或110-120bp;进一步地,所述探针的长度为100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp。
本发明第四方面提供了一种用于胎儿无创产前筛查的检测试剂盒,所述试剂盒包括:前述发明中任一个所述的用于胎儿无创产前筛查的检测方法中使用的针对所述一个或多个SNP位点的靶向捕获探针,和/或根据前述发明中任一个所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备的靶向捕获探针。
在一个优选的实施方案中,本发明提供的一种用于胎儿无创产前筛查的检测试剂盒,其中,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2,所述靶向捕获探针根据前述发明中任一个所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备。
在另一个优选的实施方案中,本发明提供的一种用于胎儿无创产前筛查的检测试剂盒,其中,所述探针的长度为100-200bp;优选地,所述探针的长度为100-190bp、或100-180bp、或100-170bp、或100-160bp、或100-150bp、或100-140bp、或100-130bp、或100-120bp、或110-200bp、或110-190bp、或110-180bp、或110-170bp、或110-160bp、或110-150bp、或110-140bp、或110-130bp、或110-120bp;进一步地,所述探针的长度为100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp。
本发明第五方面提供了一种用于胎儿无创产前筛查的设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器完成如前述发明中任一个所述的用于胎儿无创产前筛查的检测方法或前述发明中任一个所述的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法。
本发明第六方面提供了一种用于胎儿无创产前筛查的计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时完成如前述发明中任一个所述的用于胎儿无创产前筛查的检测方法或前述发明中任一个所述的一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法。
本发明第七方面提供了一种用于胎儿无创产前筛查的系统,包括:检测单元和分析单元,其中
所述检测单元用于:
-检测母体外周血游离核酸;优选地,其中检测母体外周血游离核酸包括对母亲自身的游离核酸以及胎儿的游离核酸的检测;
-使用针对所述一个或多个SNP位点的靶向捕获探针捕获母体外周血游离DNA,扩增后进行测序,得到该位点的测序结果,测得等位基因A的读数NA,以及该位点的测序深度N;
优选地,等位基因A为突变型基因,等位基因A的读数NA指代突变型等位基因A的读数;等位基因B为野生型基因,等位基因B的读数NB指代野生型等位基因B的读数;该位点的测序深度N为等位基因A的读数NA与等位基因B的读数NB之和;
所述分析单元用于:
计算胎儿在各SNP位点可能为染色体拷贝数正常或不同拷贝数异常情况的概率;根据每一个SNP位点实测到cfDNA的突变基因型百分比(A%)、胎儿游离核酸百分比(ff)和母亲在此位点的基因型,分别计算胎儿是整倍体或者非整倍体的概率值;同一染色体所有有效SNP位点概率总和最大值为胎儿判读的核型;
计算的胎儿核型H包括:D(二倍体型,disomy)、MI(母源三体综合症I型,maternaltrisomy type I)、MII(母源三体综合症II型,maternal trisomy type II)、PI(父源三体综合症I型,paternal trisomy type I)、PII(父源三体综合症II型,paternal trisomytype II)、LM(母源微缺失,maternal deletion)和LP(父源微缺失,paternal deletion);
胎儿在各SNP位点的核型概率是通过π加权的有条件贝塔二项式分布概率的线性组合并取对数得出,计算公式为:
Figure BDA0002632233670000351
i为第i个有效SNP位点;
N为该SNP位点的测序深度;pAi是胎儿为整倍体或非整倍体在不同基因座上突变型的下一代测序(NGS)读数百分比的期望值;在胎儿为不同核型时,pAi在不同基因座H上的基因型不同,其期望值也各不相同,具体不同基因座H的pAi见表1;
α是pAi根据在测序中实际值选取的离散参数;因其受实验条件的影响实测值会偏离期望值;使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β=α/pAi-α
加权系数πk的计算根据胎儿不同的核型计算:
Figure BDA0002632233670000361
其中PATk∈{AA,AB,BB},p(PATk)根据Hardy-Weinberg公式计算,该SNP位点的人群频率为p:
p(AA)=p×p
p(AB)=2×p×(1-p)
p(BB)=(1-p)×(1-p)
p(FET)是胎儿的可能基因型,其受父亲和母亲基因型影响,在胎儿为整倍体或非整倍体时,p(FET)按照孟德尔遗传规律计算,见表2。
在一个实施方案中,前述本发明的一种用于胎儿无创产前筛查的系统,所述分析单元还用于:胎儿染色体拷贝数变异的计算、胎儿染色体微缺失/微重复的计算、和/或显性单基因突变的计算,其中,
所述胎儿染色体拷贝数变异的计算为:
在精子或者卵子产生过程中,如果被考察的某条染色体没有发生减数分裂同源重组,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure BDA0002632233670000362
H∈{,MI,MII,PI,PII,LM,LP}
LD是该位点在整倍体核型下的概率值;
LH是该位点在非整倍体核型下的概率值;
M为该染色体有效SNP位点个数;
当此值小于检测阈值时,染色体倍数异常为阳性,所述检测阈值用已知产前诊断结果的孕妇血浆样本和人工混合的阳性与阴性参考品样品的检测结果确定,具体到不同的非整倍体类型,阴性样本和阳性样本的检测阈值见表3;
所述胎儿染色体微缺失/微重复的计算为:
在精子或者卵子产生过程中,如果被考察的某条染色体发生部分缺失或者部分重复,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure BDA0002632233670000371
H∈{MI,MII,PI,PII,LM,LP},0<b1,b2<M
b1和b2是染色体发生微缺失/微重复的起始和终止位置;
当此值小于检测阈值时,染色体倍数异常为阳性,所述检测阈值用已知产前诊断结果的孕妇血浆样本和人工混合的阳性与阴性参考品样品的检测结果确定,阴性样本和阳性样本的检测阈值见表3;
所述显性单基因突变的计算:
显性单基因突变出现在母亲是纯合野生型BB的区域,根据A的读数NA,位点的测序深度N,胎儿游离核酸百分比ff,和进行贝塔二项分布拟合计算出A读数来自胎儿的概率,并将此概率与系统噪音概率进行比较,其中:
在某个基因座上,母亲为纯和野生型BB时,胎儿来自父亲或者是新发突变的概率为:
ΔL=log(beta-binom(ff/2,N,α,β1))
-log(beta-binom(e,N,α,β2))
N是该位点的测序深度;
ff是胎儿游离核酸百分比;
α是根据在胎儿游离DNA中来自于父亲的等位基因实际测值选取的离散参数,因其受实验条件的影响实测值会偏离期望值,使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β1=2×α/ff-α;
e是该位点的系统错误率,系统错误率是该位点在已知的阴性标本中的突变基因型的比例;α是系统噪音实测得的离散参数,确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β2=α/e-α
当ΔL大于检测阈值时,其中,所述检测阈值为1,基因突变为阳性。
在一个优选的实施方案中,前述本发明的一种用于胎儿无创产前筛查的系统,所述分析单元还用于:计算胎儿游离核酸百分比(ff),其中,
所述计算胎儿游离核酸百分比(ff)为:
当母亲是纯合野生型BB时,胎儿的基因型可能为BB或者BA,对于胎儿为BA的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点A的读数比例中值ffBB计算;对于母亲是纯合变异型AA的时候,胎儿的基因型可能为AA或者AB,对于胎儿为AB的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点B的读数比例中值ffAA计算;胎儿游离核酸百分比(ff)的计算为:
ff=(ffAA+ffBB)/2
优选地,计算胎儿游离核酸百分比时,选定任意染色体的位点;
更优选地,选定人类基因组拷贝数很少改变的位点;
进一步优选地,选定人类基因组拷贝数很少改变的位点,这些位点为包括或不包括染色体13,18,21,22,X和Y中的位点。
在一个优选的实施方案中,前述本发明的一种用于胎儿无创产前筛查的系统,其中,待检测的SNP位点是待检测染色体中选择的一个或多个SNP位点,是包含SNP位点的所有染色体中的一个或多个;优选地,所述待检测的SNP位点是染色体13,18,21,22,X和Y中的一个或多个。
在一个优选的实施方案中,前述本发明的一种用于胎儿无创产前筛查的系统,所述分析单元还用于:针对父母生殖细胞产生过程中可能发生一次染色体重组的情况,染色体SNP位点概率总和的计算,其中,
染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000391
Figure BDA0002632233670000392
H1,H2∈{MI,MII,PI,PII}当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性,阴性样本和阳性样本的检测阈值见表3。
在一个优选的实施方案中,前述本发明的一种用于胎儿无创产前筛查的系统,所述分析单元还用于:针对父母生殖细胞产生过程中可能发生一次或者两次染色体重组的情况,染色体SNP位点概率总和的计算,其中,
染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000393
Figure BDA0002632233670000394
H1,H2∈{MI,MII,PI,PII},
b1和b2是染色体发生重组的计算位置,当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性,阴性样本和阳性样本的检测阈值见表3。
在一个优选的实施方案中,前述本发明的一种用于胎儿无创产前筛查的系统,所述检测单元包括针对所述一个或多个SNP位点的靶向捕获探针,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2。
在一个优选的实施方案中,前述本发明的一种用于胎儿无创产前筛查的系统,所述检测单元包括针对所述一个或多个SNP位点的靶向捕获探针,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2,所述靶向捕获探针为根据前述发明中任一个所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备的靶向捕获探针。
在另一个优选的实施方案中,前述本发明的一种用于胎儿无创产前筛查的系统,所述检测单元包括针对所述一个或多个SNP位点的靶向捕获探针,其中,所述探针的长度为100-200bp;优选地,所述探针的长度为100-190bp、或100-180bp、或100-170bp、或100-160bp、或100-150bp、或100-140bp、或100-130bp、或100-120bp、或110-200bp、或110-190bp、或110-180bp、或110-170bp、或110-160bp、或110-150bp、或110-140bp、或110-130bp、或110-120bp;进一步地,所述探针的长度为100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp。
本发明第八方面提供了靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中所述靶向捕获探针为针对所述一个或多个SNP位点的靶向捕获探针;
优选地,所述靶向捕获探针是根据前述发明中任一个所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备的靶向捕获探针;
更优选地,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2,所述靶向捕获探针是根据前述发明中任一个所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备。
在另一个实施方案中,前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中所述靶向捕获探针为针对所述一个或多个SNP位点的靶向捕获探针,其中,所述探针的长度为100-200bp;优选地,所述探针的长度为100-190bp、或100-180bp、或100-170bp、或100-160bp、或100-150bp、或100-140bp、或100-130bp、或100-120bp、或110-200bp、或110-190bp、或110-180bp、或110-170bp、或110-160bp、或110-150bp、或110-140bp、或110-130bp、或110-120bp;进一步地,所述探针的长度为100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp。
在一个优选的实施方案中,前述本发明的靶向捕获探针在制备检测胎儿无创产前筛查的试剂或试剂盒中的应用,或靶向捕获探针用于胎儿无创产前筛查,或用于胎儿无创产前筛查的靶向捕获探针,其中胎儿无创产前筛查的方法包括:本发明第一方面提供的一种用于胎儿无创产前筛查的检测方法的部分或全部方法或步骤,或本发明第二方面还提供了一种用于染色体拷贝数变异、染色体微缺失/微重复、和/或显性单基因突变的检测方法的部分或全部方法或步骤。
在本发明中,多核苷酸的核苷酸序列具有与参考核苷酸序列至少具90%的“同一性”是指:在参考核苷酸序列的每100个核苷酸中,该多核苷酸的核苷酸序列除了含有最多达10个核苷酸的不同外,该多核苷酸的核苷酸序列与参考序列相同。换而言之,为了获得核苷酸序列与参考核苷酸序列至少90%同一性的多核苷酸,参考序列中多达10%的核苷酸可被其他核苷酸替代或缺失;或可将一些核苷酸插入到参考序列中,其中插入的核苷酸可多达参考序列之总核苷酸的10%;或在一些多核苷酸中,存在缺失、插入和替换的组合,其中所述缺失、插入和替换的核苷酸多达参考序列之总核苷酸的10%。参考序列的这些缺失、插入和替换可发生在参考核苷酸序列的5’或3’末端位置,或在这些末端位置之间的任意地方,它们或单独散在于参考序列的核苷酸中,或以一个或多个邻近的组存在于参考序列中。
在本发明中,用于确定序列同一性和序列相似性百分数的算法例如包括BLAST和BLAST 2.0算法。BLAST和BLAST 2.0可以用于确定本发明的核苷酸序列同一性百分数。执行BLAST分析的软件可以通过国立生物技术信息中心(NCBI)为公众所获得。
在本发明中,所述与参考序列所示的核苷酸序列具有至少90%的序列同一性的核苷酸序列包括与参考序列所公开序列基本同一的多核苷酸序列,例如当采用本发明所述方法(例如采用标准参数的BLAST分析)时,与本发明多核苷酸序列相比含有至少90%序列同一性、优选至少91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的那些序列。
在本发明实施方案中,“杂交条件”根据测量杂交时所用条件的“严紧性”程度来分类。严紧性程度可以以例如核酸结合复合物或探针的解链温度(Tm)为依据。例如,“最大严紧性”典型地发生在约Tm-5℃(低于探针Tm 5℃);“高等严紧性”发生在Tm以下约5-10℃;“中等严紧性”发生在探针Tm以下约10-20℃;“低严紧性”发生在Tm以下约20-25℃。作为替代,或者进一步地,杂交条件可以以杂交的盐或离子强度条件和/或一次或多次的严紧性洗涤为依据。例如,6×SSC=极低严紧性;3×SSC=低至中等严紧性;1×SSC=中等严紧性;0.5×SSC=高等严紧性。从功能上说,可以采用最大严紧性条件确定与杂交探针严紧同一或近严紧同一的核酸序列;而采用高等严紧性条件确定与该探针有约80%或更多序列同一性的核酸序列。
对于要求高选择性的应用,典型地期望采用相对严紧的条件来形成杂交体,例如,选择相对低的盐和/或高温度条件。Sambrook等(Sambr00k,J.等(1989)分子克隆,实验室手册,Cold Spring HarborPress,Plainview,N.Y.)ISBN-10 0-87969-577-3提供了包括中等严紧性和高等严紧性在内的杂交条件。
为便于说明,用于检测本发明的多核苷酸与其它多核苷酸杂交的合适的中度严紧条件包括:用5×SSC、0.5%SDS、1.0mM EDTA(PH8.0)溶液预洗;在50-65℃下在5×SSC中杂交过夜;随后用含0.1%SDS的2×、0.5×和0.2×SSC在65℃下各洗涤两次20分钟。本领域技术人员应当理解,能容易地操作杂交严紧性,如改变杂交溶液的含盐量和/或杂交温度。例如,在另一个实施方案中,合适的高度严紧杂交条件包括上述条件,不同之处在于杂交温度升高到例如60-65℃或65-70℃。
附图说明
图1显示了捕获前后对目标区的富集程度对比。对于非捕获区DNA片段,杂交捕获前与捕获后相比富集程度没有改变。但是对于捕获区DNA片段,杂交捕获后与捕获前相比,富集程度要超出10倍符合质检要求。
图2显示了杂交捕获时间4小时或16小时对目标区的捕获效率无明显改变。
图3显示了捕获前后对目标区的富集程度对比的量化分析。
图4a、4b显示了捕获前后对目标区的富集程度对比的量化分析。
图5显示了COATE方法的突变基因提高了等位基因的捕获均一性的结果。
图6显示了COATE方法减少采样偏差的结果。
图7a、7b分别显示了样本中CAF测得的实验误差振动范围,以及样本的杂合子突变平均CAF值的结果。
图8显示了胚系杂合子CAF的NGS测序试验误差振动范围的结果。
图9显示了基于SNP的胎儿DNA百分比计算与Y染色体计算的比较结果(N=128)。
图10a、10b、10c、10d分别显示了染色体13,18,21的L(D)-L(H),H∈{MI,MII,PI,PII}在203个阴性样本中的概率值,有202个样本大于-10,有一个阴性样本的差值L(D)-L(PI)小于-10,结论是如果把阴性阈值设置为-10,假阳性率约为0.5%。
图11a、11b分别显示了染色体13,18,21的L(D)-L(MI)在阳性参考品中的概率值与阳性参考品混合比例的关系,图11a小框中的部分放大显示于图11b。在阳性参考品混合比例大于4%的时候,L(D)-L(MI)的值小于-10。
图12显示了染色体13,18,21的L(D)-L(MI)在阳性孕妇血浆中的概率值与胎儿百分比的关系,在胎儿百分比大于4%的时候,所有阳性样本L(D)-L(MI)的值都小于-10。
图13a、13b分别显示了染色体21异常样本不同SNP位点的L(D)-L(MI)和L(D)-L(MII)的值,移动平均线和它们的累计曲线;图13c、13d分别显示了染色体13异常样本不同SNP位点的L(D)-L(MI)和L(D)-L(MII)的值,移动平均线和它们的累计曲线。
图14显示了染色体22不同SNP位点的L(D)-L(LM)和L(D)-L(LP)的值和移动平均线。
具体实施方式
以下通过实施例的方式对本发明进行详细描述,需要指出的是,在下述实施中,除非特意表明,文中未注明具体实施条件的实验方法,通常按照常规条件或按照仪器制造商所建议的条件进行。除非另行定义,本文所使用的所有专业与科学用语与本领域技术人员所熟悉的意义相同。
实施例1:靶向探针捕获DNA
a.血浆分离和游离DNA提取:
将采血管置于离心机中,1600g离心,离心时间:EDTA抗凝管10min、Streck管15min。离心完成后,由上至下缓慢吸取上清液到5mL中转管中,16000g再次离心10min,血浆进行二次离心的目的是为了去除所有的细胞污染物。使用TIANGEN磁珠法大体积游离核酸提取试剂盒进行游离DNA提取,包括蛋白酶K处理血浆样本,60℃水浴20min,加入MagAttract Suspension E、Buffer GHH和Carrier RNA,涡旋混匀30s后室温孵育15min使磁珠吸附核酸。使用漂洗液Buffer PWG,涡旋混匀,使磁珠充分悬浮。最后用洗脱液溶解核酸,收集洗脱液并质检定量。
b.测文库构建:
使用End repair&A-tailing Buffer,End repair&A-tailing Enzyme对游离DNA进行末端修复,按以下条件进行反应:20℃30min;65℃30min。使用mADPta01(15μM)、Ligation Buffer、DNA Ligase进行加接头反应,按以下条件进行反应:20℃15min。使用2XHiFi PCR MasterMix和HS-mp101(100μM)、Index Primer(4nmol)(100μM)进行PCR扩增和加测序标签。PCR扩增后使用磁珠进行片段筛选和纯化回收。文库质检使用QubitTM 1X dsDNAHS Assay Kit进行文库定量,要求游离DNA文库≥500ng,如不满足此条件,则需要重新建库。取1μL文库,加入3μL 2X Loading Buffer进行电泳,电压120V,时间30min,检查电泳条带是否异常。
c.富集、文库杂交、文库洗脱、PCR扩增、文库纯化、文库质检
1.富集
1.1将步骤b所获得的NGS文库标本,或多个(如24个)经末端修复、接头连接、index+通用引物扩增不同NGS文库标本(此处可适用于其他的NGS文库制备方案产生的标本)各400ng置于新的1.5mL低吸附离心管中混匀,并取出一定量混合样品作为杂交捕获前留样,暂存于4℃冰箱。
2.文库杂交
2.1 AMpure XP beads(后面步骤简称XP磁珠)需要提前取出,室温平衡30min,涡旋混匀后再使用。80%乙醇根据使用量进行配制,现配现用。
2.2按照表4将Cot-1 DNA和XP磁珠加入到步骤1.1中含有总文库的1.5mL低吸附离心管中,吹打混匀,室温孵育10min,瞬时离心,将离心管置于磁力架上5min,至液体完全澄清后,弃去上清。
表4
组分 加入量
混合文库 使用步骤1.1制备的文库
Human Cot-1 DNA 7.5μL
XP磁珠 上两项体积之和的1.8倍
混合文库:满足质检要求即可,混合文库体积不设定量化范围。
2.3在磁力架上沿管壁缓慢加入80%乙醇,确保没过XP磁珠,静置30s,弃去上清。
2.4重复步骤2.3一次。
2.5瞬时离心,用10μL移液器去除残留乙醇,将离心管放在预先升温到37℃的恒温混匀仪上,至XP磁珠表面80%乙醇完全去除。
注意:保证XP磁珠不能过于干燥,不裂口。
2.6按表5在0.2mLPCR管中配制洗脱液,涡旋混匀。
表5
试剂名称 体积(μL)
XGen 2X Hybridization Buffer 9.5
XGen Hybridization Buffer Enhancer 3
NanoPrep Blocker 2
探针 4.5
总体积 19
2.7将上述19μL洗脱液加入到步骤2.5中干燥好的XP磁珠中,吹吸混匀,室温放置5min。将其于磁力架上静置2min,转移17μL上清到新的0.2mL低吸附PCR管中,瞬时离心。将0.2mL PCR管放于基因扩增仪,反应条件为95℃30s;65℃16h;65℃hold(热盖温度为100℃)。
3.文库洗脱:
3.1对于单次捕获反应,稀释缓冲液,如表6所示:
表6
试剂名称 浓缩缓冲液(μL) NF水(μL)
2X Bead Wash Buffer 250 250
10X Wash Buffer I<sup>*</sup> 30 270
10X Wash Buffer II 20 180
10X Wash Buffer III 20 180
10X Stringent Wash Buffer 40 360
3.2将经步骤3.1稀释后制得的1X Wash Buffer I和1X Stringent Wash Buffer按照表7中的体积进行分装,将需要65℃保存的buffer在步骤3.9时放到基因扩增仪,其他buffer室温放置:
表7
试剂名称 体积 离心管规格(mL) 存放条件
Wash Buffer I<sup>*</sup> 100μL 0.2 65℃
Wash Buffer I<sup>*</sup> 200μL 1.5 室温
Stringent Wash Buffer 200μL 0.2 65℃
Stringent Wash Buffer 200μL 0.2 65℃
3.3在使用前将M-270磁珠在室温下平衡30min,涡旋15s彻底混匀。将每次捕获需要的100μL M-270磁珠等分至单个1.5mL低吸附离心管中。将1.5mL低吸附离心管置于磁力架上静置2min,使M-270磁珠与上清液完全分离。弃上清液,确保M-270磁珠留在管中。
3.4清洗M-270磁珠:向上述离心管中加入200μL 1X Bead Wash Buffer,并涡旋10s,瞬时离心,将离心管置于磁力架上,使M-270磁珠与上清液完全分离,弃上清液。
3.5重复步骤3.4一次。
3.6向上述离心管中加入100μL 1X Bead Wash Buffer,吹吸混匀。
3.7将100μL重悬的M-270磁珠分别转移到新的0.2mL低吸附PCR管中。
3.8将0.2mL低吸附PCR管放入杂交完毕且温度在65℃的基因扩增仪上,并将磁条靠近PCR管,使M-270磁珠与上清液完全分离并弃上清液。
注意:立即进入下一部分。
3.9将步骤2.7中的杂交样品转移到3.8中的0.2mL低吸附PCR管中,用移液器轻柔吹吸10次使其彻底混匀(此步骤使用20μL低吸附枪头)。在65℃孵育45min,每15min轻柔吹吸10次,以确保M-270磁珠磁珠保持悬浮状态。
3.10向步骤3.9的管中加入100μL已经65℃预热的1X Wash BufferI。用移液器缓慢吹吸10次混匀。将磁条靠近PCR管,使M-270磁珠磁珠与上清液完全分离,弃上清液。
3.11加入200μL已经65℃预热的1X Stringent Wash Buffer,用移液器缓慢吹吸10次混匀。65℃孵育5min,将磁条靠近PCR管,使M-270磁珠磁珠与上清液完全分离,弃上清液。
3.12重复步骤3.11一次。
3.13加入200μL室温放置的1X Wash Buffer I,吹吸混匀后将其转入到1.5mL低吸附离心管中并涡旋2min,将1.5mL低吸附离心管放入磁力架中,使M-270磁珠磁珠与上清液完全分离,弃上清液。
3.14加入200μL室温1X Wash Buffer II并涡旋1min,将1.5mL低吸附离心管放入磁力架中,使M-270磁珠磁珠与上清液完全分离,弃上清液。
3.15加入200μL室温1X Wash Buffer III并涡旋30s,将1.5mL低吸附离心管放入磁力架中,使M-270磁珠磁珠与上清液完全分离,弃上清液。
3.16从磁力架上取下上述1.5mL低吸附离心管,向M-270磁珠磁珠中加入20μL NF水,吹吸混匀,使磁珠重新悬浮,确保任何粘在管子侧面的磁珠都重新悬浮。
注意:不要丢弃磁珠,在步骤4.2中使用整个20μL重悬的磁珠和捕获的DNA文库。
4.PCR扩增:
4.1取出2X HiFi PCR Master Mix和NanoPrepTMM-Amplificatiom Primer Mix在冰上自然融化,NanoPrepTMM-Amplificatiom Primer Mix涡旋混匀,瞬时离心备用。按照表8在置于冰上的0.2mL PCR管中配制PCR反应体系并涡旋混匀,瞬时离心。
注意:捕获DNA的磁珠单独加入,并吹吸混匀。
表8
试剂名称 体积(μL)
2X HiFi PCR Master Mix 25
NanoPrepTMM-Amplificatiom Primer Mix 5
捕获DNA的磁珠 20
总体积 50
4.2将0.2mL PCR管放入基因扩增仪中,并在加热盖为105℃的条件下运行以下程序:
表9
Figure BDA0002632233670000481
5.文库的纯化:
5.1 XP磁珠需要提前取出,室温平衡30min,涡旋混匀后再使用,80%乙醇根据使用量进行配制现配现用。
5.2扩增结束后取下0.2mL PCR管,瞬时离心。将50μL扩增产物转移至含有75μL XP磁珠的1.5mL低吸附离心管中,点振10次,静置10min。
5.3将离心管置于磁力架上5min,弃去上清,加入200μL 80%乙醇,乙醇需没过XP磁珠,静置30s,弃上清。
5.4重复步骤5.3。
5.5瞬时离心,用10μL移液器将残留乙醇去除,将离心管放在预先升温到37℃的恒温混匀仪上,至XP磁珠表面80%乙醇完全去除。
注意:保证磁珠不能过于干燥,不裂口。
5.6向干燥好的XP磁珠中加入33μL NF水,吹吸混匀。室温放置2min,将离心管置于磁力架上2min,将30μL洗脱产物转移至新的1.5mL低吸附离心管中,确保没有携带磁珠。
6.文库质检:
6.1Qubit定量:取1μL文库样本用QubitTM dsDNA HS Assay Kit准确定量核酸浓度。
6.2电泳检测:对捕获前和捕获后的文库各取20ng,用水稀释到4μL,分别用P2、P3、N2三对引物进行扩增,扩增体系如下表10,扩增程序如下表11。
表10
Figure BDA0002632233670000491
表11
Figure BDA0002632233670000501
扩增完成后在产物中加入5μL 2X Loading Buffer,用1.5%的琼脂糖凝胶120V电压,电泳30min。查看对比电泳结果。
结果分析
1.捕获前后对目标区的富集程度对比。用于文库杂交质检的PCR引物见表12。对于非捕获区DNA片段,杂交捕获前与捕获后相比富集程度没有改变。但是对于捕获区DNA片段,杂交捕获后与捕获前相比,富集程度要超出10倍符合质检要求(图1)。
表12:用于文库杂交质检的PCR引物
Figure BDA0002632233670000502
2.杂交捕获时间4小时或16小时对目标区的捕获效率无明显改变,如图2所示。
3.捕获前后对目标区的富集程度对比的量化分析。如图3、图4a、图4b以及表13和表14所示,捕获后可以富集20倍以上的目标区域DNA。
表13:图3所示不同泳道的DNA量(量化单位)
Figure BDA0002632233670000511
表14:图4a所示不同泳道的DNA量(量化单位)
Figure BDA0002632233670000512
实施例2:测序
测序采用华大高通量测序平台MGISEQ-2000以及配套试剂高通量测序试剂套装(PE100)进行。测序原理为使用联合探针锚定聚合技术(cPAS),通过将DNA分子锚和荧光探针在DNA纳米球(DNB)上进行聚合,并利用高分辨率成像系统对光信号进行采集,光信号经过数字化处理后获得高质量高准确度的样本序列信息。捕获后扩增的文库需要捕获后扩增的文库需要经过下列步骤才能完成测序输出fastq文件,文库定量,环化,DNB制备,高通量测序,和数据拆分和比对:
1.进行浓度及片段长度的质控,浓度测定使用invitrogen Qubit Fluorometer及配套试剂Qubit 1X dsDNA HS Assay Kit,片段长度使用Aglient2100生物分析仪及配套试剂Aglient DNA 1000 Reagents;
2.环化:要求文库摩尔质量≥1pmol。1pmol PCR产物对应的质量(ng)=DNA主片段大小(bp)x 660ng/1000bp。根据上步骤中的浓度及片段长度信息计算投入量。使用华大MGIEsay环化试剂盒进行变性,单链环化,酶切消化以及纯化。使用Qubit ssDNA Assay Kit定量,要求环化得率≥7%,环化得率=酶切消化纯化后的产物产量/投入量x 100%;
3.DNA制备:环化完成后初始文库ssDNA浓度≥2fmol/μL,投入量40fmol。文库需用Qubit ssDNA Assay Kit和Qubit Fluorometer定量出文库实际浓度(ng/μL),根据定量的结果计算投入量。
注:投入体积V(μL)=N x 330g/mol x40fmol/(1000x1000x C)
N表示核苷酸数目(文库总片段长度),C表文库浓度ng/μL
DNB制备完成后,使用Qubit ssDNA Assay Kit定量,要求DNB浓度≥8ng/ul方可上机测序。
4.数据拆分和比对:当测序正在进行时,测序仪控制软件自动调用base call软件分析,并输出测序数据fastq到指定位置用于数据拆分。Fastq数据使用bwa软件(http://bio-bwa.sourceforge.net/)比对到人类基因组组装版本38。下面是一个批次(30)的测序结果(表15):
表15
Figure BDA0002632233670000521
实施例3:寡核苷酸探针协同等位基因靶标富集方法提高目标区域等位基因的捕获均一性
我们采用寡核苷酸探针协同等位基因靶标富集方法(COATE)减少了探针与参考和突变等位基因在内的靶标的杂交退火温度差(ΔTm)。与传统的探针设计不同的是,本发明提供的探针设计方法并不要求设计的探针与参考基因组序列或突变序列互补,这些探针可以和也可以不和参考或突变等位基因互补,只需要探针对捕获区的参考基因序列(野生型)和突变序列(突变型)的ΔTm最小即可。
以下为一个SNP捕获探针设计实例:针对染色体13上的SNP位点rs7321990(chr13:20257054-20257054)有两个等位基因A和G(互补碱基为T和C),需要捕获的目标序列为:
目标序列1:
Figure BDA0002632233670000531
目标序列2:
Figure BDA0002632233670000532
用于捕获目标序列的捕获探针序列可被设计为:
捕获探针1:
Figure BDA0002632233670000533
捕获探针2:
Figure BDA0002632233670000534
捕获探针3:
Figure BDA0002632233670000535
捕获探针4:
Figure BDA0002632233670000541
四种捕获探针分别与目标序列1和目标序列2的杂交退火温度(Tm)如表16所示。
表16
捕获探针1 捕获探针2 捕获探针3 捕获探针4
目标序列1 81.678 81.011 80.952 81.458
目标序列2 81.582 80.694 81.228 82.017
Tm差值(ΔTm) 0.096 0.317 0.276 0.559
根据捕获探针对参考基因序列(野生型)和突变序列(突变型)的ΔTm最小的原则,我们在实验中选择捕获探针1来捕捉染色体13上的SNP位点rs7321990。
在对8个样本进行了胚系游离核酸提取,文库构建,高通量测序按照实施例2所描述,捕获探针采用传统设计或者寡核苷酸探针协同等位基因靶标富集方法。这8个本在339个SNP位点都是杂合子并且具有相同的突变基因型,这些杂合子的两种探针杂交突变频率的对比结果如图5所示:对于相同的目标区域,COATE方法的突变基因提高了等位基因的捕获均一性,杂合子突变基因比例更加接近0.5(0.499±0.0148 Vs 0.495±0.0213 95%Cl);
COATE方法也减少了采样偏差,COATE方法的杂合子突变基因比例方差是传统探针方法的68%,对于不同位点的方差比较如图6所示。
在胚系杂合子突变的中心等位基因百分比(CAF,central allele fraction)对比测试中,相对于传统探针设计方法,基于COATE法设计的探针对目标区富集后进行的NGS测序,这一组样本中CAF测得的实验误差振动范围显著减小(CAF_SDCOATE=0.0148,CAF_SDCONVENTION=0.0213,p=0.00142,95%Cl,N=8,如图7a所示)。此外,在这8个样本中,每个样本的杂合子突变平均CAF值也更接近0.5,(CAFCOATE=0.499,CAFCONVENTION=0.495,p=0.00001,95%Cl,N=8,如图7b所示)。
此前基于多重PCR技术的NIPS,需要通过对多达20000个位点进行分析,确保胎儿CNVs产生可改变孕妇血浆游离DNA AF的有效信号超过CAF的实验误差造成的变化。由于我们将胚系杂合子CAF的NGS测序试验误差振动范围降低(如图8所示),与传统的与多重PCR技术的NIPS相比,此发明对21、18、13号染色体的探针的使用数量降低了60-80%。液相杂交技术相对多重PCR对目标区域不同转座子之间富集效率更均衡。
实施例4:21三体综合征阴性阈值的确定
203个阴性样本经过游离核酸提取,文库构建,分三个批次完成测序如实施例2所描述。经过染色体非整倍体检测流程分析:分别计算了胎儿在二倍体以及不同三倍体下的L(H)。胎儿染色体非整倍体检测方法简明步骤如下:
(1)检测和计算胎儿游离核酸百分比(ff)
选定人类基因组拷贝数很少改变的位点,这些位点不包括染色体13,18,21,22X和Y中的位点;当母亲是纯合野生型BB时,胎儿的基因型可能为BB或者BA,对于胎儿为BA的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点A的读数比例中值ffBB计算;对于母亲是纯合变异型AA的时候,胎儿的基因型可能为AA或者AB,对于胎儿为AB的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点B的读数比例中值ffAA计算;胎儿游离核酸百分比(ff)的计算为:
ff=(ffAA+ffBB)/2
在基于本发明的SNP方法的胎儿DNA百分比计算的性能验证实验中,在128个男性胎儿的孕妇血浆里比较了本发明的SNP方法和根据Y染色体计算方法的结果。两组数据显示了较高的相关性(R2=0.968,如图9所示)。
(2)在待检测染色体中选择一个或多个SNP位点,
(3)使用针对所述一个或多个SNP位点的靶向探针捕获母体外周血游离DNA(cfDNA),扩增后进行测序,测得等位基因A的读数NA,以及该位点的测序深度N;
(4)计算胎儿在各SNP位点可能为染色体拷贝数正常或不同拷贝数异常情况的概率;根据每一个SNP位点实测到cfDNA的突变基因型百分比(A%)、胎儿游离核酸百分比(ff)和母亲在此位点的基因型,分别计算胎儿是整倍体或者非整倍体的概率值;同一染色体所有有效SNP位点概率总和最大值为胎儿判读的核型;
计算的胎儿核型H包括:D(二倍体型,disomy)、MI(母源三体综合症I型,maternaltrisomy type I)、MII(母源三体综合症II型,maternal trisomy type II)、PI(父源三体综合症I型,paternal trisomy type I)、PII(父源三体综合症II型,paternal trisomytype II)、LM(母源微缺失,maternal deletion)和LP(父源微缺失,paternal deletion);
胎儿在各SNP位点的核型概率是通过π加权的有条件贝塔二项式分布概率的线性组合并取对数得出,计算公式为:
Figure BDA0002632233670000561
(5)染色体拷贝数变异的计算
在精子或者卵子产生过程中,如果被考察的某条染色体没有发生减数分裂同源重组,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure BDA0002632233670000562
H∈{MI,MII,PI,PII,LM,LP}
LD是该位点在整倍体核型下的概率值;
LH是该位点在非整倍体核型下的概率值;
当此值小于检测阈值时,染色体倍数异常为阳性,所述检测阈值用已知产前诊断结果的孕妇血浆样本和人工混合的参考品样品的检测结果确定。
针对父母生殖细胞产生过程中可能发生一次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000571
Figure BDA0002632233670000572
H1,H2∈{MI,MII,PI,PII}当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性。
针对父母生殖细胞产生过程中可能发生一次或者两次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000573
Figure BDA0002632233670000574
H1,H2∈{MI,MII,PI,PII},
b1和b2是染色体发生重组的计算位置,当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性。
分析结果如图10a、10b、10c、10d所示,染色体13,18,21的L(D)-L(H)在203个阴性样本中的值有202个样本大于-10,有一个阴性样本的差值L(D)-L(PI)小于-10。结论是如果把阴性阈值设置为-10,假阳性率约为0.5%。
实施例5:21三体综合征阳性阈值的确定
T21的阳性参考样本Coriell DNA NG09394和母亲的DNA NG09387用酶切方法打断(KAPA fragmentase,20分钟)为约180bp的片断,然后混合成下面比例:3%,3.5%,4%,5%,10%,15%,30%。进行文库构建,完成测序如实施例2所描述。经过染色体非整倍体检测流程分析:分别计算了胎儿在二倍体以及不同三倍体下的L(H)。胎儿染色体非整倍体检测方法步骤如实施例4所描述。
图11a、11b显示了染色体非整倍体检测流程分析不同胎儿百分比的T21阳性参考样本结果,胎儿百分比越高,对于正常二倍体的染色体13,18的L(D)-L(MI)值随胎儿百分比增高而变大;而异常染色体21的L(D)-L(MI)值随胎儿百分比增高而变小。如果采用实施例4的阴性阈值设置-10,胎儿百分比大于4%的时候异常21号染色体可以被此非整倍体检测流程检测出。图11a小框中的部分放大显示于图11b。
实施例6:孕妇血浆21三体综合征的检测方法
八例染色体21三倍体的孕妇血浆经过游离核酸提取,文库构建,完成测序如实施例2所描述。经过染色体非整倍体检测流程分析如实施例4所描述:分别计算了胎儿在整倍体以及不同三体下的L(H)。图12显示了染色体非整倍体检测流程分析不同胎儿百分比的孕妇染色体21阳性样本结果,胎儿百分比越高,对于正常整倍体的染色体13,18的L(D-MI)值随胎儿百分比增高而变大;而异常染色体21的L(D)-L(MI)值随胎儿百分比增高而变小。如果阳性阈值设置-10,胎儿百分比大于4%的时候染色体21异常可以被此非整倍体检测流程检测出。
实施例7:对发生了同源染色体重组的三体检测方法
由于卵母细胞的生命周期长而且复杂,因此染色体三体主要起源于卵子的形成过程。目前认为至少存在三种不同的减数分裂的不分离模式:因卵母细胞第一次减数分裂期(MI)发生了同源染色体不分离、因卵母细胞第二次减数分裂期(MII)发生了姐妹染色单体不分离。第三种较为罕见,为受精卵形成后发生的有丝分裂期的染色体不分离。实施例5-6描述了卵母细胞未发生染色体重组时形成三体的情形,下面的例子阐明如果卵母细胞发生了染色体重组后形成的三体综合征的计算方式。如果卵母细胞在MI发生了同源染色体重组,且发生了MI的同源染色体不分离,那么在计算胎儿三体的似然值的时候需要考虑L(MI/MII)的混合模式;如果卵母细胞在MI发生了同源染色体重组,且发生了MII的姐妹染色单体不分离,那么在计算胎儿三体的似然值的时候需要考虑L(MII/MI)的混合模式,由此计算整条染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000581
Figure BDA0002632233670000591
针对父母生殖细胞产生过程中可能发生两次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure BDA0002632233670000592
Figure BDA0002632233670000593
H1,H2∈{MI,MII,PI,PII},
b1和b2是染色体发生重组的计算位置,当上述两个计算结果之一小于表3检测阈值时,染色体倍数异常为阳性。
发生一次染色体重组导致染色体21异常的样本分析结果如图13a、13b所示:突变基因型比例分布显示染色体21异常,造成异常的原因可能为母体MI的错误,在异常卵细胞形成的时候染色体21的长臂发生了一次同源染色体重组,这与L(D)-L(M)移动平均线(图13a)的结果一致,上面整条染色体SNP位点概率累加总和的结果(图13b)进一步确认了我们的结果。发生两次染色体重组导致染色体13异常的样本分析结果分析如图13c、13d所示:突变基因型比例分布显示染色体13异常,造成异常的原因可能为母体MII的错误,在异常卵细胞形成的时候染色体13的长臂发生了两次同源染色体重组,这与L(D)-L(M)移动平均线(图13c)的结果一致,上面整条染色体SNP位点概率累加总和的结果(图13d)进一步确认了我们的结果。结论是当父母染色体在减数分裂期间发生重组和不分离导致的三倍体综合症,可以被此染色体非整倍体检测流程分析检测出。
实施例8:染色体微缺失的检测(DiGeorge的实例)
染色体微缺失的阳性参考细胞系GM10382(46,XY.arr[hg19]1q42.13(227047013-227285131)x1,22q11.21(18876415-21465835)x1)和母亲(正常)的细胞系GM10384经过核酸提取(天根基因组核算提取试剂盒)得到的基因组DNA用酶切方法打断(KAPAfragmentase,20分钟)为约180bp的片断,然后混合成10%的比例。打断后的DNA进行文库构建,完成测序如实施例2所描述。经过染色体非整倍体检测流程分析:分别计算了胎儿在单倍体,二倍体,和三倍体下的L(H)。胎儿染色体非整倍体检测方法步骤如实施例4所描述。
分析结果如图14所示:单倍体与二倍体突变基因型比例概率差分布显示染色体22异常,造成异常的原因可能为胎儿染色体22q11区域至少发生0.5MB来母体DNA的微缺失,这与D-LM移动平均线的结果一致。表17统计结果表明此胎儿其他染色体正常,与阳性参考品的结果一致。
表17
Figure BDA0002632233670000601
实施例9:显性单基因突变的检测性(FGFR3:.pG380R)
两对阳性参考品的子代DNA含有致病致病性基因突变FGFR3:c.1138G>A(p.Gly380Arg),母代DNA正常,该位点地基因组坐标为Chr4:1804392(GRCh38)。子代与母代DNA用酶切方法打断(KAPA fragmentase,20分钟)为约180bp的片断,然后混合成下面比例:3.5%,5%,10%。打断后的DNA进行文库构建,完成测序和数据比对如实施例2所描述。显性单基因突变检测中,胎儿来自父亲或者是新突变的概率的计算公式为:
ΔL=log(beta-binom(ff/2,N,α,β1))
-log(beta-binom(e,N,α,β2))
N是该位点的测序深度,ff是胎儿游离核酸百分比,α是实验离散参数,β1=2×α/ff-α,e是该位点的系统错误率,系统错误率是该位点在阴性标本中的突变基因型的比例,即AF值,背景系统噪音,
β2=α/e-α,
ΔL是该位点基因突变的概率,当ΔL大于检测阈值1时,基因突变为阳性。
位点FGFR3:c.1138G>A(chr4:1804392)的捕获探针序列如表18所示。
表18
Figure BDA0002632233670000611
单基因突的检测结果如表19所示,11个阴性样本在该位点的系统错误率为0.0000448,不同的阳性参考品的基因突变的概率ΔL都远大于检测阈值1。
表19
Figure BDA0002632233670000612
Figure BDA0002632233670000621
实施例10:显性单基因突变的检测性能分析
25对子代与母代DNA用酶切方法打断(KAPA fragmentase,20分钟)为约180bp的片断,然后混合成下面比例:3%,3.5%,4%,5%,10%,20%,30%。进行文库构建,完成测序和数据比对如实施例2所描述。显性单基因突变与子代测序结果对比如表20所示,列表结果只考虑母代纯合野生型的位点:
真阳性:混合样本检测到,实际也出现在子代结果中
假阳性:混合样本检测到,未出现在子代结果中
真阴性:混合样本未检测到,未出现在子代结果中
假阴性:混合样本未检测到,实际出现在子代结果中
表20:单基因突变的监测的模拟性能分析
Figure BDA0002632233670000622
如上表所述,在胎儿游离核酸百分比为3.0%至30.0%的范围内,本发明方法均能够以极高的灵敏度、特异性得到检测结果。
实施例11:本发明的NIPS技术实验室性能验证结果分析
通过NGS对捕获的目标区母源和胎源性单核苷酸多态性(SNPs)进行定量统计。根据以上算法我们对确定临床结果的25例阳性样本和190例阴性样本进行了检测,结果阳性样本检出率为100%,阴性结果检出率为98.9%(表21)。该结果显示了本方法较高的准确性,下一步计划扩大检测范围和检测标本数量进一步对该方法的表现进行论证。
表21:本发明研发新NIPS技术实验室性能验证结果
Figure BDA0002632233670000631
尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
序列表
<110> 北京博昊云天科技有限公司
博昊云天智造(北京)科技有限公司
<120> 染色体和单基因病同步产前筛查的方法、试剂盒和分析系统
<130> 2020
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列()
<400> 1
tgggcttctt cctgttcatc 20
<210> 2
<211> 19
<212> DNA
<213> 人工序列()
<400> 2
ggaagcggga gatcttgtg 19
<210> 3
<211> 20
<212> DNA
<213> 人工序列()
<400> 3
agctgtcacc cacatcaaga 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列()
<400> 4
ttaattgccc gtgatgttcc 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列()
<400> 5
ggttcattaa cctgggctga 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列()
<400> 6
ctagccccaa gtgagacctg 20
<210> 7
<211> 120
<212> DNA
<213> 人工序列()
<400> 7
tggcgagttc tacccacctc ttgtgttcca cccaccggtt cacgtcttct tgtcgtccat 60
gaacccttca gactcctact gtcttggttc gtcgtctggg taagattcgg tccaacatta 120
<210> 8
<211> 120
<212> DNA
<213> 人工序列()
<400> 8
tggcgagttc tacccacctc ttgtgttcca cccaccggtt cacgtcttct tgtcgtccac 60
gaacccttca gactcctact gtcttggttc gtcgtctggg taagattcgg tccaacatta 120
<210> 9
<211> 120
<212> DNA
<213> 人工序列()
<400> 9
accgctcaag atgggtggag aacacaaggt gggtggccaa gtgcagaaga acagcaggta 60
cttgggaagt ctgaggatga cagaaccaag cagcagaccc attctaagcc aggttgtaat 120
<210> 10
<211> 120
<212> DNA
<213> 人工序列()
<400> 10
accgctcaag atgggtggag aacacaaggt gggtggccaa gtgcagaaga acagcaggtc 60
cttgggaagt ctgaggatga cagaaccaag cagcagaccc attctaagcc aggttgtaat 120
<210> 11
<211> 120
<212> DNA
<213> 人工序列()
<400> 11
accgctcaag atgggtggag aacacaaggt gggtggccaa gtgcagaaga acagcaggtt 60
cttgggaagt ctgaggatga cagaaccaag cagcagaccc attctaagcc aggttgtaat 120
<210> 12
<211> 120
<212> DNA
<213> 人工序列()
<400> 12
accgctcaag atgggtggag aacacaaggt gggtggccaa gtgcagaaga acagcaggtg 60
cttgggaagt ctgaggatga cagaaccaag cagcagaccc attctaagcc aggttgtaat 120
<210> 13
<211> 120
<212> DNA
<213> 人工序列()
<400> 13
gcctcaacgc ccatgtcttt gcagccgagg aggagctggt ggaggctgac gaggcgggca 60
gtgtgtatgc aggcatcctc agctacgggg tgggcttctt cctgttcatc ctggtggtgg 120

Claims (20)

1.一种用于胎儿无创产前筛查的检测方法,其包括以下步骤:
(1)检测和计算胎儿游离核酸百分比(ff);
(2)在待检测染色体中选择一个或多个SNP位点,其中所述SNP位点在人群中分布相对较高的等位基因称为野生型(B),在人群中分布相对较低的等位基因称为突变型(A),纯合野生基因型为BB,纯合突变基因型为AA,杂合基因型为AB;
(3)使用针对所述一个或多个SNP位点的靶向捕获探针捕获母体外周血游离DNA(cfDNA),扩增后进行测序,测得等位基因A的读数NA,以及该位点的测序深度N;
(4)计算胎儿在各SNP位点可能为染色体拷贝数正常或不同拷贝数异常情况的概率;根据每一个SNP位点实测到cfDNA的突变基因型百分比(A%)、胎儿游离核酸百分比(ff)和母亲在此位点的基因型,分别计算胎儿是整倍体或者非整倍体的概率值;同一染色体所有有效SNP位点概率总和最大值为胎儿判读的核型;
计算的胎儿核型H包括:D(二倍体型,disomy)、MI(母源三体综合症I型,maternaltrisomy type I)、MII(母源三体综合症II型,maternaltrisomy type II)、PI(父源三体综合症I型,paternal trisomy type I)、PII(父源三体综合症II型,paternal trisomy typeII)、LM(母源微缺失,maternal deletion)和LP(父源微缺失,paternal deletion);
胎儿在各SNP位点的核型概率是通过π加权的有条件贝塔二项式分布概率的线性组合并取对数得出,计算公式为:
Figure FDA0002632233660000011
i为第i个有效SNP位点;
N为该SNP位点的测序深度;pAi是胎儿为整倍体或非整倍体在不同基因座上突变型的下一代测序(NGS)读数百分比的期望值;在胎儿为不同核型时,pAi在不同基因座H上的基因型不同,其期望值也各不相同,具体不同基因座H的pAi见表1;
α是pAi根据在测序中实际值选取的离散参数;因其受实验条件的影响实测值会偏离期望值;使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β=α/pAi-α
加权系数πk的计算根据胎儿不同的核型计算:
Figure FDA0002632233660000012
其中PATk∈{AA,AB,BB},p(PATk)根据Hardy-Weinberg公式计算,该SNP位点的人群频率为p:
p(AA)=p×p
p(AB)=2×p×(1-p)
p(BB)=(1-p)×(1-p)
p(FET)是胎儿的可能基因型,其受父亲和母亲基因型影响,在胎儿为整倍体或非整倍体时,p(FET)按照孟德尔遗传规律计算,见表2;
(5)胎儿染色体拷贝数变异的计算
在精子或者卵子产生过程中,如果被考察的某条染色体没有发生减数分裂同源重组,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure FDA0002632233660000021
H∈{MI,MII,PI,PII,LM,LP}
LD是该位点在整倍体核型下的概率值;
LH是该位点在非整倍体核型下的概率值;
M为该染色体有效SNP位点个数;
当此值小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3。
2.根据权利要求1所述的用于胎儿无创产前筛查的检测方法,其特征在于,所述方法的步骤(5)为:
(5)胎儿染色体微缺失/微重复的计算
在精子或者卵子产生过程中,如果被考察的某条染色体发生部分缺失或者部分重复,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure FDA0002632233660000022
H∈{MI,MII,PI,PII,LM,LP},0<b1,b2<M
b1和b2是染色体发生微缺失/微重复的起始和终止位置;
当此值小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3;
或(5)显性单基因突变的计算
显性单基因突变出现在母亲是纯合野生型BB的区域,根据A的读数NA,位点的测序深度N,胎儿游离核酸百分比ff,和进行贝塔二项分布拟合计算出A读数来自胎儿的概率,并将此概率与系统噪音概率进行比较,其中:
在某个基因座上,母亲为纯和野生型BB时,胎儿来自父亲或者是新发突变的概率为:
ΔL=log(beta-binom(ff/2,N,α,β1))-log(beta-binom(e,N,α,β2))
N是该位点的测序深度;
ff是胎儿游离核酸百分比;
α是根据在胎儿游离DNA中来自于父亲的等位基因实际测值选取的离散参数,因其受实验条件的影响实测值会偏离期望值,使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β1=2×α/ff-α;
e是该位点的系统错误率,系统错误率是该位点在已知的阴性标本中的突变基因型的比例;α是系统噪音实测得的离散参数,确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β2=α/e-α
当ΔL大于检测阈值1时,基因突变为阳性。
3.根据权利要求1所述的用于胎儿无创产前筛查的检测方法,其特征在于,所述方法还包括:胎儿染色体微缺失/微重复的计算、显性单基因突变的计算、或胎儿染色体微缺失/微重复的计算和显性单基因突变的计算;
所述胎儿染色体微缺失/微重复的计算为:
在精子或者卵子产生过程中,如果被考察的某条染色体发生部分缺失或者部分重复,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure FDA0002632233660000031
H∈{MI,MII,PI,PII,LM,LP},0<b1,b2<M
b1和b2是染色体发生微缺失/微重复的起始和终止位置;
当此值小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3;
所述显性单基因突变的计算为:
显性单基因突变出现在母亲是纯合野生型BB的区域,根据A的读数NA,位点的测序深度N,胎儿游离核酸百分比ff,和进行贝塔二项分布拟合计算出A读数来自胎儿的概率,并将此概率与系统噪音概率进行比较,其中:
在某个基因座上,母亲为纯和野生型BB时,胎儿来自父亲或者是新发突变的概率为:
ΔL=log(beta-binom(ff/2,N,α,β1))-log(beta-binom(e,N,α,β2))
N是该位点的测序深度;
ff是胎儿游离核酸百分比;
α是根据在胎儿游离DNA中来自于父亲的等位基因实际测值选取的离散参数,因其受实验条件的影响实测值会偏离期望值,使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β1=2×α/ff-α
e是该位点的系统错误率,系统错误率是该位点在已知的阴性标本中的突变基因型的比例;α是系统噪音实测得的离散参数,确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β2=α/e-α
当ΔL大于检测阈值1时,基因突变为阳性。
4.根据权利要求1、2或3所述的用于胎儿无创产前筛查的检测方法,其特征在于,所述步骤(1)检测和计算胎儿游离核酸百分比(ff),
其包括以下步骤:
当母亲是纯合野生型BB时,胎儿的基因型可能为BB或者BA,对于胎儿为BA的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点A的读数比例中值ffBB计算;对于母亲是纯合变异型AA的时候,胎儿的基因型可能为AA或者AB,对于胎儿为AB的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点B的读数比例中值ffAA计算;胎儿游离核酸百分比(ff)的计算为:
ff=(ffAA+ffBB)/2。
5.根据前述权利要求中任一项所述的用于胎儿无创产前筛查的检测方法,其特征在于,其中,待检测的SNP位点是包含SNP位点的所有染色体中的一个或多个;优选地,所述待检测的SNP位点是染色体13,18,21,22,X和Y中的一个或多个。
6.根据前述权利要求中任一项所述的用于胎儿无创产前筛查的检测方法,其特征在于,其中,针对父母生殖细胞产生过程中可能发生一次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure FDA0002632233660000041
Figure FDA0002632233660000042
H1,H2∈{MI,MII,PI,PII}当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3。
7.根据前述权利要求中任一项所述的用于胎儿无创产前筛查的检测方法,其特征在于,其中,针对父母生殖细胞产生过程中可能发生一次或者两次染色体重组的情况,染色体SNP位点概率总和的公式为:
Figure FDA0002632233660000051
Figure FDA0002632233660000052
H1,H2∈{MI,MII,PI,PII},
b1和b2是染色体发生重组的计算位置,当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3。
8.根据前述权利要求中任一项所述的用于胎儿无创产前筛查的检测方法,其特征在于,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2。
9.根据前述权利要求中任一项所述的用于胎儿无创产前筛查的检测方法,其特征在于,所述步骤(3)中使用的靶向捕获探针使用以下靶向捕获探针的设计方法获得,所述方法包括以下步骤:
(1)确定目标SNP位点;
(2)对于每一个靶向捕获的SNP位点,根据所述SNP位点设计四种探针,四种探针在所述SNP位点上分别被设计为-A-、-G-、-C-、-T-;
(3)对于每一个靶向捕获的SNP位点,分别计算出四种探针和两种靶标序列结合的退火温度(Tm),所述两种靶标序列分别带有两种不同的单核苷酸多态性;并依此计算出所述四种探针和两种靶标序列结合的退火温度的差值(ΔTm);根据计算结果,选择四种探针中ΔTm最低的探针,确定为该位点的最优探针。
10.根据权利要求9所述的用于胎儿无创产前筛查的检测方法,其特征在于,所述靶向捕获探针的设计方法中,所述两种靶标序列分别为作为野生型的参考基因序列和作为突变型的突变基因序列;其中,四种探针和作为野生型的参考基因序列结合的Tm值分别为:Tma、Tmg、Tmc、Tmt,四种探针和作为突变型的突变基因序列结合的Tm值分别为:Tma’、Tmg’、Tmc’、Tmt’,四种探针和两种靶标序列结合的ΔTm值分别为:|Tma-Tma’|、|Tmg-Tmg’|、|Tmc-Tmc’|、|Tmt-Tmt’|。
11.根据权利要求9或10所述的用于胎儿无创产前筛查的检测方法,其特征在于,所述靶向捕获探针的设计方法中,采用最近邻模型和阳离子校正计算探针退火温度(Tm),探针退火温度的计算公式为:
Figure FDA0002632233660000061
ΔH表示所有邻近碱基对的标准焓变的和,ΔS表示所有邻近碱基对的标准熵变的和,R为摩耳气体常量,CT表示引物的浓度,[Na+]表示溶液中单价钠离子浓度。
12.一种用于胎儿无创产前筛查的靶向捕获探针的设计方法,其包括以下步骤:
(1)确定目标SNP位点;
(2)对于每一个靶向捕获的SNP位点,根据所述SNP位点设计四种探针,四种探针在所述SNP位点上分别被设计为-A-、-G-、-C-、-T-;
(3)对于每一个靶向捕获的SNP位点,分别计算出四种探针和两种靶标序列结合的退火温度(Tm),所述两种靶标序列分别带有两种不同的单核苷酸多态性;并依此计算出所述四种探针和两种靶标序列结合的退火温度的差值(ΔTm);根据计算结果,选择四种探针中ΔTm最低的探针,确定为该位点的最优探针。
13.根据权利要求12所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法,其特征在于,其中,所述两种靶标序列分别为作为野生型的参考基因序列和作为突变型的突变基因序列;其中,四种探针和作为野生型的参考基因序列结合的Tm值分别为:Tma、Tmg、Tmc、Tmt,四种探针和作为突变型的突变基因序列结合的Tm值分别为:Tma’、Tmg’、Tmc’、Tmt’,四种探针和两种靶标序列结合的ΔTm值分别为:|Tma-Tma’|、|Tmg-Tmg’|、|Tmc-Tmc’|、|Tmt-Tmt’|。
14.根据权利要求12或13所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法,其特征在于,其中,采用最近邻模型和阳离子校正计算探针退火温度(Tm),探针退火温度的计算公式为:
Figure FDA0002632233660000062
ΔH表示所有邻近碱基对的标准焓变的和,ΔS表示所有邻近碱基对的标准熵变的和,R为摩耳气体常量,CT表示引物的浓度,[Na+]表示溶液中单价钠离子浓度。
15.一种用于胎儿无创产前筛查的检测试剂盒,所述试剂盒包括:权利要求1-11中任一项所述的用于胎儿无创产前筛查的检测方法中使用的针对所述一个或多个SNP位点的靶向捕获探针,和/或根据权利要求12-14中任一项所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备的靶向捕获探针;优选地,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2,所述靶向捕获探针根据权利要求12-14中任一项所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备。
16.一种设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器完成如权利要求1-11中任一项所述的用于胎儿无创产前筛查的检测方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时完成如权利要求1-11中任一项所述的用于胎儿无创产前筛查的检测方法。
18.一种用于胎儿无创产前筛查的系统,其特征在于,包括:检测单元和分析单元,其中,
所述检测单元用于:
-检测母体外周血游离核酸;
-使用针对所述一个或多个SNP位点的靶向捕获探针捕获母体外周血游离DNA,扩增后进行测序,得到该位点的测序结果,测得等位基因A的读数NA,以及该位点的测序深度N;
所述分析单元用于:
计算胎儿在各SNP位点可能为染色体拷贝数正常或不同拷贝数异常情况的概率;根据每一个SNP位点实测到cfDNA的突变基因型百分比(A%)、胎儿游离核酸百分比(ff)和母亲在此位点的基因型,分别计算胎儿是整倍体或者非整倍体的概率值;同一染色体所有有效SNP位点概率总和最大值为胎儿判读的核型;
计算的胎儿核型H包括:D(二倍体型,disomy)、MI(母源三体综合症I型,maternaltrisomy type I)、MII(母源三体综合症II型,maternaltrisomy type II)、PI(父源三体综合症I型,paternal trisomy type I)、PII(父源三体综合症II型,paternal trisomy typeII)、LM(母源微缺失,maternal deletion)和LP(父源微缺失,paternal deletion);
胎儿在各SNP位点的核型概率是通过π加权的有条件贝塔二项式分布概率的线性组合并取对数得出,计算公式为:
Figure FDA0002632233660000081
i为第i个有效SNP位点;
N为该SNP位点的测序深度;pAi是胎儿为整倍体或非整倍体在不同基因座上突变型的下一代测序(NGS)读数百分比的期望值;在胎儿为不同核型时,pAi在不同基因座H上的基因型不同,其期望值也各不相同,具体不同基因座H的pAi见表1;
α是pAi根据在测序中实际值选取的离散参数;因其受实验条件的影响实测值会偏离期望值;使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β=α/pAi-α
加权系数πk的计算根据胎儿不同的核型计算:
Figure FDA0002632233660000082
其中PATk∈{AA,AB,BB},p(PATk)根据Hardy-Weinberg公式计算,该SNP位点的人群频率为p:
p(AA)=p×p
p(AB)=2×p×(1-p)
p(BB)=(1-p)×(1-p)
p(FET)是胎儿的可能基因型,其受父亲和母亲基因型影响,在胎儿为整倍体或非整倍体时,p(FET)按照孟德尔遗传规律计算,见表2。
19.根据权利要求18所述的一种用于胎儿无创产前筛查的系统,其特征在于,
所述分析单元还用于:胎儿染色体拷贝数变异的计算、胎儿染色体微缺失/微重复的计算、和/或显性单基因突变的计算,其中,
所述胎儿染色体拷贝数变异的计算为:
在精子或者卵子产生过程中,如果被考察的某条染色体没有发生减数分裂同源重组,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure FDA0002632233660000091
H∈{MI,MII,PI,PII,LM,LP}
LD是该位点在整倍体核型下的概率值;
LH是该位点在非整倍体核型下的概率值;
M为该染色体有效SNP位点个数;
当此值小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3;
所述胎儿染色体微缺失/微重复的计算为:
在精子或者卵子产生过程中,如果被考察的某条染色体发生部分缺失或者部分重复,染色体拷贝数异常与正常概率的分布差别计算公式为:
Figure FDA0002632233660000092
H∈{MI,MII,PI,PII,LM,LP},0<b1,b2<M
b1和b2是染色体发生微缺失/微重复的起始和终止位置;
当此值小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3;
所述显性单基因突变的计算:
显性单基因突变出现在母亲是纯合野生型BB的区域,根据A的读数NA,位点的测序深度N,胎儿游离核酸百分比ff,和进行贝塔二项分布拟合计算出A读数来自胎儿的概率,并将此概率与系统噪音概率进行比较,其中:
在某个基因座上,母亲为纯和野生型BB时,胎儿来自父亲或者是新发突变的概率为:
ΔL=log(beta-binom(ff/2,N,α,β1))-log(beta-binom(e,N,α,β2))
N是该位点的测序深度;
ff是胎儿游离核酸百分比;
α是根据在胎儿游离DNA中来自于父亲的等位基因实际测值选取的离散参数,因其受实验条件的影响实测值会偏离期望值,使用预先混合好的母子配对的参考品或者孕妇血浆样本确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β1=2×α/ff-α
e是该位点的系统错误率,系统错误率是该位点在已知的阴性标本中的突变基因型的比例;α是系统噪音实测得的离散参数,确定α的范围为1000-5000;优选地,α值为1000、2000、3000、4000、5000;
β2=α/e-α
当ΔL大于检测阈值1时,基因突变为阳性;
和/或,所述分析单元还用于:计算胎儿游离核酸百分比(ff),其中,
所述计算胎儿游离核酸百分比(ff)为:
当母亲是纯合野生型BB时,胎儿的基因型可能为BB或者BA,对于胎儿为BA的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点A的读数比例中值ffBB计算;对于母亲是纯合变异型AA的时候,胎儿的基因型可能为AA或者AB,对于胎儿为AB的位点,A的读数比例分布以ff/2为中心,胎儿游离核酸百分比可被所有此类型位点B的读数比例中值ffAA计算;胎儿游离核酸百分比(ff)的计算为:
ff=(ffAA+ffBB)/2;
和/或,所述分析单元还用于:针对父母生殖细胞产生过程中可能发生一次染色体重组的情况,染色体SNP位点概率总和的计算,其中,
染色体SNP位点概率总和的公式为:
Figure FDA0002632233660000101
Figure FDA0002632233660000102
H1,H2∈{MI,MII,PI,PII}当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3;
和/或,所述分析单元还用于:针对父母生殖细胞产生过程中可能发生一次或者两次染色体重组的情况,染色体SNP位点概率总和的计算,其中,
染色体SNP位点概率总和的公式为:
Figure FDA0002632233660000103
Figure FDA0002632233660000104
H1,H2∈{MI,MII,PI,PII},
b1和b2是染色体发生重组的计算位置,当上述两个计算结果之一小于检测阈值时,染色体倍数异常为阳性,检测阈值见表3。
20.根据权利要求18或19所述的一种用于胎儿无创产前筛查的系统,其特征在于,所述检测单元包括针对所述一个或多个SNP位点的靶向捕获探针,所述靶向捕获探针覆盖包含基因突变的全部基因;优选地,所述靶向捕获探针覆盖以下基因:FGFR3、FGFR2、PTPN11、RAF1、RIT1、SOS1、COL1A1、COL1A2、COL2A1、OTC和MECP2,优选地,所述靶向捕获探针为根据权利要求12-14中任一项所述的用于胎儿无创产前筛查的靶向捕获探针的设计方法制备的靶向捕获探针。
CN202010815673.8A 2020-08-13 2020-08-13 染色体和单基因病同步产前筛查的设备、试剂盒和分析系统 Active CN111951890B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN202010815673.8A CN111951890B (zh) 2020-08-13 2020-08-13 染色体和单基因病同步产前筛查的设备、试剂盒和分析系统
AU2021323854A AU2021323854A1 (en) 2020-08-13 2021-08-12 Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease
EP21855607.4A EP4200857A1 (en) 2020-08-13 2021-08-12 Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease
GB2302027.4A GB2615204A (en) 2020-08-13 2021-08-12 Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease
PCT/CN2021/112314 WO2022033557A1 (en) 2020-08-13 2021-08-12 Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease
US17/938,570 US20230272473A1 (en) 2020-08-13 2022-10-06 Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010815673.8A CN111951890B (zh) 2020-08-13 2020-08-13 染色体和单基因病同步产前筛查的设备、试剂盒和分析系统

Publications (2)

Publication Number Publication Date
CN111951890A true CN111951890A (zh) 2020-11-17
CN111951890B CN111951890B (zh) 2022-03-22

Family

ID=73343616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010815673.8A Active CN111951890B (zh) 2020-08-13 2020-08-13 染色体和单基因病同步产前筛查的设备、试剂盒和分析系统

Country Status (6)

Country Link
US (1) US20230272473A1 (zh)
EP (1) EP4200857A1 (zh)
CN (1) CN111951890B (zh)
AU (1) AU2021323854A1 (zh)
GB (1) GB2615204A (zh)
WO (1) WO2022033557A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112322726A (zh) * 2020-12-11 2021-02-05 长沙金域医学检验实验室有限公司 一种检测otc基因拷贝数变异的试剂盒
CN112575077A (zh) * 2020-12-23 2021-03-30 东莞市妇幼保健院 一种胎儿显性遗传病新发突变的无创基因检测方法及应用
CN113611361A (zh) * 2021-08-10 2021-11-05 飞科易特(广州)基因科技有限公司 一种用于婚恋匹配的单基因常染色体隐性遗传病的匹配方法
WO2022033557A1 (en) * 2020-08-13 2022-02-17 Beijing Biobiggen Technology Co., Ltd. Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease
WO2022134807A1 (zh) * 2020-12-21 2022-06-30 高嵩 一种利用多态性位点和靶位点测序检测胎儿遗传变异的方法
CN116004779A (zh) * 2022-11-12 2023-04-25 复旦大学附属妇产科医院 一种克服微量细胞扩增等位基因脱扣的方法
CN116246704A (zh) * 2023-05-10 2023-06-09 广州精科生物技术有限公司 用于胎儿无创产前检测的系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120185176A1 (en) * 2009-09-30 2012-07-19 Natera, Inc. Methods for Non-Invasive Prenatal Ploidy Calling
CN105695567A (zh) * 2015-11-30 2016-06-22 北京昱晟达医疗科技有限公司 一种用于检测胎儿染色体非整倍体的试剂盒、引物和探针序列及检测方法
WO2018132400A1 (en) * 2017-01-11 2018-07-19 Quest Diagnostics Investments Llc Method for non-invasive prenatal screening for aneuploidy
CN108342455A (zh) * 2017-06-25 2018-07-31 北京天健惠康生物科技有限公司 一种从母体外周血检测胎儿非整倍体染色体的方法及其试剂盒
CN109628578A (zh) * 2019-01-13 2019-04-16 清华大学 一种基于通用探针检测胎儿染色体变异的方法
CN109971846A (zh) * 2018-11-29 2019-07-05 时代基因检测中心有限公司 使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012108920A1 (en) * 2011-02-09 2012-08-16 Natera, Inc Methods for non-invasive prenatal ploidy calling
CN107988362B (zh) * 2017-10-26 2021-07-20 广东省人民医院(广东省医学科学院) 一种肺癌相关33基因靶向捕获测序试剂盒及其应用
CN108642160B (zh) * 2018-05-16 2022-03-11 广州市达瑞生物技术股份有限公司 检测胎儿地中海贫血致病基因的方法和试剂盒
CN110993024B (zh) * 2019-12-20 2023-08-22 北京科迅生物技术有限公司 建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置
CN111500574B (zh) * 2020-05-07 2023-11-17 和卓生物科技(上海)有限公司 一种用于检测遗传性耳聋的探针组合及其应用
CN111951890B (zh) * 2020-08-13 2022-03-22 北京博昊云天科技有限公司 染色体和单基因病同步产前筛查的设备、试剂盒和分析系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120185176A1 (en) * 2009-09-30 2012-07-19 Natera, Inc. Methods for Non-Invasive Prenatal Ploidy Calling
CN105695567A (zh) * 2015-11-30 2016-06-22 北京昱晟达医疗科技有限公司 一种用于检测胎儿染色体非整倍体的试剂盒、引物和探针序列及检测方法
WO2018132400A1 (en) * 2017-01-11 2018-07-19 Quest Diagnostics Investments Llc Method for non-invasive prenatal screening for aneuploidy
CN110770341A (zh) * 2017-01-11 2020-02-07 奎斯特诊断投资有限责任公司 非整倍性无创产前筛查方法
CN108342455A (zh) * 2017-06-25 2018-07-31 北京天健惠康生物科技有限公司 一种从母体外周血检测胎儿非整倍体染色体的方法及其试剂盒
CN109971846A (zh) * 2018-11-29 2019-07-05 时代基因检测中心有限公司 使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法
CN109628578A (zh) * 2019-01-13 2019-04-16 清华大学 一种基于通用探针检测胎儿染色体变异的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DAVID KUBICEK等: ""Incidence and origin of meiotic whole and segmental chromosomal aneuploidies detected by karyomapping"", 《REPRODUCTIVE BIOMEDICINE ONLINE》 *
于文倩等: ""无创产前检测技术在双胎染色体非整倍体疾病筛查中应用研究"", 《中国实用妇科与产科杂志》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022033557A1 (en) * 2020-08-13 2022-02-17 Beijing Biobiggen Technology Co., Ltd. Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease
GB2615204A (en) * 2020-08-13 2023-08-02 Beijing Biobiggen Tech Co Ltd Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease
CN112322726A (zh) * 2020-12-11 2021-02-05 长沙金域医学检验实验室有限公司 一种检测otc基因拷贝数变异的试剂盒
WO2022134807A1 (zh) * 2020-12-21 2022-06-30 高嵩 一种利用多态性位点和靶位点测序检测胎儿遗传变异的方法
CN112575077A (zh) * 2020-12-23 2021-03-30 东莞市妇幼保健院 一种胎儿显性遗传病新发突变的无创基因检测方法及应用
CN113611361A (zh) * 2021-08-10 2021-11-05 飞科易特(广州)基因科技有限公司 一种用于婚恋匹配的单基因常染色体隐性遗传病的匹配方法
CN113611361B (zh) * 2021-08-10 2023-08-08 飞科易特(广州)基因科技有限公司 一种用于婚恋匹配的单基因常染色体隐性遗传病的匹配方法
CN116004779A (zh) * 2022-11-12 2023-04-25 复旦大学附属妇产科医院 一种克服微量细胞扩增等位基因脱扣的方法
CN116246704A (zh) * 2023-05-10 2023-06-09 广州精科生物技术有限公司 用于胎儿无创产前检测的系统
CN116246704B (zh) * 2023-05-10 2023-08-15 广州精科生物技术有限公司 用于胎儿无创产前检测的系统

Also Published As

Publication number Publication date
AU2021323854A1 (en) 2023-03-16
EP4200857A1 (en) 2023-06-28
GB2615204A (en) 2023-08-02
CN111951890B (zh) 2022-03-22
GB202302027D0 (en) 2023-03-29
WO2022033557A1 (en) 2022-02-17
US20230272473A1 (en) 2023-08-31

Similar Documents

Publication Publication Date Title
CN111951890B (zh) 染色体和单基因病同步产前筛查的设备、试剂盒和分析系统
US20200385810A1 (en) Methods for determining fraction of fetal nucleic acids in maternal samples
JP6634105B2 (ja) 非侵襲性の出生前診断のために有用な、母体サンプル由来の胎児核酸のメチル化に基づく濃縮のためのプロセスおよび組成物
JP6513622B2 (ja) 非侵襲的出生前診断に有用な母体試料由来の胎児核酸のメチル化に基づく富化のためのプロセスおよび組成物
CN106715711B (zh) 确定探针序列的方法和基因组结构变异的检测方法
JP2018042580A (ja) 非侵襲性の出生前診断に有用な母体サンプル由来の胎児核酸のメチル化に基づく富化のためのプロセスおよび組成物
JP2016000046A (ja) 遺伝マーカーを評価するための方法および組成物
JP2015522293A (ja) 多重化連続ライゲーションに基づく遺伝子変異体の検出
JP2018524993A (ja) 染色体異常を検出するための核酸及び方法
WO2012068919A1 (zh) DNA文库及其制备方法、以及检测SNPs的方法和装置
TW202246521A (zh) 藉由大量平行rna定序之母體血漿轉錄體分析
JP2017506907A (ja) 循環セルフリー核酸のサンプルの富化
AU2016269332B2 (en) Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing
EP3775274B1 (en) Detection method of somatic genetic anomalies, combination of capture probes and kit of detection
WO2017193044A1 (en) Noninvasive prenatal diagnostic
CN114787385A (zh) 用于检测核酸修饰的方法和系统
CN114457143B (zh) 一种构建cnv检测文库的方法及cnv检测方法
WO2018096308A1 (en) Non-invasive prenatal screening method
WO2019016292A1 (en) SYSTEM AND METHOD FOR SCREENING AND PRENATAL DIAGNOSIS
CA3216028A1 (en) Synthetic polynucleotides and method of use thereof in genetic analysis
WO2011082386A1 (en) Specific amplification of fetal dna sequences from a mixed, fetal-maternal source
WO2017124214A1 (zh) 一种检测染色体罗氏易位的方法
KR101167934B1 (ko) Ticam1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
KR101167940B1 (ko) Fmn2 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
CN117004708A (zh) 遗传性Imerslund-Grasbeck综合征的筛查方法、检测组合物及检测试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant