CN109971846A - 使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法 - Google Patents

使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法 Download PDF

Info

Publication number
CN109971846A
CN109971846A CN201910187460.2A CN201910187460A CN109971846A CN 109971846 A CN109971846 A CN 109971846A CN 201910187460 A CN201910187460 A CN 201910187460A CN 109971846 A CN109971846 A CN 109971846A
Authority
CN
China
Prior art keywords
probability
aneuploid
dna
fetus
snp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910187460.2A
Other languages
English (en)
Inventor
谭楚颖
陈伊文
周俊健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Time Gene Detection Center Co Ltd
Original Assignee
Time Gene Detection Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Time Gene Detection Center Co Ltd filed Critical Time Gene Detection Center Co Ltd
Publication of CN109971846A publication Critical patent/CN109971846A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种用于非侵入性产前检测(NIPT)的方法,用于确定胎儿中非整倍体的概率。本发明包括使用能够进行绝对或相对定量的平台定量和分析常染色体单核苷酸多态性(SNP),以确定胎儿中非整倍体的概率。在一个实施例中,本方法包括获得含有来自孕妇的游离DNA(cfDNA)的血液样品,使用提取的DNA使用靶标富集方法制备包含多个靶标双等位基因常染色体单核苷酸多态性(SNP)(即,靶SNP)的核酸库,使用制备的库进行靶向的下一代测序(NGS),获得游离DNA中靶SNP的等位基因计数并确定胎儿非整倍体的概率。

Description

使用双等位基因SNP靶向下一代测序的非侵入性产前测定非 整倍体的方法
技术领域
本发明涉及用于确定非整倍体概率的非侵入性产前检测(NIPT)的领域。具体地,本发明涉及非侵入性产前测定13三体(T13)、18三体(T18)和21三体(T21)。
背景技术
通常建议孕妇在妊娠6-12周检测胎儿染色体异常。该测试的目标是确定胎儿发育出非整倍体(染色体数目异常)的概率。已经证实21三体(T21)将导致唐氏综合症,18三体(T18)可能导致爱德华兹综合征,13三体(T13)可能会导致帕托综合征。当发现胎儿有染色体异常的风险时,胎儿的早期产前检查可以为父母提供一个继续怀孕与否的选择。它也是一种检查婴儿是否有染色体异常风险的方法。
与出生后可进行的亲子鉴定不同,三体性测试通常在产前进行。用于鉴定非整倍体的传统方法是侵入性的,其中绒毛膜绒毛取样(CVS)和羊膜穿刺术是最常见的策略。CVS涉及将针通过母亲的宫颈或腹部插入子宫进行胎盘组织(即绒毛膜绒毛)取样以获得胎儿DNA。它可以在10至14周期间进行,其准确度可达到99%。另一方面,羊膜穿刺术涉及从胎儿周围的羊膜囊取样胎儿组织。然而,这两种手术都涉及侵入子宫,并且由于感染和羊水泄漏而导致1-2%的流产风险。
越来越流行的非整倍体检测方法是非侵入性产前检测(NIPT)。其不侵入子宫;NIPT仅需要分析来自母体血液样品的循环游离胎儿DNA(cff DNA)。卢煜明教授于1997年在母体血液中发现了游离胎儿DNA,为NIPT的发展铺平了道路。在过去的十年中,已经开发了非侵入性产前检测或诊断方法来分析胎儿遗传物质,并且进一步用于各种临床应用,例如亲子关系测试、胎儿性别测定和胎儿非整倍体筛选。NIPT的侵袭性远小于CVS和基于羊膜组织的方法,因为它只需要母亲的外周血,并且可以早在妊娠第6周就完成。
cff DNA作为150-200个碱基对之间的小片段从胚胎来源的生物材料释放到母亲的血液中。通常认为cff DNA在妊娠期间衍生自多种组织来源,包括胎盘或胎膜、胎儿造血细胞、细胞和器官的细胞凋亡或坏死。cff DNA的检测最好在怀孕期间进行,因为cff DNA在分娩后会迅速消失。母体循环中cff DNA的数量和质量由诸如母体质量指数、孕龄、胎儿临床状态和妊娠类型(单胎或多胎)等因素决定。
NIPT的主要挑战之一在于从母体DNA中分离胎儿DNA以进行准确的胎儿基因型鉴定,因为cff DNA仅代表母体血液中的微量DNA。基于cff DNA分析确定胎儿基因型需要扩增,例如使用聚合酶链式反应(PCR)以及比较母体和胎儿的基因型。已经证明,cff DNA仅占母体循环中总游离DNA的2-20%,因此从母体样品中捕获cff DNA序列需要能够绝对定量的高度精细和灵敏的手段和方法。
该领域目前使用两种方法进行基因型确定。第一个是全基因组测序(WGS),它解码基因组序列的每个碱基对。由于基因组的庞大,WGS通常需要更长的时间才能获得和处理所需的基因型数据。WGS的实例包括Sanger测序和大规模平行鸟枪测序(MPSS)。第二种是靶标富集方法,其也是越来越受欢迎的方法。与WGS不同,靶标富集方法仅捕获用于测序的靶标区域,因此与WGS相比,其样本量大大减少并且允许更快的周转时间。如本文所解释的,靶标富集方法涉及使用特异设计的引物或探针以识别靶标基因组区域,然后扩增这些区域以获得更准确和一致的测序结果。
在靶标富集方法中,测序前的库制备是必不可少的。在本发明时,库制备策略分为两大类,即基于杂交的库制备和基于扩增子的库制备。一般而言,这两个类别都包括衔接子和索引连接,靶标富集和富集后PCR扩增的标准程序。这导致了NIPT的另一个挑战,即在库制备的不同阶段保持DNA质量以确保准确和敏感的结果。
通常在该领域中使用几种类型的基因型数据。基于短串联重复(STR)的方法需要较少的基因组测序,因为它们靶向特定基因座,但它们的灵敏度相对较低,因为来自胎儿的STR信号经常被来自母亲的STR信号掩盖。多年来,已经对STR技术进行了改进。例如,在Y染色体上研究STR增加了准确性和灵敏度,但是这些方法仅适用于男性胎儿,并且在NIPT之前不可避免地需要性别确定。本发明采用另一种方法。该方法基于检测单核苷酸多态性(SNP),并且其允许仅选择性检测选自正常人类基因组内约30亿碱基对的靶标碱基对。SNP方法不是对整个基因组进行测序后选择靶标基因型,而是在序列之前的库制备阶段用特异设计的引物和探针选择靶标碱基对。在选择靶SNP时,需要考虑诸如连锁平衡/不平衡和群体中特定SNP的基因型分布的因素。
发明内容
本发明提供用于非侵入性产前检测非整倍体的方法和材料。本发明还提供了用于确定胎儿非整倍体概率的非侵入性产前检测(NIPT)的方法和材料。
在一个实施例中,本发明提供用于13三体(T13)、18三体(T18)或21三体(T21)的非侵入性产前检测的方法和材料。在一个实施例中,本发明提供用于确定胎儿中13三体(T13)、18三体(T18)或21三体(T21)概率的非侵入性产前检测(NIPT)的方法和材料。
在一个实施例中,本发明包括使用能够进行绝对或相对定量的平台定量和分析常染色体单核苷酸多态性(SNP),以鉴定引起染色体病症的染色体失衡或核酸序列。
在一个实施例中,本发明提供了一种用于确定胎儿中非整倍体的概率的非侵入性产前检测(NIPT)的方法,其中该方法包括从孕妇获得含有游离DNA的血液样品,使用靶标富集方法用提取的DNA制备包含多个靶标双等位基因常染色体单核苷酸多态性(SNP)(即靶SNP)的核酸库,使用所制备的库进行靶向的下一代测序(NGS),获得游离DNA中靶SNP的等位基因计数,确定胎儿非整倍体的概率。
在一个实施例中,本发明的方法包括收集来自孕妇的血液样品,从母体样品中提取游离DNA;任选地,包括提取的游离DNA的定量,使用靶标富集方法(即,基于杂交或基于扩增子的方法)制备包含靶SNP的库;进行所制备库的下一代测序(NGS),使用能够定量靶标核酸序列的平台确定靶SNP的基因型和等位基因计数;获得非整倍体统计,其包括基于与非整倍体相关的胎儿常染色体SNP的基因型和等位基因计数的聚集胎儿分数和染色体异常概率,并基于聚集的胎儿分数和非整倍体概率确定胎儿中非整倍体的概率。
在一个实施例中,基于杂交的库的制备包括对提取的游离DNA、衔接子和索引连接进行末端修复和A尾加工,预富集PCR扩增,通过将扩增的DNA与设计用于捕获靶SNP的探针杂交的靶标富集,以及富集后PCR扩增。在一些实施例中,可以在对提取的游离DNA的末端修复和A尾加工之前进行DNA片段化。
在一个实施例中,基于扩增子的库的制备包括对提取的游离DNA、衔接子和索引连接进行末端修复和A尾加工,通过使用靶特异性引物(即设计用于扩增包含靶SNP的区域的引物)的选择性扩增富集靶SNP,以及富集后PCR扩增。在一些实施例中,可以在对提取的游离DNA的末端修复和A尾加工之前进行DNA片段化。
在一个实施例中,非整倍体是13三体(T13)、18三体(T18)或21三体(T21)。
在一个实施例中,本方法能够确定非整倍体是母源性还是父源性三体。
附图说明
图1是说明根据本发明一个实施例的用于确定胎儿非整倍体概率的非侵入性产前检测(NIPT)的流程图。
图2是示出根据本发明的一个实施例的用于确定胎儿三体概率的系统的流程图。
图3是示出根据本发明的一个实施例的用于确定胎儿三体概率的系统的另一流程图。
图4是显示使用根据本发明一个实施例的基于杂交的方法制备库的图示。
图5是示出使用根据本发明一个实施例的基于扩增子的方法制备库的图示。
具体实施方式
本发明提供了用于非侵入性产前检测非整倍体的方法和材料。本发明还提供了用于确定胎儿非整倍体概率的非侵入性产前检测(NIPT)的方法和材料。
在一个实施例中,本发明提供了用于非侵入性产前检测13三体(T13)、18三体(T18)或21三体(T21)的方法和材料。在一个实施例中,本发明提供了用于确定胎儿13三体(T13)、18三体(T18)或21三体(T21)概率的非侵入性产前检测(NIPT)的方法和材料。
在一个实施例中,本发明包括使用能够进行绝对或相对定量的平台定量和分析常染色体单核苷酸多态性(SNP),以鉴定引起染色体病症的染色体失衡或核酸序列。
在一个实施例中,本发明提供了一种用于确定胎儿非整倍体的概率的非侵入性产前检测(NIPT)的方法,其中该方法包括从孕妇获得含有游离DNA的血液样品,使用靶标富集方法用提取的DNA制备包含多个靶标双等位基因常染色体单核苷酸多态性(SNP)(使用靶SNP)的核酸库,使用所制备的库进行靶向的下一代测序(NGS),获得游离DNA中靶SNP的等位基因计数并确定胎儿非整倍体的概率。
在一个实施例中,本发明的方法包括收集来自孕妇的血液样品,从母体样品中提取游离DNA;任选地,包括提取的游离DNA的定量,使用靶标富集方法(即,基于杂交或基于扩增子的方法)制备包含靶SNP的库;进行所制备库的下一代测序(NGS),使用能够定量靶标核酸序列的平台确定靶SNP的基因型和等位基因计数;获得非整倍体统计,其包括基于与非整倍体相关的胎儿常染色体SNP的基因型和等位基因计数的聚集胎儿分数和染色体异常概率,并基于聚集的胎儿分数和非整倍体概率确定胎儿中非整倍体的概率。
在一个实施例中,基于杂交的库的制备包括对提取的游离DNA、衔接子和索引连接进行末端修复和A尾加工,预富集PCR扩增,通过将扩增的DNA与设计用于捕获靶SNP的探针杂交的靶标富集,以及富集后PCR扩增。在一些实施例中,可以在对提取的游离DNA的末端修复和A尾加工之前进行DNA片段化。
在一个实施例中,基于扩增子的库的制备包括对提取的游离DNA、衔接子和索引连接进行末端修复和A尾加工,通过使用靶特异性引物(即设计用于扩增包含靶SNP的区域的引物)的选择性扩增富集靶SNP,以及富集后PCR扩增。在一些实施例中,可以在对提取的游离DNA的末端修复和A尾加工之前进行DNA片段化。
在一个实施例中,非整倍体是13三体(T13)、18三体(T18)或21三体(T21)。
在一个实施例中,本方法能够确定非整倍体是母源性还是父源性三体。
在一个实施例中,本文描述的方法是非侵入性的,因为该方法不涉及侵入子宫以获得胎儿遗传物质。
在一个实施例中,本发明提供了用于确定胎儿中非整倍体的风险或概率的非侵入性产前检测(NIPT)。在一个实施例中,通过对所述染色体中的多个选定的常染色体双等位基因SNP进行测序来检测胎儿非整倍体。在一个实施例中,染色体是染色体13、18或21。
在一个实施例中,本发明的重要性是利用基于杂交和基于扩增子的库制备来富集遗传物质,以及利用NGS平台对SNP的靶向选择进行测序,从而实现与异常高的染色体浓度相关联的非整倍体检测。特定种类的非整倍体(例如T13、T18或T21,以及它是否是母系或父系衍生的)可以通过一组生物信息学计算基于特定染色体的读数来确定。
在一个实施例中,本发明提供了一种用于非整倍体测定的创新且成本有效的方法,其比在本发明之前存在的任何传统非整倍体测试更有效,灵敏和精确。如本文详述的,本发明包括并优化从胎儿染色体的取样到基因型分析的各种步骤。本发明与已知方法不同,因为它直接测定和分析来自母体全血样品的循环游离胎儿DNA(cffDNA)。该方法使用能够用DNA标记物(例如索引和独特分子标识符(UMI))进行靶标测序和靶标核酸序列的定量的平台,从母体血浆游离DNA获得一组选定的SNP的计数值。在使用NGS的一个实施例中,使用各种数学计算来比较来自收集的数据的SNP等位基因计数与染色体病症模型中的SNP等位基因计数,以确定胎儿具有染色体病症的概率。在一个实施例中,对于所选SNP组获得的计数是绝对的,并且使用能够进行绝对定量的测序方法。
在一个实施例中,本发明提供了一种专有系统或算法用于分析从测序获得的数据,从而确定在胎儿中具有特定非整倍体的概率。
在一个实施例中,本算法是Goya等人的算法的扩展[1],其检查测序数据以确定肿瘤DNA中的单核苷酸变异。例如,当胎儿分数(ff)=10%时,整倍体胎儿应该给出0、0.05、0.45、0.5、0.55、0.95和1.0的可能等位基因频率(表3)。相反,具有100%单亲源二体(即,染色体组的两个复制仅从一个亲本遗传)的母体三体应具有0、0.047619、0.4285714、0.47619、0.52381、0.571428、0.95238和1.0的可能等位基因频率。这两个模型给出了不同的似然度,如果考虑到孕龄和妊娠周,则两个似然度之间的比率可以转换成特定胎儿非整倍体的概率。总之,本算法考虑了包括孕龄和妊娠周的一组因素以及不同非整倍体模型的双等位基因SNP的两个等位基因的等位基因频率,并且将这些非整倍体模型的似然比转化为特定非整倍体的后验概率。
在本发明之前,存在需要确定胎儿、亲生母亲和亲生父亲的基因型以进行非整倍体测定的方法。相反,本发明不需要关于亲生父亲的任何遗传信息,而是能够通过使用本文所述的专有方法和算法仅基于母体和胎儿基因型产生准确和灵敏的结果。发现本方法可以早在第七妊娠周检测胎儿非整倍体,并且能够确定胎儿非整倍体是母系还是父系衍生的三体。因此,与现有方法相比,本发明的一些实施例可以以显著更低的成本提供具有高准确度、灵敏度和效率的非整倍体测试。
术语的定义
如本文所用,单核苷酸多态性(SNP)是指核酸序列中特定位置的单核苷酸的变异,例如,一些个体在其基因组内的特定位置具有一个核苷酸,而其他个体在相应位置具有不同的核苷酸。如果超过1%的群体在DNA序列中的特定位置不携带相同的核苷酸,则该变异可以归类为SNP。SNP可以发生在DNA序列的编码区或非编码区。
如本文所用,常染色体单核苷酸多态性是指不位于任何性染色体上的SNP。
如本文所用,序列是指DNA分子中任何长度或类型或遗传信息的核苷酸序列。
如本文所用,基因座是指染色体上的特定位置,其可以是从几个碱基对到含有大基因家族的百万碱基大小区域的任何长度。
如本文所用,等位基因是指基因的变体形式,其位于染色体上的相同基因座并且负责遗传变异。对于二倍体生物,例如人类,个体通常在每个基因座上具有两个等位基因,其中一个等位基因遗传自母亲,另一个遗传自父亲。
如本文所用,多态性基因或基因座是指在群体内具有两个或更多个等位基因的基因或基因座。
如本文所用,基因型是指生物的遗传组成。它还可以指特定的碱基对序列,其包含生物携带的染色体、基因中的等位基因或基因座。例如,每对等位基因代表特定基因的基因型。
如本文所用,非整倍体是指细胞中存在异常数量的染色体。具有比野生型更多或更少数量的染色体的细胞被称为非整倍体细胞。通常,非整倍体细胞的染色体组与野生型仅有一个或少数染色体不同。具有正确染色体数目的细胞称为整倍体细胞。
如本文所用,母体血浆是指孕妇血液的非细胞部分。它主要由水组成,含有溶解的蛋白质、葡萄糖、电解质、激素、二氧化碳和氧气。母体血浆还含有游离胎儿和游离母体DNA。
如本文所用,核酸是由核苷酸组成的分子,包括核糖核酸(RNA)和脱氧核糖核酸(DNA)。如本文所用,核酸可以来自任何物种具有任何长度(例如寡核苷酸或多核苷酸),天然存在的或合成的(即,人工制备并含有天然和/或非天然核苷酸),线性、环状或其他组态,DNA或RNA的混合物等。
如本文所用,扩增是指通过任何适用的方法如聚合酶链反应(PCR)通过片段的复制增加特定DNA片段的拷贝数。
如本文所用,聚合酶链式反应(PCR)是指使用聚合酶扩增特定DNA区段的过程。
如本文所用,引物是指核酸的短链,其用作合成核酸的起始点。例如,DNA聚合酶在DNA复制中需要引物,其将新的核苷酸添加到现有的核酸链中。
如本文所用,探针是指与靶序列100%或足够互补的单链核酸,因此它可用于检测其他单链核酸分子混合物中的靶序列或将靶序列与其他核酸分子区分开来。
如本文所用,非侵入性产前检测(NIPT)是指一种测试过程,其不涉及胎儿皮肤的任何破损、从胎儿中移除组织、或与孕妇的粘膜或内腔接触。
如本文所用,胎儿基因型是指胎儿的遗传构成。它还可以指胎儿在特定基因座携带的等位基因。
如本文所用,连锁不平衡是指在给定群体中不同基因座的等位基因的非随机关联。当基因座的不同等位基因的结合频率高于或低于基因座独立且随机结合的预期时,基因座处于连锁不平衡状态。
如本文所用,靶标富集方法是指使用特定设计的引物或探针从靶标染色体中选择等位基因,所述引物或探针携带能够识别靶标基因座或区分靶标基因座和非靶标基因座的序列。
如本文所用,靶特异性引物是指包含核酸序列的引物,所述核酸序列能够识别靶标基因座或区分靶标基因座和非靶标基因座。例如,引物可以包含靶标基因座内的序列,或者包含将结合到基因组中导致靶标基因座扩增的特定区域的序列。
如本文所用,靶特异性探针是指包含核酸序列的探针,该核酸序列能够识别靶标基因座或区分靶标基因座和非靶标基因座。例如,探针可以包含靶标基因座内的序列,或者包含将结合到基因组中导致探针和靶标基因座杂交的特定区域的序列。
如本文所用,靶向下一代测序或NGS是指下一代技术,其对从包含靶标核酸序列(即靶序列)的核酸库获得的核酸进行测序。该库包括根据本发明的描述制备的库。
如本文所用,单亲源二体的百分比是指配子细胞中两条染色体来自一个亲本的两条染色体之一的百分比。例如,当配子细胞中两条染色体的单亲源二体百分比为100%时,两条染色体100%相同并且来自一个亲本的两条染色体之一。当减数分裂I中没有染色体交叉并且减数分裂II中发生非分离事件时,可能发生这种情况。另一方面,当减数分裂I中没有交叉并且在减数分裂I中发生不分离事件时,配子细胞将形成具有0%的单亲源二体(换句话说,100%异亲源二体)。通常染色体交叉确实在减数分裂I中发生,因此典型的二体配子细胞具有0%和100%之间的单亲源二体百分比。
如本文所用,等位基因计数是指从能够定量等位基因的平台或方法获得的特定等位基因的频率,包括但不限于任何种类的测序平台和数字PCR。通常,等位基因计数代表被测样品中特定基因座处的特定等位基因的数量。
如本文所用,参考等位基因是指参考基因组(例如,位于人类参考基因组结构hg19或hg38)正链上的核苷酸,用于具有特定染色体位置的SNP。
如本文所用,交互等位基因是指参考等位基因以外的任何等位基因。对于双等位基因SNP,交互等位基因指的是双等位基因SNP的第二等位基因。
如本文所用,碱基质量是指由测序仪测序的核苷酸的错误率。它是测序仪报告的一个值。
如本文所用,测序深度是指由测序仪产生的与参考基因组比对的测序读数的数量。双等位基因SNP的测序深度是指与该位置对齐的读数。
如本文所用,次要等位基因频率是指群体中参考等位基因频率和交互等位基因频率的较小值。
如本文所用,胎儿分数(ff)是指母体样品中胎儿来源的游离DNA的比例。通常,胎儿分数可以是通过计算母体样品中游离胎儿DNA的实际比例确定的实际值,或者是基于所讨论样品的数据使用适当算法确定的估计值。
概述
在一个实施例中,本发明提供了用于检测胎儿非整倍体或确定胎儿非整倍体的概率的非侵入性产前非整倍体测试。在一个实施例中,待测试的胎儿非整倍体是在胎儿细胞中存在额外的染色体13、18或21的拷贝。在一个实施例中,本发明通过比较所述胎儿的上述染色体的SNP的等位基因计数和所述三体的模型的SNP的等位基因计数,提供用于确定概率或检测13三体(T13)、18三体(T18)和21三体(T21)中的一种或多种的存在的非侵入性产前测试。
本发明的非侵入性产前非整倍体测试可包括以下一个或多个步骤:
1)从孕妇获得测试样品,该样品包含游离胎儿DNA和游离母体DNA;
2)富集游离胎儿DNA和游离母体DNA中的多个靶序列,其中靶序列包含多个靶标双等位基因常染色体单核苷酸多态性(SNP);
3)扩增富集的靶序列;
4)对一些或所有所述靶序列进行测序;以及
5)通过分析多个SNP的等位基因计数来确定胎儿患有非整倍体的概率。
在一个实施例中,本发明的非侵入性产前非整倍体测试可包括以下步骤中的一个或多个:
1)从孕妇(母亲)收集外周血样品;
2)从样品中提取游离DNA;
3)确定提取的游离胎儿DNA和游离母体DNA的浓度;
4)使用提取的游离DNA制备包含多个靶标双等位基因常染色体单核苷酸多态性(SNP)(即靶SNP)的核酸库,其中选择性地富集和扩增包含靶SNP的序列;
5)对从库中获得的富集和扩增序列进行下一代测序(NGS);
6)针对其信息值过滤靶SNP;
7)基于从测序步骤获得的靶SNP的等位基因计数,获得包含聚集胎儿分数和非整倍体概率的非整倍体统计;
8)确定胎儿中是否存在非整倍体。
图1是说明根据本发明一个实施例的用于确定胎儿非整倍体概率的非侵入性产前检测(NIPT)的流程图。
样品的收集和核酸的提取
在一个实施例中,本方法包括从怀孕母亲获得血液样品的步骤,以及从怀孕母亲的样品中提取遗传物质的步骤。在一个实施例中,血液样品是外周血样品。
来自母体全血的循环游离DNA可以通过市售的游离DNA提取试剂盒在手动或自动提取平台上提取。提取试剂盒的实例包括:GenELuteTM血浆/血清游离循环DNA纯化Midi试剂盒、MAGMAX游离DNA分离试剂盒、循环核酸试剂盒、PME自由循环DNA提取试剂盒、MAGNA纯紧凑核酸分离试剂盒I、RSC ccfDNA血浆试剂盒、EpiQuikTM循环游离DNA分离试剂盒、NEXTprep-MagTMcfDNA分离试剂盒、BioChain cfPureTM游离DNA提取试剂盒、NORGEN BIOTEK CORP血浆/血清游离循环DNA纯化迷你试剂盒、Quick-cfDNATM血清和血浆试剂盒、MagBio Genomics cfKaptureTM21试剂盒(游离DNA分离试剂盒)、HIPRO循环游离DNA(cfDNA)分离试剂盒、Cell3TMXtract游离DNA提取试剂盒、ALINE游离DNA分离试剂盒、游离DNA试剂盒、自由循环DNA试剂盒、ChemagicTMcfDNA 5k试剂盒、Omega Bio-cfDNA提取试剂盒、FitAmpTM血浆/血清DNA分离试剂盒、MAGPURIX游离循环(CFC)DNA提取试剂盒、truXTRACTMcfDNA试剂盒、Amoy血清/血浆游离DNA试剂盒、IGENcfDNA试剂盒、XCF COMPLETE Exosome和cfDNA分离试剂盒和BIOFACTORIES 5分钟循环DNA提取试剂盒。本领域技术人员将理解,可以使用适于从母体血液中提取游离DNA的其他商业试剂盒或非商业化方法及其组合。
示例1描述了使用Promega快速样品浓缩器(RSC)从母体全血或血浆样品中提取游离DNA的一个实施例。
测定样品中核酸的浓度或数量
在一个实施例中,本方法包括确定从母体样品中提取的游离核酸的浓度或量的步骤。在一个实施例中,游离DNA的浓度或量通过能够定量核酸的任何仪器或方法确定,所述仪器包括但不限于荧光计。
在一个实施例中,使用荧光计和dsDNA高灵敏度检测试剂盒测量从母体样品中提取的游离DNA的浓度或数量。
示例1描述了使用dsDNA高灵敏度检测试剂盒和仪器测定提取的游离DNA浓度的一个实施例。
利用靶标富集方法构建库
在一个实施例中,本发明包括使用靶富集方法制备库的步骤。然后该库将进行下一代测序(NGS)步骤。
在一个实施例中,本发明使用核酸序列、衔接子序列和索引序列以在NGS之前富集靶序列,其中,所述核酸序列包含对靶染色体的常染色体双等位基因SNP有特异性的序列(即靶序列)。在一个实施例中,用于富集靶序列的核酸序列是包括靶SNP或序列的序列,尽管不包括靶SNP,但是能够区分靶SNP与非靶序列(例如靶SNP的序列的上游或下游)。应当理解,本领域技术人员能够根据所讨论的非整倍体和本发明的描述选择能够实施本发明的合适核酸序列。
在一个实施例中,使用基于杂交的方法制备库。
在一个实施例中,使用基于扩增子的方法制备库。
在一个实施例中,通过片段化方法处理提取的游离DNA,以在制备库之前将DNA破碎成片。在一个实施例中,片段化过程是基于超声处理或基于酶处理。
库制备:基于杂交
在一个实施例中,使用基于杂交的方法库制备,即,靶特异性探针用于通过探针杂交选择和保留靶序列,并且通过扩增富集靶序列。在一个实施例中,基于杂交的方法包括以下步骤:
1.末端修复和A尾加工提取的游离DNA;
2.使用衔接子和索引序列连接游离DNA;
3.洗去未连接的碎片;
4.对连接的游离DNA进行预富集扩增;
5.扩增序列的纯化;
6.通过探针杂交选择含有靶序列的片段,其中杂交中使用的每种探针包括能够与包含至少一个靶SNP的DNA片段杂交的序列;
7.洗去未选择的碎片;
8.对所选靶序列进行富集后扩增;以及
9.扩增的靶序列的纯化。
如本文所用,为了制备基于杂交的库,衔接子是合成DNA的短片段,其使得与衔接子连接的DNA能够与测序平台结合以开始测序过程。索引序列是对样品有特异的序列,以鉴定来源于特定样品的核酸产物,使得来自不同样品的核酸产物的混合物能够在同一测序仪中同时测序。在一个实施例中,游离DNA与衔接子和索引序列的连接可以通过提供包含衔接子序列和索引序列的核酸群同时进行(例如图4)。在不需要样品索引的一些实施例中,提供包含衔接子序列的衔接子用于连接步骤。
图4描绘了本发明的用于库制备的基于杂交的方法的一个实施例。
在一个实施例中,用于在本发明的基于杂交的方法中选择靶SNP序列的每个探针包含能够与含有靶SNP的DNA片段杂交的序列。
应理解,本领域技术人员将能够根据所讨论的非整倍体和本发明的描述设计用于该基于杂交的方法的探针。
在一个实施例中,本发明的杂交方法改编自Roche SeqCap。在该实施例中,基于杂交的库制备开始于游离DNA样品的末端修复和A尾加工。这是为了确保精细和片段化的游离DNA可以容易地与其他核酸序列(例如衔接子)连接。接下来,将游离DNA与衔接子和索引连接。洗去未连接的DNA片段,对DNA样品进行PCR扩增,然后纯化DNA片段。然后进行探针杂交以捕获(即,富集)含有靶SNP的片段。洗去未杂交的DNA片段。然后进一步扩增和纯化DNA样品以完成库制备程序。
示例2描述了基于杂交的靶捕获方法的一个实施例,其用于从母体血浆中提取的游离DNA。使用KAPA库制备试剂盒制备游离DNA,并使用定制设计的NimbleGen SeqCap EZ探针进行靶标捕获,以富集位于染色体13、18和21上的选定SNP基因座。然后使用Illumina测序仪对库进行配对末端测序。
库制备:基于扩增子
在一个实施例中,使用基于扩增子的库制备方法,即,靶特异性引物用于选择性扩增并因此富集靶序列。在一个实施例中,基于扩增子的方法包括以下步骤:
1.末端修复和A尾加工提取的游离DNA;
2.用平台特异性衔接子序列、索引序列和独特分子标识符(UMI)连接游离DNA;
3.洗去未连接的碎片;
4.使用靶特异性引物进行连接的游离DNA的扩增;
5.使用通用引物扩增富集片段;以及
6.扩增的靶序列的纯化。
在一个实施例中,在富集后扩增以及连接步骤中将索引序列添加至靶序列。
如本文所用,基于扩增子制备库,衔接子是短的合成DNA片段,其使得与衔接子连接的DNA能够与测序平台结合以开始测序过程。索引序列是对样品有特异性的序列,能够鉴定来源于特定样品的核酸产物,并且它们的掺入允许来自不同样品的核酸产物的混合物在同一测序仪中同时测序。独特的分子标识符(UMI)是分子标签,其为每个输入分子建立独特的特性,从而允许考虑PCR扩增偏差。在一个实施例中,衔接子、索引序列和条形码如UMI在一个单一核酸中提供,如图5所示。在一些实施例中,这些序列分开提供并分别附着于游离DNA(例如,通过连接游离DNA或通过扩增游离DNA实现)。
图5描绘了本发明的用于库制备的基于扩增子的方法的一个实施例。
在一个实施例中,用于在本发明的基于扩增子的方法中选择靶SNP序列的引物包含对靶SNP序列有特异性的序列(即,能够结合含有靶SNP的样品DNA片段的序列,因此允许靶SNP被扩增)。
应理解,本领域技术人员将能够根据所讨论的非整倍体和本发明的描述设计用于该基于扩增子的方法的引物。
在一个实施例中,本发明的基于扩增子的方法适改编自QIAseq并进行了优化。提取的游离DNA用片段酶片段化。然后将DNA片段与平台特异性衔接子和索引序列连接,并用独特分子标识符(UMI)条形码化。洗去未连接的DNA片段。然后对DNA样品进行靶向PCR以实现靶向富集。使用与衔接子结合的通用引物,在通用PCR中进一步扩增得到的索引扩增子,以完成库制备程序。
示例3描述了基于扩增子的靶标捕获方法的一个实施例,其用于从母体血浆中提取的游离DNA。
下一代测序
在一个实施例中,本发明包括进行下一代测序(NGS)的步骤,所述下一代测序用于测序由本发明的基于杂交或基于扩增子的库制备捕获和富集的SNPs。
在一个实施例中,如本文所用的下一代测序是指能够对核酸进行大规模平行测序的测序技术[2]。它通常包括三个步骤:库制备、扩增和测序。
在一个实施例中,用于下一代测序的平台是能够进行下一代测序的任何平台。
在一个实施例中,用于下一代测序的平台包括但不限于Illumina(MiSeq、NextSeq、HiSeq、NovaSeq)、Thermo Fisher(PGM、Proton、S5)、Pacific Biosciences(Sequel)和牛津纳米孔(Minion、Gridion、Promethion)。
在一个实施例中,使用Illumina测序的方法。DNA片段上的衔接子序列附着在测序仪的丙烯酰胺包被的玻璃流通池上的互补寡核苷酸上。然后通过桥式扩增以扩增每个结合的片段以产生由数百个DNA链组成的克隆簇。这些簇形成用于测序的模板。掺入荧光标记的核苷酸并在重复的测序循环中检测以产生测序读数。对于配对末端测序,正向和反向链都被测序,给出正向和反向读数作为读数对。读数对对齐在一起进行分析。然后基于读取的信息识别非整倍体。在一个实施例中,还可以从测序数据获得靶SNP的绝对定量。
SNP靶标的等位基因鉴别和定量
在一个实施例中,本方法包括收集怀孕母亲血浆中发现的游离DNA的基因型测量的步骤。在另一个实施例中,本方法包括获得一组胎儿常染色体SNP的基因分型数据。
在一个实施例中,母体和胎儿基因型衍生自本文所述的游离DNA的靶向测序结果。
非侵入性产前检测的SNP选择标准
在一个实施例中,根据千人基因组计划,用于本发明的SNP是双等位基因。
在一个实施例中,靶SNP的基因组位置在瓶中基因组(GIAB)项目的高置信区域内。
在一个实施例中,选择在千人基因组计划中测序的所有五个群体中(非洲人、美国人、东亚人、南亚人和欧洲人)具有大于0.3的次要等位基因频率的SNP。
在一个实施例中,选择具有处于Hardy Weinberg平衡(即,具有一个自由度的卡方检验的p值≥0.05)的基因型频率的SNP。
在一个实施例中,来自千人基因组计划的上述五个群体中的SNP衍生的固定指数<0.05。
在一个实施例中,来自同一染色体的靶SNP对来自千人基因组计划的所有五个群体都不处于连锁不平衡,即r2<0.1。
根据SNP的信息价值过滤SNP
在一个实施例中,多个SNP的非整倍体测定能力意指这些SNP足以检测胎儿中非整倍体(例如特定的三体)的存在的能力。这是基于每个靶染色体上捕获的SNP的数量及其信息值来确定的。
在一个实施例中,SNP的信息价值基于许多因素确定,包括但不限于捕获的SNP位点处的两个等位基因的测序深度、映射质量和碱基质量。测序深度反映是否具有足够的信息可用于后续分析,而映射质量和碱基质量反映了可用数据是否具有足够的质量以包括在分析中。
在一个实施例中,从随后的分析步骤中除去低信息量值的SNP,用于计算非整倍体概率。
SNP基因分型和定量数据分析
在一个实施例中,本发明提供了一种专有系统和/或建模方法,用于分析从测序获得的数据,从而确定胎儿中特定非整倍体的概率。仅需要来自母体样品的胎儿和母体遗传信息,本发明足够稳健以提供灵敏和准确的胎儿非整倍体测试,而不需要来自亲生父亲的遗传信息。
图2-3示出了根据本发明的一个实施例的用于计算胎儿三体概率的系统。应当注意,本领域技术人员将能够根据本发明的描述得到用于其他非三体非整倍体的类似系统。
在一个实施例中,本发明用于分析关于所选核酸序列的数据和信息,本发明包括以下一个或多个模块或操作这些模块的步骤:期望最大化(EM)算法模块、总概率模块和贝叶斯模块。
在一个实施例中,本发明接收多个数据(输入)并提供多个似然和概率参数(输出),包括但不限于表1中描述的那些。
表1-适用于本发明的一个实施例的输入和输出数据的类型
期望最大化(EM)算法模块
在一个实施例中,本发明提供了一种期望最大化(EM)算法模块,用于估计贝叶斯模型的参数,该参数最大化贝叶斯模型的概率。如图2所示,将从先前测序步骤获得的靶SNP数据输入EM算法模块(21),以基于测序深度数据、映射质量数据和碱基质量数据估计多个双等位基因SNP的母胎基因型的最佳可能组合。在一个实施例中,要输入EM算法模块的数据包括但不限于参考等位基因的计数、映射质量和碱基质量,以及交互等位基因的计数、映射质量和碱基质量,其可以使用本领域可获得的数据处理工具从测序数据导出,例如,picard+GATK。在一个实施例中,EM算法模块确定倍性状态的最大概率,例如整倍体、母系三体和父系三体。
如图3所示,期望最大化(EM)算法模块(31)包括用于确定三体胎儿的最大概率的三体EM模块(311)和用于确定整倍体胎儿的最大概率的整倍体EM模块(312)。
三体EM模块(311)以迭代循环开始,使用0%的初始重组分数(rf)和0.02%的初始胎儿分数(ff)。整倍体EM模块(312)以迭代循环开始使用0.02%的初始ff。然后使用蛮力方法在一系列迭代循环中尝试各种可能的值,每个迭代循环包括期望步骤(即,根据提供的数据和模型参数的当前估计来估计缺失数据)和最大化步骤(即,似然函数最大化)。重组分数(rf)的值是指重组的完整性,并且当前的EM算法模块在每次循环中将rf值增加1%,范围为0-100%,其中0%表示没有重组,100%表示完成重组。胎儿分数(ff)的值是指母体样品中来源于胎儿的游离DNA的比例,并且当前的EM算法模块在每次循环中将ff值增加0.01%,范围为0.02-25.9%(图3)。本领域技术人员将能够根据EM算法的一般原理采用适当的值作为阈值。
总概率模块
在一个实施例中,本发明提供了一种总概率模块,其确定感兴趣结果的总概率。如图2所示,将多个条件概率输入到总概率模块(22)中,以确定特定非整倍体(例如三体)的概率。在一个实施例中,条件概率是来源于文献中报道的数据产生或衍生的,包括但不限于基于存活概率具有三体的概率(即,自然流产“SA”、死产“SB”和活产“LB“),以及基于孕龄“ma”和妊娠周“gw”的存活概率。在一个实施例中,当前总概率模块输出三体的概率,包括整倍体的概率、母系三体的概率和父系三体的概率。由总概率模块输出的概率可以被描述为“先验”概率,因为用于确定它们的信息和观察不是从所讨论的胎儿获得。
贝叶斯模块
在一个实施例中,本发明提供了一种贝叶斯模块,其将在先前模块中获得的各种整倍体和非整倍体状态的概率转化为后验概率,后验概率是给定观察到的基因型的整倍体或非整倍体的概率。如图2所示,贝叶斯模块(23)基于从EM算法模块和总概率模块获得的相应似然和概率,导出整倍体、母系三体和父系三体的后验概率。
确定胎儿非整倍体的概率
本部分说明了使用本发明确定特定类型的三体(T13、T18和T21)的概率的方法。通过选择所讨论的染色体上的SNP并使用与所讨论的非整倍体相关的概率数据,本领域技术人员将能够应用本发明来确定其他类型的胎儿非整倍体的概率。
胎儿分数是确定准确度的一般指标,其中如果胎儿分数具有更高的值,则测试结果更准确。因此,建立胎儿分数的阈值以评估测试结果的准确性,并且应基于诸如用于制备库的方法、SNP选择、序列质量和测序深度以及期望的特异性等因素来选择。如果胎儿分数令人满意,则可以基于从测序数据获得的基因型/SNP数据来计算三体的后验概率(即,关于所讨论的胎儿的三体概率)。在本发明的一个实施例中,该试验在胎儿分数≥2.1%时达到99%的特异性。
当计算携带观察到的基因型(即从测序获得的基于靶SNP)的胎儿反映特定三体的概率时,来自一般群体的胎儿具有特定三体的概率(表示为P(Di))需要首先根据所有它的存活概率(即自然流产“SA”、死产“SB”和活产“LB”)和一般人群的存活概率来计算。根据贝叶斯规则改编的公式(1)计算胎儿具有特定三体的概率,其中需要包括孕龄(表示为ma)和妊娠周(表示为gw)的其他信息。
P(Di)=P(Di|SA)P(SA|ma,gw)+P(Di|SB)P(SB|ma,gw)+P(D)i|LB)P(LB|ma,gw) (1)
当P(Di)与代表母胎基因型的G一起输入时,P(Di|G)是携带所观察的靶标基因型的胎儿具有特定三体的概率,其可通过公式(2)获得。在一个实施例中,可以基于从测序获得的基因型数据确定胎儿是否具有三体性。
P(Di|G)被计算为患有三体Di的人携带观察到的靶标基因型的概率与具有不同类型的三体的人和不具有这些三体状态的人携带观察到的基因型的概率的总和之比,即P(G|Di)P(Di)除以∑kP(G|Dk)P(Dk)+P(G|N)P(N),其中∑kP(G|Dk)P(Dk)+P(G|N)P(N)表示在四种情况下观察到的胎儿基因型的一般概率(即T13、T18,T21和N,其中P(N)=1-∑kP(Dk))。
在其他情况下观察到的胎儿基因型的一般概率也可以与上述类似的方式获得和使用。
基因型概率和母胎基因型各组合的预期参考等位基因频率
基因型概率将用于确定母体血浆中不同母体-胎儿基因型组合的先验频率(例如,Goya,R等人描述的癌症相关基因型[1]中描述的概率)。本发明提供了从参数p确定的预期参考等位基因频率的各种值,根据定义,参数p是指参考等位基因的等位基因频率。预先确定p的值以获得所需的灵敏度(例如99%特异性)。然后,本文提供的预期参考等位基因频率将用作模拟每个SNP基因座处的等位基因计数的参数。先验频率和预期参考等位基因频率用作算法的输入,用于计算每种类型的非整倍体的概率以及用于导出胎儿分数[3]。使用本文描述的算法计算衍生胎儿分数的不同胎儿非整倍体的概率。
本发明能够无限制地分析大量SNP。在一个实施例中,根据测序深度调整在单个分析中待分析的SNP的数量。例如,如果获得的测序深度更高,则可以分析更少的SNP。
例如,当胎儿分数(ff)=10%时,整倍体胎儿应该给出可能的等位基因频率0、0.05、0.45、0.5、0.55、0.95和1.0(表3)。相反,具有100%单亲源二体(即,染色体组的两个拷贝仅从一个亲本遗传)的母系三体性应具有0、0.047619、0.4285714、0.47619、0.52381、0.571428、0.95238和1.0的可能等位基因频率。这两个模型给出了不同的似然度,如果考虑到孕龄和妊娠周,则两个似然度之间的比率可以转换为概率。总之,本算法考虑了一组因子,包括孕龄和妊娠周以及不同非整倍体模型的双等位基因SNP的两个等位基因的等位基因频率,并将这些非整倍体模型的似然比转化为特定非整倍体的后验概率。
整倍体:一个母系染色体和一个父系染色体
亲生母亲
设A为参考等位基因,B为交互等位基因。
设p是参考等位基因的等位基因频率,1-p是交互等位基因的等位基因频率。
表2当p=0.6时,基于参考等位基因频率的整倍体基因型的概率
母亲基因型胎儿基因型 基因型的概率 p=0.6
AA<sub>AA</sub> p<sup>3</sup> 0.2160
AA<sub>AB</sub> p(1-p)<sup>2</sup> 0.0960
AB<sub>AA</sub> p<sup>2</sup>(1-p) 0.1440
AB<sub>AB</sub> p(1-p) 0.2400
AB<sub>BB</sub> p(1-p)<sup>2</sup> 0.0960
BB<sub>AB</sub> p<sup>2</sup>(1-p) 0.1440
BB<sub>BB</sub> (1-p)<sup>3</sup> 0.0640
设f为胎儿分数
表3当f=0.1时整倍体的胎儿分数
母系三体性:两个母系染色体和一个父系染色体
设Pi是单亲源二体的百分比。
设A为参考等位基因,B为交互等位基因。
设p是参考等位基因的等位基因频率,1-p是交互等位基因的等位基因频率。
表4当p=0.6时,基于参考等位基因频率的基因型对于母系三体的概率
母亲基因型胎儿基因型 基因型的概率 p=0.6
AA<sub>AAA</sub> p<sup>3</sup> 0.2160
AA<sub>AAB</sub> p<sup>2</sup>(1-p) 0.1440
AB<sub>AAA</sub> P<sub>i</sub>p<sup>2</sup>(1-p) P<sub>i</sub>0.1440
AB<sub>AAB</sub> p(1-p)(P<sub>i</sub>-3P<sub>i</sub>p+2p) 0.288-0.192P<sub>i</sub>
AB<sub>ABB</sub> p(1-p)(3P<sub>i</sub>p+2-2P<sub>i</sub>-2p) 0.192-0.048P<sub>i</sub>
AB<sub>BBB</sub> P<sub>i</sub>p(1-p)<sup>2</sup> P<sub>i</sub>0.0960
BB<sub>ABB</sub> p(1-p)<sup>2</sup> 0.0960
BB<sub>BBB</sub> (1-p)<sup>3</sup> 0.0640
设f为胎儿分数
表5当f=0.1时,母系三体的胎儿分数
父系三体性:一条母系染色体和两条父系染色体
设Pi是单亲源二体的百分比。
设A为参考等位基因,B为交互等位基因。
设p是参考等位基因的等位基因频率,1-p是交互等位基因的等位基因频率。
表6当p=0.6时,基于父系三体的参考等位基因频率的基因型的概率
母亲基因型胎儿基因型 基因型的概率 p=0.6
AA<sub>AAA</sub> p<sup>3</sup>(P<sub>i</sub>+p-P<sub>i</sub>p) P<sub>i</sub>0.2160+(1-P<sub>i</sub>)0.1296
AA<sub>AAB</sub> 2p<sup>3</sup>(1-p)(1-P<sub>i</sub>) (1-P<sub>i</sub>)0.1728
AA<sub>ABB</sub> p<sup>2</sup>(1-p)(1-p+P<sub>i</sub>p) P<sub>i</sub>0.1440+(1-P<sub>i</sub>)0.0576
AB<sub>AAA</sub> p<sup>2</sup>(1-p)(P<sub>i</sub>+p(1-P<sub>i</sub>)) P<sub>i</sub>0.1440+(1-P<sub>i</sub>)0.0864
AB<sub>AAB</sub> p<sup>2</sup>(1-p)(P<sub>i</sub>+(1-P<sub>i</sub>)(2-p)) P<sub>i</sub>0.1440+(1-P<sub>i</sub>)0.2016
AB<sub>ABB</sub> p(1-p)<sup>2</sup>(P<sub>i</sub>+(1-P<sub>i</sub>)(1+p)) P<sub>i</sub>0.0960+(1-P<sub>i</sub>)0.1536
AB<sub>BBB</sub> p(1-p)<sup>2</sup>(P<sub>i</sub>+(1-P<sub>i</sub>)(1-p)) P<sub>i</sub>0.0960+(1-P<sub>i</sub>)0.0384
BB<sub>AAB</sub> p(1-p)<sup>2</sup>(p-P<sub>i</sub>p+P<sub>i</sub>) P<sub>i</sub>0.0960+(1-P<sub>i</sub>)0.0576
BB<sub>ABB</sub> 2p(1-p)<sup>3</sup>(1-P<sub>i</sub>) (1-P<sub>i</sub>)0.0768
BB<sub>BBB</sub> (1-p)<sup>3</sup>(1-p+P<sub>i</sub>p) P<sub>i</sub>0.0640+(1-P<sub>i</sub>)0.0256
设f为胎儿分数
表7当f=0.1时,父系三体性的胎儿分数
母亲和父亲三体之间的比率
取自文献[4]的引起三体的五个原因的数值:
表8不同原因的三体比率
假设T13、T18和T21的亲本比例相同,有丝分裂的一半是母系,一半是父系,我们得出以下:
表9母系和父系三体之间的比率
从似然度得出的后验分布
推导出给予每种基因型的胎儿具有特定三体的后验概率。给出了数据的来源和推导后验概率的计算。一个示例演示了如何计算后验概率。
其中P(G|Di)是具有基因型G的人具有状况Di的概率,P(Di)是状况的先验概率,N表示不携带测试状况的情况,Di表示不同类型的测试倍性(母系三体性、父系三体性等)。
计算三体概率的模型可以扩展到三倍体。
数据来源
P(Di),P(N):对于三体,我们通过计算得到P(Di)。设P(N)=1-P(Di)。P(G|D),P(G|N):根据作为SNVMix2[1]的扩展的程序计算。
获得P(SA|ma,gw)
数据从https://datayze.com/miscarriage-chart.php下载,并且在孕龄<35,35-39和≥40时获得P(SA|ma,gw)的三个数据点(表10)。为了提高P(LB|ma,gw)的准确性,进行了所有孕龄和孕龄25、37和44的二次回归。这是在R(统计学家的编程语言)中完成的。
表10不同妊娠周和孕龄的P(SA|ma,gw)的回归数据。
获得P(SB|ma,gw)和P(LB|ma,gw)
P(SB|年龄,周)=P(SB|年龄)
P(SB|年龄)的值取自文献[5]。
文献资料如下:
表11死产的概率
孕龄 样品总数量 死产数量 死产的概率
<20 6463 87 0.0135
24 89373 639 0.0071
29 125138 703 0.0056
34 52245 383 0.0073
≥35 18087 260 0.0144
使用年龄为17、22、27、32、40的三次多项式对数据进行回归。
公式为0.08243-0.006765x年龄+0.0001834x(年龄)2-0.00000142x(年龄)3
P(LB|年龄,周)=1-P(SA|年龄,周)-P(SB|年龄,周)
=1-P(SA|年龄,周)-P(SB|年龄)
因此值P(LB|年龄,周)如下:
表12值P(LB|年龄,周)
计算P(Di)
要计算P(Di),应用以下公式:
P(Di)=P(Di|SA)P(SA|ma,gw)+P(Di|SB)P(SB|ma,gw)+P(Di|LB)P(LB|ma,gw)(1)
其中ma是孕龄,gw是妊娠周。
条件概率
在该分析中,应用来自文献[6-9]的参数。
表13基于存活概率的各种三体的条件概率
概率 概率 概率
P(T21|SA) 0.0319 P(T21|SB) 0.0921 P(T21|LB) 0.0005
P(T13|SA) 0.0319 P(T13|SB) 0.0026 P(T13|LB) 0.0000
P(T18|SA) 0.0160 P(T18|SB) 0.0102 P(T18|LB) 0.0042
示例:
让Di为T21三体
参数
P(T21|SA) 3.19%
P(SA|ma,gw) 15%
P(T21|5B) 9.21%
P(SB|ma,gw)=P(SB|ma) 15%
P(T21|LB) 0.05%
概率
非21三体胎儿 e<sup>-206221</sup>
母系21三体 e<sup>-206209</sup>
父系21三体 e<sup>-206271</sup>
P(T21|ma,gw)
=P(T21|SA)P(SA|ma,gw)+P(T21|5B)P(SB|ma,gw)+P(T21|LB)P(LB|ma,gw)
=P(T21|SA)P(SA|ma,gw)+P(T21|SB)P(SB|ma)+P(T21|LB)(1-P(SA|ma,gw)
-P(SB|ma))
通过代入值P(T21)=0.01895。
根据P(Di|G)的等式可得
三体的比例(即0.9034和0.0966)根据本文件中的表9提供。值0.01895是T21的概率。
在一个实施例中,该方法通过比较确定的非整倍体概率和产生预定灵敏度的截止值来确定所讨论的胎儿是否具有非整倍体。在一个实施例中,90%的截止值产生超过99%的灵敏度。
在一个实施例中,本发明提供了一种用于确定胎儿患有非整倍体的概率的方法,该方法包括以下步骤:
a)从携带胎儿的孕妇获得测试样品,该样品包含游离胎儿DNA和游离母体DNA;
b)富集游离胎儿DNA和游离母体DNA中的多个靶序列,该靶序列包含多个靶标双等位基因常染色体单核苷酸多态性(SNP);
c)扩增富集的靶序列,从而获得扩增的靶序列;
d)确定一些或所有扩增的靶序列的至少一部分的序列,其中该部分包含至少一个靶标双等位基因常染色体SNP;以及
e)通过使用期望最大化算法模块、总概率模块和贝叶斯模块分析该至少一个靶标双等位基因常染色体SNP的等位基因频率来确定胎儿患有非整倍体的概率。
在本方法的一个实施例中,步骤b)还包括扩增至少一些所述靶序列的步骤。在一个实施例中,步骤b)还包括通过探针杂交捕获至少一些所述靶序列的步骤。
在本方法的一个实施例中,测试样品来源于孕妇的血液样品。
在本方法的一个实施例中,靶SNP是位于同一染色体上的SNP,其中所述染色体的异常拷贝数导致非整倍体。
在本方法的一个实施例中,该方法确定胎儿遭受的两种或更多种非整倍体的概率,其中两种或更多种类型的非整倍体的每一种由不同的染色体导致。
在本方法的一个实施例中,非整倍体是13三体、18三体或21三体。
在本方法的一个实施例中,使用能够进行下一代测序的平台进行步骤d)。
在本方法的一个实施例中,步骤e)包括步骤:
i.使用所述期望最大化算法模块确定整倍体和非整倍体的最大概率;
ii使用所述总概率模块从多个条件概率确定整倍体和非整倍体的先验概率;以及
iii.使用所述贝叶斯模块将确定的整倍体和非整倍体的最大概率以及确定的整倍体和非整倍体的先验概率转化为胎儿的整倍体和非整倍体的后验概率。
在本方法的一个实施例中,条件概率包括基于胎儿的存活概率的非整倍体的条件概率和基于孕龄和妊娠周的胎儿存活条件概率,其中所述条件概率并非特定于所讨论的胎儿。
在本方法的一个实施例中,步骤i)的最大概率是基于给定SNP的参考等位基因及交互等位基因的等位基因计数、映射质量和碱基质量来确定的。
在本方法的一个实施例中,还包括通过比较确定的非整倍体概率和产生预定灵敏度的截止值来确定胎儿是否有非整倍体的步骤。
在一个实施例中,本发明提供了一种用于确定胎儿患有非整倍体的概率的方法,该方法包括以下步骤:
a)从怀有所述胎儿的孕妇获得血液样品;
b)从样品中提取游离胎儿DNA和游离母体DNA以形成测试样品;
c)确定测试样品中游离DNA的浓度;
d)从测试样品制备包含多个靶序列的核酸库,所述靶序列包含多个靶标双等位基因常染色体单核苷酸多态性(SNP);
e)至少对库的一部分进行测序;以及
f)通过使用期望最大化算法模块、总概率模块和贝叶斯模块分析多个SNP中的等位基因频率来确定胎儿患有非整倍体的概率。
在本方法的一个实施例中,步骤d)包括从所述游离DNA富集所述靶序列的步骤。
在本方法的一个实施例中,从游离DNA富集靶序列的步骤包括扩增至少一部分靶序列的步骤。
在本方法的一个实施例中,从所述游离DNA富集靶序列的步骤包括通过探针杂交捕获至少一部分所述靶序列的步骤。
在本方法的一个实施例中,步骤d)包括以下步骤:
i.游离DNA的末端修复和A尾加工;
ii.使用衔接子连接从步骤(i)获得的游离DNA,从而获得连接的DNA序列;
iii.扩增连接的DNA序列;
iv.将来自步骤(iii)的DNA序列与包含对靶序列特异的序列的探针杂交,从而捕获包含靶序列的DNA序列;以及
v.扩增捕获的DNA序列,从而获得包含靶序列的多个DNA序列。
在本方法的一个实施例中,步骤d)包括步骤:
i.游离DNA的末端修复和A尾加工;
ii.使用衔接子连接从步骤(i)获得的游离DNA,从而获得连接的DNA序列;以及
iii.使用对靶序列特异的引物扩增连接的DNA序列,从而获得多个扩增子;以及
iv.扩增多个扩增子,从而获得包含靶序列的多个DNA序列。
在本方法的一个实施例中,靶SNP是位于同一染色体上的SNP,其中所述染色体的异常拷贝数导致非整倍体。
在本方法的一个实施例中,该方法确定胎儿遭受的两种或更多种非整倍体的概率,其中,所述两种或更多种类型的非整倍体的每一种由不同的染色体导致。
在本方法的一个实施例中,非整倍体是13三体、18三体或21三体。
在本方法的一个实施例中,使用能够进行下一代测序的平台进行步骤e)。
在本方法的一个实施例中,步骤f)还包括步骤:
i.使用所述期望最大化算法模块确定整倍体和非整倍体的最大概率;
ii使用所述总概率模块从多个条件概率确定整倍体和非整倍体的先验概率;以及
iii.使用所述贝叶斯模块将确定的整倍体和非整倍体的最大概率以及确定的整倍体和非整倍体的先验概率转化为胎儿非整倍体的后验概率。
在本方法的一个实施例中,条件概率包括基于胎儿的存活概率的非整倍体的条件概率和基于孕龄和妊娠周的胎儿存活条件概率,其中所述条件概率并非特定于所讨论的胎儿。
在本方法的一个实施例中,步骤i)的最大概率是基于给定SNP的参考等位基因及交互等位基因的等位基因计数、映射质量和碱基质量来确定的。
在本方法的一个实施例中,还包括通过比较确定的非整倍体概率和产生预定灵敏度的截止值来确定胎儿是否有非整倍体的步骤。
在一个实施例中,本发明提供了一种确定胎儿中非整倍体的概率的系统,所述确定基于来自怀有所述胎儿的孕妇的血液样品的遗传数据,其中,所述血液样品包含来自妇女和胎儿的核酸的混合物,所述系统包括:
i.用于从所述样品接收所述遗传数据的装置,其中所述遗传数据包括关于靶标多个双等位基因常染色体单核苷酸多态性(SNP)的信息;
ii.期望最大化算法模块,用于确定整倍体和非整倍体的最大概率,从而产生似然比;
iii.总概率模块,用于从多个条件概率确定整倍体和非整倍体的先验概率;以及
iv.贝叶斯模块,用于将确定的似然比和确定的整倍体和非整倍体的先验概率转化为整倍体和非整倍体的后验概率,其中所述后验概率产生胎儿中所述非整倍体的概率。
在本系统的一个实施例中,遗传数据包括给定SNP的参考等位基因和交互等位基因的等位基因计数、映射质量和碱基质量。
在本系统的一个实施例中,遗传数据来源于包含目标SNP的DNA序列库。
在本系统的一个实施例中,遗传数据来源于从能够进行下一代测序的平台获得的数据。
在本系统的一个实施例中,条件概率包括基于胎儿的存活概率的非整倍体的条件概率和基于孕龄和妊娠周的胎儿存活条件概率,其中所述条件概率并非特定于所讨论的胎儿。
在本系统的一个实施例中,靶SNP是位于同一染色体上的SNP,其中所述染色体的异常拷贝数导致非整倍体。
在本系统的一个实施例中,SNP位于两条或更多条染色体上。
在本系统的一个实施例中,非整倍体是13三体、18三体或21三体。
在一个实施例中,本发明提供了本文描述的任何系统用于确定胎儿中非整倍体的概率的用途。
通过参考下面的实验细节将更好地理解本发明,但是本领域技术人员将容易理解,详述的具体实验仅是说明性的,并不意味着限制本文所述的本发明,即由其后的权利要求定义。
贯穿本申请,引用了各种参考文献或出版物。这些参考文献或出版物的全部公开内容通过引用结合到本申请中,以便更全面地描述本发明所属领域的现有技术。应注意,与“包括”、“含有”或“由...表示”同义的过渡术语是包含性的或开放式的,并且不排除另外的、未列举的元素或方法步骤。
示例
示例1
样品制备-从母体血液或血浆样品中纯化游离DNA
该实施例说明了一个使用快速样品浓缩器(RSC)从母体全血或血浆样品中提取游离DNA并使用荧光计测定提取的基因组DNA浓度的实施例。
从怀孕的受试者收集10mL全血样品并储存在cfDNA血液管中。然后根据以下方案处理样品:
制备血浆
1.将来自cfDNA血液管的全血以3000rpm离心5分钟。
2.将所有血浆等分,并以14000rpm离心收集的血浆10分钟。
3.将上清液收集于新2mL螺帽管中并储存在4℃,直至进一步使用,或-20℃进行长期储存。
循环核酸与磁性树脂的结合
1.将2mL结合缓冲液加入50mL离心管中。
2.在离心管中加入140μL磁性树脂。
3.在离心管中加入2mL血浆样品(样品与结合缓冲液的比例为1∶1)。
4.在辊式振荡器上混合45分钟。
5.以6000rcf离心50mL离心管3分钟以颗粒化树脂(Eppendorf 5430/R)或以4000rpm沉淀2分钟以颗粒化树脂(Eppendorf 5810/R)。
6.用P1000移液器小心取出上清液,避免干扰珠子。
麦克斯韦试剂盒的制备
1.简单地向下摆动试剂盒以沉降所有用量。
2.将试剂盒放入麦克斯韦甲板托盘中,孔#1离洗脱管最远。
3.将试剂盒卡入到位,直到听到“咔哒”声。
4.将密封圈从操作员的方向剥离到最大的孔。
5.将洗脱管放入托盘中每个试剂盒的洗脱管位置。
6.在洗脱管底部加入75μL洗脱缓冲液。
7.将柱塞放入每个试剂盒的#8孔中。
8.使用P1000移液器,用孔1(大孔)中的缓冲液重新悬浮50mL离心管中的磁性树脂。
9.将树脂和液体转移回麦克斯韦试剂盒的1号孔。
10.将托盘放回仪器中。
仪器运行
1.打开麦克斯韦仪器和台式计算机。
2.选择主屏幕上的开始。
3.选择提取方法:“LV ccf DNA Custom”。
4.选择要运行的试剂盒位置并命名样品。
5.验证:将样品加入到试剂盒的#1孔中,将试剂盒装入正确的位置,洗脱管含有正确量的洗脱缓冲液,将柱塞置于孔#8中,并且洗脱管盖保持打开。
6.单击开始以关闭仪器门并开始处理。
7.在-30℃下储存纯化的游离DNA。
使用dsDNA高灵敏度检测试剂盒和仪器测定纯化的游离DNA浓度:
将从前一步骤获得的纯化的游离DNA涡旋并使用台式离心机离心。取2μL游离DNA溶液,根据以下方案测量游离DNA的浓度:
反应混合物制备
1.按以下比例制备反应混合物:199μL反应缓冲液:1μL荧光染料。
2.彻底混合。
3.将190μL反应混合物分装到两个Qubit反应管中,设定两个标准。
4.分别向两个含有190μL反应混合物的标准管中加入10μL标准1溶液和标准2溶液。彻底混合。
5.将198μL反应混合物等分到另一个Qubit反应管中以测量游离DNA浓度。6.将2μL游离DNA加入含有198μL反应混合物的反应管中。
7.将每种标准品中的混合物和样品反应管彻底混合,然后通过离心反应管使混合物沉降。
仪器运行
1.打开仪器。
2.在主屏幕上选择dsDNA。
3.在主屏幕上选择dsDNA:高灵敏度检测。
4.在主屏幕上选择读取标准。
5.将标准1管插入样品室并按下读取标准。
6.将标准2管插入样品室并按下读取标准。
7.荧光与浓度图表在主屏幕上显示。
8.将样品管插入样品室并按下运行样品。
9.选择输入样品量和输出样品单位,按下读取管。
示例2
基于杂交方法的靶向富集-库制备方案
在本发明中,基于杂交的库制备建立在SeqCap制造商的方案上。在以下方案和过程中,引入了与制造商版本的细微差别,以定制和优化工作流程,以便在后续阶段获得更好的序列读数。
该过程包括DNA的片段化,末端修复和A尾加工,衔接子连接,库扩增(即,预富集扩增),扩增后清除,与SeqCap探针池的样品杂交(即靶富集)和杂交后扩增(即富集后扩增)。详细方案如下:
A.将AMPure XP珠子置于室温下
B.制备DNA(游离DNA推荐用1ng-1μg)
1.最大化体积-50μL cfDNA输入
C.末端修复和A尾加工
使用的套件:KAPA HyperPrep套件
1.为每个样品准备以下主混合物(RT)
2.轻轻涡旋并旋转下来
3.在热循环仪中启动以下程序
4.立即继续进行衔接子连接
D.衔接子连接
1.准备以下主混合物(1个样品)
2.将主混合物添加到每个样品(60μL)中。
3.向每个样品中加入5μL未稀释的SeqCap索引衔接子
(注意:不同的样品使用不同的索引衔接子)
4.彻底混合并旋转
5.在20℃下在热循环仪中孵育15分钟
6.继续进行连接后清理
E.连接后清理
1.在同一管中,通过组合以下成分进行清理。
2.记录每个样品使用的索引。
3.上下移液彻底混合(不是涡旋)。
4.在室温下孵育5分钟,使DNA与珠子结合。
5.将管放在磁铁上以捕获珠子。孵育直至液体澄清(≥5分钟)。
6.小心取出并丢弃上清液。
7.将管子保持在磁铁上,加入200μL新鲜制成的80%乙醇。
8.将管在室温下孵育≥30s。
9.小心取出并丢弃乙醇。
10.将管保持在磁铁上,加入200μL新鲜制成的80%乙醇。
11.在室温下将管子在磁铁上孵育≥30s
12.小心取出并丢弃乙醇。尝试去除所有残留的乙醇,而不影响珠子。
13.在室温下干燥珠子4-5分钟。
(注意:过度干燥珠子会降低产量)
14.从磁铁上取下管。
15.将珠子彻底重新悬浮在23μL洗脱缓冲液中。
16.将管在室温下孵育2分钟以从珠子上洗脱DNA。
17.将管放在磁铁上以捕获珠子。孵育直至液体澄清。
18.将透明的22μL上清液转移至96孔板以进行库扩增。
F.库扩增
1.如下将每个库扩增反应装配在96孔板中。
2.彻底混合并旋转。
3.使用以下步骤进行扩增(约32分钟)
(体积=50,加热盖=105℃,斜坡=3℃)
4.直接进行扩增后清理
G.扩增后清理
准备以下等分试样:
i.80%乙醇
ii.AMPure XP试剂
iii.PCR级水
iv.Qubit试剂-两种标准品和样品的试剂
1.使用前,让AMPure XP珠子平衡至室温至少30分钟。
2.使用前,将AMPure XP珠子涡旋至均匀状态。
3.将90μLAmpureXP珠加入96孔板中的50μL扩增样品库中。
4.用移液器上下彻底混合。
5.在室温下孵育5分钟,使DNA与珠子结合。
6.将样品放入磁铁收集器中。孵育直至液体澄清。
7.取出并丢弃上清液,不要影响珠子。
8.将样品保留在磁铁上。加入200μL新鲜制成的80%乙醇
9.在室温下孵育≥30s
10.取出并丢弃乙醇
11.将样品保持在磁体上,加入200μL新鲜制备的80%乙醇
12.在室温下孵育≥30s
13.取出并丢弃乙醇。尝试去除所有残留的乙醇,而不影响珠子。
14.让珠子在室温下干燥4-5分钟,不要超过5分钟。过度干燥会导致产率低。
15.从磁力收集器中取出样品。
16.使用53μL洗脱缓冲液重悬DNA。
17.上下移液以混合样品。确保重新悬浮所有珠子。
18.在室温下孵育2分钟。
19.将样品放在磁性收集器上,直到液体清洁干净。
20.将52μL上清液转移到新的1.5mL管中。
21.将1.5μL样品移液到另一个新的1.5mL管中进行Bioanalyzer测量样品质量。
22.将2μL样品加入198uL Qubit工作溶液中进行Qubit定量。
23.杂交前将整个样品保存在-20℃。
H.杂交样品和SeqCap EZ探针池
使用的套件:
SeqCap HE通用,SeqCap HE索引寡聚核苷酸(Index OLigos)
SeqCap EZ附属套件中的COT人类DNA(COT Human DNA in SeqCap EZ Accessory Kit)
杂交和清洗套件(Hybridization and Wash kit)
1.解冻SeqCap HE通用,SeqCap HE Index OLigos,它们与库池中包含的DNA衔接子索引相匹配
2.解冻样品库以进行池化
3.将等量的每种扩增的DNA样品库混合在一起,以获得组合质量为1μg的单个池(例如,4个库各0.25μg用于单个池)。总寡核苷酸=2000pmoL(2μL,1000μM)
4.准备多重杂交增强寡核苷酸池
i.SeqCap HE通用寡核苷酸=1000pmoL(1μL的1000μM)
ii.HE索引寡核苷酸的混合物=1000pmoL
(例如:HE索引寡核苷酸混合物=4种HE索引寡核苷酸各250pmoL(0.25μL,1000μM))
5.根据下表制备杂交混合物
6.确定杂交混合物的总体积。
7.向杂交混合物中加入2倍体积的AMPure XP试剂。
(例如,如果杂交混合物的总体积=57μL,则在混合物中加入114μL AmpureXP试剂)
8.在室温下孵育样品10分钟,使样品库与珠子结合。
9.将样品放在磁性收集器上以捕获珠子直至液体澄清。
10.取出并丢弃上清液,不要影响珠子。
11.将样品保留在磁铁上。加入190μL新鲜制成的80%乙醇
12.在室温下孵育≥30s
13.取出并丢弃乙醇。尝试去除所有残留的乙醇,而不影响珠子。
14.让珠子在室温下干燥4-5分钟,不要超过5分钟。过度干燥会导致产率低。
15.添加以下试剂(1个样品池的体积)以重悬珠子。
i.7.5μL的2x杂交缓冲液(小瓶5)
ii.3μL的杂交成分A(小瓶6)
16.从磁力收集器中取出样品,并通过上下移液将其彻底混合。
17.在室温下孵育2分钟
18.将样品放在磁性收集器上直至液体澄清。
19.在含有4.5μL SeqCapEZ探针池的新PCR板中转移10.5μL上清液。
20.彻底混合。
21.使用以下程序在热循环仪中进行杂交孵育(体积=15μL,加热盖=57℃)
i.95℃持续5分钟
ii.47℃持续16-20小时
注意:在杂交过程中,重要的是热循环仪的加热盖比杂交温度高10℃。样品维持47℃直到它转移到捕获珠子上是重要的。
22.杂交后立即进行洗涤和回收步骤。在清洗和回收之前,请勿存放样品。
23.准备珠子洗涤缓冲液,供第二天使用。
第二天
I.洗涤和回收捕获的多重样品
使用的套件:
杂交和清洗套件(Hybridization and Wash kit)
SeqCap纯捕获珠子套件(Pure Capture Bead Kit)
1.如下准备珠子洗涤缓冲液
2.使用SeqCap纯捕获珠子套件(Pure Capture Bead Kit)中的捕获珠子在使用前平衡至室温30分钟。
3.在使用前将捕获珠子涡旋15秒以确保珠子的均匀混合物。
4.在1.5mL管中为每个样品等分50μL珠子。
5.将管子放在磁性收集器上,直到液体澄清。
6.取出并丢弃上清液,不要影响珠子
7.将管保持在磁性收集器上,加入两倍初始体积的1X珠子洗涤缓冲液珠子(即100μL珠子洗涤缓冲液,用于50μL捕获珠子)
8.从磁力收集器中取出管子,并通过上下吸移将其彻底混合
9.将管子放在磁力收集器上,直到液体变得清澈为止
10.去除并丢弃上清液
11.重复步骤7-10(总共:2次洗涤)
12.加入1X初始体积的1X珠子洗涤缓冲液珠子(即每次捕获50μL)
13.从磁力收集器上取下管子,并通过上下吸移彻底混合
14.对于每次捕获,将50μL重悬的珠子等分到新的PCR板中。
15.将管子放在磁性收集器上,直到液体澄清。
16.取出并丢弃上清液,不要影响珠子
17.珠子现在准备结合捕获的DNA。立即继续下一步(不要让捕获的珠子变干)
J.将DNA与捕获珠子结合和洗涤步骤
1.将10.5μL杂交样品转移至含有来自前一步骤的捕获珠子的PCR板。
2.上下移液彻底混合
3.将样品在热循环仪中于47℃孵育15分钟(加热盖设置为57℃),以将捕获的DNA加到珠子上
4.从热循环仪中取出样品。将热循环仪保持在47℃,加热盖保持在57℃,以进行下一步骤。
5.向15μL捕获珠子混合物中加入100μL1X洗涤缓冲液I。
6.彻底混合。
7.将管子放在磁力收集器上,直到液体澄清。
8.取出并丢弃上清液,不要影响珠子。
9.加入200μL1X严格洗涤缓冲液
10.从磁力收集器中取出管子,并通过上下移液彻底混合
11.将热循环仪置于加热至47℃,盖上盖子(设定为57℃)并孵育5分钟。
12.孵育后,从热循环仪中取出样品,将管置于磁性收集器上,直至液体澄清。
13.取出并丢弃上清液,不要影响珠子。
14.重复步骤9-13(使用严格洗涤缓冲液洗涤2次)。
15.加入200μL1X的洗涤缓冲液I。
16.上下移液彻底混合,确保混合均匀。
17.在室温下孵育1分钟。
18.将管子放在磁力收集器上,直到液体澄清。
19.取出并丢弃上清液,不要影响珠子
20.加入200μL1X洗涤缓冲液II
21.通过上下吸移彻底混合,确保混合物均匀。
22.在室温下孵育1分钟。
23.将管子放在磁性收集器上,直到液体澄清。
24.取出并丢弃上清液,不要影响珠子
25.加入200μL1X洗涤缓冲液III
26.通过上下移液彻底混合,确保混合物均匀。
27.在室温下孵育1分钟
28.将管子放在磁性收集器上,直到液体澄清。
29.取出并丢弃上清液,不要影响珠子
30.从磁性收集器中取出样品。
31.向含有珠子结合的DNA样品的平板孔中加入20μL PCR级水。珠子和捕获的DNA将用作LM-PCR中的模板。
K.使用LM-PCR扩增捕获的多重DNA样品
使用套件:SeqCap EZ附属套件v2(Accessory Kit v2)
1.重悬LM-PCR后的寡核苷酸
2.准备下列试剂的主混合物
3.将样品保持在平板中,加入30μL捕获后的LM-PCR主混合物。
4.上下移液彻底搅拌。不要旋转。
5.使用以下程序在热循环仪中执行捕获后的PCR扩增约20分钟(设置斜坡=3℃)。
运行前检查循环数
6.继续进行清理步骤
L.使用AMPure XP珠子纯化扩增的捕获的多重DNA样品
1.确保AMPure XP珠子至少在使用前30分钟处于室温。
2.将珠子涡旋10秒以确保其为均匀状态。
3.将90μL AMPure珠子加入96孔板中的150μL扩增的捕获的多重DNA样品库。
4.上下移液彻底混合。
5.在室温下孵育5分钟,使样品与珠子结合。
6.将管子放在磁力收集器上,直到液体澄清。
7.取出并丢弃上清液,不要影响珠子。
8.将样品保存在磁性收集器上。加入200μL新鲜制成的80%乙醇
9.在室温下孵育≥30s
10.取出并丢弃乙醇
11.将样品保存在磁性收集器上。加入200μL新鲜制成的80%乙醇
12.在室温下孵育≥30s
13.取出并丢弃乙醇。尝试去除所有残留的乙醇,而不会影响珠子
14.使珠子在室温下干燥4-5分钟(不大于5分钟)
15.从磁性收集器中取出样品
16.使用53μL洗脱缓冲液(EA缓冲液)重悬DNA样品
17.上下移液几次,确保所有珠子重新悬浮
18.在室温下孵育2分钟
19.将管子放在磁力收集器上,直到液体澄清。
20.在新的1.5mL管中转移53μL上清液
21.使用Qubit测量样品浓度,使用生化分析仪测量样品质量
M.计算测序仪的库输入
[数量(ng/μL)/(660g/moL x库中的平均片段大小)]x106=10nM or 4nM
库中的平均片段大小=300bp
示例3
靶向富集的库制备-基于扩增子的方法
已对QIAseq库制备方案进行了修改,以实现所需的结果。详细方案如下:
·确定输入量并将DNA控制在10-40ng
·反应清理:使用QIAseq珠子清洁板
·通过短暂离心将DNA样品离心,然后通过7-8次上下移液混合,然后再次离心。
片段化、末端修复和A尾加工
1.准备反应混合物。
2.通过向每个反应添加5μL片段化酶混合物进行DNA片段化、末端修复和A尾添加。简单地离心,通过上下移液7-8次混合并再次短暂离心。
3.预冷热循环仪在4摄氏度。孵育时间参见下表。
4.将管转移到预冷的热循环仪并恢复循环程序。
5.让热循环仪返回4摄氏度。
衔接子连接
1.根据下表制备衔接子连接混合物。简单地离心,通过上下移液10-12次混合并再次短暂离心。
2.将热循环仪编程至20摄氏度并将反应孵育15分钟。
清除衔接子连接的DNA
1.加入30μL无核酸酶水,使每个样品达到80μL
2.加入112μL QIAseq珠子。通过上下移液几次混合均匀。
3.在室温下孵育5分钟
4.将板放在磁架上10分钟。小心地取出并丢弃上清液,同时将珠子放在磁力架上。
5.从磁架上取下板,加入52μL无核酸酶水,从珠子中洗脱DNA。通过移液混合均匀。
6.将板放回磁架直到溶液清除。
7.将50μL上清液转移到干净的平板上。
8.加入70μL QIAseq珠子。通过上下移液充分混合。
9.在室温下孵育5分钟
10.将板放在磁架上5分钟。将珠子放在磁力架上,小心取出并丢弃上清液。
11.加入200μL 80%乙醇。在磁铁的两个柱位置之间左右移动板以清洗珠子。小心取出并丢弃洗涤液。
12.重复乙醇洗涤。
13.将板保持在磁力架上,在室温下风干15分钟。
14.从磁力架上取下平板,加入12μL无核酸酶水,从珠子中洗脱DNA。通过移液混合均匀。
15.将板放回磁架直到溶液清除。
16.将9.4μL上清液转移至干净的试管或平板中。
靶向富集
1.短暂离心,通过上下吸移7-8次制备靶向富集混合物并再次短暂离心。
2.使用表14中的循环条件(具有<1500引物/管的组)或表15(具有≥1500引物/管的组)对热循环仪进行编程。
表14引物数量<1500/管的靶向富集的循环条件
表15引物数量≥1500/管的靶向富集的循环条件
3.将靶向富集反应置于热循环仪中并开始运行。
4.反应完成后,将反应物置于冰上,然后进行“靶向富集的净化”。或者,样品可以在-20℃下在恒温冷冻箱中储存长达3天。
清除靶向富集的DNA
1.加入70μL无核酸酶水,使每个样品达到90μL。
2.加入108μLQIAseq珠子。通过上下移液几次混合均匀。
3.在室温下孵育5分钟。
4.将管/板放在磁架上5分钟。在溶液澄清后,将珠子仍然放在磁力架上,小心地取出并丢弃上清液。
5.将珠子放在磁力架上,加入200μL80%乙醇。旋转管(2-3次)或在磁铁的两个柱位置之间左右移动板以清洗珠子。小心取出并丢弃洗涤液。
6.重复乙醇洗涤。
7.将珠子放在磁力架上,在室温下风干10分钟。
8.从磁力架上取下珠子,加入16μL不含核酸酶的水从珠子中洗脱DNA。通过移液混合均匀。
9.将管/板放回磁架,直至溶液清除。
10.将13.4μL上清液转移至清洁的管/板中。
11.继续下面的“通用PCR”。或者,样品可以在-20℃下在恒温冷冻箱中储存长达3天。
通用PCR
1.根据表14或表15,准备通用PCR预混液(或反应),具体取决于使用的是哪种索引。简单地离心,通过上下吸移7-8次混合并再次短暂离心。
重要提示:如果使用QIAseq 96索引IA,B,C或D组,则直接在含有预先分配的干燥索引引物和通用PCR引物的IL-S5索引引物板A,B,C或D中混合成分。
重要提示:用于衔接子连接反应的A,B,C或D IL-N7衔接板必须与用于通用PCR扩增反应的匹配的A,B,C或D IL-S5索引引物板配对。
如果使用QIAseq 12-index I,用于通用PCR的反应混合物
如果使用QIAseq 96-index IA,B,C或D组*,用于通用PCR的反应成分
*适用于A,B,C或D组的QIAseq IL-S5索引引物板。最终库双样本指数由IL-N7衔接子板和QIAseq IL-S5索引引物板的组合决定。如果一起使用QIAseq 96-index A,B,C和D组,则总样品指数水平可高达384-plex。
2.使用表16(循环程序)和表17(循环数量)中的循环条件对热循环仪进行编程。
表16通用PCR的循环条件
表17通用PCR的扩增循环
3.反应完成后,将反应物置于冰上,然后进行“通用PCR的清除”。或者,样品可以在-20℃下在恒温冷冻箱中储存长达3天。
清除通用PCR
1.对于cfDNA样品,加入70μL无核酸酶水,使每个样品达到90μL。
2.对于cfDNA样品,添加108μLQIAseq珠子。通过上下移液几次混合均匀。
3.在室温下孵育5分钟。
4.将管/板放在磁架上5分钟,以从上清液中分离珠子。一旦溶液清除,珠子仍在磁力架上,小心地取出并丢弃上清液。(重要提示:不要丢弃珠子,因为它们含有靶标DNA)
5.将珠子保持在磁力架上,加入200μL80%乙醇。旋转管(2-3次)或在磁铁的两个柱位置之间左右移动板以清洗珠子。小心取出并丢弃洗涤液。
6.重复乙醇洗涤。(重要提示:第二次洗涤后,彻底清除所有痕量的乙醇洗液。先用200μL移液管取出乙醇,然后用10μL移液管除去残留的乙醇)
7.将珠子保持在磁力架上,在室温下风干10分钟。(注意:目视检查颗粒是否完全干燥。从磁力架上取下珠子,加入30μL无核酸酶水,从珠子中洗脱DNA。用移液管充分混合)
8.将管/板放回磁架,直至溶液清除。
9.将28μL上清液转移到干净的管或平板上。
10.使用QIAseq定量之前,可将库储存在-20℃冰箱中。
示例4
非整倍体测定
该示例说明了使用本发明的一个实施例确定非整倍体的一个实施例。
表18、19和20呈递在三个独立运行中本非整倍体测试的数据,其中有产生阳性结果。
如表18所示,“12_S12A”号样品为发出“母体T21阳性”的结果,这意味着胎儿很可能患有母体21三体。
如果在血浆样品处理、DNA提取和库制备的各个步骤中的质量控制不充分,则可能影响本非整倍体测试的性能。全血的收集、储存和加工;提取cfDNA;选择提取的cfDNA用于库构建;用于衔接子连接库DNA质量;适当的库片段大小;适当的靶标捕获杂交比例;用于最佳靶向富集的杂交条件和用于加载到测序仪上的库的最终汇集是可能影响测序性能和测试结果的一些因素。
表18来自一次运行的数据,一个结果为阳性(第1号)
表19一次运行的数据,两个结果为阳性(第2号)
表20一次运行的数据,一个结果为阳性(第3号)
相关文献
1.Goya,Rodrigo,et al.″SNVMix:predicting single nucleotide variants fromnext-generation sequencing of tumors.″Bioinformatics26.6(2010):730-736.
2.John Besser,Heather A.Carleton,Peter Gerner-Smidt,Rebecca L.Lindsey,andEija Trees.“Next-Generation Sequencing Technologies and their Application tothe Study and Control of Bacterial Infections”,Clin Microbiol Infect.2018Apr;24(4):335-341.
3.Jiang,Peiyong,et al.″FetalQuant:deducing fractional fetal DNAconcentration from massively parallel sequencing of DNA in maternal plasma.″Bioinformatics 28.22(2012):2883-2890.
4.Hassold,Terry,and Patricia Hunt.″To err(meiotically)is human:thegenesis of human aneuploidy.″Nature Reviews Genetics 2.4(2001):280.
5.王惠英,刘菊凝,苏州市,2008-2013年围产儿死亡率变化趋势及影响因素分析
6.Sahlin,Ellika,et al.″Molecular and cytogenetic analysis in stillbirth:results from 481consecutive cases.″Fetal diagnosis and therapy36.4(2014):326-332.
7.Zhang,Xiao-Hui,et al.″Chromosomal abnormalities:subgroup analysis bymaternalage and perinatal features in Zhejiang province of China,2011-2015.″Italian journal of pediatrics 43.1(2017):47.
8.吕杰忠,莫晓珊,陈颖,杜涛,吴夏龙,...,1713例早期自然流产胚胎的染色体核型分析
9.Curnow,Kirsten J.,et al.″Clinical experience and follow-up with largescale single-nucleotide polymorphism-based noninvasive prenatal aneuploidytesting.″American Journal of Obstetrics&Gynecology 211.5(2014):527-e1。

Claims (35)

1.一种用于确定胎儿患有非整倍体的概率的方法,包括以下步骤:
a)从怀有所述胎儿的孕妇获得测试样品,所述样品包含游离胎儿DNA和游离母体DNA;
b)富集所述游离胎儿DNA和游离母体DNA中的多个靶序列,所述靶序列包含多个靶标双等位基因常染色体单核苷酸多态性(SNP);
c)扩增所述富集的靶序列,从而获得扩增的靶序列;
d)确定一些或所有所述扩增的靶序列的至少一部分的序列,其中所述部分包含至少一个靶标双等位基因常染色体SNP;以及
e)通过使用期望最大化算法模块、总概率模块和贝叶斯模块分析所述至少一个靶标双等位基因常染色体SNP的等位基因频率以确定胎儿患有非整倍体的概率。
2.根据权利要求1所述的方法,其中,步骤b)还包括扩增至少一些所述靶序列的步骤。
3.根据权利要求1所述的方法,其中,步骤b)还包括通过探针杂交捕获至少一些所述靶序列的步骤。
4.根据权利要求1至3中任一项所述的方法,其中,所述测试样品来源于孕妇的血液样品。
5.根据权利要求1至4中任一项所述的方法,其中,所述靶SNP是位于同一染色体上的SNP,其中,所述染色体的异常拷贝数导致所述非整倍体。
6.根据权利要求1至4中任一项所述的方法,其中,所述方法确定所述胎儿遭受的两种或更多种类型的非整倍体的概率,其中,所述两种或更多种类型的非整倍体的每一种由不同的染色体导致。
7.根据权利要求1至4中任一项所述的方法,其中,所述非整倍体选自由13三体、18三体和21三体组成的组。
8.根据权利要求1至7中任一项所述的方法,其中,步骤d)使用能够进行下一代测序的平台进行。
9.根据权利要求1至8中任一项所述的方法,其中,步骤e)包括步骤:
i、使用所述期望最大化算法模块确定整倍体和非整倍体的最大概率;
ii、使用所述总概率模块从多个条件概率确定整倍体和非整倍体的先验概率;以及
iii、使用所述贝叶斯模块将所述确定的整倍体和非整倍体的最大概率以及所述确定的整倍体和非整倍体的先验概率转化为所述胎儿的整倍体和非整倍体的后验概率。
10.根据权利要求9所述的方法,其中,所述条件概率包括基于胎儿的存活概率的非整倍体的条件概率和基于孕龄和妊娠周的胎儿存活条件概率,其中所述条件概率并非特定于所讨论的胎儿。
11.根据权利要求9所述的方法,其中,步骤i)的所述最大概率是基于给定SNP的参考等位基因和交互等位基因的等位基因计数、映射质量和碱基质量来确定的。
12.根据权利要求1至11中任一项所述的方法,还包括通过比较所述确定的非整倍体概率和产生预定灵敏度的截止值来确定胎儿是否有非整倍体的步骤。
13.一种用于确定胎儿患有非整倍体的概率的方法,包括以下步骤:
a)从怀有所述胎儿的孕妇获得血液样品;
b)从所述样品中提取游离胎儿DNA和游离母体DNA以形成测试样品;
c)确定所述测试样品中游离DNA(cfDNA)的浓度;
d)从所述测试样品制备包含多个靶序列的核酸库,所述靶序列包含多个靶标双等位基因常染色体单核苷酸多态性(SNP);
e)对所述库的至少一部分进行测序;以及
f)通过使用期望最大化算法模块、总概率模块和贝叶斯模块分析所述多个SNP中的等位基因频率以确定胎儿患有非整倍体的概率。
14.根据权利要求13所述的方法,其中,步骤d)包括从所述游离DNA富集所述靶序列的步骤。
15.根据权利要求14所述的方法,其中,所述从所述游离DNA富集所述靶序列的步骤包括扩增至少一部分所述靶序列的步骤。
16.根据权利要求14所述的方法,其中,所述从所述游离DNA富集所述靶序列的步骤包括通过探针杂交捕获至少一部分所述靶序列的步骤。
17.根据权利要求13所述的方法,其中,步骤d)包括以下步骤:
i、所述游离DNA的末端修复和A尾加工;
ii、使用衔接子连接从步骤(i)获得的所述游离胎儿DNA,从而获得连接的DNA序列;
iii、扩增所述连接的DNA序列;
iv、将来自步骤(iii)的DNA序列与包含对靶序列特异的序列的探针杂交,从而捕获包含所述靶序列的DNA序列;以及
v、扩增所述捕获的DNA序列,从而获得包含所述靶序列的多个DNA序列。
18.根据权利要求13所述的方法,其中,步骤d)包括以下步骤:
i、游离DNA的末端修复和A尾加工;
ii、使用衔接子连接从步骤(i)获得的所述游离DNA,从而获得连接的DNA序列;以及
iii、使用对所述靶序列特异的引物扩增所述连接的DNA序列,从而获得多个扩增子;以及
iv、扩增所述多个扩增子,从而获得包含所述靶序列的多个DNA序列。
19.根据权利要求13至18中任一项所述的方法,其中,所述靶SNP是位于同一染色体上的SNP,其中所述染色体的异常拷贝数导致所述非整倍体。
20.根据权利要求13至18中任一项所述的方法,其中,所述方法确定胎儿遭受的两种或更多种类型的非整倍体的概率,其中,所述两种或更多种类型的非整倍体的每一种由不同的染色体导致。
21.根据权利要求13至18中任一项所述的方法,其中,所述非整倍体选自由13三体、18三体和21三体组成的组。
22.根据权利要求13至21中任一项所述的方法,其中,步骤e)使用能够进行下一代测序的平台进行。
23.根据权利要求13至21中任一项所述的方法,其中,步骤f)还包括步骤:
i、使用所述期望最大化算法模块确定整倍体和非整倍体的最大概率;
ii、使用所述总概率模块从多个条件概率确定整倍体和非整倍体的先验概率;以及
iii、使用所述贝叶斯模块将所述确定的整倍体和非整倍体的最大概率以及所述确定的整倍体和非整倍体的先验概率转化为胎儿的非整倍体的后验概率。
24.根据权利要求23所述的方法,其中,所述条件概率包括基于胎儿的存活概率的非整倍体的条件概率和基于孕龄和妊娠周的胎儿存活条件概率,其中,所述条件概率并非特定于所讨论的胎儿。
25.根据权利要求23所述的方法,其中,步骤i)的所述最大概率是基于给定SNP的参考等位基因和交互等位基因的等位基因计数、映射质量和碱基质量来确定的。
26.根据权利要求13至25中任一项所述的方法,还包括通过比较所述确定的非整倍体概率和产生预定灵敏度的截止值来确定胎儿是否有非整倍体的步骤。
27.一种用于确定胎儿中非整倍体的概率的系统,所述确定基于来自怀有所述胎儿的孕妇的血液样品的遗传数据,其中,所述血液样品包含来自所述妇女和所述胎儿的核酸的混合物,所述系统包括:
i、用于从所述样品接收所述遗传数据的装置,其中,所述遗传数据包括关于多个靶标双等位基因常染色体单核苷酸多态性(SNP)的信息;
ii、期望最大化算法模块,用于确定整倍体和非整倍体的最大概率,从而产生似然比;
iii、总概率模块,用于从多个条件概率确定整倍体和非整倍体的先验概率;以及
iv、贝叶斯模块,用于将所述确定的似然比和所述确定的整倍体和非整倍体的先验概率转化为整倍体和非整倍体的后验概率,其中,所述后验概率产生胎儿中所述非整倍体的概率。
28.根据权利要求27所述的系统,其中,所述遗传数据包括给定SNP的参考等位基因和交互等位基因的等位基因计数、映射质量和碱基质量。
29.根据权利要求27所述的系统,其中,所述遗传数据来自包含靶SNP的DNA序列库。
30.根据权利要求27至29中任一项所述的系统,其中,所述遗传数据来源于从能够进行下一代测序的平台获得的数据。
31.根据权利要求27至30中任一项所述的系统,其中,所述条件概率包括基于胎儿的存活概率的非整倍体的条件概率和基于孕龄和妊娠周的胎儿存活条件概率,其中,所述条件概率并非特定于所讨论的胎儿。
32.根据权利要求27至30中任一项所述的系统,其中,所述靶SNP是位于同一染色体上的SNP,其中,所述染色体的异常拷贝数导致所述非整倍体。
33.根据权利要求27至30中任一项所述的系统,其中,所述SNP位于两条或更多条染色体上。
34.根据权利要求27至30中任一项所述的系统,其中,所述非整倍体选自由13三体、18三体和21三体组成的组。.
35.一种根据权利要求27至34中任一项所述的系统用于确定胎儿中非整倍体的概率的用途。
CN201910187460.2A 2018-11-29 2019-03-12 使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法 Pending CN109971846A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862772639P 2018-11-29 2018-11-29
US62/772,639 2018-11-29

Publications (1)

Publication Number Publication Date
CN109971846A true CN109971846A (zh) 2019-07-05

Family

ID=67078707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910187460.2A Pending CN109971846A (zh) 2018-11-29 2019-03-12 使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法

Country Status (2)

Country Link
US (1) US20190338362A1 (zh)
CN (1) CN109971846A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111883207A (zh) * 2020-07-31 2020-11-03 武汉蓝沙医学检验实验室有限公司 一种生物学亲缘关系的鉴定方法
CN111951890A (zh) * 2020-08-13 2020-11-17 北京博昊云天科技有限公司 染色体和单基因病同步产前筛查的方法、试剂盒和分析系统
CN113874523A (zh) * 2019-08-14 2021-12-31 深圳华大基因股份有限公司 确定孕妇血液中胎儿核酸浓度的方法及设备
WO2022134807A1 (zh) * 2020-12-21 2022-06-30 高嵩 一种利用多态性位点和靶位点测序检测胎儿遗传变异的方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018035062A1 (en) * 2016-08-16 2018-02-22 The Regents Of The University Of California Method for finding low abundance sequences by hybridization (flash)
CN111526793A (zh) 2017-10-27 2020-08-11 朱诺诊断学公司 用于超低体积液体活检的设备、系统和方法
CN111091868B (zh) * 2019-12-23 2020-09-25 江苏先声医学诊断有限公司 一种染色体非整倍体的分析方法及系统
CN114945685A (zh) * 2020-01-17 2022-08-26 深圳华大生命科学研究院 确定胎儿核酸浓度的方法以及胎儿基因分型方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103946394A (zh) * 2011-10-18 2014-07-23 姆提普力科姆公司 胎儿染色体非整倍性诊断
CN106460070A (zh) * 2014-04-21 2017-02-22 纳特拉公司 检测染色体片段中的突变和倍性

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103946394A (zh) * 2011-10-18 2014-07-23 姆提普力科姆公司 胎儿染色体非整倍性诊断
CN106460070A (zh) * 2014-04-21 2017-02-22 纳特拉公司 检测染色体片段中的突变和倍性

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
T. MCKANNA等: "Fetal fraction-based risk algorithm for non-invasive prenatal testing: screening for trisomies 13 and 18 and triploidy in women with low cell-free fetal DNA", 《ULTRASOUND IN OBSTETRICS & GYNECOLOGY》 *
XI Y等: "Noninvasive Prenatal Detection of Trisomy 21 by Targeted Semiconductor Sequencing: A Technical Feasibility Study", 《FETAL DIAGNOSIS AND THERAPY》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113874523A (zh) * 2019-08-14 2021-12-31 深圳华大基因股份有限公司 确定孕妇血液中胎儿核酸浓度的方法及设备
CN113874523B (zh) * 2019-08-14 2024-04-30 深圳华大基因股份有限公司 确定孕妇血液中胎儿核酸浓度的方法及设备
CN111883207A (zh) * 2020-07-31 2020-11-03 武汉蓝沙医学检验实验室有限公司 一种生物学亲缘关系的鉴定方法
CN111951890A (zh) * 2020-08-13 2020-11-17 北京博昊云天科技有限公司 染色体和单基因病同步产前筛查的方法、试剂盒和分析系统
WO2022033557A1 (en) * 2020-08-13 2022-02-17 Beijing Biobiggen Technology Co., Ltd. Method, kit and system for synchronous prenatal detection of chromosomal aneuploidy and monogenic disease
CN111951890B (zh) * 2020-08-13 2022-03-22 北京博昊云天科技有限公司 染色体和单基因病同步产前筛查的设备、试剂盒和分析系统
WO2022134807A1 (zh) * 2020-12-21 2022-06-30 高嵩 一种利用多态性位点和靶位点测序检测胎儿遗传变异的方法

Also Published As

Publication number Publication date
US20190338362A1 (en) 2019-11-07

Similar Documents

Publication Publication Date Title
CN109971846A (zh) 使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法
CN103608818B (zh) 非侵入性产前倍性识别装置
US9994902B2 (en) Methods and genotyping panels for detecting alleles, genomes, and transcriptomes
JP6830094B2 (ja) 染色体異常を検出するための核酸及び方法
JP6328934B2 (ja) 非侵襲性出生前親子鑑定法
CA2868836C (en) Rapid aneuploidy detection
CN103874767B (zh) 对核酸样本中预定区域进行基因分型的方法和系统
EP2895626B1 (en) Accurate genome sequencing of single cells by single-stranded amplification and sequencing
US9206417B2 (en) Multiplexed sequential ligation-based detection of genetic variants
CN110536967A (zh) 用于分析相联系核酸的试剂和方法
CN107849607A (zh) 血浆dna的单分子测序
CN108220403B (zh) 特定突变位点的检测方法、检测装置、存储介质及处理器
WO2017193044A1 (en) Noninvasive prenatal diagnostic
CN105209637B (zh) 非侵入性胎儿性别确定
CN108611408A (zh) 检测胎儿染色体非整倍性的方法和装置
WO2017145739A1 (ja) 染色体数定量方法
CN110741094A (zh) 一种用于校正扩增子测序中扩增偏差的方法
CN114875118B (zh) 确定细胞谱系的方法、试剂盒和装置
JPWO2017145738A1 (ja) 染色体数定量方法
CN107937571B (zh) 一种基于信息snp集及其引物的核酸质谱亲权鉴定方法
CN112955960A (zh) 确定从怀孕母体分离的循环胎儿细胞来自当前妊娠或过往妊娠的方法
US20240047008A1 (en) Method for detecting fetal genetic variations by sequencing polymorphic sites and target sites
US20220145368A1 (en) Methods for noninvasive prenatal testing of fetal abnormalities
CN107988343A (zh) 非侵入性产前倍性识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40011397

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190705