CN103384725A - 胎儿遗传变异的检测 - Google Patents

胎儿遗传变异的检测 Download PDF

Info

Publication number
CN103384725A
CN103384725A CN2011800682838A CN201180068283A CN103384725A CN 103384725 A CN103384725 A CN 103384725A CN 2011800682838 A CN2011800682838 A CN 2011800682838A CN 201180068283 A CN201180068283 A CN 201180068283A CN 103384725 A CN103384725 A CN 103384725A
Authority
CN
China
Prior art keywords
nucleic acid
sequence
nucleotide sequence
maternal
born
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800682838A
Other languages
English (en)
Inventor
H·希克森
C·R·坎特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sequenom Inc
Original Assignee
Sequenom Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sequenom Inc filed Critical Sequenom Inc
Publication of CN103384725A publication Critical patent/CN103384725A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本文提供了用于非侵入性检测遗传变异的胎儿诊断方法、试剂盒和计算机产品,其中使用母方核酸序列作为参照。

Description

胎儿遗传变异的检测
相关专利申请
本申请要求2010年12月23日提交的,题为FETAL ANEUPLOIDYDIAGNOSTICS(胎儿非整倍性诊断),发明人为Harry Hixson和Charles R.Cantor,代理人案卷号为SEQ-6030-PV的美国临时申请第61/427,054号的优先权。前述临时专利申请通过引用全文纳入本文。
领域
所述技术部分涉及鉴定基因变异的方法和组合物,其包括但不限于检测染色体非整倍性的产前测试(如21三体性(唐氏综合征)、18三体性(爱德华氏综合征)、13三体性(帕陶氏综合征))。
背景
活体生物的遗传信息(如动物、植物和微生物)和复制遗传信息的其他形式(如病毒)在脱氧核糖核酸(DNA)或核糖核酸(RNA)中编码。遗传信息是代表化学或假定核酸的初级结构的一连串核苷酸或修饰的核苷酸。人的完整基因组包含位于二十四(24)条染色体上的约30,000基因(见The Human Genome(人类基因组),T.Strachan,BIOS科学出版社,1992)。各基因编码特定蛋白质,所述蛋白质通过转录和翻译表达后在活细胞中实现特定的生物化学功能。
很多医学病症由一种或多种遗传变异造成。某些遗传变异造成医学病症,包括例如血友病、地中海贫血、杜兴型肌营养不良(DMD)、亨廷顿病(HD)、阿耳茨海默氏病和囊性纤维化(CF)(Human Genome Mutations(人基因组突变),D.N.Cooper和M.Krawczak,BIOS科学出版社,1993)。这种遗传疾病能来自特定基因DNA中单个核苷酸的加入、取代或缺失。某些出生缺陷由染色体异常(也称为非整倍性)造成,例如21三体性(唐氏综合征)、13三体性(帕陶氏综合征)、18三体性(爱德华氏综合征)、X单体性(特纳氏综合征)和某些性染色体非整倍性如克氏综合征(XXY)。一些遗传变异可以使个体倾向于或造成很多下面疾病中的任意一种:例如糖尿病、动脉硬化、肥胖、各种自身免疫疾病和癌症(如结直肠癌、乳腺癌、卵巢癌、肺癌)。
鉴定一种或多种遗传变异或变化能导致对特定医学病症的诊断或对特定医学病症患病趋势的测定。鉴定遗传变异能帮助医疗决策和/或使用辅助性的医疗方案。在一些示例中,鉴定一种或多种遗传变异或变化涉及分析无细胞DNA。无细胞DNA(CF-DNA)由来自细胞死亡和外周血循环的DNA片段组成。高浓度的CF-DNA能指示某些临床病症,例如癌症、创伤、烧伤、心肌梗塞、中风、败血症、感染和其他疾病。此外,无细胞胎儿DNA(CFF-DNA)能在母方血流中检测,并且用于多种非侵入性产前诊断。
母方血浆中存在的胎儿核酸可供通过分析母方血样来进行非侵入性产前诊断。例如,母方血浆中胎儿DNA的定量异常能与多种妊娠相关疾病关联,所述妊娠相关疾病包括先兆子痫,未足月产,产前出血,侵入性胎盘形成,胎儿唐氏综合征和其它胎儿染色体非整倍性。因此,母方血浆中的胎儿核酸分析是监控母婴健康的有用机制。
包括孕期并发症和胎儿遗传缺陷在内的妊娠相关病症的早期检测是重要的,因为这允许就母婴安全而言所必需的早期医疗介入。传统上已经使用通过例如绒膜绒毛取样(CVS)或羊膜穿刺术的方法从胎儿分离的细胞来进行产前诊断。但是,这些常规方法是侵入性的,并对母婴都具有明显的风险。国家卫生系统(National Health Service)目前引用的侵入性羊膜穿刺术和绒膜绒毛取样(CVS)测试后的流产率为1-2%。这些侵入性方法的替代方法是使用分析循环CFF-DNA的非侵入性筛选技术。
发明内容
在一些实施方式中提供了检测妊娠妇女的胎儿中是否存在染色体非整倍性的方法,所述方法包括:(a)测定与妊娠妇女胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;(b)测定与基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;(c)将(b)的核苷酸序列组装成母方参照序列;(d)将(a)的核苷酸序列与所述母方参照序列的部分或全部进行比对,并且计算能定位到母方参照序列的部分上的(a)的核苷酸序列的数目;和(e)根据定位到母方参照序列的部分上的(a)的核苷酸序列的数目,检测所述妊娠妇女的胎儿中是否存在染色体非整倍性。在一些实施方式中还提供了检测妊娠妇女的胎儿中是否存在染色体非整倍性的方法,所述方法包括:(a)测定与妊娠妇女胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;(b)测定与基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;(c)将(b)的核苷酸序列组装成母方参照序列;(d)将(a)的核苷酸序列与所述母方参照序列的部分或全部进行比对,并且计算能定位到母方参照序列的部分上的(a)的核苷酸序列的数目;和(e)由定位到母方参照序列的部分上的(a)的核苷酸序列的数目,提供测定是否存在染色体非整倍性的结果。在某些实施方式中,在母方参照序列的部分或全部上定位并被计数的(a)的核苷酸序列由以下成分组成:(i)母方核苷酸序列,(ii)遗传自该妊娠妇女的胎儿核苷酸序列,和(iii)遗传自双亲之一但不能分辨来自哪一方的胎儿核苷酸序列。
在一些实施方式中,方法能包括对特定靶标染色体而言,将能定位到母方参照序列的部分或全部上的(a)的核苷酸序列数目与染色体整倍性的预定值作比较。在某些实施方式中,所述母方参照序列的部分在特定靶标染色体上或在基因组核酸的其他部分上。所述母方参照序列部分有时是一个或多个箱(bin),并且有时箱的长度是约30K碱基对-约100K碱基对。在一些实施方式中,所述靶标染色体是染色体21、染色体18、染色体13、染色体X和/或染色体Y。
在某些实施方式中,胞外核酸或无细胞核酸来自血液,并且有时来自血浆或血清。在一些实施方式中,所述胞外核酸或无细胞核酸来自妊娠头三个月内的妊娠妇女。胞外核酸或无细胞核酸有时包含约1%-约40%胎儿核酸,有时包含约15%或更多胎儿核酸。所述胞外核酸中胎儿核酸的拷贝数目有时是总体胞外核酸的约10个拷贝-约个2000拷贝。在一些实施方式中,方法包括测定所述胞外核酸或无细胞核酸中的胎儿核酸浓度,并且有时方法包括在所述胞外核酸或无细胞核酸中富集胎儿核酸。
在一些实施方式中,所述胞外核酸、所述基本不含胎儿核酸的妊娠妇女核酸或所述胞外核酸和所述基本不含胎儿核酸的妊娠妇女核酸在测定(a)、(b)或(a)和(b)中的核苷酸序列前,没有片段化(fragmented)、没有大小分级(size fractionated),或者没有片段化且没有大小分级。在某些实施方式中,所述胞外核酸、所述基本不含胎儿核酸的妊娠妇女核酸或所述胞外核酸和所述基本不含胎儿核酸的妊娠妇女核酸在测定(a)、(b)或(a)和(b)中的核苷酸序列前,被片段化,被大小分级,或者被片段化且被大小分级。
在一些实施方式中,所述基本不含胎儿核酸的妊娠妇女核酸是来自妊娠妇女的细胞核酸。所述细胞核酸有时来自口颊拭子或皮肤样品,并且能获自任何其他合适的来源和方法。在一些实施方式中,方法包括使所述基本不含胎儿核酸的妊娠妇女核酸片段化,大小分级,或者片段化且大小分级。在某些实施方式中,方法包括所述基本不含胎儿核酸的妊娠妇女核酸没有片段化、没有大小分级,或者没有片段化和没有大小分级。
在一些实施方式中,与所述基本不含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列是所述妊娠妇女基因组核酸的全部或部分。在某些实施方式中,与所述基本不含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列覆盖(cover)所述妊娠妇女基因组核酸的约0.1倍-约20倍(如约0.2倍、0.3倍、0.4倍、0.5倍、0.6倍、0.7倍、0.8倍、0.9倍、1倍、2倍、4倍、6倍、8倍、10倍、12倍、14倍、16倍、18倍)。在一些实施方式中,所述(a)、(b)或(a)和(b)中的核苷酸序列通过大规模平行测序方法测定。
在某些实施方式中,所述母方参照序列通过将(b)的核苷酸序列与外部参照序列进行比对来组装。用来组装的所述外部参照序列有时选自具有约6倍-约60倍覆盖率(如约10倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、55倍)的核苷酸序列。在一些实施方式中,所述外部参照序列来自与所述妊娠妇女基本同一种族的一个或多个对象。所述母方参照序列有时与所述外部参照序列不完全进行比对。在一些实施方式中,所述母方参照序列与所述外部参照序列基本完全比对。
在一些实施方式中,方法包括将(b)的核苷酸序列与所述母方参照序列的部分进行比对,并且计数定位到母方参照序列的部分上的(b)的核苷酸序列。在某些实施方式中,计数在母方参照序列的部分上基本精确定位的(b)的核苷酸序列。在一些实施方式中,计数在母方参照序列的部分上基本精确定位的(a)的核苷酸序列。
在某些实施方式中,方法包括将一个或多个染色体位置上、能定位到所述母方参照序列上的(a)的核苷酸序列的数目与一个或多个不同染色体位置上、能定位到所述母方参照序列上的(a)的核苷酸序列的数目作比较。在一些实施方式中,方法包括将一个或多个染色体位置上、能定位到所述母方参照序列上的(b)的核苷酸序列的数目与一个或多个不同染色体位置上、能定位到所述母方参照序列上的(b)的核苷酸序列的数目作比较。在一些方法中,测定了(i)能定位到所述母方参照序列的部分上的(a)中的核苷酸序列的计数,和(ii)能定位到所述母方参照序列的部分上的(b)中的核苷酸序列的计数之间是否存在差异。在某些实施方式中,根据测定是否存在统计学显著差异来检测所述染色体非整倍性的存在。在一些实施方式中,方法包括就一个或多个不同染色体位置上进行所述差异比较。
在某些实施方式中,确定是否存在所述染色体非整倍性的置信水平为约95%或更高。有时确定是否存在所述染色体非整倍性的特异性为约95%或更高。在一些实施方式中,确定是否存在所述染色体非整倍性的灵敏度为约95%或更高。
在一些实施方式中,所述(a)、(b)或(a)和(b)的核苷酸序列包含单末端读数。所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度有时是约20个连续核苷酸-约50个连续核苷酸,有时是约30个连续核苷酸-约40个连续核苷酸,以及有时是约35个连续核苷酸或约36个连续核苷酸。
在某些实施方式中,所述(a)、(b)、或(a)和(b)的核苷酸序列包含双末端读数。所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度有时是约10个连续核苷酸-约25个连续核苷酸,有时是约15个连续核苷酸-约20个连续核苷酸,以及有时是约17个连续核苷酸或约18个连续核苷酸。
若合适,在一些实施方式中,本文提供的方法包括指示不能确定是否存在非整倍性。
在一些实施方式中,方法包括从妊娠妇女样品分离核酸。有时所述经分离的核酸是样品的胞外核酸或无细胞核酸,并且有时所述样品是血浆、血清、尿等。有时所述经分离的核酸是样品的细胞核酸,并且所述样品是来自妊娠妇女的合适的细胞样品,例如血液细胞。在某些实施方式中,方法包括从所述妊娠妇女分离样品。
在一些实施方式中提供了检测妊娠妇女的胎儿中是否存在遗传变异的方法,所述方法包括:(a)测定与妊娠妇女胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;(b)测定与基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;(c)将(b)的核苷酸序列组装成母方参照序列;(d)将(a)的核苷酸序列与所述母方参照序列的部分或全部进行比对,并且计算能定位到母方参照序列的部分上的(a)的核苷酸序列的数目;和(e)根据定位到母方参照序列的部分上的(a)的核苷酸序列的数目,检测所述妊娠妇女的胎儿中是否存在遗传变异。在一些实施方式中还提供了检测妊娠妇女的胎儿中是否存在遗传变异的方法,所述方法包括:(a)测定与妊娠妇女胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;(b)测定与基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;(c)将(b)的核苷酸序列组装成母方参照序列;(d)将(a)的核苷酸序列与所述母方参照序列的全部或部分进行比对,并且计算能定位到母方参照序列的部分上的(a)的核苷酸序列的数目;和(e)由(a)中定位到母方参照序列的部分上的核苷酸序列的数目,提供决定是否存在遗传变异的结果。
在某些实施方式中提供了计算机程序产品,所述产品包括其内含有计算机可读程序编码的计算机可读介质,所述计算机可读程序编码经执行以实施鉴定妊娠妇女的胎儿中是否存在染色体非整倍性的方法,所述方法包括:提供包含不同软件模块的系统,所述软件模块包括检测模块、逻辑处理模块和数据显示组织模块;通过检测模块收集(a)与所述妊娠妇女胞外核酸对应的核苷酸序列(所述胞外核酸包含无细胞胎儿核酸)和(b)与基本不含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;通过逻辑处理模块接收所述核苷酸序列;通过逻辑处理模块将(a)的核苷酸序列与母方参照序列的部分进行比对,并且计算能定位到所述母方参照序列的部分上的(a)的核苷酸序列的数目,从而测定大量计数;通过逻辑处理模块根据所述计数的数目判定(call)胎儿中是否存在染色体非整倍性;通过数据显示组织模型响应逻辑处理模块的判定(call)来组织数据显示以表明是否存在染色体非整倍性。
在一些实施方式中还提供了计算机程序产品,所述产品包括其中含有计算机可读程序编码的计算机可读介质,所述计算机可读程序编码经执行以实施鉴定妊娠妇女胎儿中是否存在染色体非整倍性的方法,所述方法包括:提供包含不同软件模块的系统,所述软件模块包括数据处理模块、逻辑处理模块和数据显示组织模块;通过数据处理模块将配置文件解析成定义数据,所述配置文件包括(a)与所述妊娠妇女胞外核酸对应的核苷酸序列(所述胞外核酸包含无细胞胎儿核酸)和(b)与基本不含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;通过逻辑处理模块接收所述定义数据;通过逻辑处理模块将(a)的核苷酸序列与母方参照序列的部分进行比对,并且计算能定位到所述母方参照序列的部分上的(a)的核苷酸序列的数目,从而测定大量计数;通过逻辑处理模块根据所述计数的数目判定(call)是否存在染色体非整倍性;用数据显示组织模型响应逻辑处理模块的判定(call)来组织数据显示以表明所述妊娠妇女的胎儿中是否存在染色体非整倍性。
在一些实施方式中,计算机程序产品包括通过逻辑处理模块将来自(b)的核苷酸序列组装成母方参照序列。在某些实施方式中还提供了包含存储本文所述的计算机程序产品的存储器的设备。在某些实施方式中,所述设备包含执行本文所述计算机程序产品的一种或多种功能的处理器。
在某些实施方式中提供了包含一种或多种成分的试剂盒,所述试剂盒用于(a)测定与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;和(b)测定与基本不含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列。在一些实施方式中,试剂盒包含用于处理所述妊娠妇女的核酸样品的一种或多种成分,并且有时试剂盒包含说明书或获取说明书的信息,所述说明书用于指导本文所述的方法。
在以下说明书、权利要求和附图中进一步描述某些实施方式。
具体实施方式
本文提供了用于鉴定是否存在一种或多种胎儿遗传变异(如一种或多种染色体异常)的改进的方法和试剂盒。这些方法和试剂盒有下列优点:(i)由于非侵入性而降低妊娠并发症的风险;(ii)提供快速结果;和(iii)提供具有相对高的如置信度、特异性和灵敏度中一种或多种的结果。本文所述方法和试剂盒能用于鉴定是否存在各种染色体异常,例如21三体性、18三体性和/或13三体性,以及和与特种癌症相关联的非整倍体状态。另外,这种方法和试剂盒用于以下应用,包括但不限于非侵入性产前筛查和诊断、癌症检测、拷贝数目变化检测以及作为与细胞复制(如干细胞)有关的分子生物学方法的质量控制工具。
遗传变异和医学病症
是否存在遗传变异能使用本文所述方法、试剂盒或设备确定。在某些实施方式中,根据本文所述方法、试剂盒和设备提供的结果确定是否存在一种或多种遗传变异。遗传变异通常是某些个体中存在的特定遗传表型,并且遗传变异经常是在统计学显著的个体亚群中存在。遗传变异的非限定性示例包括一种或多种缺失(如微缺失)、复制(duplication)(如微复制(micro-duplication))、插入、突变、多态性(如单核苷酸多态性)、融合、重复(repeat))(如短串联重复)、不同甲基化位点、不同甲基化模式等,及其组合。插入、重复(repeat)、缺失、复制(duplication)、突变或多态性可以是观察到的任意长度,并且在一些实施方式中是长度约1个碱基或碱基对(bp)-1,000个千碱基(kb)(如长度约为10bp、50bp、100bp、500bp、1kb、5kb、10kb、50kb、100kb、500kb或1000kb)。在一些实施方式中,遗传变异是下文详述的染色体异常(如非整倍性)、部分染色体异常或镶嵌性。
在某些实施方式中,鉴定对象是否存在遗传变异与医学病症相关联。因此,本文所述技术能用于鉴定是否存在与医学病症或医学状态相关联的一种或多种遗传变异。医学病症的非限定性示例包括与智力残疾(如唐氏综合征)、异常细胞增殖(如癌症)、存在微生物(如病毒、细菌、真菌、酵母)核酸和先兆子痫相关联的那些。
下文描述了遗传变异、医学病症和状态的非限定性示例。
胎儿性别
在一些实施方式中,胎儿性别的预测能通过本文所述方法、试剂盒或设备确定。性别决定通常基于性染色体。人有两种性染色体,X和Y染色体。有XX的个体是女性,有XY的个体是男性,而非限定性变异包括XO、XYY、XXX和XXY。
染色体异常
在一些实施方式中,胎儿染色体异常可以使用本文所述方法、试剂盒或设备确定。染色体异常包括但不限于整个染色体或者包含一个或多个基因的染色体区域的获得或丢失。染色体异常包含单体性、三体性、多体性、杂合性的丢失、一个或多个核苷酸序列(如一个或多个基因)的缺失和/或复制,包括非平衡易位造成的缺失和复制。本文所用术语"非整倍性"和"非整倍的"指生物细胞中染色体数目异常。由于不同生物有广泛不同的染色体套数(complement),所述术语"非整倍性"并非指特定数目的染色体,而是指给定细胞或生物体细胞中染色体含量异常的情况。
本文所用术语"单体性"指正常套数(complement)缺乏一条染色体。部分单体性可在非平衡易位或缺失中发生,其中仅有一部分染色体以单个拷贝存在。例如性染色体(45,X)的单体性造成特纳氏综合征。
术语"二体性"指存在染色体的两个拷贝。就各染色体有两个拷贝的生物体(二倍体或"整倍体"的那些)(例如人)而言,二体性是正常情况。就各染色体通常有三个或更多个拷贝的生物体(三倍体或更多倍体的那些)而言,二体性是非整倍染色体状态。在单亲源二体性中,染色体的两个拷贝来自同一亲本(另一个亲本没有贡献)。
本文所用术语"三体性"指存在特定染色体的三个拷贝,而不是两个拷贝。人唐氏综合征中发现额外一条染色体21的存在,称为"21三体性"。18三体性和13三体性是其它两种人常染色体三体性。性染色体的三体性可出现在女性中(如47,XXX)或男性中(如克氏综合征中的47,XXY;或47,XYY)。
本文使用"四体性"和"五体性"指分别存在染色体的四个或五个拷贝。尽管对常染色体罕见,但已报道了人性染色体的四体性和五体性,包括XXXX、XXXY、XXYY、XYYY、XXXXX、XXXXY、XXXYY、XXYYY和XYYYY。
染色体异常能由多种机制产生。机制包括但不限于(i)有丝分裂检查点弱化导致的不分离,(ii)有丝分裂检查点失活造成多个染色体处的不分离,(iii)当一个着丝粒连接两个有丝分裂纺锤体极时发生单极向型(merotelic)连接,(iv)当形成多于两个纺锤体极时形成多极性纺锤体,(v)当形成仅一个纺锤体极时形成单极性纺锤体,和(vi)单极性纺锤体机制最终导致出现四倍体中间型。
本文所用术语"部分单体性"和"部分三体性"指部分染色体的获得或丢失造成遗传物质的不平衡。非平衡易位可导致部分单体性或部分三体性,此时个体载有通过两条不同染色体的破裂和融合形成的衍生染色体。在这种情况下,所述个体可以有一条染色体部分的三个拷贝(两个正常拷贝和所述衍生染色体上存在的部分),和所述衍生染色体中所带的其它染色体部分的仅仅一个拷贝。
本文所用术语"镶嵌性"指生物体的一些细胞但不是全部细胞中的非整倍性。某些染色体异常能以镶嵌性(mosaic)和非镶嵌性(non-mosaic)染色体异常形式存在。例如,某些21三体性个体有镶嵌性(mosaic)唐氏综合征而一些有非镶嵌性(non-mosaic)唐氏综合征。不同机制能造成镶嵌性。例如(i)起始受精卵可以有三条21号染色体,正常情况下会导致简单的21三体性,但是在细胞分裂中一个或多个细胞系丢失了所述21号染色体中的一条;和(ii)起始受精卵可以有两条21号染色体,但是在细胞分裂中所述21号染色体中的一条复制。体细胞镶嵌性似乎通过不同于通常与涉及完全或镶嵌性非整倍性的遗传症状相关联的那些的机制发生。例如已在某些类型的癌症和神经元中鉴定了体细胞镶嵌性。在某些示例中,在慢性淋巴细胞性白血病(CLL)中鉴定了12三体性,而在急性骨髓性白血病(AML)中鉴定了8三体性。同样,有染色体破裂倾向(染色体不稳定性综合征)的个体的遗传症状常与多种类型癌症的风险增加相关联,从而突出了癌发生中体细胞非整倍性的作用。本文所述方法和方案能鉴定是否存在非镶嵌性和镶嵌性染色体异常。
表1A和1B为可通过本文所述的方法、试剂盒和设备可能鉴定的染色体病症、综合征和/或异常的非限定性列表。表1B来自2011年10月6日的DECIPHER数据库(如版本5.1,根据定位到GRCh37的位置;统一资源定位符(URL)dechipher.sanger.ac.uk上可用)。
表1A
Figure BDA00003704631800091
Figure BDA00003704631800101
Figure BDA00003704631800111
表1B
Figure BDA00003704631800112
Figure BDA00003704631800121
级别1病症常具有以下特点中的一种或多种:致病性异常;遗传学家之间的一致认同;高度外显;仍然可以有可变的表型,但有一些共同特性;文献中的所有示例有临床表型;没有含所述异常的健康个体示例;在DVG数据库上没有报导或健康人群中没有发现;证明单个基因或多个基因剂量效应的函数型数据;经证明的候选基因或强候选基因;明确的临床管理意义;监测意义伴随的已知的癌症风险;多个信息来源(OMIM、Genereviews、Orphanet、Unique、Wikipedia);和/或可以用于诊断应用(生殖咨询(counseling))。
级别2病症常具有以下特点中的一种或多种:可能的致病性异常;高度外显;除了DD以外没有持续特性的可变表型;文献中少量示例/报导;所有报导的示例都有临床表型;没有函数型数据或经证明的病原基因;多个信息来源(OMIM、Genereviews、Orphanet、Unique、Wikipedia);和/或可以用于诊断目的和生殖咨询。
级别3病症常具有以下特点中的一种或多种:易感位点;健康个体或所述先证者的未受影响的父母;在对照人群中存在;非显性;表型温和且无特异性;特征较不一致;无函数型数据或经证明的病原基因;更有限的数据来源;针对偏离大部分或有新临床发现设想提出的情况仍可能有二次诊断的可能性;和/或用于诊断目的时需谨慎且就生殖咨询给出有保留的建议。
先兆子痫
在一些实施方式中,使用本文所述的方法、试剂盒或设备确定是否存在先兆子痫。先兆子痫是妊娠中出现高血压(即妊娠诱导的高血压)且与尿中高蛋白含量相关联的病症。在一些示例中,先兆子痫也与胞外核酸的水平增加和/或甲基化模式的变化相关联。例如,已经观察到了胞外胎儿源性高甲基化RASSF1A水平和先兆子痫的严重性正相关。在某些实施例中,对比正常对照,在先兆子痫胎盘中观察到了H19基因DNA甲基化的增加。
先兆子痫是世界范围内母方和胎儿/新生儿死亡率和发病率的主要原因之一。血浆和血清中的循环无细胞核酸是在包括产前诊断在内的不同医学领域中具有临床应用前景的新型生物标记物。不同研究中已报道了将母方血浆中无细胞胎儿(cff)DNA的量变作为即将发生先兆子痫的指示物,例如针对男性特异性SRY或DYS 14位点使用实时定量PCR。在早发型先兆子痫的示例中,在头三个月内可以观察到水平提高。症状发作前cffDNA水平的增加可归因为导致组织氧化应激和胎盘凋亡及坏死增加的绒毛间空隙中的缺氧/复氧。除有证据证明先兆子痫中排入母方循环的cffDNA增多以外,也有证据证明在先兆子痫中cffDNA的肾清除率降低。由于当前通过定量Y-染色体特异性序列确定胎儿DNA的量,替代性方法例如测量总无细胞DNA或使用性别无关的胎儿表观遗传学标记物(如DNA甲基化)提供了其它选择。胎盘来源的无细胞RNA是可以在临床实践中用于筛选和诊断先兆子痫的另一个备选标记。胎儿RNA与保护其免于降解的亚细胞胎盘颗粒相关联。有先兆子痫的妊娠妇女中的胎儿RNA水平有时相较于对照高出10倍,因此所述胎儿RNA水平是可以在临床实践中用于筛选和诊断先兆子痫的备选标记物。
病原体
在一些实施方式中,通过本文所述的方法、试剂盒或设备确定是否存在病原性病症。病原性病症能通过病原体(包括但不限于细菌、病毒或真菌)感染宿主而产生。由于病原体通常具有能与宿主核酸区分开的核酸(如基因组DNA、基因组RNA、mRNA),本文提供的方法、试剂盒和设备能用于确定是否存在病原体。通常,病原体具有特定病原体独有特性的核酸,例如表观遗传状态和/或一种或多种序列变异、复制和/或缺失。因此,本文提供的方法可以用于鉴定特定的病原体或病原体变体(如株)。
癌症
在一些实施方式中,能使用本文所述方法、试剂盒或设备确定是否存在细胞增殖疾病(如癌症)。例如,相较健康个体,多种癌症患者血清中无细胞核酸的水平提高。例如,患有转移性疾病的患者的血清DNA水平有时能比无转移患者高出大约两倍。患有转移性疾病的患者还可以通过例如癌症特异性标志物和/或某些单核苷酸多态性或短串联重复来鉴定。可以与循环DNA水平提高正相关的癌症类型的非限定性示例包括乳腺癌、结直肠癌、胃肠癌、肝细胞癌、肺癌、黑素瘤、非霍奇金淋巴瘤、白血病、多发性骨髓瘤、膀胱癌、肝细胞瘤、宫颈癌、食道癌、胰腺癌和前列腺癌。多种癌症能具有与非癌健康细胞核酸特性(例如表观遗传状态和/或序列变异、复制和/或缺失)不同的核酸,并且有时释放其进入血液。例如此类特性能对特定类型的癌症特异。因此,还考虑本文所述方法能用于鉴定特定类型的癌症。
其它遗传变异
在一些实施方式中,能使用本文所述的方法、试剂盒或设备确定是否存在遗传变异。本文所用的术语“遗传变异”指选自下面的一种或多种情况:拷贝数变异(CNV)、微缺失、复制,或者引起或造成相较于在未受影响个体中观察到的预期遗传剂量的遗传剂量变化的任何情况。本文所用的术语“拷贝数变异”指一种或多种基因组部分、染色体或染色体部分的结构重排,所述重排通常由缺失、复制、插入和/或易位造成。CNV可经遗传或由全新突变引起,并且通常导致一个或多个基因组部分的拷贝数异常(例如相对于未受影响样品而言的异常基因剂量)。在一些实施方式中,拷贝数变异发生的范围是小至1千碱基到数兆碱基。CNV能使用多种细胞遗传学方法(FISH、CGH、aCGH、核型分析)和/或测序方法来检测。
本文所用的术语“微缺失”指相对于未受影响区域而言,定位在所选基因组部分或片段中的遗传物质(如特定区域的代表性DNA、基因、核酸)的剂量降低。微缺失和微缺失引起的病征经常表征为跨越一个或多个基因的一个或多个染色体片段的小的缺失(如通常小于5兆碱基),所述缺失经常产生疾病病症。微缺失有时由有丝分裂过程中染色体交换错误所致。在很多示例中,当前使用的核型分析方法不能检测到微缺失。
本文所用的术语“染色体复制(duplication)”、“微复制”或“复制”指相较于未受影响区域,遗传物质(如特定区域的代表性DNA、基因、核酸)剂量增加的一个或多个区域。复制经常由于同源重组的错误或由于逆转座子事件造成。在一些示例中,复制的范围可以是小区域(数千碱基对)到全部染色体。复制能与某些类型的增殖疾病相关联。复制能使用基因组微阵列或比较基因组杂交(CGH)来表征。有时复制表征为重复一次或多次(如重复1、2、3、4、5、6、7、8、9或10次)的遗传区域。
样品
本文所述方法、试剂盒和设备中使用的核酸经常从获自对象的样品中分离。在一些实施方式中,对象指测试对象,而在某些实施方式中,对象指样品对象或参照对象。本文所用的术语“测试对象”指用于评价是否存在遗传变异的对象。本文所用的术语“样品对象”和“参照对象”指用作测试对象比较基础的对象,并且参照对象有时根据已知所述参照对象没有或具有待评价测试对象的遗传变异来选择。对象可以是任何活体或非活体生物,包括但不限于人、非人动物、植物、细菌、真菌或原生生物。能选择任何人或非人动物,包括但不限于哺乳动物、爬行动物、鸟类、两栖类、鱼类、有蹄类动物、反刍动物、牛科动物(如牛)、马科动物(如马)、山羊和绵羊类动物(如绵羊、山羊)、猪科动物(如猪)、羊驼类动物(如骆驼、美洲驼、羊驼)、猴子、猿(如大猩猩、黑猩猩)、熊科动物(如熊)、家禽、犬、猫、小鼠、大鼠、鱼、海豚、鲸鱼和鲨鱼。对象可以是男性或女性(如妇女)。
核酸可以从任何类型的合适生物试样或样品中分离。试样的非限定性示例包括对象的液体或组织,包括但不限于脐带血、绒毛、羊水、脑脊液、脊液、灌洗液(如支气管肺泡、胃、腹膜、导管、耳、关节)、活检样品(如来自移植前胚胎)、膜间液样品、胎儿有核细胞或胎儿细胞残余物、女性生殖道清洗物、尿、粪、痰液、唾液、鼻粘膜、前列腺液、灌洗液、精液、淋巴液、胆汁、泪液、汗液、母乳、乳腺体液、胚胎细胞和胎儿细胞(如胎盘细胞)。在一些实施方式中,生物样品可以是血液,而有时是血浆或血清。例如,本文所用的术语“血液”涵盖全血或血液的任何部分,例如常规定义的血清和血浆。血液血浆指经抗凝剂处理的血液离心所得全血的部分。血液血清指血液样品凝结后余留的水样部分。通常按照医院或临床常规遵循的标准方法采集液体或组织样品。就血液而言,通常采集适当量的外周血(例如3-40毫升),并且在进一步制备前可按标准流程保存。提取核酸所用的液体或组织样品可以是无细胞的。在一些实施方式中,液体或组织样品可含有细胞要素或细胞残余物。在一些实施方式中,所述样品中可包含胎儿细胞或癌细胞。
样品可以是异质性的,即所述样品中存在多于一种类型的核酸种类。例如,异质性核酸包括但不限于(i)胎儿源性和母方源性的核酸、(ii)癌症和非癌症核酸、(iii)病原体和宿主核酸、和更常见的(iv)突变的和野生型核酸。样品可以是异质性的原因是,存在多于一种细胞类型,例如胎儿细胞和母方细胞,癌细胞和非癌细胞,或者病原体和宿主细胞。在一些实施方式中,存在次要核酸种类和主要核酸种类。
就本文所述技术的产前应用而言,流体或组织样品可采自孕龄适于测试的女性或经测试可能有孕的女性。适当孕龄可能视所进行的产前测试而不同。在某些实施方式中,妊娠女性对象有时在孕期头三个月,有时在孕期中三个月或有时在孕期末三个月。在某些实施方式中,液体或组织采自胎儿妊娠约1-约45周(如胎儿妊娠1-4、4-8、8-12、12-16、16-20、20-24、24-28、28-32、32-36、36-40或40-44周)和有时胎儿妊娠约5-约28周(如胎儿妊娠6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26或27周)的妊娠妇女。
核酸分离和加工
可用本领域已知方法从一种或多种样品来源(如细胞、土壤等)中获取核酸。细胞裂解方法和试剂是本领域已知的,且一般可通过化学、物理或电解的裂解方法进行。例如,化学方法一般采用裂解剂来破坏细胞并从细胞中提取核酸,随后用离液盐处理。也可利用物理方法如冻/融后进行研磨、使用细胞压碎器等。高盐裂解法也是常用的。例如,可采用碱裂解法。所述后一种方法传统上包括使用苯酚-氯仿溶液,或可采用替代的包括三种溶液的无苯酚-氯仿方法。在后一种方法中,一种溶液可包含15mMTris,pH8.0;10mM EDTA和100ug/ml RNA酶A;第二溶液可包含0.2N NaOH和1% SDS;以及第三溶液可包含3M KOAc,pH5.5。这些方法可参见纽约约翰韦利森公司(John Wiley&Sons,Inc.,New York)的《新编分子生物学实验指南》(CurrentProtocols in Molecular Biology)的6.3.1-6.3.6(1989),其全文纳入本文。
术语“核酸”和“核酸分子”互换使用。该术语指任意组合物形式的核酸,例如:脱氧核糖核酸(DNA,例如,互补DNA(cDNA),基因组DNA(gDNA)等)、核糖核酸(RNA,例如,信使RNA(mRNA)、短抑制RNA(siRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA、胎儿或胎盘高度表达的RNA等)和/或DNA或RNA类似物(例如,含碱基类似物、糖类似物和/或非天然主链等)、RNA/DNA杂交体和聚酰胺核酸(PNA),所有这些可以是单链或双链形式。且除非另有限定,核酸可涵盖天然核苷酸的已知类似物,所述类似物中的一些能以与天然产生的核苷酸相似方式起作用。核酸可以是可用于进行本文所述方法的任何形式(例如线性、环状、超螺旋、单链、双链等)。在某些实施方式中,核酸可以是或者可来自质粒、噬菌体、自主复制序列(ARS)、着丝粒、人工染色体、染色体或能够在体外或者在宿主细胞、细胞、细胞的细胞核或细胞质中复制或被复制的其它核酸。在一些实施方式中,核酸可来自单条染色体(例如核酸样品可来自二倍体生物所得样品的一条染色体)。核酸也可包括从单链("有义"或"反义","正"链或"负"链,"正向"阅读框或"反向"阅读框)和双链多核苷酸合成、复制或扩增的RNA或DNA衍生物、变体和类似物。脱氧核糖核苷酸通常包括脱氧腺苷、脱氧胞苷、脱氧鸟苷和脱氧胸苷。对RNA而言,所述碱基胞嘧啶用尿嘧啶取代,并且糖2’位包含羟基部分。核酸可采用获自对象的核酸作为模板制备。
核酸还可以在与另一核酸不同的时间点分离得到,其中各样品来自相同或不同来源。核酸可来自核酸库,例如cDNA或RNA库。核酸可以是样品中核酸分子的核酸纯化或分离和/或扩增的产物。为本文所述方法提供的核酸可包含来自一个样品或来自两个或更多个样品(例如来自1个或更多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、11个或更多个、12个或更多个、13个或更多个、14个或更多个、15个或更多个、16个或更多个、17个或更多个、18个或更多个、19个或更多个、20个或更多个的样品)的核酸。
在某些实施方式中,核酸能包含胞外核酸。本文所用的术语"胞外核酸"指从基本没有细胞的来源中分离的核酸,并且胞外核酸经常是基本无细胞的核酸。胞外核酸经常包含检测不到的细胞,并且可以包含细胞要素或细胞残余物。胞外核酸无细胞来源的非限定性示例是血浆、血清和尿。不受理论限制,胞外核酸可以是细胞凋亡和细胞破裂的产物,这使胞外核酸常具有大范围内的系列长度(例如"梯状带(ladder)")。
在某些实施方式中,胞外核酸能包含不同核酸种类,因而在本文中称作"异质性(heterogeneous)"。例如,患有癌症的人的血液血清或血浆可包含来自癌细胞的核酸与来自非癌细胞的核酸。在另一实施例中,妊娠妇女的血液血清或血浆可包括母方核酸和胎儿核酸。在一些示例中,胎儿核酸有时占全部核酸的约5%-约50%(例如,总体核酸中约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48或49%是胎儿核酸)。在一些实施方式中,胎儿核酸中大多数的长度是约500个碱基对或更短(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的胎儿核酸长度是约500个碱基对或更短)。在一些实施方式中,胎儿核酸中大多数的长度是约250个碱基对或更短(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的胎儿核酸长度是约250个碱基对或更短)。在一些实施方式中,胎儿核酸中大多数的长度是约200个碱基对或更短(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的胎儿核酸长度是约200碱基对或更短)。在一些实施方式中,胎儿核酸中大多数的长度是约150个碱基对或更短(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的胎儿核酸长度是约约150碱基对或更短)。在一些实施方式中,胎儿核酸中大多数的长度是约100个碱基对或更短(例如,约80、85、90、91、92、93、94、95、96、97、98、99w或100%的胎儿核酸长度是约100碱基对或更短)。
在某些实施方式中,可不处理含核酸样品就提供用于进行本文所述方法的核酸。在一些实施方式中,在处理含核酸样品后提供用于进行本文所述方法的核酸。例如,可从样品提取、分离、纯化或扩增核酸。如本文所用的术语“分离”指将核酸从其原始环境中取出(例如,天然发生核酸的天然环境或外源表达核酸的宿主细胞),因此核酸从其原始环境通过人的干预(如人工)而被改变。与来源样品中具有的组分含量相比,分离的核酸带有较少的非核酸组分(例如,蛋白质、脂质)。包含分离核酸的组合物可以是约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%不含非核酸组分。本文所用术语“纯化”是指提供的核酸与其所衍生自的样品来源相比包含更少的核酸种类。包含核酸的组合物可以是约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%不含其他核酸种类。如本文所用术语“扩增”是指处理样品中的核酸进行以线性或指数形式产生扩增子核酸,所述扩增子核酸的核苷酸序列与样品中核酸的核苷酸序列或其部分序列相同或基本相同。
在某些实施方式中,在提供核酸用于本文所述方法之前,还可通过采取方法使核酸产生核酸片段来处理核酸。在一些实施方式中,经过片段化或剪切的核酸可具有约5-约10,000个碱基对、约100-约1,000个碱基对、约100-500个碱基对或约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000或9000个碱基对的标称、平均或等比中数长度。可通过本领域已知的任何合适方法产生片段,且核酸片段的平均、等比中数或标称长度可通过选择适当的片段生成方法而加以控制。在某些实施方式中,较短长度的核酸可用来分析几乎不含序列变异和/或含有较大量的已知核苷酸序列信息的序列。在一些实施方式中,较长长度的核酸可用来分析含有较多序列变异和/或含有较少量核苷酸序列信息的序列。
核酸片段可含有重叠的核苷酸序列,这样的重叠序列可促进构建未片段化的对应核酸或其部分的核苷酸序列。例如,一个片段可具有亚序列x和y,而另一个片段可具有亚序列y和z,其中x、y和z是核苷酸序列,其长度可以是5个核苷酸或更长。在某些实施方式中,重叠序列y可用来促进构建样品中核酸的x-y-z核苷酸序列。在某些实施方式中,核酸可以是部分片段化的(例如,来自未完全的或中止的特异性剪切反应)或完全片段化的。
可以通过本领域已知的各种方法使样品核酸片段化,所述方法包括但不限于物理法、化学法和酶法。此类方法的非限定性示例在美国专利申请公开第20050112590号(2005年5月26日公开,题为“Fragmentation-based methods and systems for sequencevariation detection and discovery(用于检测和发现序列变异的基于片段化的方法和系统)”,发明人为Van Den Boom等)中有所描述。能选择某些方法以生成非特异性剪切的片段或特异性剪切的片段。可产生非特异性剪切片段核酸的方法的非限定性示例包括但不限于:让核酸接触使核酸暴露于剪切力的设备(例如使核酸通过注射器针头;使用法式压制器);使核酸暴露于辐射(例如γ射线、x射线、紫外辐射;可以通过辐射强度控制片段的大小);在水中煮沸核酸(例如产出约500个碱基对的片段)和将核酸暴露于酸和碱水解处理。
本文所用的“片段化”或“剪切”指使核酸分子(如核酸模板基因分子或其扩增产物)可以分成两个或更多较小核酸分子的方法或条件。这种片段化或剪切可以是序列特异性、碱基特异性或非特异性的,并且能通过任意不同方法、试剂或条件(包括例如化学、酶、物理片段化)来完成。
本文所用的“片段”、“剪切产物”、“经剪切的产物”或其语法变体指由核酸模板基因分子或其扩增产物的片段化或剪切获得的核酸分子。尽管这种片段或剪切产物可指由剪切反应获得的所有核酸,但是这种片段或剪切产物通常仅指由核酸模板基因分子或其扩增产物部分(包含核酸模板基因分子的相应核苷酸序列)的片段化或剪切获得的核酸分子。例如,扩增产物能包含多于核酸模板序列的扩增核苷酸区域的一个或多个核苷酸(如引物能包含除了与核酸模板基因分子互补的核苷酸以外的"额外"核苷酸例如转录起始序列,生成包含"额外"核苷酸或者与所述核酸模板基因分子的扩增核苷酸区域不对应的核苷酸的扩增产物)。因此,片段能包含来自扩增的核酸分子部分的片段,所述核酸分子至少部分包含来自或基于代表性核酸模板分子的核苷酸序列信息。
本文所用的术语“互补剪切反应”是指用不同剪切试剂或者通过改变相同剪切试剂的剪切特异性在相同核酸上进行的剪切反应,从而产生相同目标或参比核酸或蛋白质的不同剪切模式。在某些实施方式中,可以用一种或多种特异性剪切剂(例如1、2、3、4、5、6、7、8、9、10或更多种特异性剪切剂)在一个或多个反应容器中处理核酸(例如用各种特异性剪切剂在单独的容器内处理核酸)。
可通过使核酸接触一种或多种特异性剪切剂来特异性地剪切核酸。如本文所用术语“特异性剪切剂”指试剂,有时是可在一个或多个特异性位点处剪切核酸的化学品或酶。特异性剪切剂通常根据特定位点的特定核苷酸序列进行特异性剪切。
酶特异性剪切剂的例子包括但不限于:内切核酸酶(例如,DNA酶(例如DNA酶I、II);RNA酶(例如RNA酶E、F、H、P);CleavaseTM酶;Taq DNA聚合酶;大肠杆菌(E.coli)DNA聚合酶I和真核结构特异性内切核酸酶;鼠FEN-1内切核酸酶;I、II或III型限制性内切核酸酶如Acc I、Afl III、Alu I、Alw44 I、Apa I、Asn I、Ava I、Ava II、BamH I、Ban II、Bcl I、Bgl I.Bgl II、Bln I、Bsm I、BssH II、BstE II、Cfo I、CIa I、Dde I、Dpn I、Dra I、EcIX I、EcoR I、EcoR I、EcoR II、EcoR V、Hae II、HaeII、Hind II、Hind III、Hpa I、Hpa II、Kpn I、Ksp I、Mlu I、MIuN I、Msp I、Nci I、Nco I、Nde I、Nde II、Nhe I、Not I、Nru I、Nsi I、Pst I、Pvu I、Pvu II、Rsa I、Sac I、Sal I、Sau3A I、Sca I、ScrF I、Sfi I、Sma I、Spe I、Sph I、Ssp I、Stu I、Sty I、Swa I、Taq I、Xba I、Xho I;糖基化酶(例如,尿嘧啶-DNA糖基化酶(UDG)、3-甲基腺嘌呤DNA糖基化酶、3-甲基腺嘌呤DNA糖基化酶II、嘧啶水合DNA糖基化酶、FaPy-DNA糖基化酶、胸腺嘧啶错配DNA糖基化酶、次黄嘌呤-DNA糖基化酶、5-羟甲基尿嘧啶DNA糖基化酶(HmUDG)、5-羟甲基胞嘧啶DNA糖基化酶或1,N6-亚乙烯基-腺嘌呤DNA糖基化酶);外切核酸酶(例如外切核酸酶III);核酶和DNA酶。可用化学试剂处理核酸,可剪切修饰的核酸。在非限制性的例子中,可采用以下试剂处理核酸:(i)烷基化剂如甲基亚硝基脲,其产生若干烷基化的碱基,包括被烷基嘌呤DNA糖基化酶识别并剪切的N3-甲基腺嘌呤和N3-甲基鸟嘌呤;(ii)亚硫酸氢钠,其引起DNA中的胞嘧啶残基脱氨形成可被尿嘧啶N-糖基化酶剪切的尿嘧啶残基;以及(iii)将鸟嘌呤转化成其氧化形式8-羟基鸟嘌呤的化学试剂,8-羟基鸟嘌呤可被甲酰胺基嘧啶DNAN-糖基化酶剪切。化学剪切方法的例子包括但不限于:烷基化(例如硫代磷酸酯修饰核酸的烷基化);含P3′-N5′-磷酰胺酯核酸的酸不稳定性剪切;以及核酸的四氧化锇与哌啶处理。
在一些实施方式中,可对片段化的核酸进行大小分级处理,并且可以分离或分析所述分级(fractionated)的库的全部或部分。大小分级处理为本领域已知(如阵列分离、分子筛分离、凝胶电泳分离、柱色谱分离)。
在提供核酸用于本文所述方法之前,还可对核酸进行修饰核酸中某些核苷酸的处理。例如,可对核酸施用根据核酸中核苷酸的甲基化状态选择性修饰核酸的处理。此外,诸如高温、紫外辐射、x-射线辐射等条件可诱导核酸分子序列中的变异。可以有利于进行本文所述的序列分析或制备方法的任何形式(如固体或液体形式)提供核酸。在某些实施方式中,核酸可以液体形式提供,所述液体形式可选包含一种或多种其它成分,包括但不限于一种或多种缓冲液或盐。
胎儿核酸含量的测定和针对胎儿核酸的富集
在一些实施方式中,测定核酸中胎儿核酸的量(如浓度)。在某些实施方式中,根据男性胚胎特异性标记物(例如,Y-染色体STR标记物(如DYS 19、DYS 385、DYS392)、RhD阴性女性中用RhD标记),或根据一种或多种对胎儿核酸而非母方核酸有特异性的标记物(例如,母亲和胎儿之间不同的甲基化,或母方血浆中的胎儿RNA标记物;Lo,2005,Journal of Histochemistry and Cytochemistry 53(3):293-296)测定胎儿核酸的量。基于甲基化的胎儿定量组合物和方法描述于2009年9月16号提交的美国申请号12/561,241,其通过引用纳入本文。胎儿部分的测定有时使用胎儿定量试验(FQA)(例如美国专利申请公开号:US 2010-0105049 A1,名为“PROCESSES ANDCOMPOSITIONS FOR METHYLATION-BASED ENRICHMENT OF FETALNUCLEIC ACIDS(胎儿核酸基于甲基化的富集方法和组合物)”)完成。
胞外核酸中胎儿核酸的量可经定量并与本文提供的测定方法联用。因此,在某些实施方式中,所述技术方法包括测定胎儿核酸量的额外步骤。可在加工以制备样品核酸之前或之后测定对象的核酸样品中胎儿核酸的量。在某些实施方式中,在样品核酸经加工和制备后,测定样品中胎儿核酸的量,并用于进一步评价。在一些实施方式中,结果包括整理样品核酸中的胎儿核酸部分(如调节计数、除去样品、作出判定或不作出判定)。所述测定步骤能在本文所述非整倍性检测方法之前、中或后进行。例如,为了获得有给定灵敏度或特异性的非整倍性检测方法,胎儿核酸定量方法可以在剪切非整倍性之前、中或后进行,以鉴定有大于约2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%或更多胎儿核酸的那些样品。在一些实施方式中,被测定为具有某一胎儿核酸阈值量(如约15%或更多胎儿核酸)的样品进一步用于分析是否存在非整倍性。在某些实施方式中,仅选择(例如,选择并告知患者)具有某一胎儿核酸阈值量(如约15%或更多胎儿核酸)的样品确定是否存在非整倍性。
在一些实施方式中,在胞外核酸中富集或相对富集胎儿核酸。针对特定种类的核酸富集样品的方法在以下文件中有所描述:2001年8月31日提交的美国专利号6,927,028,2007年5月30日提交的专利申请号PCT/US07/69991,专利申请号PCT/US2007/071232(2007年6月15日提交),专利申请号PCT/US2008/074689,专利申请号PCT/US2008/074692,专利申请号PCT/US2009/057215,专利申请号PCT/US2010/027879,和专利申请号PCT/EP05/012707(2005年11月28日提交)。在某些实施方式中,从样品中选择性除去(部分、基本、几乎完全或完全)母方核酸。在某些实施方式中,根据甲基化差异从母方核酸中区分并分离胎儿核酸。在某些实施方式中,胎儿核酸通过大小富集(如较小核酸的扩增)或大小分离方法(如在经分离的大小有约300个碱基对或更小、约200个碱基对或更小或约150个碱基对或更小的无细胞核酸中富集胎儿核酸)来富集。针对特定低拷贝数目种类核酸的富集还可以提高定量灵敏度。例如,其最灵敏峰比率检测区域有时在距中心点10%内。
获得序列读数
测序、定位和相关分析方法为本领域已知(如美国专利申请公开US2009/0029377,通过引用纳入)。下文描述此类方法的某些方面。
本文所用的“读数”是由本文所述或本领域已知的任意测序方法生成的短核苷酸序列。读数能从核酸片段一端生成("单末端读数"),而有时从核酸片段两端生成("双末端读数")。在某些实施方式中,对象样品“获得”核酸序列读数,和/或从一个或多个参照个体的生物样品“获得”核酸序列读数能直接涉及测序核酸以获得序列信息。在一些实施方式中,“获得”能涉及接收直接从另一个核酸获得的序列信息。
在一些实施方式中,测序来自一个个体的一个核酸样品。在某些实施方式中,将来自两个或多个生物样品的核酸样品(其中各生物样品来自一个个体或者两个或更多个个体)收集成库,并且对所述库测序。在后面的实施方式中,常通过一个或多个独特鉴定标签来鉴定来自各生物样品的核酸样品。
在一些实施方式中,对基因组部分测序,其有时以测定的核苷酸序列覆盖基因组的量来表述(如小于1"倍"覆盖率)。当用约1倍覆盖率对基因组测序时,读数表示基因组的约100%核苷酸序列。也能用冗余度对基因组测序,其中所述基因组的给定区域能通过两次或更多次读数或者重叠读数来覆盖(如大于1"倍"覆盖率)。在一些实施方式中,用约0.1倍-约100倍覆盖率、约0.2倍-20倍覆盖率或者约0.2倍-约1倍覆盖率(如约0.2-、0.3-、0.4-、0.5-、0.6-、0.7-、0.8-、0.9-、1-、2-、3-、4-、5-、6-、7-、8-、9-、10-、15-、20-、30-、40-、50-、60-、70-、80-、90-倍覆盖率)对基因组测序。
在某些实施方式中,在测序前对一次运行测序的核酸库部分进行进一步的子选择(sub-select)。在某些实施方式中,可先采用基于杂交的技术(如使用寡核苷酸阵列)对某些染色体的核酸序列进行子选择(如不牵涉所述非整倍性测试的可能的非整倍体染色体和其它染色体)。在一些实施方式中,核酸能按大小分级(如通过凝胶电泳、尺寸排阻色谱法或通过基于微流体的方法),而在某些示例中,能通过选择较低分子量的核酸(如小于300个碱基对、小于200个碱基对、小于150个碱基对、小于100个碱基对)来富集胎儿核酸。在一些实施方式中,胎儿核酸能通过抑制母方背景核酸来富集,例如通过加入甲醛。在一些实施方式中,对核酸的预选择库的部分或亚组随机测序。在一些实施方式中,在测序前扩增所述核酸。在一些实施方式中,在测序前扩增所述核酸的部分或亚组。
能使用适合进行本文所述方法的任何测序方法。在一些实施方式中,使用高通量测序方法。高通量测序方法通常涉及在流动槽(flow cell)中以大规模平行方式测序的克隆扩增DNA模板或单个DNA分子(如描述于Metzker M,Nature Rev 11:31-46(2010);Volkerding等,Clin Chem 55:641-658(2009))。这种测序方法也能提供数字定量信息,其中各序列读数是表示个体克隆DNA模板或单个DNA分子的可计数的“序列标签”。高通量测序技术包括例如可逆染料终止子的合成法测序、寡核苷酸探针连接测序、焦磷酸测序和实时测序。
用于高通量测序方法的系统市售可得,并且包括例如罗氏(Roche)454平台、应用生物系统公司(Applied Biosystems)SOLID平台、Helicos True单分子DNA测序技术、昂飞(Affymetrix)公司杂交法测序平台、太平洋生物科学公司(PacificBiosciences)的单分子实时(SMRT)技术、454生命科学公司(Life Sciences)、亿明达(Illumina)/Solexa公司和螺旋生物科学公司(Helicos BioSciences)的合成法测序平台,和生物系统公司(Applied Biosystems)的连接法测序平台。高通量测序方法中还可使用生命技术公司(Life Technologies)的ION TORRENT技术和纳米孔测序技术。
在一些实施方式中,第一代技术例如桑格(Sanger)测序(包括自动化桑格(Sanger)测序)可用于本文所述的方法。本文也考虑包括使用显影核酸成像技术在内的其它测序技术(如透射电子显微镜(TEM)和原子力显微镜(AFM))。下面描述多种测序技术的示例。
本文所述方法中可以使用的核酸测序技术是合成法测序和基于可逆终止子的测序(如亿明达公司(Illumina)的基因组分析仪(Genome Analyzer)和基因组分析仪II(Genome Analyzer II))。采用这种技术能对数百万核酸(如DNA)片段平行测序。在这种测序技术的一个实施例中,使用包含具备8个单独通道的光学透明载玻片的流动槽(flow cell),所述流动槽表面结合寡核苷酸锚(如衔接子引物)。本文所述术语“流动槽(flow cell)”指能被构建以保留和/或可供试剂溶液有序通过结合分析物的任何固体支持物。流动槽(flow cell)通常是平面形状,光学透明,通常在毫米或亚毫米级,并且常具备通道或通路,在所述通道或通路中发生分析物/试剂的相互作用。
例如,在某些合成法测序中的库生成制备中,有时使模板DNA(如循环无细胞DNA(ccfDNA))片段化成数百碱基对长度。在一些实施方式中,可以不进一步对所述模板DNA(如ccfDNA)做片段化或大小选择来进行库制备。在某些实施方式中,如实施例2所述使用改进的生产方案来进行库生成。在某些实施方式中,使用自动化方法和设备进行样品分离和库生成。简言之,通过补平反应、外切酶反应或者补平反应和外切酶反应的结合来末端修复ccfDNA。所得经钝性末端修复的ccfDNA通过单核苷酸延伸,所述单核苷酸与衔接子引物3’末端上突出的单核苷酸互补,从而常增加连接效率。任何互补核苷酸都能用于延伸/突出核苷酸(如A/T、C/G),但是腺嘌呤常用于延伸经末端修复的DNA,而胸腺嘧啶常用作3’末端突出核苷酸。
例如,在某些合成法测序中,衔接子寡核苷酸与流动槽锚互补,并且有时用于使经修饰的ccfDNA(如延伸的经末端修复的核苷酸和单核苷酸)结合固体支持物(如流动槽的内表面)。在一些实施方式中,所述衔接子引物包含索引(indexing)核苷酸、或“条形码(barcode)”核苷酸(如可用作索引(indexing)引物以使明确鉴定样品的核苷酸的独特序列)、一个或多个测序引物杂交位点(如与通用测序引物、单末端测序引物、配对末端测序引物、多重测序引物等互补的序列)或其组合物(如衔接子/测序、衔接子/索引(indexing)、衔接子/索引(indexing)/测序)。衔接子引物内所含的索引(indexing)引物或核苷酸的长度经常是6个或更多个核苷酸并且经常位于引物中从而测序所述索引核苷酸。
在某些合成法测序方法中,利用索引(index)引物可供在流动槽通道中进行多重测序,从而允许每个流动槽通道分析多个样品。能在给定流动槽通道中分析的样品数目常取决于库制备中使用的独特索引引物的数目。索引引物可获自很多商业来源(如亿明达(Illumina)公司、生命技术公司(Life Technologies)、NEB公司)。能使用市售可得的试剂盒进行反应(如多重样品制备寡核苷酸试剂盒(经试剂盒包装的寡核苷酸用于制备对多重测序的多至96个样品)亿明达(Illumina)公司,目录号PE-400-1001;多重测序引物和PhiX控制试剂盒(经试剂盒包装的多重测序引物、多重控制DNA和缓冲液组,足够基因组分析仪运行多至10次)亿明达(Illumina)公司,目录号PE-400-1002)。本文所述方法不限于12个索引引物,而是能使用任何数目(如4、8、12、24、48、96或更多)的独特索引引物进行。独特索引引物的数目越大,可在单个流动槽通道中的多重样品数目越多。多重使用12个索引引物可允许在8个通道流动槽中同时分析96个样品(如等于96孔微孔板中的孔数)。相似地,多重使用48个索引引物可允许在8个通道流动槽中同时分析384个样品(如等于384孔微孔板中的孔数)。
在某些合成法测序中,向流动槽添加经衔接子修饰的单链模板DNA,并且所述单链模版DNA通过在有限稀释条件下与锚杂交以固定。与乳液PCR对比,DNA模板在流动槽中通过"桥式(bridge)"扩增,所述扩增依赖于捕获的DNA链"成拱形"并且与临近锚寡核苷酸杂交。多个扩增循环使所述单分子DNA模板转化成克隆扩增的拱形"簇",各簇包含约1000个克隆分子。每个流动槽能生成约50×106个分离簇。使所述簇变性,并随后经化学剪切反应和洗涤仅留下单末端测序的正链以供测序。通过使与衔接子序列互补的引物杂交,然后加入聚合酶和四个不同颜色荧光可逆染料终止子的混合物来开始测序正链。根据克隆簇中各链的序列互补来整合所述终止子。整合后,洗掉过量试剂,光学检测所述簇,并且记录所测荧光。连续化学步骤中,所述可逆染料终止子被解封,所述荧光标记被剪切和洗掉,然后进行下一个测序循环。这个反复的合成法测序过程有时需要约2.5天以生成36个碱基的读取长度。由于每个流动槽有50×106簇,每个分析运行的整体序列输出能大于10亿碱基对(Gb)。
能配合本文所述方法使用的另一种核酸测序技术是454测序(罗氏公司)。454测序使用大规模平行焦磷酸测序系统,每次运行能测序约400-600兆碱基DNA。所述方法通常包含两个步骤。在第一个步骤中,有时将样品核酸(如DNA)分级(fractionated)成更小片段(300-800个碱基对)并改良(各个末端生成钝端)。然后使短衔接子连接到片段的末端上。这些衔接子提供了对样品库片段扩增和测序的引物序列。一个衔接子(衔接子B)包含供所述DNA库固定在链霉亲和素涂覆微珠上的5′生物素标签。在缺口修复后,所述非生物素化的链被释放并用作单链模板DNA(sstDNA)库。评价所述sstDNA库的质量,并且通过滴定测定emPCR需要的最佳量(DNA拷贝/微珠)。所述sstDNA库固定在微珠上。包含库片段的微珠载有单个sstDNA分子。所述结合微珠的库用内含扩增试剂的油包水混合物乳化。在其发生PCR扩增的微反应器中捕获各个微珠。这样获得微珠固定的、克隆扩增的DNA片段。
在454测序的第二步骤中,向包含DNA聚合酶的孵育混合物添加单链模板DNA库的微珠,并且将包含硫酸化酶和荧光素酶的微珠涂层到包含皮升级孔的设备上。在各DNA片段上平行进行焦磷酸测序。加入一个或多个核苷酸生成由测序设备内CCD照相机记录的光信号。所述信号强度与整合的核苷酸数目成比例。焦磷酸测序检测加入核苷酸时焦磷酸(PPi)的释放。PPi在腺嘌呤5′磷酰硫酸存在下通过ATP硫酸化酶转化成ATP。荧光素酶使用ATP以使荧光素转化成氧化荧光素,并且这个反应生成可分辨和可分析的光(见例如Margulies,M.等,Nature 437:376-380(2005))。
能配合本文提供方法使用的另一种核酸测序技术是应用生物系统公司(AppliedBiosystems)的SOLIDTM技术。在SOLiDTM连接法测序中,核酸片段库从样品中制备,并且用于制备克隆微珠群体。用这个方法,各个微珠(如磁珠)表面上会存在一种核酸片段。样品核酸(如基因组DNA)被剪切成片段,然后衔接子连接到所述片段的5’和3’末端以生成片段库。所述衔接子通常是通用的衔接子序列,从而各片段的起始序列已知并且一致。在包含PCR的所有必需试剂的微反应器中进行乳液PCR。然后使连接到所述微珠的所得PCR产物共价结合到载玻片上。然后使引物与库模板中的衔接子序列杂交。四色荧光标记的二元(di-base)探针组竞争连接测序引物。通过检测各连接反应中的各个第一和第二碱基来实现所述二元探针的特异性。进行连接、检测和剪切的多个循环,用循环数目决定最终读取长度。在一系列连接循环后,除去所述延长产物并用与n-1位点互补的引物重新设定模版以进行第二轮连接循环。经常,对各序列标签完成五轮引物的重新设定。通过所述引物重新设定过程,在两个独立连接反应中通过两个不同引物研究各碱基。例如,在读取位置5的碱基通过连接循环2中的引物2和连接循环1中的引物3来测试。
能配合本文所述方法使用的另一种核酸测序技术是Helicos真单分子测序(tSMS)。在所述tSMS技术中,向样品中各核酸链(如DNA)的3’端添加聚A序列。各链通过添加荧光标记的腺嘌呤核苷酸来标记。然后使所述DNA链杂交至流动槽,所述流动槽包含数百万个固定在流动槽表面的寡T捕获位点。所述模板可以是约10千万模板/cm2浓度。然后将所述流动槽载入测序设备,并且激光照明所述流动槽的表面以显示各模板的位置。CCD照相机能绘制所述流动槽表面的模板位置。然后剪切并洗去所述模板荧光标记。所述测序反应通过引入DNA聚合酶和荧光标记的核苷酸开始。所述寡T核酸作为引物。所述聚合酶以模板介导方式将标记的核苷酸整合到引物上。除去所述聚合酶和未整合的核苷酸。通过对所述流动槽表面成像来检测定向整合有荧光标记核苷酸的模板。成像后,剪切步骤除去荧光标记,并用其它荧光标记核苷酸重复所述过程直到获得所需读数长度。通过各核苷酸加入步骤收集序列信息(见例如Harris T.D.等,Science 320:106-109(2008))。
可以用于本文所述方法的另一种核酸测序技术是太平洋生物科学公司(PacificBiosciences)的单分子实时(SMRTTM)测序技术。用这个方法,四种DNA碱基各连接四种不同的荧光染料之一。这些染料是磷连接的。单个DNA聚合酶用零模式波导(ZMW)底部的模板单链DNA的单个分子固定。ZMW是能通过DNA聚合酶对比荧光核苷酸背景观察到单核苷酸整合度的限制结构,所述荧光核苷酸快速扩散在ZMW输出中(以微秒计)。其耗用数毫秒以将核苷酸整合到生长链上。在该时间中,所述荧光标记被激发并生成荧光信号,并且切掉所述荧光标签。检测所述染料的对应荧光指示整合了哪个碱基。然后重复所述过程。
可以用于本文所述方法的另一种核酸测序技术是ION TORRENT(生命技术公司(Life Technologies))单分子测序,所述技术使半导体技术与简单测序化学配对以直接将编码信息(A、C、G、T)化学翻译成半导体芯片上的数字信息(0,1)。IONTORRENT使用微机器孔的高密度阵列以大规模平行方式进行核酸测序。各孔有不同的DNA分子。所述孔下面是离子灵敏层,而该层下面是离子传感器。通常当核苷酸通过聚合酶整合DNA链时,释放氢离子作为副产物。如果例如核苷酸C加入到DNA模板并且随后整合到DNA链上,则释放氢离子。所述离子的电荷会改变溶液的pH,这能由离子传感器来检测。测序器(sequencer)能判定(call)碱基,从化学信息直接到数字信息。然后,所述测序器使核苷酸一个接一个地顺序流入芯片。如果流入芯片的下一个核苷酸不匹配,则不会记录电压变化也不会判定碱基。如果在所述DNA链上有两个相同的碱基,所述电压会加倍,并且所述芯片会记录判定(call)的两个相同碱基。因为这是直接检测(即没有扫描、照相机或光照的检测),所以各核苷酸整合以秒来记录。
可以用于本文所述方法的另一种核酸测序技术是化学灵敏的场效应晶体管(CHEMFET)阵列。在这个测序技术的一个实施例中,将DNA分子置于反应室中,然后所述模板分子能与结合在聚合酶上的测序引物杂交。能通过CHEMFET传感器由电流改变来检测整合到测序引物3’末端的新核酸链的一个或多个三磷酸。阵列能有多个CHEMFET传感器。在另一个实施例中,单核酸连接到微珠上,并且所述核酸能在微珠上扩增,而所述单个微珠能被转移到CHEMFET阵列的单个反应室,各室有CHEMFET传感器,并且能对所述核酸测序(见例如美国阵列公开号2009/0026082)。
能配合本文所述方法使用的另一种核酸测序技术是电子显微镜。在该测序技术的一个实施例中,单个核酸(如DNA)分子使用电子显微镜可区别的金属标记来标记。然后这些分子在平面上伸展,并且使用电子显微镜成像以测量序列(见例如Moudrianakis E.N.和Beer M.Proc Natl Acad Sci USA.1965年3月;53:564-71)。在一些示例中,使用透射电子显微镜(TEM)(如HM公司(Halcyon Molecular)的TEM方法)。这种称为单分子放置快速纳米转移(Individual Molecule Placement Rapid NanoTransfer)(IMPRNT)的方法包含利用单原子分辨透射电子显微镜对用重原子标记物选择性标记的高分子量(如约150kb或更大)DNA成像,并且在有相同碱基-碱基间隔的超致密(3nm链-链)平行阵列上的超薄膜上排列这些分子。所述电子显微镜用于在膜上对所述分子成像以确定重原子标记物的位置并提取DNA的碱基序列信息(见例如PCT专利公开WO 2009/046445)。
其他可以用于进行本文所述方法的测序方法包括数字PCR和杂交法测序。数字聚合酶链式反应(数字PCR或dPCR)能用于直接鉴定和定量样品中的核酸。在一些实施方式中,能在乳液中进行数字PCR。例如在微流体室设备中分离单个核酸,并且各核酸单独通过PCR扩增。能以每个孔中不多于一个核酸地分离核酸。在一些实施方式中,能使用不同探针区分多种等位基因(例如胎儿等位基因和母方等位基因)。能列举等位基因以测定拷贝数目。在杂交测序中,所述方法涉及使多核苷酸序列接触多种多核苷酸探针,其中所述多种多核苷酸探针各自可选地连接到底物。在一些实施方式中,所述底物可以是带有已知核苷酸序列阵列的平面。可使用与阵列杂交的模式测定样品中存在的多核苷酸序列。在一些实施方式中,各探针连接到微珠(如磁珠等)上。与所述微珠的杂交能被鉴定并用于鉴定样品中的多种核苷酸序列。
在一些实施方式中,纳米孔测序能用在本文所述的方法中。纳米孔测序是单分子测序技术,由此当单核酸分子(如DNA)通过纳米孔时被直接测序。纳米孔是直径为1纳米级别的小孔或通道。某些穿膜细胞蛋白(如α-溶血素)能起纳米孔的作用。在一些示例中,能合成纳米孔(如使用硅平台)。使纳米孔浸入传导流体并跨越该流体施加电压导致轻微电流,这归因于通过所述纳米孔的离子传导。流过的电流量对纳米孔的大小敏感。当DNA分子穿过纳米孔时,DNA分子上的各核苷酸不同程度地阻塞所述纳米孔,并使当前电流的特性产生改变。因此,能在任何给定时刻通过所述纳米孔的电流量根据所述纳米孔是否被A、C、G、T或一些示例中的甲基-C阻塞而不同。DNA分子通过纳米孔时通过所述纳米孔的电流的变化代表所述DNA序列的直接读数。在一些示例中,当DNA碱基以正确顺序通过所述纳米孔时,可使用纳米孔逐一鉴定所述DNA碱基(见例如Soni GV和Meller A.Clin Chem 53:1996-2001(2007);PCT公开号WO2010/004265)。
可以多种方式使用纳米孔对核酸分子测序。在一些实施方式中,使用外切核酸酶如脱氧核糖核酸酶。在该示例中,所述外切核酸酶用于从核酸(如DNA)分子上顺序分离核苷酸。然后由所述纳米孔按所述核苷酸释放的顺序来对其进行检测和分辨,从而读取所述原始链的序列。对这种实施方式而言,可使所述外切核酸酶连接所述纳米孔,从而释放自所述DNA分子的核苷酸部分能进入纳米孔通道并与其相互作用。所述外切核酸酶可在紧邻通道开口形成处的纳米孔部分的位点连接到所述纳米孔结构上。在一些示例中,所述外切核酸酶可以其轨迹离出点朝向形成所述开口的纳米孔部分的方式连接到所述纳米孔结构。
在一些实施方式中,核酸的纳米孔测序涉及使用某种酶,所述酶推进或拉出核酸(如DNA)分子通过所述孔。在该示例中,离子电流因所述DNA分子中的核苷酸通过所述孔而变动。所述电流中的变动指示DNA序列。对这种实施方式而言,所述酶可以其能够推进或拉出所述靶标核酸通过所述纳米孔通道而不干扰离子电流通过该孔的方式连接到纳米孔结构上。所述酶可在紧邻形成开口结构部分的位点连接到所述纳米孔结构上。所述酶可以例如其活性位点朝向形成开口部分的结构部分的方式连接到所述亚基上。
在一些实施方式中,核酸的纳米孔测序涉及紧邻纳米孔检测器的聚合酶副产物的检测。在这个示例中,标记核苷磷酸(核苷酸),从而在向核苷酸链添加聚合酶时释放磷酸标记的种类,并且通过所述孔来检测所述磷酸标记种类。通常,所述磷酸种类包含对各核苷酸的特定标记。由于核苷酸顺序加入到所述核酸链上,检测碱基加入的副产品。检测磷酸标记种类的顺序能用于测定核酸链的序列。
所述序列读数的长度经常与特定测序技术相关联。例如高通量方法提供了大小能由数十到数百碱基对(bp)变化的序列读数。例如纳米孔测序提供大小能由数十到数百到数千碱基对变化的序列读数。在一些实施方式中,所述序列读数是长度约15bp-900bp长(如约20bp、约25bp、约30bp、约35bp、约40bp、约45bp、约50bp、约55bp、约60bp、约65bp、约70bp、约75bp、约80bp、约85bp、约90bp、约95bp、约100bp、约110bp、约120bp、约130、约140bp、约150bp、约200bp、约250bp、约300bp、约350bp、约400bp、约450bp、或约500bp)的等比中数(mean)、中值(median)或平均(average)。在一些实施方式中,所述序列读数是长度约1000bp或更长的等比中数、中值或平均。
在一些实施方式中,核酸可以包含荧光信号或序列标签信息。信号或标签的定量可以用于多种技术,例如流式细胞术、定量聚合酶链式反应(qPCR)、凝胶电泳、基因芯片分析、微阵列、质谱、细胞荧光测定分析、荧光显微镜、共聚焦激光扫描显微镜、激光扫描细胞术、亲和层析、手工批量模式分离、电场悬浮术、测序及其组合。
测序读数的定位(map)
鸟枪法测序信息(即物理基因组位点未知的片段的测序信息)的定位能以多种方式完成,其涉及使获得的测序读数与参照基因组中的匹配序列进行比对。见Li等,"Mapping short DNA sequencing reads and calling variants using mapping quality score(定位短DNA测序读数并使用比对的质量分数判定变异)",Genome Res.,2008年8月19日。使序列读数与参照序列进行比对,并且比对上的那些被称为“定位的(mapped)”或是“序列标签”。
"序列标签"是特异性地分配与染色体1-22、X或Y之一的DNA序列。序列标签可以在参照基因组(如染色体)的单个部分内重复或不重复。在某些实施方式中,某些小程度的错配(0-1)可说明在所述参照基因组和经定位的来自个体基因组(母方和胎儿)读数之间可能存在次要多态性。在一些实施方式中,没有错配可使读数定位到参照序列上。
"序列标签密度"指对染色体上序列定义窗的序列标签经标准化的值,其中所述序列标签密度用于不同样品的比较和后续分析。在一些实施方式中,所述窗是约10千碱基(kb)-约100kb、约20kb-约80kb、约30kb-约70kb、约40kb-约60kb,而有时约50kb。序列窗也称为"箱(bin)"。
所述序列标签密度的值经常在样品中标准化。标准化能通过下面方法进行:计算落入染色体各窗中标签的数目;获得各染色体所计总序列标签的中值;获得全部常染色体值的中值;和使用这个值作为标准化常数以说明对不同样品获得的序列标签总体数目的不同。就二体生物染色体而言,有时序列标签密度约为1。序列标签浓度能根据测序工艺而不同,最值得注意的是G/C偏好,其能通过使用外部标准或内部参照(如来自基本全部序列标签(基因组序列),例如其可以是单染色体或来自全部常染色体的计算值)来校正。因此,能从所述样品的其它可定位的测序标签中的百分比代表推断染色体或染色体区域的剂量失衡。因此能定量测定和标准化特定染色体或染色体区域的剂量失衡。
参照序列经常是来自个体或多个个体的组装或部分组装的基因组序列。有时参照序列不来自胎儿、胎儿母亲或胎儿父亲,从而在本文中被称为“外部参照”。当根据外部参照制取妊娠妇女序列("母方参照序列")时,使基本不含胎儿DNA的妊娠妇女DNA的读数定位到外部参照序列上并且组装。在某些实施方式中,所述外部参照来自与所述妊娠妇女基本属同一种族的个体的DNA。母方参照序列可以不完全覆盖母方基因组DNA(如可以覆盖母方基因组DNA的约50%、60%、70%、80%、90%或更多),并且所述母方参照可以不与母方基因组DNA序列完美匹配(如所述母方参照序列可以包含多个错配)。在某些实施方式中,由于纯母方序列和母方加胎儿血浆序列中的母方成分中的一个或多个箱(bin)中过量或过低表示的染色体的相似性,使用母方参照序列能帮助提供结果。有时使用一个或多个基因组部分或箱(bin)中胎儿加母方序列读数的丰度与仅母方序列读数的母方序列读数丰度的比较来获得关于胎儿非整倍性的结果。实施例1描述了使用母方序列读数生成母方参照,并使胎儿加母方序列读数定位到母方参照上以获得结果。
在一些实施方式中,全部序列读数的比例来自涉及非整倍性的染色体(如染色体21),而其它序列读数来自其它染色体。考虑到涉及非整倍性染色体(如"靶标染色体":染色体21)相较其它染色体的相对大小,可在参照范围内获得靶标染色体特异序列的标准化频率。如果所述胎儿靶标染色体中有非整倍性,那么所述靶标染色体来源序列的标准化频率在统计学上大于非靶标染色体来源序列的标准化频率,从而能够检测非整倍性。标准化频率中的变化程度将取决于分析样品中胎儿核酸的浓度分数。
计数
在一些实施方式中,能根据选择特性或变量定位(map)或分配定量序列读数以测定对各基因组部分(如箱、部分、基因组片段等)定位的读取数字。在某些实施方式中,定位的序列读数的总数通过计数全部定位的序列读数来测定。在一些实施方式中,定位的序列读数的总数通过总计各箱或部分定位的计数来测定。在某些实施方式中,定位的序列读数的亚组通过计数定位上的序列读数的预测定亚组来测定,而在一些实施方式中,定位的序列读数的预测定亚组通过总计各预测定箱(bin)或部分定位上的计数来测定。在一些实施方式中,定位的测序读数的预测定亚组能包含1-n个序列读数,其中n表示与从测试对象或参照对象样品生成的所有序列读数总和相等的数目。在某些实施方式中,能利用任意合适的特性或变量来选择定位的测序读数的预测定亚组。
测试对象样品(如分离的胎儿DNA、包含母方和胎儿DNA的循环无细胞DNA)、一种或多种参照对象样品(如外部参照、与外部参照定位的母方DNA)、流动槽中处理的所有样品或板中制备的所有样品的经定位和计数的序列读数有时被称为样品计数。样品计数有时还参考所述样品分离的来源对象(如测试对象的样品计数、参照对象的样品计数等)来做进一步区分。在一些实施方式中,测试样品也用作参照样品。有时测定测试样品和/或参照样品的已知无遗传变异(如在一个或多个选择的基因组部分中没有任何微缺失、复制、非整倍体等)的一个或多个所选基因组部分(如第一基因组部分、第二基因组部分、第三基因组部分、5或更多基因组部分、50或更多基因组部分、500或更多基因组部分等)的中值期望计数和/或中值期望计数导出数。对一个或多个无遗传变异的基因组部分的中值期望计数或其导出数能用于评价获自测试样品的其它所选基因组部分的计数的统计学显著性。在一些实施方式中,还测定了中值绝对偏差,而在某些实施方式中,所述中值绝对偏差还用于评价获自测试样品的其它所选基因组部分的计数的统计学显著性。
对序列读数的定量或计数能以任何合适的方法完成,所述方法包括但不限于手工计数方法和自动计数方法。在一些实施方式中,可将自动计数方法编入测定或计数序列读数数目或定位到各染色体和/或一个或多个所选基因组部分上的序列标签的数目的软件中。如本文所用,软件指在由计算机执行时进行计算机操作的计算机可读程序指令。
可定位到各箱(bin)上的序列读数数目和源自测试对象和/或参照对象的样品的序列读数的总数进行再分析和处理以提供是否存在基因变异的决定性结果。已经计数的定位的测序读数有时称为“数据”或“数据组”。在一些实施方式中,数据或数据组能表征为一种或多种特性或变量(如基于序列的[如GC含量、特异性核苷酸序列等]、功能特异性[如表达的基因、癌基因等]、基于定位的[基因组特异性、染色体特异性、基因组部分或箱特异性]等及其组合)。在某些实施方式中,能根据一种或多种特性或变量将数据或数据组组织成有两个或多个维数的矩阵。能使用任何合适的特性或变量对组织成矩阵的数据分级。组织成矩阵的数据的非限定性示例包含通过母方年龄、母方倍性和胎儿基值分级的数据。在某些实施方式中,表征为一种或多种特性或变量的数据组有时在计数后处理。
扩增方法
在一些实施方式中,用于检测是否存在染色体非整倍性的方法能包含扩增方法,而在某些实施方式中,可以不包含扩增方法。关于本文所述的技术能使用某些核酸扩增方法。后面描述了能使用的扩增和引物技术的多个方面。
扩增
在一些实施方式中,使用合适的扩增方法扩增一个或多个核酸。如果一个或多个核酸以低拷贝数存在,则可能尤其需要扩增核酸。在一些实施方式中,扩增感兴趣序列或区域可以帮助检测基因剂量失衡。本文把特定核酸的扩增产物(扩增子)称为"扩增的核酸"。
核酸扩增常涉及酶合成含有与待扩增核酸互补序列的核酸扩增子(拷贝)。因为开始测试时需要的靶标序列较少,扩增核酸和检测合成的扩增子能改善测试灵敏度,并能改善核酸的检测。
可使用任何合适的扩增技术。多核苷酸扩增的示例包括但不限于,聚合酶链式反应(PCR);连接扩增(或连接酶链反应(LCR));基于应用Q-β复制酶或模板依赖性聚合酶的扩增方法(参见美国专利公开号US20050287592);解旋酶依赖性等温扩增(Vincent等,"Helicase-dependent isothermal DNA amplification(解旋酶依赖性等温DNA扩增)".EMBO reports 5(8):795-800(2004));链置换扩增(SDA);基于嗜热SDA核酸序列的扩增(3SR或NASBA)以及转录相关扩增(TAA)。PCR扩增方法的非限定性示例包括标准PCR、AFLP-PCR、等位基因特异性PCR、Alu-PCR、不对称PCR、菌落PCR、热起始PCR、反向PCR(IPCR)、原位PCR(ISH)、序列间特异性PCR(ISSR-PCR)、长PCR、多重PCR、巢式PCR、定量PCR、逆转录酶PCR(RT-PCR)、实时PCR、单细胞PCR、固相PCR、其组合等。进行PCR的试剂和硬件市售可得。
术语“扩增”、“扩增反应”或“进行扩增”指用于倍增核酸靶序列拷贝的任何体外方法。有时,扩增指靶核酸的“指数”增加。然而,如本文所用的“扩增”也可指选定核酸靶序列数量的线性增加,但不同于一次、单引物延伸步骤。在一些实施方式中,可进行有限扩增反应,也称为预扩增。预扩增是一种因为进行的循环次数小(例如10个循环)而发生有限量扩增的方法。预扩增可允许一定的扩增,但在指数期之前停止扩增,并通常产生所需一个或多个核苷酸序列的约500拷贝。采用预扩增还可限制标准PCR反应中与反应物耗尽有关的不准确,并还能降低因靶标的核苷酸序列或物种丰度引起的扩增偏差。在一些实施方式中,可进行一次引物延伸作为线性或指数扩增的开头。
在此提供扩增过程的概述。例如使引物与靶标核酸接触,然后互补序列彼此退火。引物可在感兴趣序列或其附近(例如相邻、毗邻等)处与靶标核酸退火。向引物-靶标核酸混杂物添加含有酶功能必要组分的反应混合物,然后可在适当条件下发生扩增。扩增反应的组分可包括但不限于,例如引物(如单独引物、引物对、引物组等)、多核苷酸模板(如靶标核酸)、聚合酶、核苷酸、dNTP等。例如,在一些实施方式中,可使用非天然产生的核苷酸或核苷酸类似物,例如含有可检测标记(例如荧光或比色标记)的类似物。能选择聚合酶,并且包括用于热循环扩增的聚合酶(如Taq DNA聚合酶;Q-BioTM Taq DNA聚合酶(重组的缺失5’-3’外切酶活性的截短形式Taq DNA聚合酶);SurePrimeTM聚合酶(经化学修饰的用于"热启动"PCR的Taq DNA聚合酶);ArrowTM Taq DNA聚合酶(高灵敏度及长模板扩增))和用于热稳定扩增的聚合酶(如例如互联网址URL“gen-probe.com/pdfs/tma_whiteppr.pdf”中所述用于转录介导的扩增(TMA)的RNA聚合酶)。例如,可添加其它酶组分如用于转录介导的扩增(TMA)反应的逆转录酶。
在讨论核苷酸感兴趣序列时术语“接近”或“相邻”指引物末端与所述核苷酸或感兴趣核苷酸之间的距离或区段。如本文所用,毗邻是在约5个核苷酸到约500个核苷酸范围内(例如,离感兴趣的核苷酸约5个核苷酸、离感兴趣的核苷酸约10、约20、约30、约40、约50、约60、约70、约80、约90、约100、约150、约200、约250、约300、约350、约400、约450或约500个核苷酸)。在一些实施方式中,一组引物在距离感兴趣核酸序列的约10-30个核苷酸内杂交并生成扩增产物。
在一些实施方式中,经扩增的核酸各自独立地具有约10-约500个碱基对的长度。在某些实施方式中,经扩增的核酸长度为约20-约250个碱基对,有时长度为约50-约150个碱基对,有时长度约100个碱基对。因此,在一些实施方式中,经扩增的核酸产物的长度各自独立地是约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、125、130、135、140、145、150、175、200、250、300、350、400、450或500个碱基对长度。
扩增产物可包括天然产生的核苷酸、非天然产生的核苷酸、核苷酸类似物等及上述物质的组合。扩增产物常具有与样品核酸核苷酸序列或其互补体相同或基本相同的核苷酸序列。扩增产物中“基本相同”的核苷酸序列通常与被扩增的核酸或其互补体具有高度序列相同性(例如,序列相同性约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或超过99%),变化有时是延伸和/或扩增中所用聚合酶失真或向扩增用引物添加额外的核苷酸序列所致。
PCR条件可取决于引物序列、靶标丰度和所需扩增量,因此本领域技术人员可在多种可用PCR方案中选择(参见例如,美国专利第4,683,195和4,683,202号;PCRProtocols:A Guide to Methods and Applications(《PCR方案:方法和应用指南》,Innis等编,1990)。数字PCR也为本领域技术人员已知;见例如2007年2月2日提交的美国专利申请公开号20070202525,通过引用纳入本文)。PCR通常用热稳定性酶以自动过程进行。该过程中,反应混合物的温度在变性区、引物退火区与延伸反应区之间自动循环。特定适于该目的的机器市售可得。可适于本文所述实施方式的PCR方案的非限制性示例为,样品在95℃下处理5分钟,重复45轮以下循环:95℃1分钟,59℃1分钟、10秒钟,和72℃1分30秒;然后样品在72℃处理5分钟。通常使用市售可得的热循环仪进行多轮循环。在某些实施方式中,也可以应用已知并选择的合适的等温扩增方法。
在一些实施方式中,可采用多重扩增方法扩增靶标核酸,从而在单次均匀反应中同时扩增多个扩增子。如本文所用“多重扩增”指PCR的变体,可通过使用多于一对引物(例如多于一组引物)实现在一个反应容器内同时扩增多个感兴趣靶标。在一些实施方式中,多重扩增可用于分析缺失、突变与多态性或定量试验。在某些实施方式中,多重扩增可用于旁系同源序列失衡检测,需要同时分析多个标志物的基因分型应用,病原体或遗传改良生物的检测或用于微卫星分析。在一些实施方式中,多重扩增可与另一扩增(例如PCR)方法(例如,巢式PCR或热启动PCR)联用以提高扩增特异性和重复性。在其它实施方式中,例如多重扩增可以在复制中完成以降低由所述扩增引入的变异。
在某些实施方式中,核酸扩增可产生不同或基本相似核酸序列的额外核酸物质。本文所述的某些实施方式中,可能含有与感兴趣序列基本互补或基本相同的污染或额外的核酸物质能用于序列定量分析,前提是污染或额外的序列保持恒定,从而能作为水平可充分重现的可靠标志物。其它可以影响序列扩增重复性的考虑因素是:PCR条件(循环数目、反应体积、引物对之间的熔融温度差异等)、样品中的靶标核酸浓度、含有感兴趣核酸种类的染色体数目、制备样品的质量变化等。本文所用术语“基本重复”或“基本可重复”指在基本相似条件下,在约75%或更多时间,约80%、约85%、约90%、约95%或约99%或更多时间以基本相同方式产生结果(例如核酸的可定量含量)。
在靶标核酸是RNA的一些实施方式中,在扩增步骤前,可以合成感兴趣RNA转录体的DNA拷贝(cDNA)。可通过逆转录合成cDNA,所述逆转录可以单独步骤进行,或在均一的逆转录聚合酶链式反应(RT-PCR)(为扩增RNA改良的聚合酶链式反应)中进行。Romero和Rotbart在Diagnostic Molecular Biology:Principles andApplications(诊断分子生物学:原理及应用)第401-406页;Persing等编著,麦友基金会(Mayo Foundation),明尼苏达州洛切斯特(Rochester,Minn.),1993;Egger等,J.Clin.Microbiol.33:1442-1447,1995;和美国专利第5,075,212号中描述了适用于PCR扩增核糖核酸的方法。分支-DNA技术可以用于扩增母方血液中的RNA标志物的信号。关于分支-DNA(bDNA)信号扩增用于直接定量临床样品中核酸序列的综述参见Nolte,Adv.Clin.Chem.33:201-235,1998。
在某些实施方式中,也可采用数字PCR(例如Kalinina及其同事(Kalinina等,“Nanoliter scale PCR with TaqMan detection.(带TaqMan检测的纳升级PCR)”,NucleicAcids Research.25;1999-2004,(1997);Vogelstein和Kinzler(Digital PCR(数字PCR),Proc Natl Acad Sci U S A.96;9236-41,(1999);PCT专利公开号WO05023091A2;美国专利公开号20070202525)。数字PCR利用单分子水平核酸(DNA、cDNA或RNA)扩增的优势并为定量分析低拷贝数核酸提供高度灵敏的方法。已有用于数字扩增和核酸分析的系统(例如,Fluidigm
Figure BDA00003704631800371
公司)。
在所述技术方法中也可采用引物延伸反应。在一些实施方式中,例如通过区分单核苷酸错配处的核酸序列来进行引物延伸反应。通过向延伸寡核苷酸添加一个或多个脱氧核苷酸和/或双脱氧核苷酸来检测所述错配,所述延伸寡核苷酸与临近错配位点的区域杂交。延伸寡核苷酸通常由聚合酶延伸。在一些实施方式中,可检测标记或可检测标签(例如生物素或链霉亲和素)被整合入延伸寡核苷酸或加至延伸寡核苷酸上的核苷酸内。可用任何已知的合适检测方法(例如质谱;测序方法)检测延伸的寡核苷酸。在一些实施方式中,错配位点仅通过一个或两个由特定标记加标签的互补脱氧核苷酸或双脱氧核苷酸延伸或产生具有特定量的引物延伸产物,因而错配可以被区分并定量。
在一些实施方式中,扩增可以在固体支持物上进行。在一些实施方式中,可使引物结合固体支持物。在某些实施方式中,可使靶标核酸(如核酸)结合固体支持物。与固体支持物结合的核酸(引物或靶标)通常称为固相核酸。
在一些实施方式中,提供用于扩增的核酸分子在“微反应器”中。如本文所用术语“微反应器”指能使核酸分子杂交固体支持物核酸分子的分隔空间。微反应器的示例包括但不限于乳液小球(下文有述)和基质中的空穴。在某些实施方式中,基质中的空穴可以是由可用于包含液体的固体材料(例如,塑料(如聚丙烯、聚乙烯、聚苯乙烯)或硅)所构建的基质中的坑、洞或孔(例如微米孔、纳米孔、皮米孔、微米洞或纳米洞)。乳液小球由如下文详述的不混溶相分隔。在一些实施方式中,微反应器的容积足够大以在所述微反应器内容纳一个固体支持物(例如,微珠),又足够小以排斥微反应器内两个或更多固相支持物的存在。
如本文所用术语“乳液“指两种不混溶、不可混物质的混合物,通常其中一种物质(分散相)分散在另一物质(连续相)中。在某些实施方式中,分散相可以是水性溶液(即,含水溶液)。在一些实施方式中,分散相主要由水组成(例如以重量计,超过70%、超过75%、超过80%、超过85%、超过90%、超过95%、超过97%、超过98%和超过99%的水)。分散相(如含水分散相)的各离散部分,在此称为“小球”或“微反应器”。在某些实施方式中,小球形状有时可以是球体、基本球体或半球体。
如本文所用术语“乳液装置”与“乳液组分”指能用于制备乳液的装置和组分。适合使用以制备乳液的乳液装置的非限制性示例包括但不限于逆流、错流、旋转筒和膜装置。在某些实施方式中,乳液组分形成乳液的连续相,其包括但不限于不与水混溶的物质,如含油或基本由油组成的组分(例如,热稳定、生物相容性油如轻质矿物油)。生物相容性乳液稳定剂可用作乳液组分。乳液稳定剂包括但不限于Atlox 4912、Span 80和其它生物相容性表面活性剂。
在一些实施方式中,分散相中可包含有用于生物反应的组分。乳液中的小球可包含(i)固体支持物单元(例如,一粒微珠或一个颗粒);(ii)样品核酸分子;和(iii)足量延伸试剂以延长固相核酸并扩增延长的固相核酸(如延伸核苷酸、聚合酶、引物)。乳液中的非活性小球可包括这些组分的子集(例如,固体支持物和延伸试剂与非样品核酸),一些可以是空的(即,小球将不包含固体支持物,无样品核酸且无延伸试剂)。
乳液可采用已知的合适方法制备(例如,Nakano等,“Single-molecule PCR usingwater-in-oil emulsion;(采用油包水乳剂的单分子PCR)”Journal of Biotechnology 102(2003)117-124)。乳化方法包括但不限于佐剂法、逆流法、错流法、旋转筒法、膜法等。在某些实施方式中,制备含有固体支持物的含水反应混合物(下文中称为“反应混合物”)然后加入生物相容性油中。在某些实施方式中,可向生物相容性油(例如,轻质矿物油(西格玛公司(Sigma))的转动混合物逐滴添加反应混合物并使其乳化。在一些实施方式中,可向错流的生物相容性油逐滴添加反应混合物。可调整乳液中含水小球的大小,例如通过改变流速和组分彼此添加的速度。
在某些实施方式中,可根据以下两项竞争因素选择乳剂小球的大小:(i)小球足够大以包含一个固体支持物分子、一个样品核酸分子与以供所需延长和扩增度的足量延伸试剂;以及(ii)小球足够小,从而可通过常规实验设备(例如,热循环设备、试管、培养箱等)扩增小球群。在某些实施方式中,所述乳剂中小球的标称、等比中数(mean)或平均直径可为约5-约500微米、约10-约350微米、约50-约250微米、约100-约200微米、或约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400或500微米。
在某些实施方式中,一组内扩增的核酸长度相同,而有时一组内扩增的核酸长度不同。例如,一种扩增的核酸可以比组内其它一种或多种扩增的核酸长约1-约100个核苷酸(例如,长了约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80或90个核苷酸)。
在一些实施方式中,可确定组内一种扩增核酸的含量与该组内另一种扩增核酸的含量的比例(下文为“组内比例”)。在一些实施方式中,组内一种扩增核酸的含量与该组内另一种扩增核酸的含量大约相等(即,组内扩增核酸物质的含量约为1:1),这通常是在样品中携带各扩增核酸的染色体数大致相等的情况。如本文所用关于扩增核酸的术语“量”指任何适当的度量,包括但不限于,拷贝数、重量(例如克)和浓度(例如,克每单位体积(例如毫升);摩尔单位)。在某些实施方式中,组内一种扩增核酸的量可不同于组内另一种扩增核酸的量,即使样品中携带各扩增核酸的染色体数量大致相等。在一些实施方式中,组内扩增核酸的量可变化至多至某一阈值水平,在该阈值水平可测得染色体异常的置信度水平为约95%(例如,约90、91、92、93、94、95、96、97、98、99或大于99%)。在某些实施方式中,组内扩增核酸的量变化约50%或更低(例如,约45、40、35、30、25、20、15、10、5、4、3、2或1%,或低于1%)。因此,在某些实施方式中,组内扩增核酸的量可在约1:1-约1:1.5范围内变化。不受理论限制,某些因素可导致观察到组内一种扩增核酸的量可不同于组内另一种扩增核酸的量,即使样品中携带各扩增核酸的染色体数量大致相等。这些因素可包括不同扩增效率和/或实验设计意图之外的染色体扩增。
在以基本可重复水平扩增该物质的条件下扩增组内各扩增核酸。如本文所用术语“基本可重复的水平”指对于每单位核酸(例如,每单位含有特定扩增核酸的核酸)的特定扩增核酸的扩增水平的一致性。在某些实施方式中,在分解产生特定扩增核酸物质的核酸量(例如,按核酸含量标准化)后,基本可重复的水平变动约1%或更低。在一些实施方式中,在分解产生特定扩增核酸物质的模板核酸量后,基本可重复的水平变动10%、5%、4%、3%、2%、1.5%、1%、0.5%、0.1%、0.05%、0.01%、0.005%或0.001%。或者,任意两次或更多次扩增水平测量的基本可重复的等比中数在给定等比中数的特定变异系数(“CV”)内。这种CV可以是20%或更少,有时10%或更少,和有时5%或更少。所述两次或更多次扩增水平测量可以在两次或更多次反应和/或两种或更多种相同样品类型(例如两种正常样品或两种三体性样品)之间测定。
引物
提供了用于检测、定量、扩增、测序和分析核酸的引物。在一些实施方式中,使用引物组,其中所述组包含至少一对引物。在一些实施方式中,引物组可以包含第三或第四核酸(例如两对引物,或例如巢式引物组)。在某些实施方式中,多个引物对可构成引物组(例如,约2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100对)。在一些实施方式中,可使用多个引物组,每组包含(多个)引物对。本文中所用的术语“引物”指所含核苷酸序列能在特定感兴趣区域处或附近(如邻接)与靶标核酸杂交或退火的核酸。例如,引物可供特异性测定靶标核酸核苷酸序列或检测靶标核酸序列(例如有或没有某序列或某序列的拷贝数)或其特征。引物可以是天然发生的或合成的。如本文所述术语“特异”或“特异性”指一个分子与另一分子的结合或杂交,例如靶标多核苷酸之于引物。即,“特异”或“特异性”指两个分子间识别、接触与形成稳定的复合物,相比之下这两个分子中任一分子与其它分子的识别、接触或复合物形成显著较低。本文中所用术语“退火”指两个分子间形成稳定的复合物。当指引物时,术语“引物”、“寡”、或“寡核苷酸”可在文中互换使用。
引物核酸可采用合适方法设计并合成,并可具有适合与感兴趣核苷酸序列(例如,核酸在液相中或结合于固体支持物)杂交并进行本文所述分析方法的任意长度。可以根据靶标核苷酸序列设计引物。在一些实施方式中,引物可以长约10-约100个核苷酸、约10-约70个核苷酸、约10-约50个核苷酸、约15-约30个核苷酸、或约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸。引物可由天然发生和/或非天然发生的核苷酸(例如带标记的核苷酸)或其混合物组成。适用于本文所述实施方式的引物可采用已知技术合成并标记。寡核苷酸(例如,引物)可按固相亚磷酰胺三酯法化学合成,该方法首先由Beaucage和Caruthers在Tetrahedron Letts.22:1859-1862(1981)中描述,按Needham-VanDevanter等在Nucleic Acids Res.12:6159-6168,1984中所述用自动合成仪化学合成。寡核苷酸的纯化可通过天然丙烯酰胺凝胶电泳或通过阴离子交换高效液相色谱(HPLC)实现,例如,如Pearson和Reanier在J.Chrom.255:137-149(1983)中所述。
在一些实施方式中,引物核酸序列(天然发生或合成)的全部或部分可与靶标核酸基本互补。本文所述关于序列的“基本互补”是指能够相互杂交的核苷酸序列。可改变杂交条件的严谨性以容许不同量的序列错配。包括对应物、靶标和捕获核苷酸序列的区域之间具有55%或更高、56%或更高、57%或更高、58%或更高、59%或更高、60%或更高、61%或更高、62%或更高、63%或更高、64%或更高、65%或更高、66%或更高、67%或更高、68%或更高、69%或更高、70%或更高、71%或更高、72%或更高、73%或更高、74%或更高、75%或更高、76%或更高、77%或更高、78%或更高、79%或更高、80%或更高、81%或更高、82%或更高、83%或更高、84%或更高、85%或更高、86%或更高、87%或更高、88%或更高、89%或更高、90%或更高、91%或更高、92%或更高、93%或更高、94%或更高、95%或更高、96%或更高、97%或更高、98%或更高、或者99%或更高的互补性。
与靶标核酸序列基本互补的引物也与靶标核酸序列的互补体基本一致。即,引物与所述核酸的反义链基本相同。本文所述关于序列的“基本相同”是指核苷酸序列彼此间的相同性为55%或更高、56%或更高、57%或更高、58%或更高、59%或更高、60%或更高、61%或更高、62%或更高、63%或更高、64%或更高、65%或更高、66%或更高、67%或更高、68%或更高、69%或更高、70%或更高、71%或更高、72%或更高、73%或更高、74%或更高、75%或更高、76%或更高、77%或更高、78%或更高、79%或更高、80%或更高、81%或更高、82%或更高、83%或更高、84%或更高、85%或更高、86%或更高、87%或更高、88%或更高、89%或更高、90%或更高、91%或更高、92%或更高、93%或更高、94%或更高、95%或更高、96%或更高、97%或更高、98%或更高、或者99%或更高。确定两个核苷酸序列之间是否基本相同的一种测试是测定共享相同核苷酸序列的百分比。
引物序列和长度可能会影响与靶标核酸序列的杂交。根据引物和靶标核酸之间的错配度,可采用低、中、高的严紧条件实现引物/靶标的退火。本文所用术语“严紧条件”指杂交和洗涤的条件。杂交反应温度条件优化的方法为本领域技术人员已知,可参见纽约约翰韦利父子公司(John Wiley&Sons,N.Y.)出版的Current Protocols inMolecular Biology(《新编分子生物学实验指南》)中6.3.1-6.3.6部分(1989年)。该文献中所述的水性和非水性方法均可采用。严紧杂交条件的非限制性例子是:约45℃下在6X氯化钠/柠檬酸钠(SSC)中杂交,然后在50℃下用0.2X SSC、0.1% SDS洗涤一次或多次。严紧杂交条件的另一个例子是:约45℃下在6X氯化钠/柠檬酸钠(SSC)中杂交,然后在55℃下用0.2X SSC、0.1% SDS洗涤一次或多次。严紧杂交条件的另一个例子是:约45℃下在6X氯化钠/柠檬酸钠(SSC)中杂交,然后在60℃下用0.2XSSC、0.1% SDS洗涤一次或多次。严紧杂交条件通常是:约45℃下在6X氯化钠/柠檬酸钠(SSC)中杂交,然后在65℃下用0.2X SSC、0.1% SDS洗涤一次或多次。更常见地,严紧条件是在65℃下用0.5M磷酸钠、7% SDS处理,然后在65℃下用0.2X SSC、1% SDS洗涤一次或多次。也可通过添加某些有机溶剂如甲酰胺来改变(即降低)严紧杂交温度。有机溶剂(如甲酰胺)降低双链多核苷酸的热稳定性,使得杂交可在较低的温度下进行同时仍能保持严谨条件并延长可能不耐热的核酸的使用寿命。
如本文所用表述“杂交”或其语法变形指在低、中、高严紧条件或在核酸合成条件下第一核酸分子与第二核酸分子的结合。杂交可包括第一核酸分子与第二核酸分子结合的情况,其中所述第一与第二核酸分子互补。如本文所用“特异性杂交”指在核酸合成条件下,相较与不具互补序列的核酸分子的杂交,引物优先杂交具有与所述引物互补序列的核酸分子。例如,特异性杂交包含引物与跟引物互补的靶标核酸序列杂交。
在一些实施方式中,引物可包含能与固相核酸引物杂交序列互补或与固相核酸引物杂交序列基本互补的核苷酸亚序列(例如,比对时与引物杂交序列互补体的相同性约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%)。引物可含有与固相核酸引物杂交序列不互补或不是基本互补的核苷酸亚序列(例如,在所述与固相引物杂交序列互补或基本互补的引物的核苷酸序列的3’或5’端)。
在某些实施方式中,引物可以包含修饰,例如肌苷、脱碱基位点、锁核酸(lockednucleic acid)、小沟结合物、双链体稳定剂(如吖啶、亚精胺)、Tm改性剂或改变所述引物或探针结合属性的任意改性剂。
在某些实施方式中,引物可含有可检测分子或实体(例如,荧光团、放射性同位素、比色剂、颗粒、酶等)。在需要时,可利用本领域技术人员已知的任何方法修饰核酸以包含可检测标记。所述标记可作为合成的部分掺入,或在本文所述的任何方法使用所述引物之前掺入。标记的掺入可在液相或者固相中进行。在一些实施方式中,可检测的标记可用于检测靶标。在一些实施方式中,可检测的标记可用于定量分析靶标核酸(例如,测定特定序列或核酸物质的拷贝数)。本领域技术人员可适当选择并利用适用于检测系统中的相互作用或者生物活性的任何可检测的标记。可检测的标记的示例有:荧光标记如荧光素、罗丹明、及其它(例如Anantha等,Biochemistry(1998)37:2709 2714;和Qu和Chaires,Methods Enzymol.(2000)321:353 369);放射性同位素(例如125I、131I、35S、31P、32P、33P、14C、3H、7Be、28Mg、57Co、65Zn、67Cu、68Ge、82Sr、83Rb、95Tc、96Tc、103Pd、109Cd和127Xe);光散射标记(例如美国专利第6,214,560号、以及加州杰尼康科学公司(Genicon Sciences Corporation)的市售产品);化学发光标记和酶底物(例如二氧杂环丁烷和吖啶酯);酶或蛋白质标记(例如绿色荧光蛋白(GFP)、或其颜色变体、荧光素酶、过氧化物酶);其它生色标记或染料(例如菁),以及其它辅因子或生物分子如地高辛、链霉亲和素、生物素(例如,结合对的成员如生物素和亲和素)、亲和捕获部分等。在一些实施方式中,引物可以用亲和捕获部分标记。可检测的标记中还包括用于质量修饰以用质谱(例如基体辅助激光解吸/电离(MALDI)质谱和电喷雾(ES)质谱)检测的那些标记。
引物也可指与靶标核酸的亚序列或另一引物杂交,以促进检测引物、靶标核酸或两者(例如用分子信标检测)的多核苷酸序列。如本文所用术语“分子信标”指可检测分子,其中所述分子的可检测特性仅在某些特定条件下可被检测,从而使其能起到特异性和报道性信号的作用。可检测性质的非限制性例子有:光学性质、电学性质、磁力性质、化学性质和通过已知尺寸开口的时间和速度。
在一些实施方式中,分子信标可以是能形成茎环结构的单链寡核苷酸,其中环序列可与感兴趣的靶标核酸序列互补并侧接能形成茎的短互补臂。所述寡核苷酸可在一端用荧光团标记,在另一端用淬灭分子标记。在茎环构象中,通过与荧光共振能量转移或FRET中所见相似的长范围偶极-偶极偶联,来自受激发荧光团的能量转移至淬灭分子,并释放为热而非光。当环序列杂交特定靶标序列时,所述分子的两端分开,受激发荧光团的能量发射为光,产生可检测信号。分子信标提供附加优势,由于未杂交探针的自体淬灭本质而无需去除过量探针。在一些实施方式中,可通过调节环-靶标杂交和茎形成的相对强度将分子信标探针设计成区分或容忍所述环与靶标序列之间的错配。如本文所用术语“错配核苷酸”或“错配”指与靶标序列在该位置或某些位置不互补的核苷酸。探针可具有至少一个错配,但也可具有2、3、4、5、6或7个或更多错配核苷酸。
数据处理并鉴定是否存在遗传变异
已经计数的经定位的序列读数在本文中被称为原始数据,因为所述数据表示未处理的计数(如原始计数)。在一些实施方式中,数据组中的序列读数数据能经调整和/或再处理(如数学和/或统计学处理)和/或显示以帮助提供结果。本文所用的术语“调整”有时指对序列读数、数据组中数据和/或样品核酸的部分或全部的处理。任何合适的处理都能用于调整序列读数、数据组中数据和/或样品核酸的部分或全部。在一些实施方式中,对序列读数、数据组中数据和/或样品核酸的调整是选自下列的方法:过滤(如根据所选特性或变量除去数据的部分;除去重复序列,例如除去没有信息的箱或具有0个中值计数的箱)、调整(如根据G/C含量对数据的部分或全部重设比例和/或再加权,例如根据胎儿组分对数据的部分或全部重设比例和/或再加权),使用一个或多个估值器或统计学处理进行标准化(如针对胎儿基值对数据组中的全部数据作标准化)等。在某些实施方式中,调整和/或处理序列读数数据的部分,而在一些实施方式中,调整和/或处理序列读数数据的全部。
经调整或处理的序列读数、数据组中数据和/或样品核酸有时指导出(如计数的导出数、导出的数据、序列读数的导出数等)。计数、数据或序列读数的导出数经常通过对所述计数、数据或序列读数使用一种或多种数学和/或统计学处理来生成。本文所述或本领域已知的任何合适的数学和/或统计学处理都能用于生成导出的计数、数据或序列读数。能用于过滤、调整、标准化或处理计数、数据或序列读数以生成导出数的数学和/或统计学处理的非限定性示例包括平均、等比中数、中位、中值绝对偏差、本文所述和本领域已知的其它方法等或其组合。
在某些实施方式中,数据组(包括较大数据组)可得益于预处理以帮助进一步的分析。数据组的预处理有时涉及除去冗余的和/或无信息的基因组部分或箱(bin)(如具有无信息数据的箱、冗余定位的读数、具有0中值计数的基因组部分或箱、过高频出现或过低频出现的序列[如G/C序列]、重复序列)。不受理论限制,数据处理和/或预处理可以(i)除去噪声数据,(ii)除去无信息数据,(iii)除去冗余数据,(iv)降低较大数据组的复杂性,(v)对数据组中数据的部分或全部重设比例和/或再加权,和/或(vi)帮助所述数据从一种形式转化成一种或多种其它形式。当用于数据或数据组时,术语“预处理”和“处理”在本文中被统称为“处理”。在一些实施方式中,处理能使数据更易于被进一步分析,从而能生成结果。
本文所用的术语“噪声数据”指(a)分析或作图时在数据点之间有显著变化的数据,(b)有显著标准偏差的数据,(c)有显著的标准误差均值的数据等,及以上组合。由于起始材料(如核酸样品)的数量和/或质量,有时出现噪声数据,并且噪声数据有时作为制备或复制用于生成序列读数的DNA的方法的部分出现。在某些实施方式中,噪声来自使用基于PCR的方法制备时的过高频出现的某些序列。本文所述方法能降低或消除噪声数据的基值,从而降低噪声数据对所提供结果的影响。
本文使用术语“无信息数据”、“无信息箱”和“无信息基因组部分”指所具有的数值与预定的阈限值显著不同或落在预定限值范围外的基因组部分或其导出的数据。在一些实施方式中,常通过数学和/或统计学处理序列读数数据(如来自参照和/或对象)计算阈限值或值的范围,而在某些实施方式中,经处理以生成阈限值或值的范围的序列读数数据是序列读数数据(如来自参照和/或对象)。在一些实施方式中,通过计算原始计数或标准化计数分布的标准偏差和/或中值绝对偏差(如MAD)并使所述分布的标准偏差乘以代表被选作阈限值的标准偏差数目的常数(如3个标准偏差即乘以3)来获得阈限值,从而生成未确定性值。在某些实施方式中,在标准化处理之前、之后或作为标准化处理的一部分,除去超过经计算的不确定性阈限值或者超出阈限值范围的基因组部分的部分或全部。在一些实施方式中,在标准化或分级处理之前或作为所述处理的一部分,使超过经计算的不确定性阈限值或超出阈限值或原始数据点范围的基因组部分的部分或全部加权。本文描述了加权的示例。本文所用的术语“冗余数据”和“冗余定位读数”指鉴定为已经分配了基因组位置(如碱基位置)和/或算作基因组部分的样品源性序列读数。
任何合适的方法都能用于调整和/或处理的经计数、定位的本文所述的序列读数(如数据或数据组)。合适用于处理数据组的方法的非限定性示例包含过滤、标准化、加权、监测峰高、监测峰面积、监测峰边缘、测定面积比率、数据的数学处理、数据的统计学处理、数学算法的应用、采用固定变量的分析、采用优化变量的分析、对数据作图以鉴定模式或趋势以供其它处理等,及以上组合。在一些实施方式中,根据不同特点(如GC含量、重复序列、冗余定位读数、着丝粒区域、端粒区域等,及其组合)和/或变量(如胎儿性别、母亲年龄、母亲倍性、胎儿核酸基值百分比等及其组合)处理数据组。在某些实施方式中,处理本文所述的数据组能降低大数据组和/或复杂数据组的复杂性和/或维数。复杂数据组的非限定性示例包括由一个或多个测试对象和不同年龄与种族背景的多种参照对象生成的序列读取数据。在一些实施方式中,数据组能包含各测试对象和/或参照对象的数千到数百万的序列读数。
在某些实施方式中,数据调整和/或处理能以任何合适的步骤数进行,而在那些步骤多于一步的实施方式中,所述步骤能以任何顺序进行。例如,在一些实施方式中,可以仅用单一处理方法调整和/或处理数据,而在某些实施方式中,可以使用1个或更多个、5个或更多个、10个或更多个或者20个或更多个步骤(如1个或更多个处理步骤、2个或更多个处理步骤、3个或更多个处理步骤、4个或更多个处理步骤、5个或更多个处理步骤、6个或更多个处理步骤、7个或更多个处理步骤、8个或更多个处理步骤、9个或更多个处理步骤、10个或更多个处理步骤、11个或更多个处理步骤、12个或更多个处理步骤、13个或更多个处理步骤、14个或更多个处理步骤、15个或更多个处理步骤、16个或更多个处理步骤、17个或更多个处理步骤、18个或更多个处理步骤、19个或更多个处理步骤或者20个或更多个处理步骤)处理数据。
在一些实施方式中,调整和/或处理步骤可以是重复两次或更多次(如过滤两次或更多次,标准化两次或更多次)的同一步骤,而在某些实施方式中,调整和/或处理步骤可以是同时或顺序进行的两种或更多种不同的调整/处理步骤(如除去重复序列、对GC含量作标准化;过滤、标准化;标准化、监测峰高和边缘;过滤、标准化、针对参照标准化、统计学处理以测定p值等)。在一些实施方式中,可使用相同或不同处理步骤的任意合适次数和/或组合来处理序列读数数据以帮助提供结果。在某些实施方式中,通过本文所述的标准加工数据组可降低数据组的复杂性和/或维数。在一些实施方式中,一个或多个处理步骤能包括一个或多个过滤步骤。
本文所用的术语“过滤”指按考虑(consideration)除去基因组部分或箱(bin)。能根据任意合适的标准选择需除去的箱,包括但不限于冗余数据(如冗余或重叠定位读数)、非信息数据(如有0中值计数的箱)、含有过高频出现或过低频出现序列的箱、噪声数据等,及以上组合。过滤方法经常涉及按考虑除去一个或多个箱,并从考虑的箱、一条或多条染色体或基因组的计数或总计中减去所选需除去的一个或多个箱中的计数。在一些实施方式中,箱能依次被除去(如一次一个以允许评价各个单独箱的去除效果),而在某些实施方式中,标记为需除去的所有箱能同时被除去。
在一些实施方式中,一个或多个调整/处理步骤能包括一个或多个标准化步骤。本文所用的术语“标准化”指一个或多个数据组除以预定变量。可使用任何合适的标准化次数。在一些实施方式中,数据组能经标准化1次或更多次、5次或更多次、10次或更多次或甚至20次或更多次。可使数据组针对表示任何合适特点或变量(如样品数据、参照数据或两者)的值(如标准化值)作标准化。可用的数据标准化类型的非限定性示例包括使一个或多个所选测试或参照基因组部分的原始计数数据针对定位到所选一个或多个基因组部分的所述染色体或全基因组的定位上的计数总数作标准化;使一个或多个所选的基因组片段的原始计数数据针对定位到一个或多个所选基因组片段的一个或多个基因组部分或所述染色体的中值参考计数作标准化;使原始计数数据针对前述经标准化的数据或其导出数作标准化;和使前述经标准化的数据针对一个或多个其它预定的标准化变量作标准化。根据所选作为预定标准化变量的特点或属性,使数据组标准化有时具有分离统计误差的作用。通过使数据转为常用级别(scale)(如预定的标准化变量),使数据组标准化有时也使级别不同的数据的数据特征具有可比性。在一些实施方式中,对统计学导出数值的一次或多次标准化可用于使数据差异最小化并减少异常数据(outlying data)的重要性。
在一些实施方式中,处理步骤包括加权。本文所用的术语“加权的”、“加权”或“加权函数”或其语法衍生形式或等同形式指对数据组的部分或全部的数学处理,所述数据组处理有时用于改变某些数据组特点或变量对其它数据组特点或变量的影响(如根据所选一个或多个箱中数据的质量或实用性,增加或减少一个或多个基因组部分或箱中所含数据的重要性和/或基值)。在一些实施方式中,加权函数能用于增加测量变量相对较小的数据的影响,和/或减少测量变量相对较大的数据的影响。例如,能对含有过低频出现或低量序列数据的箱“降加权(down weighted)”以最小化对数据组的影响,反之能对所选箱“升加权(up weighted)”以增加对数据组的影响。加权函数的非限定性示例是[1/(标准偏差)2]。加权步骤有时以与标准化步骤基本相似的方式进行。在一些实施方式中,使数据组除以预定变量(如加权变量)。经常选择预定变量(如最小化靶函数,Phi)对数据组的不同部分有区分地加权(如增加某些数据类型的影响,而降低其它数据类型的影响)。
在一些实施方式中,一个或多个调整/处理步骤能包含对G/C含量的调节。如本文所述,含高G/C含量的序列有时在原始或经处理数据组中过高频或过低频出现。在某些实施方式中,通过参考期望值对数据组的部分或全部作调整或标准化,调整数据组的部分或全都(如所选箱、所选染色体部分、所选染色体)的G/C含量以最小化或消除G/C含量偏好。在一些实施方式中,所述期望值是所述核苷酸序列读数的G/C含量,而在某些实施方式中,所述期望值是所述样品核酸的G/C含量。在一些实施方式中,使用一个或多个估计量对染色体的部分或全部计算期望值,所述估计量选自:平均、中值、中值绝对偏差(MAD)、标准偏差、z-分值、ANOVA等。在一些实施方式中,调整数据组的部分或全部以降低或消除G/C含量偏好的影响能帮助提供结果,和/或降低数据组的复杂性和/或维数。
能通过对计数经定位的序列读数数据的一种或多种处理生成经调整/标准化的数据组。比对序列读数,并测定定位到各基因组箱上的序列标签数目(如计数)。在某些实施方式中,使序列读数定位到母方基因组,从而使用母方基因组的倍性作为鉴定胎儿基因组中偏离一个或多个所选基因组部分的预期染色体代表值的区域的筛选器或参照。在一些实施方式中,定位之前,重复掩蔽(masking)调整数据组以除去无信息和/或重复的基因组部分,而在某些实施方式中,定位之前,重复掩蔽调整参照基因组。进行任一掩蔽方法都生成基本相同的结果。在一些实施方式中,在调整G/C含量之前重复掩蔽调整数据组,而在某些实施方式中,在重复掩蔽调整之前调整数据组的G/C含量。调整后,通常对剩余计数求和以生成经调整的数据组。在某些实施方式中,数据组调整帮助分级和/或提供结果。在一些实施方式中,经调整的数据组分布由经调整的数据组生成,并且用于帮助分级和/或提供结果。
作为非限定性示例,可通过以下方式从原始序列读数数据中生成经调整/标准化的数据组:(a)获得来自一个或多个流动槽的所有样品或来自一个或多个平皿的所有样品的全部染色体、所选染色体、基因组部分和/或其一部分的总计数;(b)调整、过滤和/或除去以下一种或多种:(i)无信息和/或重复的基因组部分(如实施例2所述的重复遮蔽(masking))、(ii)G/C含量偏好、(iii)过高频或过低频出现的序列、(iv)噪声数据;和(c)参照所选染色体或所选基因组定位的期望值对(b)中剩余数据的部分或全部进行调整/标准化,从而生成经调整的/标准化的值。在一些实施方式中,对以下一种或多种:(i)无信息和/或重复的基因组部分(如重复遮蔽(masking)、(ii)G/C含量偏好、(iii)过高频或过低频出现的序列、(iv)噪声数据的调整、过滤和/或除去能以任意顺序进行(如(i);(ii);(iii);(iv);(i)、(ii);(ii)、(i);(iii)、(i);(ii)、(iii)、(i);(i)、(iv)、(iii);(ii)、(i)、(iii);(i)、(ii)、(iii)、(iv);(ii)、(i)、(iii)、(v);(ii)、(iv)、(iii)、(i);等)。在一些实施方式中,通过一种方法调整的序列能影响通过不同方法基本完全调整的序列的部分(如G/C含量偏好调整有时除去通过重复遮蔽基本完全除去序列的至多50%)。
在某些实施方式中,处理步骤能包括一种或多种数学和/或统计学处理。任意合适的数学和/或统计学处理可以单一或联合用于分析和/或处理本文所述的数据组。能使用任意合适次数的数学和/或统计学处理。在一些实施方式中,数据组可经数学和/或统计学处理1次或多次、5次或更多次、10次或更多次或者20次或更多次。能使用的数学和统计学处理的非限定性示例包括加法、减法、乘法、除法、代数函数、最小二乘估计、曲线拟合、微分方程、有理多项式、二重多项式、正交多项式、z-分值、p值、chi值、phi值、峰高程分析、确定峰边缘位置、计算峰面积比、分析中值染色体升高、计算平均绝对偏差、残差平方和、平均、标准偏差、标准误等,或其组合。能对序列读取数据或其经处理的结果的全部或部分进行数学和/或统计学处理。可经统计学处理的数据组变量或特征的非限定性示例包括原始计数、过滤计数、标准化计数、峰高、峰宽、峰面积、峰边缘、侧向公差、P值、中值高程、平均高程、基因组区域内的计数分布、核酸种类的相对值表示等,或其组合。
在一些实施方式中,处理步骤能包括使用一种或多种统计学算法。任意合适的统计学算法都可以单一或联合用于分析和/或处理本文所述的数据组。可使用任何合适的统计学算法次数。在一些实施方式中,能使用1次或更多次、5次或更多次、10次或更多次或者20次或更多次统计学算法来分析数据组。合适伴随本文所述方法使用的统计学算法的非限定性示例包括决策树、计数空值(counternull)、多重比较、综合检验、贝伦斯-费希尔问题、拔靴法(bootstrapping)、结合显著性独立测试的Fisher方法、零假设、I型误差、II型误差、精确检验、单样本Z检验、双样本Z检验、单样本t检验、配对t检验、有相等方差的双样本合并t检验、有不相等方差的双样本未合并t检验、单比例z检验、合并的双比例z检验、未合并的双比例z检验、单样本卡方检验、有相等方差的双样本F检验、置信区间、可信区间、显著性、元分析(meta-analysis)、简单线性回归、强线性回归等,或前述组合。能使用统计学算法分析的数据组变量或特征的非限定性示例包括原始计数、过滤计数、标准化计数、峰高、峰宽、峰边缘、侧向公差(lateral tolerance)、P值、中值高程、平均高程、基因组区域内的计数分布、核酸种类的相对值表示等,或其组合。
在一些实施方式中,分析和处理数据能包括使用一个或多个假设。任何合适的假设数目或类型能用于分析或处理数据组。能用于数据处理和/或分析的假设的非限定性示例包括母方倍性、胎儿基值、参照群中某些序列的普遍性、种族背景、相关家族成员中选择的医学病情的患病率、来自不同患者和/或GC标准化和重复掩蔽(如GCRM)后的运行的原始计数分布之间的对应性、代表PCR人造产物的相同匹配(如相同的碱基位置)、胎儿定量试验(如FQA)中的内在假定、关于双胞胎的假定(例如若有2个双胞胎并且仅有1个受影响,则有效胎儿占比仅是全部测量的胎儿占比的50%(三胞胎、四胞胎等也与之相似))、均一覆盖全基因组的胎儿无细胞DNA(如cfDNA)等,及其组合。
在经定位的序列读数的质量和/或深度不能在所需置信水平(如95%或更高的置信水平)预测是否存在遗传变异的结果的那些示例中,根据标准化的计数分布,可使用一种或多种额外数学处理算法和/或统计学预测算法以生成可用于数据分析和/或提供结果的额外数值。本文所用的术语“标准化的计数分布”指使用标准化的计数生成的分布。本文描述了能用于生成标准化计数和标准化计数分布的方法示例。可使所述已经计数的定位的序列读数相对于测试样品计数或参照样品计数作标准化。在一些实施方式中,标准化计数分布能以图示表示。
如上所述,数据有时从一种形式转化成另一种形式。本文使用术语“转化的”、“转化”和其语法衍生形式或等同形式指从物理起始材料(如测试对象和/或参照对象样品核酸)变成物理起始材料的数字表现(如序列读数数据)的数据变化,而在一些实施方式中,其包括将所述数字表示进一步转化成能用于提供结果的一种或多种数值或图示。在某些实施方式中,所述数字形式表示的数据的一种或多种数值或图示能用于表示测试对象的物理基因组的显示(如虚拟表示或直观表示是否存在基因组插入或基因组删除;表示是否存在与医学病症相关联的序列的物理量变化)。有时将虚拟表示进一步转化成所述起始材料的数字表示的一种或多种数值或图示。这些方法能把物理起始材料转化成数值或图示,或者表示测试对象基因组的物理存在。
在一些实施方式中,转化数据组通过降低数据复杂性和/或数据维数来帮助提供结果。有时在将物理起始材料转化成所述起始材料的虚拟表示(如物理起始材料的序列读数表示)的处理过程中降低数据组复杂性。任意合适的特性或变量都能用于降低数据组的复杂性和/或维数。能选择用作数据处理的靶标特征的特征的非限定性示例包括GC含量、胎儿性别预测、染色体非整倍性鉴定、特定基因或蛋白质鉴定、癌症鉴定、疾病、遗传基因/性状、染色体异常、生物学分类、化学分类、生物化学分类、基因或蛋白质分类、基因本体学(gene ontology)、蛋白质本体学(protein ontology)、共调基因、细胞信号转导基因、细胞循环基因、与前述基因有关的蛋白质、基因变异、蛋白质变异、共调基因、共调蛋白、氨基酸序列、核苷酸序列、蛋白质结构数据等,及以上组合。降低数据组复杂性和/或维数的非限定性示例包括:使多重序列读数简化为分布图,使多重序列读数简化为数值(如标准化的值、Z-分值、p值);使多种分析方法简化为概率图或单点;对导出的量进行主成分分析等或其组合。
本文所用的术语染色体异常的“检测"指通过处理来自本文所述序列分析获得的数据来鉴定遗传变异(如染色体失衡)。在某些方面,遗传变异(如染色体异常)的检测能包括提供确定是否存在所述变异结果。关于是否存在遗传变异的结果可以任意适当形式表示,包括但不限于:与对象或样品存在遗传变异相关的概率(例如,让步比、p值)、可能性、百分比、过阈值或风险因子。在某些实施方式中,可用灵敏度、特异性、标准偏差、变异系数(CV)和/或置信水平或其组合中的一种或多种来提供结果。
结果
数据的分析、调整和处理能提供一种或多种结果。本文所用的术语“结果”指帮助确定对象是否有遗传变异或有遗传变异风险的数据调整和处理的结果。结果常包括在关于概率或估计值的一种或多种考虑的前提下使用本文所述的调整/处理方法生成的一个或多个数值。关于概率的考虑包括但不限于:测量变化、置信水平、灵敏度、特异性、标准偏差、变异系数(CV)和/或置信水平、Z-分值、强Z-分值、染色体表示百分比、中值绝对偏差、或中值绝对偏差的替代、Chi值、Phi值、倍性值、胎儿占比、拟合的胎儿占比、面积比、中值高程等或其组合。关于概率的考虑能帮助确定对象是否有遗传变异的风险或有遗传变异,而是否存在遗传疾病的决定性结果常包括这种考虑。在一些实施方式中,结果包括在样品核酸(如上述)中分解胎儿核酸占比。
结果经常是有相关置信水平的表型(如胎儿21三体性呈阳性,其置信水平为99%;测试对象为遗传变异相关癌症阴性,其置信水平为95%)。生成结果值的不同方法有时可产生不同类型结果。通常,基于使用本文所述方法生成的结果值有四种可能的评分或判定:真阳性、假阳性、真阴性和假阴性。本文所用的术语“评分”、“分数”、“判定”指就对象/样品中是否存在特定遗传变异的概率的计算。分值可用来确定,例如,可与遗传变异相对应的定位的序列读数的变化、差异或比例。例如,关于参照基因组,对数据组的所选遗传变异或基因组部分计正分能引导鉴定是否存在遗传变异,所述遗传变异有时与医学病症相关联(如癌症、先兆子痫、三体性、单体性等)。在某些实施方式中,由调整的数据组生成结果。在一些实施方式中,提供的确定是否存在遗传变异和/或胎儿非整倍性的结果是基于标准化的样品计数。在一些实施方式中,结果包括分布情况。在那些结果包括分布情况的那些实施方式中,可就结果使用任何合适的分布情况或分布情况组合。能就结果使用的分布情况的非限定性示例包含z-分值分布、强Z-分值分布、p值分布、chi值分布、phi值分布等,及其组合。
用于确定是否存在遗传变异而生成的结果有时包括零(null)结果(如两个簇之间的数据点,包括存在和缺失的遗传变异的值的有标准偏差的数值,分布图与有或没有所研究的遗传变异的对象的分布图不相似的的数据组)。在一些实施方式中,指示零结果的结果仍然是确定结果,而所述确定可包含以供确定是否存在遗传变异的对其它信息和/或重复数据生成和/或分析的需要。
在一些实施方式中,在进行本文所述一个或多个处理步骤后能生成结果。在某些实施方式中,结果作为本文所述处理步骤之一的结果生成,而在一些实施方式中,在数据组的各统计学和/或数学处理进行之后,能生成结果。关于确定是否存在遗传变异的结果能以任意形式表示,所述形式包括但不限于与对象或样品中遗传变异存在与否相关的概率(如让步比、p值)、可能性、簇内或簇外值、过阈或阈下值、有方差或置信测量的值或风险因子。在某些实施方式中,样品之间的比较使得确证样品鉴定(如使得鉴定重复样品和/或混合起来的多种样品(如错误标记、组合等))。
在一些实施方式中,结果包含高于或低于预定阈值或限值的值(如大于1、小于1),和与所述值相关联的不确定性或置信水平。结果也能描述用于数据处理的任意假定。在某些实施方式中,结果包含落在值预定范围内或外的值,和该值在所述范围内或外的相关不确定性或置信水平。在一些实施方式中,结果包含的值等于预定值(如等于1、等于0),或等于预定值范围内的值,以及其等于或者在范围内或外的相关不确定性或置信水平。结果有时以图(如分布图)来图示显示。
如上所述,结果能表征为真阳性、真阴性、假阳性或假阴性。本文所用的术语“真阳性”指对象被正确诊断为具有遗传变异。如本文所用术语“假阳性”指对象被错误鉴定为具有遗传变异。如本文所用术语“真阴性”指对象被正确鉴定为不具有遗传变异。如本文所用术语“假阴性”指对象被错误鉴定为不具有遗传变异。可根据发生比例对任何给定方法计算两种性能度量:(i)灵敏度值,通常是被正确鉴定为阳性的预测阳性部分;和(ii)特异性值,通常是被正确鉴定为阴性的预测阴性部分。本文所用的术语“灵敏度”指真阳性的数量除以真阳性数量与假阴性数量之和,其中灵敏度(sens)可在0≤sens≤1范围内。理想地,假阴性数量等于0或接近0,从而若对象事实上具有至少一种遗传变异,则没有对象被错误鉴定为不具有至少一种遗传变异。相反,通常评估预测算法正确分类阴性的能力,这是灵敏度的互补度量。如本文所用术语“特异性”指真阴性的数量除以真阴性数量与假阳性数量之和,其中特异性(spec)可在0≤spec≤1范围内。理想地,假阳性数量等于0或接近0,从而若对象不具有所评价的遗传变异,则没有对象被错误鉴定为具有至少一种遗传变异。
在某些实施方式中,灵敏度、特异性和/或置信水平中的一个或多个表示为百分数。在一些实施方式中,独立地对应各变量的百分数大于约90%(例如,约90、91、92、93、94、95、96、97、98或99%,或大于99%(例如,约99.5%或更高,约99.9%或更高、约99.95%或更高、约99.99%或更高))。在一些实施方式中,变异系数(CV)表示为百分数,有时所述百分数为约10%或更低(例如,约10、9、8、7、6、5、4、3、2或1%,或低于1%(例如,约0.5%或更低、约0.1%或更低、约0.05%或更低、约0.01%或更低))。在某些实施方式中,概率(如特定结果不是由于偶然)被表示为Z-分值、p值或t检验的结果。在一些实施方式中,结果的测量方差、置信区间、灵敏度、特异性等(如通称为置信参数)能使用本文所述的一种或多种数据处理操作来生成。
有时选择灵敏度和特特异性等于1、或100%、或接近1(如约90%-约99%)的方法。在一些实施方式中,选择灵敏度等于1或100%的方法,而在某些实施方式中,选择灵敏度接近1(如灵敏度约90%、灵敏度约91%、灵敏度约92%、灵敏度约93%、灵敏度约94%、灵敏度约95%、灵敏度约96%、灵敏度约97%、灵敏度约98%或灵敏度约99%)的方法。在一些实施方式中,选择特异性等于1或100%的方法,而在某些实施方式中,选择特异性接近1(如特异性约90%、特异性约91%、特异性约92%、特异性约93%、特异性约94%、特异性约95%、特异性约96%、特异性约97%、特异性约98%或特异性约99%)的方法。
在一些实施方式中,根据定位的测序读数或其导出的结果确定是否存在表1A和1B中列举的一种或多种病症、症状或异常(如染色体异常(如三体性))。在某些实施方式中,使用本文所述一种或多种数据处理方法生成的结果确定是否存在表1A和1B中列举的一种或多种病症、症状或异常。在一些实施方式中,确定是否存在病症、症状或异常的结果是或包括对表1A和1B中列举的病症、症状或异常的检测。
在某些实施方式中,结果基于以下两者的比较:测试样品和参照样品(如母方参照);测试样品和其它样品;两个或多个测试样品等;及其组合。在一些实施方式中,样品之间的比较帮助提供结果。在某些实施方式中,结果基于如本文所述或本领域已知生成的Z-分值。在一些实施方式中,Z-分值使用标准化的样品计数生成。在一些实施方式中,生成以帮助提供结果的Z-分值是使用强估计值生成的强Z-分值。在某些实施方式中,结果基于标准化的样品计数。
一个或多个结果生成之后,结果经常用于提供对是否存在遗传变异和/或相关医学病症的确定。结果通常提供给健康护理专业人员(如实验室技术人员或管理者;医师或助手)。在一些实施方式中,确定是否存在遗传变异的结果以报告形式提供给健康护理专业人员,而在某些实施方式中,所述报告包含显示结果值和相关置信参数。通常,结果能以帮助确定是否存在遗传变异和/或医学病症的任意合适的格式显示。合适用于报告和/或显示数据组或报告结果的格式的非限定性示例包含数字数据、曲线图、2D图、3D图、和4D图、图片、象形图、图表、条线图、饼图、线图、流程图、散点图、图谱、柱状图、密度图、函数图、线路图、框图、起泡图、星座图、轮廓图、统计图、蛛网图、维恩图、列线图等,及其组合。结果显示的多种示例示于图中,并且在实施例中描述。
结果的应用
接收包含确定是否存在遗传变异的一个或多个结果的报告的健康护理专业人员、或其他有资格的人员能使用报告中显示的数据做出关于测试对象或患者的状态判定。在一些实施方式中,健康护理专业人员能根据提供的结果给出建议。在一些实施方式中,健康护理专业人员或有资格的人员能向测试对象或患者提供关于是否存在遗传变异的判定或评分,所述判定或评分基于一个或多个结果值或报告中提供的相关置信参数。在某些实施方式中,通过可见观察提供的报告,由健康护理专业人员或有资格的人员人工做出判定或评分。在某些实施方式中,由自动化程序(有时编入软件)做出评分或判定,并且在由健康护理专业人员或有资格的人员复查准确性之后再向测试对象或患者提供信息。本文所用的术语“接收报告”指通过任意联系方式获得包含结果的书面和或图示表示,其经复查后供健康护理专业人员或其他有资格的人员就关于测试对象或患者中是否存在遗传变异作出决定。所述报告可以通过计算机或人工数据输入生成,并且能使用电子方式(如从一个网络地址向相同或不同物理位点的另一个地址通过因特网、通过计算机、通过传真),或者通过发送或接收数据的任意其他方法(如信件服务、快递服务等)传达。在一些实施方式中,所述结果以包括但不限于以语言、文档或文件形式的合适介质传递给健康护理专业人员。例如,所述文件可以是,但不限于,听觉文件、计算机可读文件、纸质文件、实验室文件或医学记录文件。
本文所用的术语“提供结果”及其语法等同形式也能指获得这种信息的任意方法,包括但不限于从实验室文件中获得信息。能通过实验室进行一种或多种试验或者一个或多个数据处理步骤生成实验室文件以确定是否存在所述医学病症。所述实验室可以和由所述实验室文件鉴定有或没有所述医学病症的人处于相同位置或不同位置(例如,在另一国家)。例如,所述实验室文件可在一个位置产生,然后传送到另一位置,其中的信息在后一位置被传送给妊娠妇女对象。在某些实施方式中,所述实验室文件可以是有形形式或电子形式(例如计算机可读形式)。
健康护理专业人员或有资格的人员能根据报告中提供的一个或多个结果提供任意合适的建议。能根据提供的结果报告提供建议的非限定性示例包括手术、放疗、化疗、遗传咨询、出生后治疗方案(如生命计划、长期辅助治疗、药物、对症治疗)、妊娠终止、器官移植、输血等,或前述组合。在一些实施方式中,所述建议依赖于提供的基于结果的分类(如唐氏综合征、特纳氏综合征、与T13遗传变异相关联的医学病症、与T18遗传变异相关联的医学病症)。
软件能用于进行本文所述方法的一个或多个步骤,包括但不限于:计数、数据处理、生成结果和/或根据生成的结果提供一个或多个建议。
机器、软件和接口
设备、软件和接口可以用于执行本文所述方法。使用设备、软件和接口,用户可以进入、请求、查询或测定用于使用特定信息、程序或方法的选项(如定位序列读数、处理定位的数据和/或提供结果),例如,所述信息、程序或方法可涉及实现统计学分析算法、统计学显著性算法、统计学算法、重复步骤、验证算法和图示显示。在一些实施方式中,数据组可以作为输入信息由用户输入,用户可以通过任意合适的硬件介质(如闪存)下载一个或多个数据组,并且/或者用户可以从一个系统向另一个系统发送数据组以供后续处理和/或提供结果(如从一个测序器向计算机系统发送序列读取数据以定位序列读数;向计算机系统发送定位的序列数据以处理和生成结果和/或报告)。
例如,用户可以向软件设置查询,所述软件随后可以通过因特网入口获得数据组,而在某些实施方式中,可指示可编程的处理器根据给定参数获得合适的数据组。可编程的处理器也可以提示用户选择由处理器在给定参数基础上所选的一个或多个数据组选项。可编程的处理器可以提示用户选择由所述处理器基于通过因特网、其它内部或外部信息等发现的信息所选的一个或多个数据组选项。可以选定选项以选择方法、设备或计算机程序的一个或多个数据特性选择、一种或多种统计学算法、一种或多种统计学分析算法、一种或多种统计学显著性算法、一种或多种强估计值算法、重复步骤、一种或多种确证算法和一种或多种图示显示。
本文所述的系统可以包括计算机系统的通用组件,例如网络服务器、笔记本系统、台式系统、手持系统、个人数字助理、计算机自助服务终端等。所述计算机系统可包含一种或多种输入方式,例如键盘、触摸屏、鼠标、语音识别或允许用户输入数据到系统内的其它方式。系统还可以包含一个或多个输出,包括但不限于显示屏(如CRT或LCD)、扬声器、传真机、打印机(如激光、喷墨、击打式、黑白或彩色打印机)或用于提供信息的视觉、听觉和/或硬拷贝输出(如结果和/或报告)的其它方式。
系统中,可使所述输入和输出方式连接中央处理单元,该单元可含有运行程序指令的微处理器和存储程序编码与数据的存储器和其它组件。在一些实施方式中,处理可作为位于单一地理位置的单用户系统实施。在某些实施方式中,处理可作为多用户系统实施。在多用户实施的情况中,可通过网络方式连接多个中央处理单元。所述网络可以是本地的、覆盖某建筑物的一个部分中单一部门、整个建筑物、跨多个建筑物、跨某区域、跨全国或全球的。所述网络可以是私有的、由提供商持有并控制或可以基于网络服务实施,其中用户接入网页以输入或获取信息。因此,在某些实施方式中,系统包含可由用户定位或遥控的一种或多种机器。用户可以访问在一个或多个位置的多于一台机器,并且数据可以以系列和/或平行方式作图和/或处理。因此,可利用任意合适的结构和控制来使用多机器绘图和/或处理数据,所述机器例如局部网络、远程网络和/或"云"计算机平台。
在一些实施方式中,设备可以包含置入本文所述计算机程序产品的基于网络的系统。基于网络的系统有时包含足以满足基于网络的功能的计算机、无线电通讯设备(如通信接口、路由器、网络开关)等。在某些实施方式中,基于网络的系统包含网络云计算、网络云存储或者网络云计算和网络云存储。本文所用的术语“网络云存储”指位于因特网虚拟服务器上的基于网络的数据存储。本文所用的术语“网络云计算”指远端网络环境中发生的基于网络的软件和/或硬件用法(如可用于位于远端服务器上的一些的软件)。在一些实施方式中,本文所述计算机程序产品的一种或多种功能置入网络环境中。
在一些实施方式中,系统能包含通信接口。通信接口使软件和数据能在计算机系统和一种或多种外部设备之间转移。通信接口的非限定性示例可包括调制解调器、网络接口(例如以太网卡)、通信端口、PCMCIA槽和卡等。经通信接口转移的软件和数据通常为信号形式,其可以是能被通信接口接收的电子、电磁、光学和/或其它信号。信号经常通过通道提供给通信接口。通道经常携带信号,并能采用导线或线缆、光纤、电话线、手机连接、RF连接和其它通信通道实现。因此,在一个实施例中,可采用通信接口接收能由信号检测模块测定的信号信息。
数据能由任意合适的设备和/或方法输入,所述设备和/或方法包括但不限于人工输入设备或直接数据输入设备(DDE)。人工设备的非限定性示例包括键盘、概念键盘、触敏屏、光笔、鼠标、轨迹球、操纵杆、图形平板、扫描仪、数码相较、视频数字化仪和语音识别设备。DDE的非限定性示例包括条形码扫描仪、磁条编码、智能卡、磁墨字符识别、光学字符识别、光学标记识别、和周转文件。
在一些实施方式中,测序设备的输出可以作为能通过输入设备输入的数据。在某些实施方式中,定位的序列读数可以作为能通过输入设备输入的数据。在某些实施方式中,模拟数据通过计算机虚拟(in silico)方法生成,并且所述模拟数据作为能通过输入设备输入的数据。术语“计算机虚拟(in silico)”指采用计算机进行的研究和实验。计算机虚拟方法包括但不限于根据本文所述方法的定位的序列读数和处理定位的序列读数。
系统可包含用于运行本文所述方法的软件,并且软件能包含用于运行这种方法的一种或多种模块(如数据采集模块、数据处理模块、数据显示模块)。术语“软件”指在计算机执行时进行计算机操作的计算机可读程序指令。术语“模块”指能用于较大软件系统的独立功能单元。例如,软件模块是执行特定方法和任务的程序的部分。
软件常在含有程序指令的程序产品上提供,所述指令记录在计算机可读介质上,包括但不限于,磁性介质包括软盘、硬盘和磁带;和光学介质包括CD-ROM盘、DVD盘、磁光盘和其它可记录所述程序指令的此类介质。在线执行中,由组织维持的服务器和网站能被设置成向远端用户提供软件下载,或者远端用户可以使用由组织维持的远端系统来远端获取软件。软件可以获得或接收输入信息。软件可以包含特定获得或接收数据的模块(如接收序列读取数据和/或定位的读取数据的数据接收模块)并且可以包含特定调整和/或处理数据的模块(如调整和/或处理数据的处理模块(如过滤器、标准化、提供结果和/或报告)。术语“获得”和“接收”输入信息指通过计算机通信方式从本地或远端位点、人工数据输入或任意其它接收数据的方法来接收数据(如序列读数、定位读数)。所述输入信息的产生位置可与其接收位置相同,或可在不同的位置产生并传输到接收位置。在一些实施方式中,在处理前改良输入信息(如置入可用于处理的模式(如列表))。
在一些实施方式中,提供了计算机程序产品,例如包含其上具有计算机可读程序的计算机可用介质、适于执行下列实施方法的计算机可读程序编码的计算机程序产品:(a)获取获自测试对象的样品核酸的序列读数;(b)将(a)中获得的序列读数定位到已知基因组,其中所述已知基因组已被分成多个基因组部分;(c)对定位到所述基因组部分内的序列读数计数;(d)通过调整(c)中所获基因组部分的计数或计数导出数生成经调整的数据组;和(e)由(d)中经调整的计数分布提供确定是否存在遗传变异的结果。
在某些实施方式中,软件能包含一种或多种算法。算法可以用于根据有限的序列指令来处理数据和/或提供结果或报告。算法经常是用于完成任务的定义指令表。从起始状态开始,所述指令可以描述通过定义的一系列连续的状况进行并且以最终结束状态终止的计算。从一个状态向下一个的转变并不必需是确定性的(如一些算法中加入随机性)。作为非限定性示例,算法能是搜索算法、分类算法、归并算法、数值算法、图解算法、字符串搜索算法、建模算法、计算几何(genometric)算法、组合算法、机器学习算法、密码术算法、数据压缩算法、分析算法等。算法能包含一种算法或者两种或更多种算法的组合应用。算法可以是任意合适的复杂性分类和/或参数化的复杂性。算法能用于计算和/或数据处理,而在一些实施方式中能用在确定性的或盖然论/预测方法中。算法能通过使用合适的程序语言(非限定性示例是C、C++、Java、Perl、Python、Fortran等)植入到计算机环境中。在一些实施方式中,算法能构建或改进成包含误差容限、统计学分析、统计学显著性和/或与其它信息或数据组的比较(如当使用神经网络或簇算法时的应用)。
在某些实施方式中,可将若干算法植入软件以便于使用。在一些实施方式中,这些算法可以用原始数据训练。对各种新的粗数据样品而言,所述经训练的算法可以生成代表性的经调整和/或处理的数据组或结果。相较经处理的父数据组(parentdata set)而言,经调整或处理的数据组有时复杂性降低。在一些实施方式中,基于经调整和/或处理的数据组,能根据灵敏度和特异性来评价经训练的算法的实现。在某些实施方式中,可以鉴定并利用有最高灵敏度和/或特异性的算法。
在某些实施方式中,模拟数据可协助数据调整和/或处理,例如通过算法的训练或算法的测试。在一些实施方式中,模拟数据包含不同组序列读数的多种假定取样。模拟数据可基于真实群体中可能的预期情况或可被歪曲以测试算法和/或分配正确的分类。本文中模拟数据也称为“虚拟”数据。在某些实施方式中,模拟能通过计算机程序进行。使用模拟数据组中的一个可能步骤是评价经鉴定结果的置信度,如随机取样匹配或最佳代表原始数据的良好程度。一种方法是计算概率值(p值),该值评估随机样品比选定样品更好的概率。在一些实施方式中,可以评价经验模型,其中假设至少一个样品与参照样品匹配(有或没有清晰变化)。在一些实施方式中,另一种分布如泊松分布能用于定义概率分布。
在某些实施方式中,系统可以包括一个或多个处理器。处理器可以与通信总线连接。计算机系统可包括主存储器(经常为随机读取存储器(RAM)),也可包括第二存储器。第二存储器可包括如硬盘驱动器和/或移动存储驱动器、光盘驱动器、存储卡等。移动存储驱动器经常读取和/或写入可移动的存储单元。可移动存储单元的非限定性示例包括能读取或写入例如移动存储驱动器的软盘、磁带、光盘等。可移动存储单元能包含其中存有计算机软件和/或数据的计算机可用存储介质。
处理器可以执行系统中的软件。在一些实施方式中,可以对处理器编程以自动运行本文所述用户可以进行的任务。因此,处理器或者由这种处理器执行的算法能几乎不需要监控至没有监控或者来自用户的输入(如可以编写软件以自动化实施功能)。在一些实施方式中,所述处理具有很大复杂性以至于单个个人或一组人不能在足够短的时间范围内实行所述处理以提供确定是否存在遗传变异的结果。
在一些实施方式中,第二存储器可包括允许计算机程序的其它相似方式或装载到计算机系统的其它指令。例如,系统能包含可移动存储单元和接口设备。这种系统的非限定性示例可包括程序模块和模块接口(例如视频游戏设备中发现的那种)、可移动存储芯片(例如EPROM或PROM)以及关联插座和允许软件和数据从可移动存储单元转移到计算机系统的其它可移动存储单元和接口。
联合诊断试验
本文该部分所述试验的结果能与一种或多种其它试验(在本文中被称为“次级试验(secondary assay)”)组合,所述试验组合的结果能用于鉴定是否存在非整倍性。本文所述非侵入性试验的结果可以与一种或多种其它非侵入性试验和/或一种或多种侵入性试验的结果组合。在某些实施方式中,当样品包含的胎儿核酸的量低于某个阈值量时,使次级试验的结果与上述非侵入性试验的结果组合。在某些实施方式中,胎儿核酸的阈值量有时是约15%。
在一些实施方式中,本文该部分所述非侵入性试验可以与次级核酸等位基因计数试验组合。诊断、监测或预测染色体异常中所用的等位基因方法依赖于测定包含游离胎儿核酸的母方样品中发现的等位基因的比率。等位基因的比率指生物样品中一个等位基因的群和其它等位基因的群的比率。在一些示例中,可能在三体性情况中,胎儿就特定基因座而言可以是三重等位基因的,并且可以检测这些三重等位基因事件以诊断非整倍性。在一些实施方式中,次级试验检测母方等位基因,而在某些实施方式中,经次级试验中检测,母亲在多态性位点是纯合的,但胎儿在多态性位点是杂合的。在有关实施方式中,首先测定母亲的基因型(例如使用母方全血样品中的外周血单核细胞(PBMC))以测定次级试验中将由剪切试剂靶定的非靶标等位基因。
在某些实施方式中,可使本文所述非侵入性试验与次级RNA诊断方法组合。诊断、监测或预测染色体异常中所用的RNA方法常依赖于使用胎儿表达转录体的妊娠特异性以开发允许遗传测定胎儿染色体非整倍性并因而建立其非侵入性诊断法的方法。在一个实施方式中,胎儿表达的转录体是在胎盘中表达的那些。特别地,次级试验可以检测由非整倍体染色体上基因编码的组织特异性表达模式的RNA转录体的一种或多种单核苷酸多态性(SNP)。其它多态性也可以由次级试验检测,所述次级试验例如插入/缺失多态性和单串联重复多态性。可通过次级试验中感兴趣基因座转录的RNA上的信息SNP之间比率的评价来测定胎儿状态。感兴趣基因座可以包括但不限于次级试验中的COL6A1、SOD1、COL6A2、ATP5O、BTG3、ADAMTS1、BACE2、ITSN1、APP、ATP5J、DSCR5、PLAC4、LOC90625、RPL17、SERPINB2或COL4A2。
在一些实施方式中,本文所述非侵入性试验可以与次级甲基化试验组合。甲基化测试有时就母方血浆检测而言,用于检测胎儿特异性DNA甲基化标志物。已经证明胎儿和母方DNA能通过甲基化状态差异来区分(见2005年8月9日提交的美国专利号6,927,028)。甲基化是一种表观遗传学现象,指改变表型而不涉及DNA序列变异的过程。Poon等还显示表观遗传学标志物能用于检测母方血浆中的胎儿源性的母性遗传DNA序列(Clin.Chem.48:35-41,2002)。表观遗传学标志物可以通过测定血液样品中不同甲基化基因的至少部分甲基化状态用于非侵入性产前诊断,其中来自胎儿的差别的甲基化基因部分和来自妊娠妇女的部分被差别甲基化,从而区分所述血液样品中来自所述女性的基因和来自所述胎儿的基因;测定所述胎儿基因的水平;和使所述胎儿基因水平与标准对照作比较。在一些示例中,相较于标准对照的增加指示妊娠相关疾病的存在或发展。在其它示例中,相较于标准对照的降低指示妊娠相关疾病的存在或发展。
在某些实施方式中,本文所述非侵入性试验可以与另一个次级分子试验组合。还已知用于诊断非整倍体的其它分子方法(Hulten等,2003,Reproduction,126(3):279-97;Armour等,2002,Human Mutation 20(5):325-37;Eiben和Glaubitz,J HistochemCytochem.2005年3月;53(3):281-3);和Nicolaides等,J Matern Fetal Neonatal Med.2002年7月;12(1):9-18))。替代性的分子方法包括PCR方法,例如QF-PCR(Verma等,1998,Lancet 352(9121):9-12;Pertl等,1994,Lancet 343(8907):1197-8;Mann等,2001,Lancet 358(9287):1057-61;Adinolfi等,1997,Prenatal Diagnosis 17(13):1299-311)、多重可扩增探针杂交(MAPH)(Armour等,2000,Nucleic Acids Res 28(2):605-9)、多重探针连接试验(MPLA)(Slater等,2003,J Med Genet 40(12)907-12;Schouten等,200230(12:e57),这些全部通过应用纳入本文。非PCR技术例如比较基因组杂交(CGH)提供了对非整倍性检测的另一种方法(Veltman等,2002,Am J Hum Genet70(5):1269-76;Snijders等,2001 Nat Genet 29(3):263-4)。
在一些实施方式中,本文所述非侵入性试验可以与次级非核酸染色体测试组合。非核酸测试的非限定性示例包括但不限于侵入性羊膜穿刺术或绒毛膜取样测试、母方年龄测试、生物标志物筛选测试和超生波测试。检测核酸(如胎儿或母方)时,可以进行生物标志物筛选测试。然而,认为本文所用的“生物标志物测试”是非核酸测试。
羊膜穿刺和绒膜绒毛取样(CVS)测试提供了相对确定的胎儿非整倍体产前诊断,但是需要通过羊膜穿刺和绒膜绒毛取样(CVS)的侵入性取样。这些取样方法与妊娠丢失的0.5%-1%方法相关风险相关联(D′Alton,M.E.,Semin Perinatol18(3):140-62(1994))。
尽管使用与特异性非整倍性有关的不同方法,在唐氏综合征示例中,最初的筛选完全是基于母方年龄,采用任意(arbitrary)截留值为35岁用于定义处于足够高风险以许可提供侵入性胎儿测试的女性群体。
母方生物标志物根据母方生物体液的蛋白质组概况,提供了测试胎儿唐氏综合征和其它染色体非整倍体的另一个方案。本文所用的“母方生物标志物”指妊娠女性中存在的生物标志物,其经转录的mRNA水平或经翻译的蛋白质水平被检测并能与是否存在染色体异常相关联。
引入中三个月的血清筛选技术以提高检测率并降低侵入性测试率。对唐氏综合征筛选的一种类型需要提供患者15-18周妊娠中的三重标志物血清测试,其与母亲年龄一起用于风险计算。这个测试分析了甲胎蛋白(AFP)、人绒毛膜促性腺素(β-hCG)和未偶联雌激素三醇(uE3)。已将唐氏综合征的这个"三重筛选"改进成为"四重测试",其中所述血清标志物抑制素A与其它三个分析物联合测试。鉴定了多种妊娠关联蛋白和激素在头三个月的浓度以区分染色体正常和异常妊娠。能用于测试唐氏综合征和爱德华氏综合征的两种头三个月血清标志物是PAPP-A和游离β-绒毛膜促性腺激素(free.beta.hCG)(Wapner,R.,等,N Engl J Med 349(15):1405-1413(2003))。报导了唐氏综合征中PAPP-A的头三个月的血清水平显著较低,并且这种降低与颈部透明层(NT)厚度无关(Brizot,M.L.等,Obstet Gynecol 84(6):918-22(1994))。另外,显示胎儿唐氏综合征中总体和游离β-人绒毛膜促性腺激素(free.beta.hCG)的头三个月的血清水平较高,而这种增加也与NT厚度无关(Brizot,M.L.,Br J Obstet Gynaecol102(2):127-32(1995))。
超生波测试提供了诊断染色体异常的非分子方法。某些胎儿结构异常与唐氏综合征和其它非整倍体风险的显著增加相关联。已实行其它工作以评价非整倍性的超声标志物的作用,所述标志物本身并非结构异常。用于唐氏综合征筛选的这种超声标志物包含脉络丛囊肿、肠管回声增强、短股骨、短肱部、最小肾盂积水和颈背部皱褶厚度。筛选MA和胎儿的头三个月的超声评价的组合报告了80%的唐氏综合征检测率(Pandya,P.P.等,Br J Obstet Gyneacol 102(12):957-62(1995);Snijders,R.J.等,Lancet 352(9125):343-6(1998))。这种评价依赖于测量胎儿颈背部和上方皮肤之间的半透明空隙,经报告其在有唐氏综合征和其它非整倍体的胎儿中有所增加。据报道这种颈部透明带(NT)的测量通过10-14周妊娠过程中的经腹或经阴道超声术获得(Snijders,R.J.等,Ultrasound Obstet Gynecol 7(3):216-26(1996))。
试剂盒
试剂盒经常包含含有一种或多种本文所述组分的一个或多个容器。试剂盒在任意数量的独立容器、包、管、小管、多孔板等中包含一种或多种组分,或者组分可以在这种容器中以不同组合合并。例如一种或多种下列组分可以包含在试剂盒中:(i)用于扩增核酸的一种或多种扩增引物和其它试剂,(ii)用于检测经扩增核酸的一种或多种试剂;(iii)用于进行大规模平行测序的一种或多种试剂和/或装置;(iv)用于定量妊娠妇女胞外核酸中的胎儿核酸的一种或多种试剂和/或装置;(v)用于富集源自妊娠妇女胞外核酸的胎儿核酸的试剂和/或装置;(vi)用于处理核苷酸测序和/或组装、比对和/或定位核苷酸序列的软件和/或机器;(vii)用于鉴定是否存在染色体异常的软件、机器和/或信息(如把信号文件或比率转化成结果的表格或文件),(viii)提取血液的装置;(ix)生成无细胞血液的装置;(x)用于从血浆、血清或尿中分离核酸(如DNA、RNA)的试剂;(xi)运输和/或处理中用以稳定血清、血浆、尿或核酸的试剂。
试剂盒有时与处理联用,并且能包括实行一种或多种处理的说明书和/或一种或多种组合物的说明。试剂盒可以用于进行本文所述的方法。说明书和/或说明可以是有形形式(如纸等)或电子形式(如有形介质(如压缩盘)等上的计算机可读文件),并且可以包括在试剂盒附件(kit insert)中。试剂盒也可以包含提供这些说明书或说明的因特网上的书面描述(如因特网的URL)。
实施例
下面提供的实施例仅用于说明而不是限定。
实施例1:使用母方DNA作为参照的胎儿非整倍性测定
提供了不利用任意等位基因(或其它遗传信息如插入、缺失、拷贝数变化等)而测定胎儿非整倍性的方法,所述等位基因独特遗传自父亲以有助于对包含循环无细胞胎儿(“ccff”)核酸的样品中存在的染色体数目染色体数目定量。这个方法就下文提出的原因保证胎儿染色体数目表现(如染色体的两个或三个拷贝)的精确测量。
使用来自母亲的核酸(经常是DNA)构建母方基因组的全部或部分的参照序列。母方DNA在妊娠前从血浆(或其它合适的生物样品)中分离,或者常在本次妊娠中(或之前)或本次妊娠后但后一次妊娠前从口颊拭子或皮肤细胞样品(或仅包含或主要包含母亲DNA,并且没有或检测不到或基本检测不到胎儿DNA的其它生物样品)中分离。使用待用的DNA序列读取器(DNA sequence reader)所用的标准方案将母方DNA转化成测序库。例如,可以使用亿明达(Illumina)公司试剂盒和方案构建母亲DNA库。如果来源是血浆,则通常不需要DNA片段化,因为用以生成库所需的片段大小天然存在于血浆中。如果所述来源是口颊拭子或其它合适的生物样品,则所述DNA通常在测序库构建之前使用例如亿明达公司的试剂和方案被片段化和大小分级。
所述母方样品使用基因组覆盖范围为0.1-20的标准36个碱基单末端读数来测序。理想上,所述覆盖足够高以通过与以更高覆盖率(即6-60倍覆盖率)下组装的已知DNA序列进行比对来实现母方读数的合理组装。理想地,所述参照基因组的种族背景与母亲相同。不需要生成完美比对的母方序列。母方序列读数分配给箱。箱是所述母方基因组的一些部分;例如本领域已知的染色体部分。记录在各个箱中的母方序列读数的定量丰度。
DNA经常按标准公开的方法(如美国专利号6,258,540)从妊娠妇女的血浆中分离。生成库且无需额外片段化,并通过使用例如36个碱基单末端读数的标准亿明达公司测序方法来测序。使所述读数经“blast程序比对”或与前面获得的母方序列进行比对以对染色体分配血浆或其它细胞外源性DNA序列读数。在这个方法中,能对特定染色体源分配各血浆DNA序列读数。
不像前述方法,经常要求所述母方参照序列和包含胎儿DNA的生物样品之间的完美序列匹配。这个方法使用第三方参照序列应该获得超过先前方法的效率,因为鉴于第三者参照序列之间的SNP或其它序列差异可以丢弃测序读数,而不丢弃所述母亲和胎儿序列。序列读数不包含与已算入的母方序列不同的父方遗传的SNP或其它序列差异,因为其绝不能完美匹配。因此,所有计算的读数是来自母方DNA、遗传自其母亲的胎儿DNA、或遗传自双亲之一但不能分辨来自哪一方的胎儿DNA(即父方DNA不包含独特的父方序列信息)的读数。
这个方法不同于前述那些使用能分配给独特父方源的DNA序列读数的方法。使各染色体箱中胎儿加母方读数的丰度与仅含母方DNA的参照序列样品的序列读数中观察到的丰度作比较。使来自母方和母方加胎儿样品的不同染色体箱群体对(即分配给)各染色体积累(如通过对各染色体关联的箱求和),并比较。样品对中染色体群的统计学显著性偏差是非整倍性的证据。例如,对母方参照样品而言,与给定染色体(如染色体21)相关联的箱的总和计数数目是X,而对混合母方胎儿样品而言,与给定染色体(如染色体21)相关联的箱的总和计数数目是X加Y。如果X加Y在统计学上显著大于X,那么可以说所述胎儿是关于染色体21的非整倍体。也可以使用替代性的比较方法,例如使所述X加Y的值与通常发现指示整倍体胎儿的X值或X加Y的值的导出值作比较。同样,可对测定非整倍性的染色体(如染色体21)和不预计显示非整倍性的另一条参照染色体(如染色体1或3)测定X加Y值。这些方法应有足够的统计学灵敏度以区分部分染色体非整倍体,例如镶嵌性。
母方参照序列的应用应该不受由母方异态性导致的定量误差。在母亲有大扩增区域的特定染色体的实施例中,所述染色体会在纯母方序列中的一个或多个箱中过高频出现,并且所述母方加胎儿血浆序列的母方组分会显示相同的过高频出现。在这个方式中不会说明父方异态性,但其重要性小得多,因为其仅影响通常占母方加胎儿样品约10%-20%的胎儿组成。
还预想了上述方案的很多变化。上述单末端序列读数能比36个碱基更长或更短。理想上还可以替代性地使用每个末端18个碱基但是覆盖读数长度范围的配对末端读数还设想了其它DNA测序平台及其使用方法,包含例如生命技术公司(LifeTechnologies)、太平洋生物系统公司(Pacific Biosystems)、离子流公司(IonTorrent)、完整基因组学公司(Complete Genomics)、纳米孔测序提供的方法。作为对母方和母方加胎儿DNA样品分别测序的替代,其能在相同流动槽或当量中同时被编码(如编条形码)、混合并测序,注意调整所述混合物中使用的各库的相对量以实现两个样品基因组覆盖率上的所需差异。
通过把未受肿瘤危害的患者来源(如口颊拭子)和受肿瘤危害的患者来源(如血浆)的序列作比较,能使实施例1所述的方法适用于肿瘤和正常样品基因组之间的更细微或更复杂的区分。
实施例2:某些实施方式的示例
下文提供了本技术某些实施方式的非限制性例子。
A1.一种检测妊娠妇女胎儿中是否存在染色体非整倍性的方法,所述方法包括:
(a)测定与妊娠妇女胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;
(b)测定与基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;
(c)把(b)的核苷酸序列组装成母方参照序列;
(d)把(a)的核苷酸序列与所述母方参照序列的全部或部分进行比对,并且计算定位到母方参照序列部分或全部上的(a)的核苷酸序列的数目;和
(e)根据定位到母方参照序列部分或全部上的(a)的核苷酸序列的数目,检测所述妊娠妇女的胎儿中是否存在染色体非整倍性。
A1.1.一种检测妊娠妇女胎儿中是否存在染色体非整倍性的方法,所述方法包括:
(a)测定与妊娠妇女胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;
(b)测定与基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;
(c)把(b)的核苷酸序列组装成母方参照序列;
(d)把(a)的核苷酸序列与所述母方参照序列的全部或部分进行比对,并且计算定位到母方参照序列部分或全部上的(a)的核苷酸序列的数目;和
(e)由定位到母方参照序列部分上的(a)的核苷酸序列的数目,提供确定是否存在染色体非整倍性的结果。
A1.2.一种检测妊娠妇女胎儿中是否存在遗传变异的方法,所述方法包括:
(a)测定与妊娠妇女胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;
(b)测定与基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;
(c)把(b)的核苷酸序列组装成母方参照序列;
(d)把(a)的核苷酸序列与所述母方参照序列的全部或部分进行比对,并且计算定位到母方参照序列部分或全部上的(a)的核苷酸序列的数目;和
(e)根据定位到母方参照序列部分或全部上的(a)的核苷酸序列的数目,检测所述妊娠妇女的胎儿中是否存在遗传变异。
A1.3.一种检测妊娠妇女胎儿中是否存在遗传变异的方法,所述方法包括:
(a)测定与妊娠妇女胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;
(b)测定与基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;
(c)把(b)的核苷酸序列组装成母方参照序列;
(d)把(a)的核苷酸序列与所述母方参照序列的全部或部分进行比对,并且计算定位到母方参照序列部分或全部上的(a)的核苷酸序列的数目;和
(e)从定位到母方参照序列部分绘图上的(a)的核苷酸序列的数目,提供确定是否存在遗传变异的结果。
A1.4.如实施方式A1-A1.3中任一项所述的方法,其中在母方参照序列部分或全部上定位并被计数的(a)的核苷酸序列由以下成分组成:(i)母方核苷酸序列,(ii)从妊娠妇女遗传的胎儿核苷酸序列和(iii)遗传自双亲之一但不能分辨来自哪一方的胎儿核苷酸序列。
A2.如实施方式A1-A1.4中任一项所述的方法,所述方法可包括,对特定靶标染色体而言,把定位到母方参照序列部分或全部上的(a)的核苷酸序列数目与染色体整倍性的预定值作比较。
A3.如实施方式A1-A1.4中任一项所述的方法,其中所述母方参照序列部分在特定靶标染色体上。
A4.如实施方式A3所述的方法,其中所述母方参照序列的部分是一个或多个箱(bin)。
A5.如实施方式A4所述的方法,其中所述箱是长度为约30K碱基对-约100K碱基对。
A6.如实施方式A2-A5中任一项所述的方法,其中所述靶标染色体是染色体21。
A7.如实施方式A2-A5中任一项所述的方法,其中所述靶标染色体是染色体18。
A8.如实施方式A2-A5中任一项所述的方法,其中所述靶标染色体是染色体13。
A9.如实施方式A2-A5中任一项所述的方法,其中所述靶标染色体是染色体X。
A10.如实施方式A2-A5中任一项所述的方法,其中所述靶标染色体是染色体Y。
A11.如实施方式A1-A10中任一项所述的方法,其中所述胞外核酸来自血液。
A12.如实施方式A11所述的方法,其中所述胞外核酸来自血浆。
A13.如实施方式A11所述的方法,其中所述胞外核酸来自血清。
A14.如实施方式A1和A11-A13中任一项所述的方法,其中所述胞外核酸来自妊娠头三个月的妊娠妇女。
A15.如实施方式A1-A14中任一项所述的方法,其中所述胞外核酸包含约1%-约40%胎儿核酸。
A16.如实施方式A1-A14中任一项所述的方法,其中所述胞外核酸胎儿核酸包含约15%或更多胎儿核酸。
A17.如实施方式A1-A16中任一项所述的方法,其中所述胞外核酸中的胎儿核酸拷贝数目是总体胞外核酸的约10个拷贝-约2000个拷贝。
A18.如实施方式A1-A17中任一项所述的方法,其中所述胞外核酸、所述基本不含胎儿核酸的妊娠妇女的核酸、或所述胞外核酸和所述基本不含胎儿核酸的妊娠妇女的核酸在测定(a)、(b)或(a)和(b)中的核苷酸序列前,没有片段化、没有大小分级,或者没有片段化且没有大小分级。
A19.如实施方式A1-A18中任一项所述的方法,其中所述胞外核酸、所述基本不含胎儿核酸的妊娠妇女的核酸,或所述胞外核酸和所述基本不含胎儿核酸的妊娠妇女的核酸在测定(a)、(b)或(a)和(b)中的核苷酸序列前,被片段化、被大小分级,或者被片段化且被大小分级。
A20.如实施方式A1-A19.1中任一项所述的方法,所述方法包含测定胞外核酸中的胎儿核酸浓度。
A21.如实施方式A1-A20中任一项所述的方法,所述方法包括在胞外核酸中富集胎儿核酸。
A22.如实施方式A1-A21中任一项所述的方法,其中所述基本不包含胎儿核酸的妊娠妇女的核酸是所述妊娠妇女的细胞核酸。
A23.如实施方式A22所述的方法,其中所述细胞核酸来自口颊拭子。
A24.如实施方式A1-A23中任一项所述的方法,所述方法包含将基本不包含胎儿核酸的妊娠妇女的核酸有片段化、大小分级,或者有片段化且大小分级。
A25.如实施方式A1-A24中任一项所述的方法,其中与所述基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列是妊娠妇女基因组核酸的全部或部分。
A26.如实施方式A1-A25中任一项所述的方法,其中与所述基本不包含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列覆盖妊娠妇女基因组核酸的约0.1倍-约20倍。
A27.如实施方式A1-A26中任一项所述的方法,其中所述(a)、(b)或(a)和(b)中所述核苷酸序列通过大规模平行测序方法测定。
A28.如实施方式A1-A27中任一项所述的方法,其中所述母方参照序列通过把(b)的核苷酸序列与外部参照序列进行比对来组装。
A29.如实施方式A28所述的方法,其中所述外部参照序列由具有约6倍-约60倍覆盖率的核苷酸序列组装。
A30.如实施方式A28或A29所述的方法,其中所述外部参照序列来自与妊娠妇女基本同一种族的一个或多个对象。
A31.如实施方式A28-A30中任一项所述的方法,其中所述母方参照序列不完全与所述外部参照序列进行比对。
A32.如实施方式A28-A30中任一项所述的方法,其中所述母方参照序列基本完全与所述外部参照序列进行比对。
A33.如实施方式A1-A32中任一项所述的方法,所述方法包含把(b)的核苷酸序列与所述母方参照序列部分或全部进行比对,并且计数定位到所述母方参照序列部分上的(b)的核苷酸序列。
A34.如实施方式A33所述的方法,其中计数在母方参照序列部分上基本精确定位的(b)的核苷酸序列。
A35.如实施方式A1-A34中任一项所述的方法,其中计数在母方参照序列部分上基本精确定位的(a)的核苷酸序列。
A36.如实施方式A1-A35中任一项所述的方法,所述方法包括把关于一个或多个染色体位置定位到所述母方参照序列上的(a)的核苷酸序列的数目与关于一个或多个不同染色体位置定位到所述母方参照序列上的(a)的核苷酸序列的数目作比较。
A37.如实施方式A1-A36中任一项所述的方法,所述方法包括把关于一个或多个染色体位置定位到所述母方参照序列上的(b)的核苷酸序列的数目与关于一个或多个不同染色体位置定位到所述母方参照序列上的(b)的核苷酸序列的数目作比较。
A38.如实施方式A33-A37中任一项所述的方法,其中测定了(i)定位到所述母方参照序列部分上的(a)的核苷酸序列的计数,和(ii)定位到所述母方参照序列部分上的(b)的核苷酸序列的计数之间是否存在差异。
A39.如实施方式A38所述的方法,其中根据测定是否存在统计学显著区别来检测所述染色体非整倍性的存在。
A40.如A38或A39所述的方法,所述方法包含就一个或多个不同染色体位置进行所述差异比较。
A41.如实施方式A1-A40中任一项所述的方法,其中确定是否存在所述染色体非整倍性的置信水平为约95%或更高。
A42.如实施方式A1-A40中任一项所述的方法,其中确定是否存在所述染色体非整倍性的特异性为约95%或更高。
A43.如实施方式A1-A40中任一项所述的方法,其中确定是否存在所述染色体非整倍性的灵敏度为约95%或更高。
A44.如实施方式A1-A43中任一项所述的方法,其中所述(a)、(b)或(a)和(b)的所述核苷酸序列包含单末端读数。
A45.如实施方式A44所述的方法,其中所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约20个连续核苷酸-约50个连续核苷酸。
A46.如实施方式A45所述的方法,其中所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约30个连续核苷酸-约40个连续核苷酸。
A47.如实施方式A46所述的方法,其中所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约35个连续核苷酸或约36个连续核苷酸。
A48.如实施方式A1-A47中任一项所述的方法,其中所述(a)、(b)或(a)和(b)的所述核苷酸序列包含双末端读数。A49.如实施方式A48所述的方法,其中所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约10个连续核苷酸-约25个连续核苷酸。
A50.如实施方式A49所述的方法,其中所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约15个连续核苷酸-约20个连续核苷酸。
A51.如实施方式A50所述的方法,其中所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约17个连续核苷酸或约18个连续核苷酸。
A52.如实施方式A1所述的方法,其中所述方法包含适时指示不能测定是否存在非整倍性。
B1.一种计算机程序产品,所述产品包含其上含有计算机可读程序编码的计算机可读介质,所述计算机可读程序编码适用于操作实施鉴定妊娠妇女胎儿中是否存在染色体非整倍性的方法,所述方法包含:
提供了包括不同软件模块的系统,所述软件模块包含检测模块、逻辑处理模块和数据显示组织模块;
通过所述检测模块收集(a)与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;和(b)与基本不含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;
通过所述逻辑处理模块接收所述核苷酸序列;
通过逻辑处理模块把所述(a)的核苷酸序列与母方参照序列部分进行比对,并且计算定位到所述母方参照序列部分上的(a)的核苷酸序列的数目,从而测定大量计数;
通过逻辑处理模块根据所述计数的数目判定胎儿中是否存在染色体非整倍性;
用数据显示组织模型响应逻辑处理模块的判定来组织数据显示以表明是否存在染色体非整倍性。
B2.一种计算机程序产品,所述产品包含其上含有计算机可读程序编码的计算机可读介质,所述计算机可读程序编码适用于操作实施鉴定妊娠妇女胎儿中是否存在染色体非整倍性的方法,所述方法包括:
提供了包括不同软件模块的系统,所述软件模块包含数据处理模块、逻辑处理模块和数据显示组织模块;
通过数据处理模块将配置文件解析成定义数据,所述配置文件包括(a)与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸,和(b)与基本不含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列;
通过逻辑处理模块接收所述定义数据;
通过逻辑处理模块使所述(a)的核苷酸序列与母方参照序列部分进行比对,并且计算定位到所述母方参照序列部分上的(a)的核苷酸序列的数目,从而测定大量计数;
通过逻辑处理模块根据所述计数的数目判定是否存在染色体非整倍性;
用数据显示组织模型根据逻辑处理模块的判定来组织数据显示以表明所述妊娠妇女胎儿中是否存在染色体非整倍性。
B3.如实施方式B1或B2所述的计算机程序产品,所述计算机程序产品包括通过逻辑处理模块把来自(b)的核苷酸序列组装成母方参照序列。
B4.一种包含存储器的设备,所述存储器上存储了如实施方式B1-B3中任一项所述的计算机程序产品。
B5.如实施方式B4所述的设备,所述设备包含执行如实施方式B1-B3中任一项所述的计算机程序产品的一种或多种功能的处理器。
C1.一种试剂盒,所述试剂盒包含一种或多种成分用于(a)测定与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;和(b)测定与基本不含胎儿核酸的妊娠妇女核酸的全部或部分对应的核苷酸序列。
C2.如实施方式C1所述的试剂盒,所述试剂盒包含用于处理所述妊娠妇女的核酸样品的一种或多种成分。
C3.如实施方式C1或C2所述的试剂盒,所述试剂盒包含说明书或获得说明书的信息,所述说明书用于进行如实施方式A1-A52中任一项所述的方法。
* * *
本文中引用的各专利、专利申请、出版物和文献的全部内容均通过引用纳入本文。对上述专利、专利申请、出版物和文献的引用并不表示承认上述任何内容是相关的现有技术,也并不表示承认这些出版物或文献的内容或日期。
可对上述内容进行改变而不背离本技术的基本方面。尽管参考一个或多个具体实施方式充分详细描述了本技术,但是本领域普通技术人员应认识到可对本申请中具体公开的实施方式进行改变,只要这些改变和改进在本技术的范围和精神内。
本文中适当描述的技术可在没有任何本文未具体公开元件的情况下实施。因此,例如在本文各示例中,所述术语“包含”可以用“基本由…组成”和“由…组成”替换。已经使用的术语和表达用作说明而非限制性的术语,这些术语和表达的使用并不排除所显示和所描述的特征或其部分的任何等价物,以及在要求权利的本技术范围内可进行各种改良。术语“一个”或“一种”表示一种或多种其修饰的要素(例如“一种试剂”可表示一种或多种试剂),除非上下文清楚表示所描述的是要素之一或是一种以上的要素。再者,当本文描述一列数值时候(如约50%、60%、70%、80%、85%或86%),所述列表包含其所有中间值和分数值(如54%、85.4%),并且在一列数值的开头处使用术语的"约"是关于该列数值中的各数值(如"约1、2和3"指约1、约2和约3。因此,应理解,尽管通过代表性实施方式和任选的特征具体描述了本技术,但是本领域技术人员能对本文所公开内容进行改良和变化,应认为这些改良和变化落在本技术的范围内。
在所附权利要求书中陈述了本技术的某些实施方式。

Claims (64)

1.一种用于检测妊娠妇女的胎儿中是否存在染色体非整倍性的方法,所述方法包括:
(a)测定与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;
(b)测定与基本不包含胎儿核酸的所述妊娠妇女核酸的全部或部分对应的核苷酸序列;
(c)将(b)的核苷酸序列组装成母方参照序列;
(d)将(a)的核苷酸序列与所述母方参照序列的部分或全部进行比对,并且计算能定位到所述母方参照序列的部分或全部上的(a)的核苷酸序列的数目;和
(e)根据能定位到所述母方参照序列的部分或全部上的(a)的核苷酸序列的数目,检测所述妊娠妇女的胎儿中是否存在染色体非整倍性。
2.一种用于检测妊娠妇女的胎儿中是否存在染色体非整倍性的方法,所述方法包括:
(a)测定与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;
(b)测定与基本不包含胎儿核酸的所述妊娠妇女核酸的全部或部分对应的核苷酸序列;
(c)将(b)的核苷酸序列组装成母方参照序列;
(d)将(a)的核苷酸序列与所述母方参照序列的部分或全部进行比对,并且计算能定位到所述母方参照序列的部分或全部上的(a)的核苷酸序列的数目;和
(e)由定位到所述母方参照序列的部分上的(a)的核苷酸序列的数目提供确定是否存在染色体非整倍性的结果。
3.一种用于检测妊娠妇女的胎儿中是否存在遗传变异的方法,所述方法包括:
(a)测定与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;
(b)测定与基本不包含胎儿核酸的所述妊娠妇女核酸的全部或部分对应的核苷酸序列;
(c)将(b)的核苷酸序列组装成母方参照序列;
(d)将(a)的核苷酸序列与所述母方参照序列的部分或全部进行比对,并且计算能定位到所述母方参照序列的部分或全部上的(a)的核苷酸序列的数目;和
(e)根据定位到所述母方参照序列的部分或全部上的(a)的核苷酸序列的数目,检测所述妊娠妇女的胎儿中是否存在遗传变异。
4.一种用于检测妊娠妇女的胎儿中是否存在遗传变异的方法,所述方法包括:
(a)测定与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;
(b)测定与基本不包含胎儿核酸的所述妊娠妇女核酸的全部或部分对应的核苷酸序列;
(c)将(b)的核苷酸序列组装成母方参照序列;
(d)将(a)的核苷酸序列与所述母方参照序列的部分或全部进行比对,并且计算能定位到所述母方参照序列的部分或全部上的(a)的核苷酸序列的数目;和
(e)由定位到所述母方参照序列的部分上的(a)的核苷酸序列的数目,提供确定是否存在遗传变异的结果。
5.如权利要求1-4中任一项所述的方法,其中在所述母方参照序列的部分或全部上定位并被计数的(a)中核苷酸序列由以下成分组成:(i)母方核苷酸序列,(ii)遗传自所述妊娠妇女的胎儿核苷酸序列,和(iii)遗传自双亲之一但不能分辨来自哪一方的胎儿核苷酸序列。
6.如权利要求1-5中任一项所述的方法,所述方法包括对于特定靶标染色体,将定位到所述母方参照序列的部分或全部上的(a)的核苷酸序列的数目与染色体整倍性的预定值作比较。
7.如权利要求1-6中任一项所述的方法,其特征在于,所述母方参照序列的部分在特定靶标染色体上。
8.如权利要求7所述的方法,其特征在于,所述母方参照序列的部分是一个或多个箱(bin)。
9.如权利要求8所述的方法,其特征在于,所述箱的长度是约30K碱基对-约100K碱基对。
10.如权利要求6-9中任一项所述的方法,其特征在于,所述靶标染色体是染色体21。
11.如权利要求6-9中任一项所述的方法,其特征在于,所述靶标染色体是染色体18。
12.如权利要求6-9中任一项所述的方法,其特征在于,所述靶标染色体是染色体13。
13.如权利要求6-9中任一项所述的方法,其特征在于,所述靶标染色体是染色体X。
14.如权利要求6-9中任一项所述的方法,其特征在于,所述靶标染色体是染色体Y。
15.如权利要求1–14中任一项所述的方法,其特征在于,所述胞外核酸来自血液。
16.如权利要求15所述的方法,其特征在于,所述胞外核酸来自血浆。
17.如权利要求15所述的方法,其特征在于,所述胞外核酸来自血清。
18.如权利要求1-17中任一项所述的方法,其特征在于,所述胞外核酸来自妊娠头三个月的妊娠妇女。
19.如权利要求1-18中任一项所述的方法,其特征在于,所述胞外核酸包含约1%-约40%胎儿核酸。
20.如权利要求1-18中任一项所述的方法,其特征在于,所述胞外核酸胎儿核酸包含约15%或更多的胎儿核酸。
21.如权利要求1-20中任一项所述的方法,其特征在于,所述胞外核酸中的胎儿核酸拷贝数目是总胞外核酸的约10个拷贝-约2000个拷贝。
22.如权利要求1-21中任一项所述的方法,其特征在于,所述胞外核酸、基本不含胎儿核酸的所述妊娠妇女的核酸,或所述胞外核酸和基本不含胎儿核酸的所述妊娠妇女的核酸在(a)、(b)或(a)和(b)中的核苷酸序列测定之前,没有片段化、没有大小分级,或者没有片段化且没有大小分级。
23.如权利要求1-22中任一项所述的方法,其特征在于,所述胞外核酸、基本不含胎儿核酸的所述妊娠妇女的核酸,或所述胞外核酸和基本不含胎儿核酸的所述妊娠妇女的核酸在(a)、(b)或(a)和(b)中的核苷酸序列测定之前,被片段化、被大小分级,或者被片段化且被大小分级。
24.如权利要求1-23中任一项所述的方法,其特征在于,所述方法包括测定所述胞外核酸中胎儿核酸的浓度。
25.如权利要求1-24中任一项所述的方法,其特征在于,所述方法包括在所述胞外核酸中富集胎儿核酸。
26.如权利要求1-25中任一项所述的方法,其特征在于,基本不包含胎儿核酸的所述妊娠妇女的核酸是所述妊娠妇女的细胞核酸。
27.如权利要求26所述的方法,其特征在于,所述细胞核酸来自口颊拭子。
28.如权利要求1-27中任一项所述的方法,所述方法包括使基本不包含胎儿核酸的所述妊娠妇女的核酸片段化、大小分级,或者片段化且大小分级。
29.如权利要求1-28中任一项所述的方法,其特征在于,与基本不包含胎儿核酸的所述妊娠妇女的核酸的全部或部分对应的核苷酸序列是所述妊娠妇女的基因组核酸的全部或部分。
30.如权利要求1-29中任一项所述的方法,其特征在于,与基本不包含胎儿核酸的所述妊娠妇女的核酸的全部或部分对应的核苷酸序列覆盖所述妊娠妇女的基因组核酸约0.1倍-约20倍。
31.如权利要求1-30中任一项所述的方法,其特征在于,(a)、(b)或(a)和(b)中的核苷酸序列通过大规模平行测序方法测定。
32.如权利要求1-31中任一项所述的方法,其特征在于,所述母方参照序列通过将(b)的核苷酸序列与外部参照序列进行比对来组装。
33.如权利要求32所述的方法,其特征在于,用来组装所述外部参照序列的核苷酸序列选自约6倍-约60倍覆盖率的核苷酸序列。
34.如权利要求32或33所述的方法,其特征在于,所述外部参照序列来自与所述妊娠妇女基本同一种族的一个或多个对象。
35.如权利要求32-34中任一项所述的方法,其特征在于,所述母方参照序列不与所述外部参照序列完全对齐。
36.如权利要求32-34中任一项所述的方法,其特征在于,所述母方参照序列与所述外部参照序列基本完全对齐。
37.如权利要求1–36中任一项所述的方法,其特征在于,所述方法包括将(b)的核苷酸序列与所述母方参照序列的部分或全部进行比对,并且计数能定位到所述母方参照序列的部分上的(b)的核苷酸序列。
38.如权利要求37所述的方法,其特征在于,计数在所述母方参照序列的部分上基本精确定位的(b)的核苷酸序列。
39.如权利要求1–38中任一项所述的方法,其特征在于,计数在所述母方参照序列的部分上基本精确定位的(a)的核苷酸序列。
40.如权利要求1-39中任一项所述的方法,其特征在于,所述方法包括将就一个或多个染色体位置而言能定位到所述母方参照序列上的(a)的核苷酸序列的数目与就一个或多个其它染色体位置而言能定位到所述母方参照序列上的(a)的核苷酸序列的数目作比较。
41.如权利要求1-40中任一项所述的方法,其特征在于,所述方法包括将就一个或多个染色体位置而言能定位到所述母方参照序列上的(b)的核苷酸序列的数目与就一个或多个其它染色体位置而言能定位到所述母方参照序列上的(b)的核苷酸序列的数目作比较。
42.如权利要求37-41中任一项所述的方法,其特征在于,测定(i)能定位到所述母方参照序列的部分上的(a)中核苷酸序列的计数和(ii)能定位到所述母方参照序列的部分上的(b)中核苷酸序列的计数之间是否存在差异。
43.如权利要求42所述的方法,其特征在于,根据测定是否存在统计学显著差异来检测所述染色体非整倍性的存在。
44.如权利要求42或43所述的方法,其特征在于,所述方法包括就一个或多个不同染色体位置进行所述差异比较。
45.如权利要求1–44中任一项所述的方法,其特征在于,确定是否存在所述染色体非整倍性的置信水平为约95%或更高。
46.如权利要求1–44中任一项所述的方法,其特征在于,确定是否存在所述染色体非整倍性到特异性为约95%或更高。
47.如权利要求1–44中任一项所述的方法,其特征在于,确定是否存在所述染色体非整倍性的灵敏度为约95%或更高。
48.如权利要求1–47中任一项所述的方法,其特征在于,(a)、(b)或者(a)和(b)的核苷酸序列包含单末端读数。
49.如权利要求48所述的方法,其特征在于,所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约20个连续核苷酸-约50个连续核苷酸。
50.如权利要求49所述的方法,其特征在于,所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约30个连续核苷酸-约40个连续核苷酸。
51.如权利要求50所述的方法,其特征在于,所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约35个连续核苷酸或约36个连续核苷酸。
52.如权利要求1–51中任一项所述的方法,其特征在于,(a)、(b)或(a)和(b)的核苷酸序列包含双末端读数。
53.如权利要求52所述的方法,其特征在于,所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约10个连续核苷酸-约25个连续核苷酸。
54.如权利要求53所述的方法,其特征在于,所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约15个连续核苷酸-约20个连续核苷酸。
55.如权利要求54所述的方法,其特征在于,所述单末端读数的标称、平均(average)、等比中数(mean)或绝对长度是约17个连续核苷酸或约18个连续核苷酸。
56.如权利要求1-57中任一项所述的方法,其特征在于,所述方法包括适时指示不能确定是否存在非整倍性。
57.一种计算机程序产品,所述产品包括内含计算机可读程序编码的计算机可读介质,所述计算机可读程序编码经执行而实施鉴定妊娠妇女的胎儿中是否存在染色体非整倍性的方法,所述方法包括:
提供包含不同软件模块的系统,所述软件模块包括检测模块、逻辑处理模块和数据显示组织模块;
通过所述检测模块收集:(a)与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;和(b)与基本不含胎儿核酸的所述妊娠妇女的核酸的全部或部分对应的核苷酸序列;
通过所述逻辑处理模块接收所述核苷酸序列;
通过所述逻辑处理模块将(a)的核苷酸序列与所述母方参照序列的部分进行比对,并且计算能定位到所述母方参照序列的部分上的(a)的核苷酸序列的数目,从而测定大量计数;
通过所述逻辑处理模块根据所述计数的数目判定(call)胎儿中是否存在染色体非整倍性;
通过所述数据显示组织模型响应所述逻辑处理模块的判定来组织数据显示以表明是否存在染色体非整倍性。
58.一种计算机程序产品,所述产品包括内含计算机可读程序编码的计算机可读介质,所述计算机可读程序编码经执行而实施鉴定妊娠妇女的胎儿中是否存在染色体非整倍性的方法,所述方法包括:
提供包含不同软件模块的系统,所述软件模块包括数据处理模块、逻辑处理模块和数据显示组织模块;
通过数据处理模块将配置文件解析成定义数据,所述配置文件包括(a)与所述妊娠妇女的胞外核酸对应的核苷酸序列(所述胞外核酸包含无细胞胎儿核酸),和(b)与基本不含胎儿核酸的所述妊娠妇女的核酸的全部或部分对应的核苷酸序列;
通过所述逻辑处理模块接收所述定义数据;
通过所述逻辑处理模块将(a)的核苷酸序列与所述母方参照序列的部分进行比对,并且计算能定位到所述母方参照序列的部分上的(a)的核苷酸序列的数目,从而测定大量计数;
通过所述逻辑处理模块根据所述计数的数目判定是否存在染色体非整倍性;
通过所述数据显示组织模型响应所述逻辑处理模块的判定来组织数据显示以表明所述妊娠妇女的胎儿中是否存在染色体非整倍性。
59.如权利要求57或58所述的计算机程序产品,其特征在于,所述计算机程序产品包括通过所述逻辑处理模块将来自(b)的核苷酸序列组装成所述母方参照序列。
60.一种包含存储器的设备,所述存储器上存储了如权利要求57-59中任一项所述的计算机程序产品。
61.如权利要求60所述的设备,其特征在于,所述设备包含执行如权利要求57-59中任一项所述的计算机程序产品的一种或多种功能的处理器。
62.一种试剂盒,包含一种或多种成分用于(a)测定与所述妊娠妇女的胞外核酸对应的核苷酸序列,所述胞外核酸包含无细胞胎儿核酸;和(b)测定与基本不含胎儿核酸的所述妊娠的核酸的全部或部分对应的核苷酸序列。
63.如权利要求62所述的试剂盒,其特征在于,所述试剂盒包含用于处理所述妊娠妇女的核酸样品的一种或多种成分。
64.如权利要求62或63所述的试剂盒,其特征在于,所述试剂盒包含说明书或获得说明书的信息,所述说明书用于指导实施如权利要求A1-A52中任一项所述的方法。
CN2011800682838A 2010-12-23 2011-12-21 胎儿遗传变异的检测 Pending CN103384725A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201061427054P 2010-12-23 2010-12-23
US61/427,054 2010-12-23
PCT/US2011/066639 WO2012088348A2 (en) 2010-12-23 2011-12-21 Fetal genetic variation detection

Publications (1)

Publication Number Publication Date
CN103384725A true CN103384725A (zh) 2013-11-06

Family

ID=46314911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800682838A Pending CN103384725A (zh) 2010-12-23 2011-12-21 胎儿遗传变异的检测

Country Status (6)

Country Link
US (1) US20120184449A1 (zh)
EP (1) EP2655666A2 (zh)
CN (1) CN103384725A (zh)
AU (1) AU2011348267A1 (zh)
CA (1) CA2822439A1 (zh)
WO (1) WO2012088348A2 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103824001A (zh) * 2014-02-27 2014-05-28 北京诺禾致源生物信息科技有限公司 染色体的检测方法和装置
CN104232777A (zh) * 2014-09-19 2014-12-24 天津华大基因科技有限公司 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
CN104830986A (zh) * 2015-05-07 2015-08-12 深圳承启生物科技有限公司 一种检测胎儿基因信息的方法、装置和系统
CN105653896A (zh) * 2016-01-22 2016-06-08 北京圣谷同创科技发展有限公司 高通量测序突变检测结果验证方法
CN108291330A (zh) * 2015-07-10 2018-07-17 西弗吉尼亚大学 卒中和卒中严重性的标志物
TWI687937B (zh) * 2018-10-05 2020-03-11 中國醫藥大學附設醫院 染色體異常檢測模型之建立方法、染色體異常檢測系統及染色體異常檢測方法
CN111172248A (zh) * 2020-02-26 2020-05-19 上海晶准生物医药有限公司 一种基于片段分析技术验证拷贝数变异的通用试剂盒
CN111526793A (zh) * 2017-10-27 2020-08-11 朱诺诊断学公司 用于超低体积液体活检的设备、系统和方法
CN112831555A (zh) * 2021-02-01 2021-05-25 人和未来生物科技(长沙)有限公司 一种检测地中海贫血基因的参考品及其制备方法与应用
CN113409275A (zh) * 2021-06-22 2021-09-17 青岛海信医疗设备股份有限公司 基于超声图像确定胎儿颈后透明层厚度的方法及相关装置
CN113496760A (zh) * 2020-04-01 2021-10-12 深圳华大基因科技服务有限公司 基于第三代测序的多倍体基因组组装方法和装置
CN116246704A (zh) * 2023-05-10 2023-06-09 广州精科生物技术有限公司 用于胎儿无创产前检测的系统

Families Citing this family (107)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8285719B1 (en) 2008-08-08 2012-10-09 The Research Foundation Of State University Of New York System and method for probabilistic relational clustering
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
WO2011087760A2 (en) 2009-12-22 2011-07-21 Sequenom, Inc. Processes and kits for identifying aneuploidy
WO2011091046A1 (en) * 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
EP2366031B1 (en) 2010-01-19 2015-01-21 Verinata Health, Inc Sequencing methods in prenatal diagnoses
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US8700341B2 (en) 2010-01-19 2014-04-15 Verinata Health, Inc. Partition defined detection methods
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US11031095B2 (en) 2010-08-06 2021-06-08 Ariosa Diagnostics, Inc. Assay systems for determination of fetal copy number variation
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US10167508B2 (en) 2010-08-06 2019-01-01 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
US9994897B2 (en) * 2013-03-08 2018-06-12 Ariosa Diagnostics, Inc. Non-invasive fetal sex determination
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
US10131947B2 (en) 2011-01-25 2018-11-20 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
HUE050032T2 (hu) 2011-04-12 2020-11-30 Verinata Health Inc Genomfrakciók feloldása polimorfizmus-szám alkalmazásával
US9411937B2 (en) * 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
WO2012177792A2 (en) 2011-06-24 2012-12-27 Sequenom, Inc. Methods and processes for non-invasive assessment of a genetic variation
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013052907A2 (en) 2011-10-06 2013-04-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10196681B2 (en) 2011-10-06 2019-02-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US8688388B2 (en) 2011-10-11 2014-04-01 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
ES2929923T3 (es) 2012-01-20 2022-12-02 Sequenom Inc Procesos de diagnóstico que condicionan las condiciones experimentales
EP4155401A1 (en) 2012-03-02 2023-03-29 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10289800B2 (en) 2012-05-21 2019-05-14 Ariosa Diagnostics, Inc. Processes for calculating phased fetal genomic sequences
US10497461B2 (en) 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2878979C (en) 2012-07-13 2021-09-14 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US9092401B2 (en) 2012-10-31 2015-07-28 Counsyl, Inc. System and methods for detecting genetic variation
CN104583421A (zh) 2012-07-19 2015-04-29 阿瑞奥萨诊断公司 遗传变体的基于多重的顺序连接的检测
AU2013204615A1 (en) * 2012-07-20 2014-02-06 Verinata Health, Inc. Detecting and classifying copy number variation in a fetal genome
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2014028537A1 (en) 2012-08-14 2014-02-20 10X Technologies, Inc. Microcapsule compositions and methods
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
KR102028375B1 (ko) 2012-09-04 2019-10-04 가던트 헬쓰, 인크. 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
GB2510725B (en) * 2012-09-04 2015-08-05 Guardant Health Inc Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP2904534B1 (en) * 2012-10-04 2021-12-15 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2894694C (en) 2012-12-14 2023-04-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20130309666A1 (en) 2013-01-25 2013-11-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP3862435A1 (en) 2013-02-08 2021-08-11 10X Genomics, Inc. Polynucleotide barcode generation
SG11201506516TA (en) * 2013-02-28 2015-09-29 Univ Hong Kong Chinese Maternal plasma transcriptome analysis by massively parallel rna sequencing
WO2014138153A1 (en) * 2013-03-06 2014-09-12 Life Technologies Corporation Systems and methods for determining copy number variation
WO2014168711A1 (en) 2013-03-13 2014-10-16 Sequenom, Inc. Primers for dna methylation analysis
ES2939547T3 (es) 2013-04-03 2023-04-24 Sequenom Inc Métodos y procedimientos para la evaluación no invasiva de variaciones genéticas
ES2766860T5 (es) 2013-05-15 2023-02-23 Bgi Genomics Co Ltd Método para detectar anomalías estructurales cromosómicas y dispositivo para ello
WO2014190286A2 (en) 2013-05-24 2014-11-27 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
AU2014278730B2 (en) * 2013-06-13 2020-12-10 F. Hoffmann-La Roche Ag Statistical analysis for non-invasive sex chromosome aneuploidy determination
ES2721051T3 (es) 2013-06-21 2019-07-26 Sequenom Inc Método para la evaluación no invasiva de variaciones genéticas
US10395758B2 (en) 2013-08-30 2019-08-27 10X Genomics, Inc. Sequencing methods
BR112016007401B1 (pt) * 2013-10-04 2023-04-11 Sequenom, Inc. Método para determinar a presença ou ausência de uma aneuploidia cromossômica em uma amostra
US10438691B2 (en) 2013-10-07 2019-10-08 Sequenom, Inc. Non-invasive assessment of chromosome alterations using change in subsequence mappability
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
AU2014369841B2 (en) 2013-12-28 2019-01-24 Guardant Health, Inc. Methods and systems for detecting genetic variants
EP3117011B1 (en) 2014-03-13 2020-05-06 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CN103901217A (zh) * 2014-03-21 2014-07-02 靖江市人民医院 大豆过氧化物酶免疫生物芯片及在唐氏综合症产前筛查血清学标志物检测中的应用
AU2015243445B2 (en) 2014-04-10 2020-05-28 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
KR20170023979A (ko) 2014-06-26 2017-03-06 10엑스 제노믹스, 인크. 핵산 서열 조립을 위한 프로세스 및 시스템
KR20170026383A (ko) * 2014-06-26 2017-03-08 10엑스 제노믹스, 인크. 핵산 서열의 분석
CN106795553B (zh) 2014-06-26 2021-06-04 10X基因组学有限公司 分析来自单个细胞或细胞群体的核酸的方法
DK3656875T3 (da) 2014-07-18 2021-12-13 Illumina Inc Ikke-invasiv prænatal diagnostik
US11783911B2 (en) 2014-07-30 2023-10-10 Sequenom, Inc Methods and processes for non-invasive assessment of genetic variations
EP3204882A4 (en) 2014-10-10 2018-06-06 Life Technologies Corporation Methods, systems, and computer-readable media for calculating corrected amplicon coverages
EP3244992B1 (en) 2015-01-12 2023-03-08 10X Genomics, Inc. Processes for barcoding nucleic acids
JP2018508852A (ja) 2015-01-13 2018-03-29 10エックス ゲノミクス,インコーポレイテッド 構造的変異及び相化情報を視覚化するシステム及び方法
MX2017010142A (es) 2015-02-09 2017-12-11 10X Genomics Inc Sistemas y metodos para determinar variacion estructural y ajuste de fases con datos de recuperacion de variantes.
EP3262407B1 (en) 2015-02-24 2023-08-30 10X Genomics, Inc. Partition processing methods and systems
EP3298169A4 (en) 2015-05-18 2018-10-24 Karius Inc. Compositions and methods for enriching populations of nucleic acids
SG11201805119QA (en) 2015-12-17 2018-07-30 Guardant Health Inc Methods to determine tumor gene copy number by analysis of cell-free dna
SG11201806757XA (en) 2016-02-11 2018-09-27 10X Genomics Inc Systems, methods, and media for de novo assembly of whole genome sequence data
WO2017165817A1 (en) * 2016-03-25 2017-09-28 Bioceryx Inc. Apparatuses and methods for assessing target sequence numbers
WO2017193044A1 (en) * 2016-05-06 2017-11-09 Counsyl, Inc. Noninvasive prenatal diagnostic
WO2018022890A1 (en) 2016-07-27 2018-02-01 Sequenom, Inc. Genetic copy number alteration classifications
WO2018064311A2 (en) * 2016-09-28 2018-04-05 Life Technologies Corporation Methods and systems for reducing phasing errors when sequencing nucleic acids using termination chemistry
US11854666B2 (en) 2016-09-29 2023-12-26 Myriad Women's Health, Inc. Noninvasive prenatal screening using dynamic iterative depth optimization
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA3207879A1 (en) 2017-01-24 2018-08-02 Sequenom, Inc. Methods and processes for assessment of genetic variations
WO2018140966A1 (en) 2017-01-30 2018-08-02 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
SG11201901822QA (en) 2017-05-26 2019-03-28 10X Genomics Inc Single cell analysis of transposase accessible chromatin
US10844372B2 (en) 2017-05-26 2020-11-24 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
SG11201913654QA (en) 2017-11-15 2020-01-30 10X Genomics Inc Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
SG11202009889VA (en) 2018-04-06 2020-11-27 10X Genomics Inc Systems and methods for quality control in single cell processing
GB2597379B (en) * 2019-02-14 2022-12-28 Mirvie Inc Methods and systems for determining a pregnancy-related state of a subject

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060252071A1 (en) * 2005-03-18 2006-11-09 The Chinese University Of Hong Kong Method for the detection of chromosomal aneuploidies
US20080020390A1 (en) * 2006-02-28 2008-01-24 Mitchell Aoy T Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100216153A1 (en) * 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060252071A1 (en) * 2005-03-18 2006-11-09 The Chinese University Of Hong Kong Method for the detection of chromosomal aneuploidies
US20080020390A1 (en) * 2006-02-28 2008-01-24 Mitchell Aoy T Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHIU ET AL.: "Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma", 《PNAS》, vol. 105, no. 51, 23 December 2008 (2008-12-23), pages 1 - 2, XP055284693, DOI: doi:10.1073/pnas.0810641105 *
XIAOFENG ZHOU ET AL.: "Detection of DNA copy number abnormality by microarray expression analysis", 《HUM GENET》, vol. 114, 11 February 2004 (2004-02-11), pages 1 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103824001A (zh) * 2014-02-27 2014-05-28 北京诺禾致源生物信息科技有限公司 染色体的检测方法和装置
CN104232777A (zh) * 2014-09-19 2014-12-24 天津华大基因科技有限公司 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
CN104232777B (zh) * 2014-09-19 2016-08-24 天津华大基因科技有限公司 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
CN104830986A (zh) * 2015-05-07 2015-08-12 深圳承启生物科技有限公司 一种检测胎儿基因信息的方法、装置和系统
CN104830986B (zh) * 2015-05-07 2018-08-03 深圳承启生物科技有限公司 一种检测胎儿基因信息的方法、装置和系统
CN108291330A (zh) * 2015-07-10 2018-07-17 西弗吉尼亚大学 卒中和卒中严重性的标志物
CN105653896A (zh) * 2016-01-22 2016-06-08 北京圣谷同创科技发展有限公司 高通量测序突变检测结果验证方法
CN105653896B (zh) * 2016-01-22 2019-02-12 北京圣谷同创科技发展有限公司 高通量测序突变检测结果验证方法
CN111526793A (zh) * 2017-10-27 2020-08-11 朱诺诊断学公司 用于超低体积液体活检的设备、系统和方法
TWI687937B (zh) * 2018-10-05 2020-03-11 中國醫藥大學附設醫院 染色體異常檢測模型之建立方法、染色體異常檢測系統及染色體異常檢測方法
CN111172248A (zh) * 2020-02-26 2020-05-19 上海晶准生物医药有限公司 一种基于片段分析技术验证拷贝数变异的通用试剂盒
CN111172248B (zh) * 2020-02-26 2021-12-03 上海晶准生物医药有限公司 一种基于片段分析技术验证拷贝数变异的通用试剂盒
CN113496760A (zh) * 2020-04-01 2021-10-12 深圳华大基因科技服务有限公司 基于第三代测序的多倍体基因组组装方法和装置
CN113496760B (zh) * 2020-04-01 2024-01-12 深圳华大基因科技服务有限公司 基于第三代测序的多倍体基因组组装方法和装置
CN112831555A (zh) * 2021-02-01 2021-05-25 人和未来生物科技(长沙)有限公司 一种检测地中海贫血基因的参考品及其制备方法与应用
CN113409275A (zh) * 2021-06-22 2021-09-17 青岛海信医疗设备股份有限公司 基于超声图像确定胎儿颈后透明层厚度的方法及相关装置
CN116246704A (zh) * 2023-05-10 2023-06-09 广州精科生物技术有限公司 用于胎儿无创产前检测的系统
CN116246704B (zh) * 2023-05-10 2023-08-15 广州精科生物技术有限公司 用于胎儿无创产前检测的系统

Also Published As

Publication number Publication date
AU2011348267A1 (en) 2013-08-01
WO2012088348A3 (en) 2012-12-06
CA2822439A1 (en) 2012-06-28
WO2012088348A2 (en) 2012-06-28
US20120184449A1 (en) 2012-07-19
EP2655666A2 (en) 2013-10-30

Similar Documents

Publication Publication Date Title
CN103384725A (zh) 胎儿遗传变异的检测
TWI661049B (zh) 使用不含細胞之dna片段大小以測定複製數變異之方法
JP6431769B2 (ja) 実験条件を要因として含める診断プロセス
JP6227095B2 (ja) 遺伝的変異の非侵襲的評価のための方法およびプロセス
US20190276874A1 (en) Methods and Processes for Non-Invasive Assessment of Genetic Variations
ES2624686T3 (es) Métodos y procesos para la evaluación no invasiva de variaciones genéticas
JP2021035393A (ja) 染色体提示の決定
EP3473731B1 (en) Methods and processes for non-invasive assessment of genetic variations
US10424394B2 (en) Methods and processes for non-invasive assessment of genetic variations
CA2850785C (en) Methods and processes for non-invasive assessment of genetic variations
JP2015513392A5 (zh)
CN105814574A (zh) 遗传变异的非侵入性评估的方法和过程
CN105473741A (zh) 用于遗传变异的非侵入性评估的方法和过程
CN105555968A (zh) 遗传变异的非侵入性评估方法和过程
CN108485940A (zh) 拷贝数变异的检测和分类
US20230014607A1 (en) Methods and compositions for analyzing nucleic acid
US20230279494A1 (en) Methods for non-invasive assessment of fetal genetic variations that factor experimental conditions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131106