CN104169929A - 用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质 - Google Patents

用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质 Download PDF

Info

Publication number
CN104169929A
CN104169929A CN201380006956.6A CN201380006956A CN104169929A CN 104169929 A CN104169929 A CN 104169929A CN 201380006956 A CN201380006956 A CN 201380006956A CN 104169929 A CN104169929 A CN 104169929A
Authority
CN
China
Prior art keywords
sample
chromosome
pregnant woman
tire
sequencing data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380006956.6A
Other languages
English (en)
Other versions
CN104169929B (zh
Inventor
李旭超
潘小渝
葛会娟
张艳艳
陈芳
陈盛培
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Publication of CN104169929A publication Critical patent/CN104169929A/zh
Application granted granted Critical
Publication of CN104169929B publication Critical patent/CN104169929B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

提供了用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质。其中,确定胎儿是否存在性染色体数目异常的方法包括:针对包含胎儿核酸的孕妇样本进行核酸测序,以便获得多个测序数据;将测序数据与人类的参照基因组序列进行比对,以便获得比对测序数据集;确定比对测序数据集中所包含的比对测序数据的数目Q;确定比对测序数据集中来源于第i号染色体的测序数据的数目Ni,其中,i表示染色体的编号,该第i号染色体至少包括Y染色体以及任选的X染色体;基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别;以及确定该胎儿是否存在性染色体数目异常。

Description

用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质
优先权信息
技术领域
本发明涉及生物医学领域。具体而言,涉及用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质。
背景技术
染色体是组成细胞核的基本物质。正常人的体细胞染色体数目为46条,并有一定的形态和结构。染色体在形态结构或数量上的异常被称为染色体异常(chromosome abnormalities),染色体异常也称染色体发育不全(chromosomedysgenesis),由染色体异常引起的疾病称为染色体病。已发现人类染色体数目异常和结构畸变3000余种,目前已确认染色体病综合症100余种。染色体的异常会导致基因表达异常和机体发育异常。
染色体异常的发病机制不明,可能是由于细胞分裂后期染色体发生不分离或染色体在体内外各种因素影响下发生断裂和重新连接所致。在染色体异常中,又主要区分为常染色体异常及性染色体异常。
临床上常见的性染色体异常包括了Turner综合症、克氏综合征、XXX综合征、XYY综合征等。多年研究发现,性染色体异常大约占所有染色体病的三分之一,总发病率约为1/500多为散发。主要表现为性征的发育不全或畸形,智力低下。
然而,目前性染色体数目异常的检测仍有待改进。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
在本发明的第一方面,本发明提出了一种确定胎儿是否存在性染色体数目异常的方法。根据本发明的实施例,该方法包括:针对包含胎儿核酸的孕妇样本进行核酸测序,以便获得多个测序数据;将所述测序数据与人类的参照基因组序列进行比对,以便获得比对测序数据集;确定所述比对测序数据集中所包含的比对测序数据的数目Q;确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni,其中,i表示染色体的编号,所述第i号染色体至少包括Y染色体以及任选的X染色体;基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别;以及确定所述胎儿是否存在性染色体数目异常,其中,针对男胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:基于所述来源于Y染色体的测序数据的数目Ny,计算所述男胎孕妇样本中的胎儿核酸浓度;构建对照样本数据集D,其中所述对照样本数据集D与所述男胎孕妇样本具有相同的胎儿核酸浓度;以及确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述男胎存在性染色体数目异常的指示,针对女胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述女胎存在性染色体数目异常的指示。发明人惊奇地发现,利用根据本发明实施例的方法,能够准确有效地确定胎儿是否存在性染色体数目异常。
在本发明的又一方面,本发明提出了一种计算机可读介质。根据本发明的实施例,所述计算机可读介质上存储有指令,所述指令适于被处理器执行以便通过下列步骤确定胎儿是否存在性染色体数目异常:获取来自孕妇样本的多个测序数据,所述孕妇样本包含胎儿核酸;将所述测序数据与人类的参照基因组序列进行比对,以便获得比对测序数据集;确定所述比对测序数据集中所包含的比对测序数据的数目Q;确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni,其中,i表示染色体的编号,所述第i号染色体至少包括Y染色体以及任选的X染色体;基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别;以及确定所述胎儿是否存在性染色体数目异常,其中,针对男胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:基于所述来源于Y染色体的测序数据的数目Ny,计算所述男胎孕妇样本中的胎儿核酸浓度;构建对照样本数据集D,其中所述对照样本数据集D与所述男胎孕妇样本具有相同的胎儿核酸浓度;以及确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述男胎存在性染色体数目异常的指示,针对女胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述女胎存在性染色体数目异常的指示。由此,利用根据本发明实施例的计算机可读介质,能够准确有效地确定胎儿是否存在性染色体数目异常。
在本发明的再一方面,本发明又提出了一种用于确定胎儿是否存在性染色体数目异常的系统。根据本发明的实施例,该系统包括:测序装置,所述测序装置用于针对孕妇样本进行核酸测序,以便获得多个测序数据;以及前面所述的计算机可读介质。发明人惊奇地发现,利用根据本发明实施例的用于确定胎儿是否存在性染色体数目异常的系统,能够准确有效地确定胎儿是否存在性染色体数目异常。
与目前的性染色体数目异常检测的方法对比,本发明的优越性表现在:
(1)临床可行性:本发明使用目标区域捕获的方式,在较高的测序深度下同时减少测序数据,可有效的检测出XO、XXX、XXY和XYY,本发明的方法大大的减少了数据产生的成本。
(2)可扩展性:除了通过增加测序量之外,本发明可以通过扩大对照组数量来增大精度,以减轻对起始DNA量的压力。
(3)更稳定,更加全面:已报道文章中,并无明确指出自身的操作细节,而本发明涉及数据群体检测等的各个方面。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明一个实施例的确定胎儿是否存在性染色体数目异常的方法的流程示意图。
发明详细描述
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
确定胎儿是否存在性染色体数目异常的方法
在本发明的第一方面,本发明提出了一种确定胎儿是否存在性染色体数目异常的方法。根据本发明的实施例,该方法包括:
首先,针对包含胎儿核酸的孕妇样本进行核酸测序,以便获得多个测序数据。根据本发明的实施例,待测孕妇样本为含有核酸样本,核酸的类型并不受特别限制,可以是脱氧核糖核酸(DNA),也可以是核糖核酸(RNA),优选DNA。本领域技术人员可以理解,对于RNA,可以通过常规手段将其转换为具有相应序列的DNA,进行后续检测和分析。另外,待测孕妇样本的属性也不受特别限制。根据本发明的一些实施例,可以采用基因组DNA样本,也可以采用由基因组DNA的一部分作为测试样本。根据本发明的实施例,可以使用的孕妇样本包括但不限于孕妇外周血、孕妇尿液、孕妇宫颈胎儿脱落滋养细胞、孕妇宫颈粘液、胎儿有核红细胞和孕妇血浆。发明人发现,通过对上述孕妇样本进行核酸样本提取,能够有效地对胎儿基因组中的遗传变异进行分析,实现对胎儿无损的产前诊断或检测。虽然本发明可以进行无创胎儿遗传变异检测是一种优势,例如所述样本是孕妇的外周血,但是本发明的方法也适用于有创检测,例如所述样本可以来自胎儿的脐带血,胎盘组织或绒毛膜组织,未培养或培养过的羊水细胞、绒毛组细胞。根据本发明的实施例,待测受试者和正常对照受试者是同一物种,需要说明的是,由于正常对照个体是预先选择确定的,因此关于对照样本的任何检测或计算数据均可预先产生并保存下来,本发明的实施例采用这种预置对照样本的相关数据的方式,在需要时读取使用,以下涉及对照样本数据时不再赘述。在其他实施方式中,也可以采用对照样本同步检测和计算的方式。同时,本发明的变异检测并不一定用于疾病诊断或相关的目的,因为性染色体数目异常的存在并不代表着患病风险或健康状况,可以纯粹是科学研究的用途。
根据本发明的实施例,可以利用选自盐析法、柱层析法、磁珠法、SDS法的至少一种从所述孕妇样本提取DNA,以便进行所述核酸测序。即在本发明中,所述DNA分子的获取可以采用盐析法、柱层析法、磁珠法、SDS法等常规DNA提取方法,优选采用磁珠法。所谓的磁珠法,是指血液、组织或细胞经过细胞裂解液和蛋白酶K的作用后得到裸露的DNA分子,其是利用特异性的磁珠对DNA分子进行可逆性的亲和吸附,经漂洗液清洗除去蛋白质、脂质等杂质后,用纯化液将DNA分子从磁珠上洗脱下来。磁珠是本领域中公知的,可市购获得,例如从Tiangen。
在本发明中,一般情况下,对于获自样品的DNA分子直接进行测序和后续步骤已经可以实现本发明的目的,提取的DNA可以不需经过处理即用于后续步骤。在一些优选实施方案中,可以仅对电泳主带集中在50-700 bp,优选100-500bp,更优选150-300 bp,特别是约200 bp大小的片段进行研究。在本发明一些更优选实施方案中,可以将DNA分子打断为电泳主带集中在一定大小的片段,例如50-700 bp,优选100-500bp,更优选150-300 bp,特别是200 bp附近,然后进行后续步骤。所述DNA分子的随机打断处理可以采用酶切、雾化、超声、或者HydroShear法。优选地,采用超声法,例如Covaris公司的S-series(其是基于AFA技术,当由传感器释放的声能/机械能通过DNA样品时,溶解气体形成气泡,而当能量移除后,气泡破裂并产生断裂DNA分子的能力,因而通过设置一定的能量强度和时间间隔等条件,可将DNA分子打断至一定范围的大小。具体原理和方法可以参见Covaris公司的S-series说明书)。
根据本发明的实施例,可以采用携带预定探针的芯片,对欲进行核酸测序的核酸进行筛选。由此,提高测序效率。在本发明中,所使用芯片为根据待检测染色体进行设计的捕获芯片。所述捕获芯片携带能够识别待检测染色体的预定探针,以及能够识别其他染色体的预定探针。根据本发明的一个实施例,本发明设计的捕获芯片携带能够识别性染色体区域的探针,以及能够识别所有常染色体的探针,由此,对待测孕妇样本进行捕获测序时,能够以利用上述能够识别所有常染色体的探针获得的测序数据作为正常参照,对待测孕妇样本的性染色体的测序数据进行分析,从而能够准确有效地确定其胎儿是否存在性染色体异常的情况。根据本发明的实施例,可以根据检测需要,灵活调整捕获芯片中识别性染色体X、Y的探针与识别常染色体对照探针的比例。根据本发明的另一个实施例,对于对照/待测样本,加大捕获Y染色体文库的探针的数量,由此,Y染色体测序数据所占比例大于常规基因组测序中Y染色体数据所占比例(常规全基因组测序Y染色体数据所占比例值相对较小),从而有利于确定待测孕妇样本的胎儿是否存在性染色体异常。根据本发明的实施例,对芯片的设计平台及探针长度等没有特殊要求。例如,根据本发明的一个实施例,所用芯片是采用Agilent平台设计的,涵盖了所有常染色体及性染色体,由此,还可以对所有的染色体进行数目异常检测。
根据本发明的实施例,所述测序数据的长度为25~200 nt。根据本发明的实施例,利用第二代测序技术或单分子测序技术进行所述核酸测序。在本发明中,测序数据是指测序仪输出的序列片段,即reads,优选约25-200 nt。本发明中,从测试样本获得测序数据可以采用测序的方法进行,所述测序可通过任何测序方法进行,包括但不限于双脱氧链终止法;优选高通量的测序方法,包括但不限于第二代测序技术或者是单分子测序技术。所述第二代测序平台(Metzker ML.Sequencing technologies-the next generation.Nat RevGenet.2010 Jan;11(1):31-46)包括但不限于Illumina-Solexa(GATM,HiSeq2000TM等)、ABI-Solid和Roche-454(焦磷酸测序)测序平台;单分子测序平台(技术)包括但不限于Helicos公司的真实单分子测序技术(True Single Molecule DNA sequencing),Pacific Biosciences公司单分子实时测序(single molecule real-time(SMRTTM)),以及Oxford NanoporeTechnologies公司的纳米孔测序技术等(Rusk,Nicole(2009-04-01).CheapThird-Generation Sequencing.Nature Methods 6(4):2446(4)。测序类型可以为single-end(单向)测序和Pair-end(双向)测序,测序长度可以为50 bp、90 bp、或100 bp。在本发明的一个实施方案中,所述的测序平台为Illumina/Solexa,测序类型为Pair-end测序,得到具有双向位置关系的100 bp大小的DNA序列分子。当待测的DNA分子来自多个受试样本时,每个样本可以被加上不同的标签序列,以用于在测序过程中进行样品的区分(MicahHamady,Jeffrey J Walker,J Kirk Harris et al.Error-correcting barcodedprimers for pyrosequencing hundreds of samples in multiplex.NatureMethods,2008,March,Vol.5 No.3),从而实现同时对多个样品进行测序。标签序列为了区分不同序列,但不影响添加标签序列的DNA分子的其他功能。标签序列长度可以是4-12 bp。
其次,将所述测序数据与人类的参照基因组序列进行比对,以便获得比对测序数据集。本发明的一个实施例中,所述的人类基因组参考序列是NCBI数据库中的人类基因组参考序列。在本发明的一个实施方案中,所述人类基因组序列是NCBI数据库中版本37(hg19;NCBI Build 37)的人类基因组参考序列。在本发明中,所述比对可以是不容错比对,也可以是错配1个碱基的比对。序列比对可以通过任何一种序列比对程序,例如本领域技术人员可获得的短寡核苷酸分析包(Short Oligonucleotide Analysis Package,SOAP)和BWA比对(Burrows-Wheeler Aligner)进行,将测序数据与参考基因组序列进行比对,得到测序数据在参考基因组上的位置。进行序列比对可以使用程序提供的默认参数进行,或者由本领域技术人员根据需要对参数进行选择。在本发明的一个实施方案中,所采用的比对软件是SOAPaligner/soap2。
接着,确定所述比对测序数据集中所包含的比对测序数据的数目Q。在本发明的一个实施方案中,获得的比对测序数据集只包含唯一比对测序数据,即Q为比对测序数据集中所包含的唯一比对测序数据的数目。
接下来,确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni,其中,i表示染色体的编号,所述第i号染色体至少包括Y染色体以及任选的X染色体。根据本发明的实施例,对于某一样本来源的测序数据集,在确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni之后,对所述来源于第i号染色体的测序数据的数目Ni进行标准化处理。根据本发明的一个具体示例,所述标准化处理包括将所述来源于第i号染色体的测序数据的数目Ni除以所述比对测序数据集中所包含的比对测序数据的数目Q或者Q的一部分(例如Q中来源于一条或多条常染色体的比对测序数据数目),以便获得经过标准化的第i号染色体的测序数据的数目ri’,并用所述经过标准化的第i号染色体的测序数据的数目ri’替换所述来源于第i号染色体的测序数据的数目Ni。其中,对所述来源于第i号染色体的测序数据的数目Ni进行标准化处理是因为:利用孕妇血浆等孕妇样本检测胎儿的性染色体数目异常时,由于母亲DNA背景的影响,胎儿的变异较难凸显出来,所以要通过标准化,来降低母亲DNA背景噪音,放大胎儿变异信号。需要说明的是,本实施方式中所述的“标准化处理”是利用各自的测序数据量进行归一化处理,使相对数值ri’都处于0-1范围,利用相对测序数据量进行后续的分析运算,是为消除样本间的测序数据量的差异、突出数据本身的统计意义。在其他实施方式中,标准化处理也可以利用GC校正进行,或者同时进行归一化和GC校正也可达到一样的目的。在本发明的一个实施例中,GC校正指对Ni乘一个系数将第i号染色体测序数据的GC含量校正到全基因组平均水平,得Nai,Nai=εiNi,GC校正能够调整由于GC含量不同带来的测序数据量的差异。在本发明的一个实施例中,对于第i号染色体的GC校正系数εi可这样确定:比对,获得所有m个样本的第i号染色体的测序数据数目Ni后,将所有m个i染色体(GC含量相同)归为一组获得Ni的均值Nai,确定一目标值作为参考,如选取m个样本比对到所有染色体的测序数据数的平均值Na作为目标值,得εi=Nai/Na。若未采用上述的方式对测序数据量进行标准化处理但仍然依据本发明的处理思路进行后续数据分析,即只是在进行数值的分析、计算和比较时使用未标准化的数值水平,均应当视为与本实施方式等同。
接着,基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别。根据本发明的实施例,基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别包括:将所述孕妇样本的经过标准化的Y染色体的测序数据的数目ry’,对照多个已知胎儿性别的孕妇样本进行Z值检验,并基于所获得的所述孕妇样本Y染色体的Z值,确定所述胎儿的性别。根据本发明的一个实施例,所述Z值检验是对照多个正常女胎孕妇样本进行的。其中,基于所获得的所述孕妇样本Y染色体的Z值,确定所述胎儿的性别,是通过将所获得的孕妇样本Y染色体的Z值与阈值比较而实现的。所述阈值是设置一置信度计算多个对照女胎孕妇样本Y染色体的统计量获得的。如前所述,由于阈值是由对照样本得到的,因此可以预先计算和保存,在后续对目标个体进行检测时,只要对照样本数不变,均可使用相同的阈值设置。当然若减少、更换或增加对照样本则可以调整置信度更新相应的阈值。在本发明的一个实施例中,所采用的一种判断胎儿性别的Y染色体阈值计算方式,包括如下步骤:1)以多个正常女胎孕妇样本作为对照样本,优选地,对照样本数大于等于30;计算ry’的平均值meany和标准差sdy,计算每个样本的Zy值。在一实施例中,共m个对照样本, 第k个样本的zy,k=ry,k'-meany/sdy;2)按照设定的检验规则和置信度计算判断为正常所对应的Zy值边界,以此作为Y染色体的阈值。在本发明实施例中可根据对照样本的数目以及所需要的检测精度等选择检验规则并设置相应的置信度,具体可按照已有的统计数据处理方式进行。本实施方式中,优选采用Z检验双边检测,置信度为99.9%。在其他实施方式中,也可选择T检验等其他检验规则,同时地或可选地,置信度可选择为90%~99.9%,例如99%、99.5%、99.9%等。
其中,所述孕妇样本Y染色体的Z值是利用下列公式计算获得的:
z=rY,j'-meanY/sdY
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d Y = 1 n - 1 Σ j = 1 n ( r Y , j ′ - mea n Y ) 2 .
根据本发明的一个实施例,当选取置信度为99.9%时,所述孕妇样本Y染色体的Z值大于3是所述胎儿为男胎的指示,所述孕妇样本Y染色体的Z值不大于3是所述胎儿为女胎的指示。
然后,确定所述胎儿是否存在性染色体数目异常。根据本发明的实施例,具体地:
其中,针对男胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:基于所述来源于Y染色体的测序数据的数目Ny,计算所述男胎孕妇样本中的胎儿核酸浓度;构建对照样本数据集D,其中所述对照样本数据集D与所述男胎孕妇样本具有相同的胎儿核酸浓度;以及确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述男胎存在性染色体数目异常的指示。
根据本发明的实施例,所述对照样本数据集D是基于公式D=F*(1-男胎胎儿核酸浓度)+M*男胎胎儿核酸浓度而确定的,其中,F表示已知的正常女性基因组数据集,M表示已知的正常男性基因组数据集。
根据本发明的另一些实施例,所述男胎胎儿核酸浓度是基于下列公式确定的:
conc = r Y ′ - mea n Y , female mea n Y , male - mea n Y , female ,
其中,
meanY,female为预先确定的已知女胎的孕妇样本中比对到Y染色体的测序数据的数目所占比例的平均值;
meanY,male为预定先确定的已知男胎的孕妇样本中比对到Y染色体的测序数据的数目所占比例的平均值。
根据本发明的实施例,通过Z值检验,确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中所述Z值检验包括利用下列公式确定所述男胎孕妇样本的X染色体Z值:
z=rX,j'-meanX/sdX
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d X = 1 n - 1 Σ j = 1 n ( r X , j ′ - mea n X ) 2 .
根据本发明的一个具体示例,所述男胎孕妇样本的X染色体Z值小于或等于-3是所述男胎的性染色体为XYY的指示,所述男胎孕妇样本的X染色体Z值大于或等于3是所述男胎的性染色体为XXY的指示,所述男胎孕妇样本的X染色体Z值大于-3且小于3是所述男胎的性染色体为XY的指示。由此,能够有效地确定待测男胎孕妇样本中男胎的性染色体的类型,从而确定胎儿是否具有性染色体数目异常。
针对女胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述女胎存在性染色体数目异常的指示。
根据本发明的实施例,通过Z值检验,确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中所述Z值检验包括利用下列公式确定所述女胎孕妇样本的X染色体Z值:
z=rX,j'-meanX/sdX
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d X = 1 n - 1 Σ j = 1 n ( r X , j ′ - mea n X ) 2 .
根据本发明的一个具体示例,所述女胎孕妇样本的X染色体Z值小于或等于-3是所述女胎的性染色体为X的指示,所述女胎孕妇样本的X染色体Z值大于或等于3是所述女胎的性染色体为XXX的指示,所述女胎孕妇样本的X染色体Z值大于-3且小于3是所述女胎的性染色体为XX的指示。
需要说明的是,在Z值检验过程中,检验的零假设为待测样本染色体数目正常。当待测样本的染色体Z值超过一定阈值时,表示其与对照样本数据集D的该染色体相比具有显著差异,从而拒绝零假设、被判断为该染色体数目异常。由此,利用根据本发明实施例的方法,能够有效地确定胎儿是否具有性染色体数目异常。其中,确定Z值阈值时,可以将对照样本的测序数据先进行前述的标准化处理后,再统计目标染色体的测序数据数目,从而能够使每个染色体Z值符合正态分布。其中,前述的Z值-3和3都不是整数,而是正态分布中置信区间为99.9%的分位点。本领域技术人员也可以根据需要选取Z值为绝对值更大和更小的值,以便对应正态分布中置信区间更大或更小的范围。
发明人惊奇地发现,利用根据本发明实施例的方法,能够准确有效地确定胎儿是否存在性染色体数目异常。
计算机可读介质
在本发明的又一方面,本发明提出了一种计算机可读介质。根据本发明的实施例,所述计算机可读介质上存储有指令,所述指令适于被处理器执行以便通过下列步骤确定胎儿是否存在性染色体数目异常:
首先,获取来自孕妇样本的多个测序数据,所述孕妇样本包含胎儿核酸。
其次,将所述测序数据与人类的参照基因组序列进行比对,以便获得比对测序数据集。
接着,确定所述比对测序数据集中所包含的比对测序数据的数目Q。
接下来,确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni,其中,i表示染色体的编号,所述第i号染色体至少包括Y染色体以及任选的X染色体。
接着,基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别。
然后,确定所述胎儿是否存在性染色体数目异常。
其中,针对男胎,确定所述胎儿是否存在性染色体数目异常包括下列步骤:首先,基于所述来源于Y染色体的测序数据的数目Ny,计算所述男胎孕妇样本中的胎儿核酸浓度。接着,构建对照样本数据集D,其中所述对照样本数据集D与所述男胎孕妇样本具有相同的胎儿核酸浓度。根据本发明的实施例,这里所使用的术语“构建”应做广义理解,其还可以包括选择具有同样胎儿(男胎)核酸浓度的对照样本集,也可以利用现有数据模拟具有同样胎儿(男胎)浓度的对照样本集。根据本发明的实施例,采用模拟的方法进行构建,对照样本数据集D是基于公式D=F*(1-男胎胎儿核酸浓度)+M*男胎胎儿核酸浓度。接下来,确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述男胎存在性染色体数目异常的指示。
针对女胎,确定所述胎儿是否存在性染色体数目异常包括下列步骤:确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述女胎存在性染色体数目异常的指示。
需要说明的是,前面针对确定胎儿是否存在性染色体数目异常的方法所进行的描述,也适用于上述本发明的计算机可读介质,在此不再赘述。
根据本发明的实施例,利用本发明的计算机可读介质,能够准确有效地确定胎儿是否存在性染色体数目异常。
用于确定胎儿是否存在性染色体数目异常的系统
在本发明的再一方面,本发明又提出了一种用于确定胎儿是否存在性染色体数目异常的系统。根据本发明的实施例,该系统包括:测序装置,所述测序装置用于针对孕妇样本进行核酸测序,以便获得多个测序数据;以及前面所述的计算机可读介质。
需要说明的是,前面针对确定胎儿是否存在性染色体数目异常的方法及计算机可读介质所进行的描述,同样适用于本发明的用于确定胎儿是否存在性染色体数目异常的系统,在此不再赘述。
发明人惊奇地发现,利用根据本发明实施例的用于确定胎儿是否存在性染色体数目异常的系统,能够准确有效地确定胎儿是否存在性染色体数目异常。
需要说明的是,与目前的性染色体数目异常检测的方法相比,本发明的优越性主要表现为:
(1)临床可行性:本发明使用目标区域捕获的方式,在较高的测序深度下同时减少测序数据,可有效的检测出XO、XXX、XXY和XYY,本发明的方法大大的减少了数据产生的成本。
(2)可扩展性:除了通过增加测序量之外,本发明可以通过扩大对照组数量来增大精度,以减轻对起始DNA量的压力。
(3)更稳定,更加全面:已报道文章中,并无明确指出自身的操作细节,而本发明涉及数据群体检测等的各个方面。
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市场获得的常规产品。以下括号内为各个试剂或试剂盒的厂家货号。所使用的测序用的接头和标签序列来源于Illumina公司的Multiplexing Sample Preparation Oligonutide Kit。
实施例1
参考图1,对4例孕妇血浆进行胎儿性染色体非整倍性变异检测。其中,选取10例正常女胎孕妇血浆、5例正常男胎孕妇血浆、4例男性基因组样本作为参照数据集。
DNA提取:
按照TiangenDP327-02Kit操作流程提取上述血浆样品(样品编号见表1)的DNA,所提取DNA按照修改后的Illumina/Solexa标准建库流程进行建库,在主带集中于200 bp的DNA分子两端被加上测序所用接头。
具体而言,将获自上述血浆样品的约10 ng的DNA,进行修改后的Illumina/Solexa标准流程建库,具体流程参照产品说明书(www.illumina.com提供的Illumina/Solexa标准建库说明书)。经2100Bioanalyzer(Agilent)确定DNA文库大小及插入片段为约200 bp,QPCR精确定量后可进行目标片段捕获。
杂交:
构建好的文库经Bioanalyzer 2100检测片段分布范围符合要求,再经过Q-PCR方法对文库进行定量,合格后,取500 ng文库用在Agilent公司定制的液相捕获探针SureSelect XT Custom Library(5190-4816)进行捕获(具体捕获杂交及洗脱流程参照www.genomics.agilent.com提供的标准操作流程)。捕获后文库再次经Bioanalyzer 2100检测片段分布范围及Q-PCR方法对文库进行定量,合格后可上机测序。
测序:
本实施例中,对于获自上述血浆的DNA样本按照Illumina/Solexa官方公布的ClusterStation和Hiseq2000(PEsequencing)说明书进行操作上机测序,使每个样品得到约1.83 G数据量,每个样本根据所述标签序列区分。利用比对软件SOAP2(获自soap.genomics.org.cn),将测序所得DNA序列与NCBI数据库中版本37(hg19;NCBIBuild37)的人类基因组参考序列进行比对,得到所测序DNA序列在所述基因组上的定位。
数据分析:
通过对测序得到的序列,对样本的性染色体数目进行分析,其流程如图1所示,详细步骤如下:
a)对测试样本计算相对测序数据数:比对时设置读段比对长度为50 bp,统计参考唯一比对序列的数目,将人类基因组参考序列按染色体进行划分,统计落在每个染色体上的实际测序数据数Ni,j,其中下标i和j分别代表染色体编号和样本编号;
b)数据标准化:计算测试样本中多条常染色体的测序数据总数nj,则待测样本每条染色体的相对百分数为ri,j',其中:ri,j'=Ni,j/nj
c)性别判定:以已知女胎的Y染色体作为参照,计算所有样本的Y染色体z值,如果z大于3,则样本为男胎,否则为女胎。
d)男胎性染色体异常判定:
①根据Y染色体的比例,计算血浆中的胎儿浓度,公式为:
con c j = r Y , j ′ - mea n Y , female mea n Y , male - mea n Y , female
其中,
meanY,female为女胎中Y的平均相对百分比;
meanY,male为男胎中Y的平均相对百分比。
②根据计算得到的胎儿浓度,用女胎或女性基因组的数据与正常男性的基因组数据进行混合,模拟产生与此胎儿浓度对应的对照样本数据集。
对照数据=已知女胎或女性基因组的数据*(1-胎儿浓度)+正常男性的基因组数据*胎儿浓度。
③对得到的对照集,计算X染色体的均值及方差,从而对X染色体进行z值的计算,如果z大于或等于3,则待测样本为47,XXY或47,XYY,此时,再以女胎样本做对照样本对X染色体进行检验,如在±3范围内(对应置信区间99.9%,区间两极限大致为±3,不是整数),则为47,XXY,否则为47,XYY;如果z大于-3且小于3,则待测样本为正常男性46,XY。
e)女胎性染色体异常判定:
①以女胎的样本作为参考数据集,计算待测样本的X染色体z值。
②如果z小于或等于-3,则待测样本为45,X;此时的胎儿浓度为:
con c j = r X , j ′ - mea n X , female mea n X , female .
③如果z大于或等于3,则待测样本为47,XXX;此时的胎儿浓度为:
con c j = mea n X , female - r X , j ′ mea n X , female ,
其中,
为女胎中X染色体色体的平均百分比。
④如果z大于-3且小于3,则待测样本为正常女性46,XX。此时,无法计算血浆中的胎儿浓度。
其中:
z=ri,j'-meani/sdi
mea n i = 1 n Σ j = 1 n r i , j ′ ,
s d i = 1 n - 1 Σ j = 1 n ( r i , j ′ - mea n i ) 2 .
详细样本信息及检测结果见下表1。
表1样本信息及检测结果
工业实用性
本发明的用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质,能够有效地用于确定胎儿是否存在性染色体数目异常,并且可重复性好,结果准确。
尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

Claims (35)

1.一种确定胎儿是否存在性染色体数目异常的方法,其特征在于,包括:
针对包含胎儿核酸的孕妇样本进行核酸测序,以便获得多个测序数据;
将所述测序数据与人类的参照基因组序列进行比对,以便获得比对测序数据集;
确定所述比对测序数据集中所包含的比对测序数据的数目Q;
确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni,其中,i表示染色体的编号,所述第i号染色体至少包括Y染色体以及任选的X染色体;
基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别;以及
确定所述胎儿是否存在性染色体数目异常,
其中,
针对男胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:
基于所述来源于Y染色体的测序数据的数目Ny,计算所述男胎孕妇样本中的胎儿核酸浓度;
构建对照样本数据集D,其中所述对照样本数据集D与所述男胎孕妇样本具有相同的胎儿核酸浓度;以及
确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述男胎存在性染色体数目异常的指示,
针对女胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:
确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述女胎存在性染色体数目异常的指示。
2.根据权利要求1所述的方法,其特征在于,所述孕妇样本为选自孕妇外周血、孕妇尿液、孕妇宫颈胎儿脱落滋养细胞、孕妇宫颈粘液、胎儿有核红细胞和孕妇血浆的至少一种。
3.根据权利要求1所述的方法,其特征在于,利用选自盐析法、柱层析法、磁珠法、SDS法的至少一种从所述孕妇样本提取DNA,以便进行所述核酸测序。
4.根据权利要求1所述的方法,其特征在于,采用携带预定探针的芯片,对进行所述核酸测序的核酸进行筛选。
5.根据权利要求1所述的方法,其特征在于,所述测序数据的长度为25~200 nt。
6.根据权利要求1所述的方法,其特征在于,利用第二代测序技术或单分子测序技术进行所述核酸测序。
7.根据权利要求1所述的方法,其特征在于,采用SOAPaligner/soap2,将所述测序数据与人类的参照基因组序列进行比对,并且选择唯一比对序列作为所述比对测序数据。
8.根据权利要求7所述的方法,其特征在于,在确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni之后,对所述来源于第i号染色体的测序数据的数目Ni进行标准化处理。
9.根据权利要求8所述的方法,其特征在于,所述标准化处理包括将所述来源于第i号染色体的测序数据的数目Ni除以所述比对测序数据集中所包含的比对测序数据的数目Q或者Q的一部分,以便获得经过标准化的第i号染色体的测序数据的数目ri’,并用所述经过标准化的第i号染色体的测序数据的数目ri’替换所述来源于第i号染色体的测序数据的数目Ni
10.根据权利要求9所述的方法,其特征在于,基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别包括:
将所述孕妇样本的经过标准化的Y染色体的测序数据的数目ry’,对照多个已知胎儿性别的孕妇样本进行Z值检验,并基于所获得的所述孕妇样本Y染色体的Z值,确定所述胎儿的性别。
11.根据权利要求10所述的方法,其特征在于,所述孕妇样本Y染色体的Z值是利用下列公式计算获得的:
z=rY,j'-meanY/sdY
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d Y = 1 n - 1 Σ j = 1 n ( r Y , j ′ - mea n Y ) 2 .
12.根据权利要求11所述的方法,其特征在于,所述孕妇样本Y染色体的Z值大于3是所述胎儿为男胎的指示,所述孕妇样本Y染色体的Z值不大于3是所述胎儿为女胎的指示。
13.根据权利要求9所述的方法,其特征在于,所述对照样本数据集D是基于公式D=F*(1-男胎胎儿核酸浓度)+M*男胎胎儿核酸浓度而确定的,其中,F表示已知的正常女性基因组数据集,M表示已知的正常男性基因组数据集。
14.根据权利要求13所述的方法,其特征在于,所述男胎胎儿核酸浓度是基于下列公式确定的:
conc = r Y ′ - mea n Y , female mea n Y , male - mea n Y , female ,
其中,
meanY,female为预先确定的已知女胎的孕妇样本中比对到Y染色体的测序数据的数目所占比例的平均值;
meanY,male为预定先确定的已知男胎的孕妇样本中比对到Y染色体的测序数据的数目所占比例的平均值。
15.根据权利要求9所述的方法,其特征在于,通过Z值检验,确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中所述Z值检验包括利用下列公式确定所述男胎孕妇样本的X染色体Z值:
z=rX,j'-meanX/sdX
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d X = 1 n - 1 Σ j = 1 n ( r X , j ′ - mea n X ) 2 .
16.根据权利要求9所述的方法,其特征在于,通过Z值检验,确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中所述Z值检验包括利用下列公式确定所述女胎孕妇样本的X染色体Z值:
z=rX,j'-meanX/sdX
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d X = 1 n - 1 Σ j = 1 n ( r X , j ′ - mea n X ) 2 .
17.根据权利要求15所述的方法,其特征在于,
所述男胎孕妇样本的X染色体Z值小于或等于-3是所述男胎的性染色体为XYY的指示,
所述男胎孕妇样本的X染色体Z值大于或等于3是所述男胎的性染色体为XXY的指示,
所述男胎孕妇样本的X染色体Z值大于-3且小于3是所述男胎的性染色体为XY的指示。
18.根据权利要求16所述的方法,其特征在于,
所述女胎孕妇样本的X染色体Z值小于或等于-3是所述女胎的性染色体为X的指示,
所述女胎孕妇样本的X染色体Z值大于或等于3是所述女胎的性染色体为XXX的指示,
所述女胎孕妇样本的X染色体Z值大于-3且小于3是所述女胎的性染色体为XX的指示。
19.一种计算机可读介质,其特征在于,所述计算机可读介质上存储有指令,所述指令适于被处理器执行以便通过下列步骤确定胎儿是否存在性染色体数目异常:
获取来自孕妇样本的多个测序数据,所述孕妇样本包含胎儿核酸;
将所述测序数据与人类的参照基因组序列进行比对,以便获得比对测序数据集;
确定所述比对测序数据集中所包含的比对测序数据的数目Q;
确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni,其中,i表示染色体的编号,所述第i号染色体至少包括Y染色体以及任选的X染色体;
基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别;以及
确定所述胎儿是否存在性染色体数目异常,
其中,
针对男胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:
基于所述来源于Y染色体的测序数据的数目Ny,计算所述男胎孕妇样本中的胎儿核酸浓度;
构建对照样本数据集D,其中所述对照样本数据集D与所述男胎孕妇样本具有相同的胎儿核酸浓度;以及
确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述男胎存在性染色体数目异常的指示,
针对女胎孕妇样本,确定所述胎儿是否存在性染色体数目异常包括下列步骤:
确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中,存在显著差异是所述女胎存在性染色体数目异常的指示。
20.根据权利要求19所述的计算机可读介质,其特征在于,所述孕妇样本为选自孕妇外周血、孕妇尿液、孕妇宫颈胎儿脱落滋养细胞、孕妇宫颈粘液、胎儿有核红细胞和孕妇血浆的至少一种。
21.根据权利要求19所述的计算机可读介质,其特征在于,所述测序数据的长度为25~100 nt。
22.根据权利要求19所述的计算机可读介质,其特征在于,所述测序数据是利用第二代测序技术或单分子测序技术获得的。
23.根据权利要求19所述的所述计算机可读介质,其特征在于,采用SOAPaligner/soap2,将所述测序数据与人类的参照基因组序列进行比对,并且选择唯一比对序列作为所述比对测序数据。
24.根据权利要求19所述的计算机可读介质,其特征在于,在确定所述比对测序数据集中来源于第i号染色体的测序数据的数目Ni之后,对所述来源于第i号染色体的测序数据的数目Ni进行标准化处理。
25.根据权利要求24所述的计算机可读介质,其特征在于,所述标准化处理包括将所述来源于第i号染色体的测序数据的数目Ni除以所述比对测序数据集中所包含的比对测序数据的数目Q或者Q的一部分,以便获得经过标准化的第i号染色体的测序数据的数目ri’,并将所述经过标准化的第i号染色体的测序数据的数目ri’替换所述来源于第i号染色体的测序数据的数目Ni
26.根据权利要求25所述的计算机可读介质,其特征在于,基于来源于Y染色体的测序数据的数目Ny,确定胎儿的性别包括:
将所述孕妇样本的经过标准化的Y染色体的测序数据的数目ry’,对照多个已知胎儿性别的孕妇样本进行Z值检验,并基于所获得的所述孕妇样本Y染色体的Z值,确定所述胎儿的性别。
27.根据权利要求26所述的计算机可读介质,其特征在于,所述孕妇样本Y染色体的Z值是利用下列公式计算获得的:
z=rY,j'-meanY/sdY
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d Y = 1 n - 1 Σ j = 1 n ( r Y , j ′ - mea n Y ) 2 .
28.根据权利要求27所述的计算机可读介质,其特征在于,所述孕妇样本Y染色体的Z值大于3是所述胎儿为男胎的指示,所述孕妇样本Y染色体的Z值不大于3是所述胎儿为女胎的指示。
29.根据权利要求25所述的计算机可读介质,其特征在于,所述对照样本数据集D是基于公式D=F*(1-男胎胎儿核酸浓度)+M*男胎胎儿核酸浓度而确定的,其中,F表示已知的正常女性基因组数据集,M表示已知的正常男性基因组数据集。
30.根据权利要求29所述的计算机可读介质,其特征在于,所述男胎胎儿核酸浓度是基于下列公式确定的:
conc = r Y ′ - mea n Y , female mea n Y , male - mea n Y , female ,
其中,
meanY,female为预先确定的已知女胎的孕妇样本中比对到Y染色体的测序数据的数目所占比例的平均值;
meanY,male为预定先确定的已知男胎的孕妇样本中比对到Y染色体的测序数据的数目所占比例的平均值。
31.根据权利要求26所述的计算机可读介质,其特征在于,通过Z值检验,确定所述对照样本数据集的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中所述Z值检验包括利用下列公式确定所述男胎孕妇样本的X染色体Z值:
z=rX,j'-meanX/sdX
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d X = 1 n - 1 Σ j = 1 n ( r X , j ′ - mea n X ) 2 .
32.根据权利要求26所述的计算机可读介质,其特征在于,通过Z值检验,确定所述女胎孕妇样本的X染色体含量与正常胎儿孕妇样本的X染色体含量之间是否存在显著差异,其中所述Z值检验包括利用下列公式确定所述女胎孕妇样本的X染色体Z值:
z=rX,j'-meanX/sdX
其中,j代表孕妇样本的编号,
n表示孕妇样本的总数,
s d X = 1 n - 1 Σ j = 1 n ( r X , j ′ - mea n X ) 2 .
33.根据权利要求31所述的计算机可读介质,其特征在于,
所述男胎孕妇样本的X染色体Z值小于或等于-3是所述男胎的性染色体为XYY的指示,
所述男胎孕妇样本的X染色体Z值大于或等于3是所述男胎的性染色体为XXY的指示,
所述男胎孕妇样本的X染色体Z值大于-3且小于3是所述男胎的性染色体为XY的指示。
34.根据权利要求32所述的计算机可读介质,其特征在于,
所述女胎孕妇样本的X染色体Z值小于或等于-3是所述女胎的性染色体为X的指示,
所述女胎孕妇样本的X染色体Z值大于或等于3是所述女胎的性染色体为XXX的指示,
所述女胎孕妇样本的X染色体Z值大于-3且小于3是所述女胎的性染色体为XX的指示。
35.一种用于确定胎儿是否存在性染色体数目异常的系统,其特征在于,包括:
测序装置,所述测序装置用于针对孕妇样本进行核酸测序,以便获得多个测序数据;以及
权利要求19-34任一项所述的计算机可读介质。
CN201380006956.6A 2013-09-10 2013-09-10 用于确定胎儿是否存在性染色体数目异常的系统和装置 Active CN104169929B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/083217 WO2015035555A1 (zh) 2013-09-10 2013-09-10 用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质

Publications (2)

Publication Number Publication Date
CN104169929A true CN104169929A (zh) 2014-11-26
CN104169929B CN104169929B (zh) 2016-12-28

Family

ID=51912350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380006956.6A Active CN104169929B (zh) 2013-09-10 2013-09-10 用于确定胎儿是否存在性染色体数目异常的系统和装置

Country Status (2)

Country Link
CN (1) CN104169929B (zh)
WO (1) WO2015035555A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354443A (zh) * 2015-12-14 2016-02-24 孔祥军 无创产前基因检测分析软件
CN108256296A (zh) * 2017-12-29 2018-07-06 北京科迅生物技术有限公司 数据处理方法及装置
CN108900319A (zh) * 2018-05-30 2018-11-27 北京百度网讯科技有限公司 故障检测方法和装置
CN109074427A (zh) * 2015-12-22 2018-12-21 普瑞梅萨有限公司 染色体异常的检测
CN109554485A (zh) * 2018-12-26 2019-04-02 北京迈基诺基因科技股份有限公司 一种用于无创检测待测胎儿染色体是否为非整倍体的试剂盒及其专用探针组
CN110033828A (zh) * 2019-04-03 2019-07-19 北京各色科技有限公司 基于芯片检测dna数据的性别判断方法
CN110191964B (zh) * 2017-01-24 2023-12-05 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE1022789B1 (nl) * 2015-07-17 2016-09-06 Multiplicom Nv Werkwijze en systeem voor geslachtsinschatting van een foetus van een zwangere vrouw
TWI603082B (zh) * 2016-09-30 2017-10-21 有勁生物科技股份有限公司 非侵入式胎兒性徵異常檢測系統及其方法與非侵入式胎兒性徵檢測系統及其方法
CN109545279B (zh) * 2018-11-29 2023-12-29 深圳市第二人民医院 染色体微阵列数据的分析方法、装置、设备及存储介质
CN113793641B (zh) * 2021-09-29 2023-11-28 苏州赛美科基因科技有限公司 一种从fastq文件中快速判断样本性别的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060292602A1 (en) * 2005-04-13 2006-12-28 Yale University DNA diagnostic screening for turner syndrome and sex chromosome disorders
CN101137760A (zh) * 2005-03-18 2008-03-05 香港中文大学 检测染色体非整倍性的方法
CN101530336A (zh) * 2008-03-11 2009-09-16 广州医学院 无创性染色体异常出生缺陷孕早期筛查方法
CN102094083A (zh) * 2010-11-15 2011-06-15 北京大学 单细胞核酸扩增新技术对植入前胚胎的遗传学诊断
CN102985552A (zh) * 2009-11-25 2013-03-20 伯乐生命医学产品有限公司 用于检测遗传物质的方法和组合物
WO2013052557A2 (en) * 2011-10-03 2013-04-11 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
CN103108960A (zh) * 2010-02-19 2013-05-15 西昆诺姆有限公司 用于检测胎儿核酸和诊断胎儿异常的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101137760A (zh) * 2005-03-18 2008-03-05 香港中文大学 检测染色体非整倍性的方法
US20060292602A1 (en) * 2005-04-13 2006-12-28 Yale University DNA diagnostic screening for turner syndrome and sex chromosome disorders
CN101530336A (zh) * 2008-03-11 2009-09-16 广州医学院 无创性染色体异常出生缺陷孕早期筛查方法
CN102985552A (zh) * 2009-11-25 2013-03-20 伯乐生命医学产品有限公司 用于检测遗传物质的方法和组合物
CN103108960A (zh) * 2010-02-19 2013-05-15 西昆诺姆有限公司 用于检测胎儿核酸和诊断胎儿异常的方法
CN102094083A (zh) * 2010-11-15 2011-06-15 北京大学 单细胞核酸扩增新技术对植入前胚胎的遗传学诊断
WO2013052557A2 (en) * 2011-10-03 2013-04-11 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354443A (zh) * 2015-12-14 2016-02-24 孔祥军 无创产前基因检测分析软件
CN109074427A (zh) * 2015-12-22 2018-12-21 普瑞梅萨有限公司 染色体异常的检测
CN109074427B (zh) * 2015-12-22 2023-03-31 优基因健康英国有限公司 染色体异常的检测
CN110191964B (zh) * 2017-01-24 2023-12-05 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置
CN108256296A (zh) * 2017-12-29 2018-07-06 北京科迅生物技术有限公司 数据处理方法及装置
CN108256296B (zh) * 2017-12-29 2021-05-25 北京科迅生物技术有限公司 数据处理装置
CN108900319A (zh) * 2018-05-30 2018-11-27 北京百度网讯科技有限公司 故障检测方法和装置
CN108900319B (zh) * 2018-05-30 2021-05-25 北京百度网讯科技有限公司 故障检测方法和装置
CN109554485A (zh) * 2018-12-26 2019-04-02 北京迈基诺基因科技股份有限公司 一种用于无创检测待测胎儿染色体是否为非整倍体的试剂盒及其专用探针组
CN109554485B (zh) * 2018-12-26 2022-04-19 北京迈基诺基因科技股份有限公司 一种用于无创检测待测胎儿染色体是否为非整倍体的试剂盒及其专用探针组
CN110033828A (zh) * 2019-04-03 2019-07-19 北京各色科技有限公司 基于芯片检测dna数据的性别判断方法
CN110033828B (zh) * 2019-04-03 2021-06-18 北京各色科技有限公司 基于芯片检测dna数据的性别判断方法

Also Published As

Publication number Publication date
CN104169929B (zh) 2016-12-28
WO2015035555A1 (zh) 2015-03-19

Similar Documents

Publication Publication Date Title
CN104169929A (zh) 用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质
CN104221022B (zh) 一种拷贝数变异检测方法和系统
CN105392894B (zh) 确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质
CN104254618B (zh) 母体血浆中胎儿dna分数的基于大小的分析
CN104232777B (zh) 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
CN103525939B (zh) 无创检测胎儿染色体非整倍体的方法和系统
CN104204220B (zh) 一种遗传变异检测方法
US20150376691A1 (en) Rapid aneuploidy detection
JP2019531700A5 (zh)
CN107077537A (zh) 用短读测序数据检测重复扩增
KR20170036734A (ko) 생물학적 샘플 중의 무세포 핵산의 분획을 결정하기 위한 방법 및 장치 및 이의 용도
CN105844116B (zh) 测序数据的处理方法和处理装置
KR101614471B1 (ko) 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치
CN105483229A (zh) 一种检测胎儿染色体非整倍体的方法及系统
CN104830986A (zh) 一种检测胎儿基因信息的方法、装置和系统
CN104156631A (zh) 染色体三倍体检验方法
CN102753703A (zh) 胎儿染色体非整倍性的检测方法
CN105555970A (zh) 同时进行单体型分析和染色体非整倍性检测的方法和系统
CN104520437B (zh) 一种染色体非整倍性检测方法及装置
CN106096330A (zh) 一种无创产前生物信息检测分析方法
CN105765076B (zh) 一种染色体非整倍性检测方法及装置
CN104951671A (zh) 基于单样本外周血检测胎儿染色体非整倍性的装置
CN106591451A (zh) 测定胎儿游离dna含量的方法及其用于实施该方法的装置
CN106795551A (zh) 单细胞染色体的cnv分析方法和检测装置
CN104093858A (zh) 确定生物样本中染色体数目异常的方法、系统和计算机可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHENZHEN BGI CORPORATION

Free format text: FORMER OWNER: BGI-SHENZHEN CO., LTD.

Effective date: 20150805

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150805

Address after: Yantian District of Shenzhen City, Guangdong province 518083 Hongan street No. 21 China Comprehensive Park 7 Building 7 layer -14 layer

Applicant after: BGI SHENZHEN CO LTD

Address before: North Road No. 146, building 11F-3 Industrial Zone in Yantian District of Shenzhen city of Guangdong Province in 518083

Applicant before: BGI-Shenzhen Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant