CN108733982A - 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备 - Google Patents

孕妇nipt结果校正方法、装置及计算机可读存储介质、设备 Download PDF

Info

Publication number
CN108733982A
CN108733982A CN201710883645.8A CN201710883645A CN108733982A CN 108733982 A CN108733982 A CN 108733982A CN 201710883645 A CN201710883645 A CN 201710883645A CN 108733982 A CN108733982 A CN 108733982A
Authority
CN
China
Prior art keywords
cnv
pregnant woman
sequence number
sequencing sequence
sections
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710883645.8A
Other languages
English (en)
Other versions
CN108733982B (zh
Inventor
钱雨飞
岑忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Fendi Gene Technology Co Ltd
Original Assignee
Shanghai Fendi Gene Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Fendi Gene Technology Co Ltd filed Critical Shanghai Fendi Gene Technology Co Ltd
Priority to CN201710883645.8A priority Critical patent/CN108733982B/zh
Publication of CN108733982A publication Critical patent/CN108733982A/zh
Application granted granted Critical
Publication of CN108733982B publication Critical patent/CN108733982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种孕妇NIPT结果校正方法、装置及计算机可读存储介质、设备,所述校正方法包括:获取原始孕妇CNV结果,并判断在预设的染色体上是否存在CNV;当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。上述方案能够提高NIPT结果的准确率。

Description

孕妇NIPT结果校正方法、装置及计算机可读存储介质、设备
技术领域
本发明实施例涉及生物检测领域,尤其涉及一种孕妇NIPT结果校正方法、装置及计算机可读存储介质、设备。
背景技术
无创产前基因检测(Non Invasive Prenatal Testing,NIPT)技术,仅需采集孕妇静脉血,利用新一代DNA测序技术对孕妇外周血浆中的游离DNA片段进行测序,并将测序结果进行生物信息分析,即可从中得到胎儿的遗传信息,从而检测胎儿是否患有染色体疾病。
然而,已有相关研究表明,NIPT技术仍有0.09%的假阳性率,即在很小的几率下有假阳、假阴结果存在。
发明内容
本发明实施例解决的是如何提高NPIT结果的准确率。
为解决上述技术问题,本发明实施例提供一种孕妇NIPT结果校正方法,包括:获取原始孕妇CNV结果,并判断在预设的染色体上是否存在CNV;当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
可选的,所述根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,包括:将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正。
可选的,采用如下公式计算所述参考测序序列数目:其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
可选的,采用如下公式所述计算CNV校正系数:其中,ri为第i个子区间对应的CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
可选的,所述根据所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正,包括:将所述校正系数r向上取整,得到r’;将所述孕妇CNV区间的测序序列数目与r’相乘;将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
可选的,采用如下公式计算Rij其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
可选的,所述预设的染色体包括以下至少一种:第13号染色体、第18号染色体以及第21号染色体。
本发明实施例还提供了一种孕妇NIPT结果校正装置,包括:获取单元,用于获取原始孕妇CNV结果;判断单元,用于判断所述原始CNV结果在预设的染色体上是否存在CNV;第一计算单元,用于当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;校正单元,用于根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;第二计算单元,用于根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;第二计算单元,用于根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;
可选的,所述校正单元,用于将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的所有子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正。
可选的,采用如下公式计算所述参考测序序列数目:其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
可选的,采用如下公式所述计算CNV校正系数:其中,ri为所述CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
可选的,所述校正单元,用于将所述校正系数r向上取整,得到r’;将所述孕妇CNV区间的测序序列数目与r’相乘;将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
可选的,采用如下公式计算Rij其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
可选的,所述预设的染色体包括以下至少一种:第13号染色体、第18号染色体以及第21号染色体。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种所述的孕妇NIPT结果校正方法的步骤。
本发明实施例还提供了一种数据处理设备,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时执行上述任一种所述的孕妇NIPT结果校正方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
当原始孕妇CNV结果在预设染色体上存在CNV时,采用正常孕妇参考库CNV区间的参考测序序列数目,对孕妇CNV区间内的测序序列数目进行校正,并根据校正后的孕妇CNV区间测序序列数目计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果。当更新后的孕妇CNV结果在预设的染色体上不存在CNV时,输出更新后的孕妇NIPT Z值结果,作为校正后的孕妇NIPT结果。由于对原始孕妇CNV结果进行校正,将在预设染色体上存在CNV的原始孕妇CNV结果校正为在预设染色体上不存在CNV,并重新计算NIPT Z值结果,从而避免因原始孕妇CNV结果阳性对NIPT Z值结果造成假阳性影响,因此可以提高NPIT的准确率。
附图说明
图1是本发明实施例中的一种孕妇NIPT结果校正方法的流程图;
图2是本发明实施例中的一种孕妇NIPT结果校正装置的结构示意图。
具体实施方式
如前所述,已有相关研究表明,NIPT技术仍有0.09%的假阳性率,即在很小的几率下有假阳、假阴结果存在,导致上述情况出现的原因包括胎盘嵌合、母体拷贝数变异(CopyNumber Variation,CNV)、胎儿浓度以及其他生物学原因。
在本发明实施例中,由于对原始孕妇CNV结果进行校正,将在预设染色体上存在CNV的原始孕妇CNV结果校正为在预设染色体上不存在CNV,并重新计算NIPT Z值结果,从而避免因原始孕妇CNV结果阳性对NIPT Z值结果造成假阳性影响,因此可以提高NPIT的准确率。
为使本发明实施例的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种孕妇NIPT结果校正方法,参照图1,以下通过具体步骤进行详细说明。
步骤S101,获取原始孕妇CNV结果。
在具体实施中,可以根据现有的计算方法,来计算得到孕妇对应的原始孕妇CNV结果,本发明实施例不再对现有的CNV计算方法进行详细描述。
步骤S102,判断在预设的染色体上是否存在CNV。
在具体实施中,在获取到原始孕妇CNV结果之后,可以判断原始孕妇CNV结果在预设的染色体上是否存在CNV。当在预设的染色体上存在CNV时,执行步骤S103;当在预设的染色体上不存在CNV时,执行步骤S107。
在具体实施中,预设的染色体可以包括第13号染色体、第18号染色体以及第21号染色体中的任一种或多种。在本发明实施例中,预设的染色体可以同时包括第13号染色体、第18号染色体以及第21号染色体,也即在本发明实施例中,分别在第13号染色体、第18号染色体以及第21号染色体上,判断原始孕妇CNV结果是否存在CNV。
步骤S103,计算孕妇CNV区间内的测序序列数目。
在具体实施中,当原始孕妇CNV结果在预设的染色体上存在CNV时,可以计算得到孕妇CNV区间内的测序序列(read)数目。
步骤S104,对所述孕妇CNV区间的测序序列数目进行校正。
在具体实施中,可以根据正常孕妇在孕妇CNV区间内的参考测序序列数目,对孕妇CNV区间的测序序列数目进行校正,校正后的孕妇CNV区间的测序序列数目与参考测序序列数目的差值处于预设范围之内。
在具体应用中,可以预先计算得到正常孕妇在孕妇CNV区间内的参考测序序列数目。参考测序序列数目可以理解为:在孕妇CNV区间内,正常孕妇所对应的测序序列数目,也即正常情况下在孕妇CNV区间内应有的测序序列数目。
下面对参考测序序列数目的计算过程进行举例说明。
首先,挑选正常孕妇样本数据。
从预先建立的正常孕妇数据库中,选取GC含量在[37.98%,43.28%]的样本,同时满足在每个GC区间端样本分布均匀。选取的样本数据量在6M以上,选取的样本比对率M0比对率满足80%以上,且正常孕妇数据库中的样本数在1000以上。GC含量中的G表示为鸟嘌呤(Guanine),C表示为胞嘧啶(Cytosine)。
之后,正常孕妇数据库进行预处理。
对挑选出的正常孕妇样本数据的人类参考基因组屏蔽重复区域与N区域按区间长度100K不重叠分隔,得到n个区间,标号依次为{1,2,3,……,n}。计算每一个区间归一化后的测序序列数目。假设挑选出的正常孕妇样本数据的个数为m个,则第j个孕妇样本数据满足:
其中,i表示第i个区间,j表示第j个孕妇样本数据,Sij为第j个孕妇样本数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,Rij为正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
将原始孕妇CNV结果中的CNV区间进行划分,将其划分为多个长度相同的子区间。在对原始孕妇CNV结果中的CNV区间进行划分时,可以先将CNV区间的位置与正常孕妇参考库中的区间位置进行对应,使得所划分的每一个子区间位置在正常孕妇参考库中所划分的子区间对应。
在实际应用中,在对原始孕妇CNV结果中的CNV区间进行划分时,可以按照正常孕妇参考库中的区间划分长度进行设定。例如,正常孕妇参考库中,以100K为单位长度对测序序列进行划分,则将原始孕妇CNV结果中的CNV区间拆分成n’个长度为100K的CNV子区间。
在对原始孕妇CNV结果中的CNV区间进行划分之后,可以分别计算每一个子区间的GC含量。
在具体实施中,可以从所拆分出的n’个子区间中,选取出GC含量在预设GC含量区间内的m’个子区间。预设GC含量区间可以根据实际的应用场景进行设定。在本发明实施例中,预设GC含量区间的取值可以为[GC+1%,GC-1%],GC的取值范围为[37.98%,43.28%]。
在取出m’个子区间之后,采用如下公式(2),计算正常孕妇参考库CNV区间的参考测序序列数目:
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
根据计算得到的参考测序序列数目以及孕妇CNV区间的测序序列数目,可以计算得到CNV校正系数。在本发明实施例中,可以采用下式(3)计算得到CNV校正系数:
其中,ri为第i个区间的CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
在得到CNV校正系数之后,即可对孕妇CNV区间的测序序列数目进行校正。
在具体实施中,在对孕妇CNV区间的测序序列数目进行校正时,可以先对校正系数r进行向上取整运算,得到r’。之后,将孕妇CNV区间的测序序列数目与r’相乘。将校正系数r与随机数k进行比较,当校正系数r大于随机数k时,随机去除与r’相乘后的孕妇CNV区间的测序序列数据,以较少孕妇CNV区间的测序序列数目,随机数k的取值范围为:0<k<r’。当校正系数r小于或等于随机数k时,则无需对孕妇CNV区间的测序序列数据进行处理。
在对孕妇CNV区间的测序序列数目进行校正后,校正后的孕妇CNV区间的测序序列数目与参考测序序列数目的差值处于预设范围之内。在实际应用中,可以对预设范围进行设定,使得在参考测序序列数目的基础上,在预设范围内,测序序列数目仍处于正常孕妇对应的区域。换而言之,校正后的孕妇CNV区间的测序序列数目仍处于正常孕妇对应的范围之内,也即将孕妇CNV区间的测序序列数目校正至正常范围之内。
可以理解的是,在本发明其他实施例中,也可以采用其他的方法来对孕妇CNV区间的测序序列数目进行校正,以使得校正后的孕妇CNV区间的测序序列数目与参考测序序列数目的差值处于预设范围之内,也即校正后的孕妇CNV区间的测序序列数目处于正常范围值之内。对孕妇CNV区间的测序序列数目进行校正的方法并不仅限于本发明上述实施例中提供的方法。
步骤S105,根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果。
在具体实施中,在得到校正后的孕妇CNV区间测序序列数目后,可以重新计算孕妇NIPT Z值结果以及孕妇CNV结果,得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果。
步骤S106,当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
在具体实施中,在计算得到更新后的孕妇CNV结果之后,可以先判断更新后的孕妇CNV结果在预设的染色体上是否仍存在CNV。当更新后的孕妇CNV结果在预设的染色体上存在CNV时,则可以重新执行步骤S103;当更新后的孕妇CNV结果在预设的染色体上不存在CNV时,则可以输出更新后的孕妇NIPT Z值结果。
在具体实施中,当更新后的孕妇CNV结果在预设的染色体上不存在CNV时,则可以判定更新后的NIPT Z值结果不会受到CNV阳性的干扰,因此,更新后的NIPT Z值结果的精确度更高。
步骤S107,输出原始孕妇NIPT Z值结果。
在具体实施中,当原始孕妇CNV结果在预设的染色体上没有存在CNV时,则可以判定原始孕妇CNV结果为阴性,因此,无需考虑原始孕妇CNV结果阳性所导致的NIPT Z值结果假阳性的情况,故可以直接输出原始孕妇NIPT Z值结果,无需执行步骤S103~步骤S106。
由此可见,由于对原始孕妇CNV结果进行校正,将在预设染色体上存在CNV的原始孕妇CNV结果校正为在预设染色体上不存在CNV,并重新计算NIPT Z值结果,从而避免因原始孕妇CNV结果阳性对NIPT Z值结果造成假阳性影响,因此可以提高NPIT的准确率。
参照图2,本发明实施例提供了一种孕妇NIPT结果校正装置20,包括:获取单元201、判断单元202、第一计算单元203、校正单元204、第二计算单元205以及输出单元206,其中:
所述获取单元201,用于获取原始孕妇CNV结果;
所述判断单元202,用于判断所述原始CNV结果在预设的染色体上是否存在CNV;
所述第一计算单元203,用于当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;
所述校正单元204,用于根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;
所述第二计算单元205,用于根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;
所述输出单元206,用于当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
在具体实施中,所述校正单元204,可以用于将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的所有子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正。
在具体实施中,可以采用如下公式计算所述参考测序序列数目:其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
在具体实施中,可以采用如下公式所述计算CNV校正系数:其中,ri为所述CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
在具体实施中,所述校正单元204,用于将所述校正系数r向上取整,得到r’;将所述孕妇CNV区间的测序序列数目与r’相乘;将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
在具体实施中,可以采用如下公式计算Rij其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
在具体实施中,所述预设的染色体可以包括:第13号染色体、第18号染色体以及第21号染色体。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行本发明上述任一实施例中提供的孕妇NIPT结果校正方法的步骤。
本发明实施例还提供了一种数据处理设备,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时执行本发明上述任一实施例中提供的孕妇NIPT结果校正方法的步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指示相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (16)

1.一种孕妇NIPT结果校正方法,其特征在于,包括:
获取原始孕妇CNV结果,并判断在预设的染色体上是否存在CNV;
当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;
根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;
根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;
当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
2.如权利要求1所述的孕妇NIPT结果校正方法,其特征在于,所述根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,包括:
将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;
计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的子区间;
根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;
采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正。
3.如权利要求2所述的孕妇NIPT结果校正方法,其特征在于,采用如下公式计算所述参考测序序列数目:
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
4.如权利要求3所述的孕妇NIPT结果校正方法,其特征在于,采用如下公式所述计算CNV校正系数:
其中,ri为第i个子区间对应的CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
5.如权利要求4所述的孕妇NIPT结果校正方法,其特征在于,所述根据所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正,包括:
将所述校正系数r向上取整,得到r’;
将所述孕妇CNV区间的测序序列数目与r’相乘;
将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;
当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
6.如权利要求3所述的孕妇NIPT结果校正方法,其特征在于,采用如下公式计算Rij
其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
7.如权利要求1~6任一项所述的孕妇NIPT结果校正方法,其特征在于,所述预设的染色体包括以下至少一种:第13号染色体、第18号染色体以及第21号染色体。
8.一种孕妇NIPT结果校正装置,其特征在于,包括:
获取单元,用于获取原始孕妇CNV结果;
判断单元,用于判断所述原始CNV结果在预设的染色体上是否存在CNV;
第一计算单元,用于当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;
校正单元,用于根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;
第二计算单元,用于根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;
输出单元,用于当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
9.如权利要求8所述的孕妇NIPT结果校正装置,其特征在于,所述校正单元,用于将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的所有子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正。
10.如权利要求9所述的孕妇NIPT结果校正装置,其特征在于,采用如下公式计算所述参考测序序列数目:
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
11.如权利要求10所述的孕妇NIPT结果校正装置,其特征在于,采用如下公式所述计算CNV校正系数:
其中,ri为所述CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
12.如权利要求11所述的孕妇NIPT结果校正装置,其特征在于,所述校正单元,用于将所述校正系数r向上取整,得到r’;将所述孕妇CNV区间的测序序列数目与r’相乘;将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
13.如权利要求10所述的孕妇NIPT结果校正装置,其特征在于,采用如下公式计算Rij
其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
14.如权利要求8~13任一项所述的孕妇NIPT结果校正装置,其特征在于,所述预设的染色体包括以下至少一种:第13号染色体、第18号染色体以及第21号染色体。
15.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1~7任一项所述的孕妇NIPT结果校正方法的步骤。
16.一种数据处理设备,包括存储器和处理器,所述存储器上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1~7任一项所述的孕妇NIPT结果校正方法的步骤。
CN201710883645.8A 2017-09-26 2017-09-26 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备 Active CN108733982B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710883645.8A CN108733982B (zh) 2017-09-26 2017-09-26 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710883645.8A CN108733982B (zh) 2017-09-26 2017-09-26 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备

Publications (2)

Publication Number Publication Date
CN108733982A true CN108733982A (zh) 2018-11-02
CN108733982B CN108733982B (zh) 2021-02-19

Family

ID=63940161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710883645.8A Active CN108733982B (zh) 2017-09-26 2017-09-26 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备

Country Status (1)

Country Link
CN (1) CN108733982B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113643755A (zh) * 2021-08-11 2021-11-12 上海小海龟科技有限公司 一种nipt试剂盒阳性率校正方法、装置、计算机设备和介质
CN114171118A (zh) * 2021-11-15 2022-03-11 成都凡迪医疗器械有限公司 用于无创基因检测的数据处理方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120021919A1 (en) * 2010-07-23 2012-01-26 Thomas Scholl Identification of Differentially Represented Fetal or Maternal Genomic Regions and Uses Thereof
CN103215349A (zh) * 2013-03-26 2013-07-24 赛业(苏州)生物信息技术有限公司 一种染色体特异位点的筛选方法及应用
CN103525939A (zh) * 2013-10-28 2014-01-22 广州爱健生物技术有限公司 无创检测胎儿染色体非整倍体的方法和系统
CN104120181A (zh) * 2011-06-29 2014-10-29 深圳华大基因医学有限公司 对染色体测序结果进行gc校正的方法及装置
EP2370599B1 (en) * 2010-01-19 2015-01-21 Verinata Health, Inc Method for determining copy number variations
CN104789686A (zh) * 2015-05-06 2015-07-22 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置
CN104789466A (zh) * 2015-05-06 2015-07-22 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置
CN105830077A (zh) * 2013-10-21 2016-08-03 维里纳塔健康公司 用于在确定拷贝数变异中改善检测的灵敏度的方法
CN105986008A (zh) * 2015-01-27 2016-10-05 深圳华大基因科技有限公司 Cnv检测方法和装置
CN106795558A (zh) * 2014-05-30 2017-05-31 维里纳塔健康公司 检测胎儿亚染色体非整倍性和拷贝数变异

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2370599B1 (en) * 2010-01-19 2015-01-21 Verinata Health, Inc Method for determining copy number variations
US20120021919A1 (en) * 2010-07-23 2012-01-26 Thomas Scholl Identification of Differentially Represented Fetal or Maternal Genomic Regions and Uses Thereof
CN104120181A (zh) * 2011-06-29 2014-10-29 深圳华大基因医学有限公司 对染色体测序结果进行gc校正的方法及装置
CN103215349A (zh) * 2013-03-26 2013-07-24 赛业(苏州)生物信息技术有限公司 一种染色体特异位点的筛选方法及应用
CN105830077A (zh) * 2013-10-21 2016-08-03 维里纳塔健康公司 用于在确定拷贝数变异中改善检测的灵敏度的方法
CN103525939A (zh) * 2013-10-28 2014-01-22 广州爱健生物技术有限公司 无创检测胎儿染色体非整倍体的方法和系统
CN106795558A (zh) * 2014-05-30 2017-05-31 维里纳塔健康公司 检测胎儿亚染色体非整倍性和拷贝数变异
CN105986008A (zh) * 2015-01-27 2016-10-05 深圳华大基因科技有限公司 Cnv检测方法和装置
CN104789686A (zh) * 2015-05-06 2015-07-22 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置
CN104789466A (zh) * 2015-05-06 2015-07-22 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HAN ZHANG 等: "Statistical Approach to Decreasing the Error Rate of Noninvasive Prenatal Aneuploid Detection caused by Maternal Copy Number Variation", 《SCIENTIFIC REPORTS》 *
XIYA ZHOU 等: "Contribution of maternal copy number variations to false-positive fetal trisomies detected by noninvasive prenatal testing", 《ORIGINAL ARTICLE》 *
许泽辉 等: "三甲医院PCR实验室环境下的无创产前检测", 《中国生育健康杂志》 *
龙洋 等: "无创DNA检测在诊断高龄孕妇胎儿非整倍体中的应用", 《实用妇产科杂志》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113643755A (zh) * 2021-08-11 2021-11-12 上海小海龟科技有限公司 一种nipt试剂盒阳性率校正方法、装置、计算机设备和介质
CN113643755B (zh) * 2021-08-11 2023-10-13 上海小海龟科技有限公司 一种nipt试剂盒阳性率校正方法、装置、计算机设备和介质
CN114171118A (zh) * 2021-11-15 2022-03-11 成都凡迪医疗器械有限公司 用于无创基因检测的数据处理方法和装置
CN114171118B (zh) * 2021-11-15 2024-09-27 成都凡迪医疗器械有限公司 用于无创基因检测的数据处理方法和装置

Also Published As

Publication number Publication date
CN108733982B (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
Ma et al. Quantile regression for functional partially linear model in ultra-high dimensions
Blangero et al. A kernel of truth: statistical advances in polygenic variance component models for complex human pedigrees
CN109480780B (zh) 一种脑卒中预警系统的评估方法及系统
CN105825076B (zh) 消除常染色体内和染色体间gc偏好的方法及检测系统
CN110141219A (zh) 基于导联融合深度神经网络的心肌梗死自动检测方法
CN111861989B (zh) 一种脑中线检测方法、系统、终端及存储介质
CN107133491B (zh) 一种获取胎儿游离dna浓度的方法
CN109146891B (zh) 一种应用于mri的海马体分割方法、装置及电子设备
CN112542247A (zh) 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统
Galimzianova et al. Stratified mixture modeling for segmentation of white-matter lesions in brain MR images
JP2018514234A5 (zh)
CN109979529A (zh) Cnv检测装置
CN108733982A (zh) 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备
CN107463797B (zh) 高通量测序的生物信息分析方法及装置、设备及存储介质
WO2018137496A1 (zh) 确定生物样本中预定来源的游离核酸比例的方法及装置
CN116306783A (zh) 基于lstm-dcgan模型的fhr数据增强方法
KR20220122596A (ko) 염색체 이수성 판별 및 분류 모델 구성 방법 및 장치
Yang et al. Chromosome classification via deep learning and its application to patients with structural abnormalities of chromosomes
CN117153258A (zh) 校正测序数据、检测染色体非整倍体的方法和装置
CN117204860A (zh) 一种心电信号特征波定位方法
Lim et al. Automatic artifact detection algorithm in fetal MRI
Stirnemann et al. Density estimation of a biomedical variable subject to measurement error using an auxiliary set of replicate observations
CN111210140A (zh) 税务信用评价方法、设备及可读存储介质
Qu et al. Joint modeling of recurrent and terminal events using additive models
CN110033848A (zh) 一种基于无监督学习的三维医学影像z轴插值方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant