CN108664766A - 拷贝数变异的分析方法、分析装置、设备及存储介质 - Google Patents

拷贝数变异的分析方法、分析装置、设备及存储介质 Download PDF

Info

Publication number
CN108664766A
CN108664766A CN201810481391.1A CN201810481391A CN108664766A CN 108664766 A CN108664766 A CN 108664766A CN 201810481391 A CN201810481391 A CN 201810481391A CN 108664766 A CN108664766 A CN 108664766A
Authority
CN
China
Prior art keywords
read
cnv
regions
copy number
sequencing data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810481391.1A
Other languages
English (en)
Other versions
CN108664766B (zh
Inventor
唐小艳
孙明明
陈白雪
欧小华
赵薇薇
于世辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kingmed Diagnostics Group Co ltd
Original Assignee
Guangzhou Kingmed Diagnostics Group Co ltd
Guangzhou Kingmed Diagnostics Central Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kingmed Diagnostics Group Co ltd, Guangzhou Kingmed Diagnostics Central Co Ltd filed Critical Guangzhou Kingmed Diagnostics Group Co ltd
Priority to CN201810481391.1A priority Critical patent/CN108664766B/zh
Publication of CN108664766A publication Critical patent/CN108664766A/zh
Application granted granted Critical
Publication of CN108664766B publication Critical patent/CN108664766B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及一种拷贝数变异的分析方法、分析装置、设备及存储介质。本发明提供的上述拷贝数变异的分析方法通过对二代测序的DNA测序数据依次进行抽提、比对、标记区分、统计分析,最终得到CNV区域的read的占比和/或拷贝数,最终结果准确性高,分辨率好,尤其是在抽提过程中,根据靶标区域的碱基数目、测序读长以及预设的平均深度来确定待抽取的read数目,这样可以有针对性的对不同的测序结果进行分析,分析结果的可靠性大大提高。

Description

拷贝数变异的分析方法、分析装置、设备及存储介质
技术领域
本发明涉及生物信息学技术领域,尤其是涉及一种拷贝数变异的分析方法、分析装置、设备及存储介质。
背景技术
随着二代测序技术的日益成熟以及二代测序技术在人类基因组检测相关应用领域的飞速发展,采用二代测序技术来进行人类基因组分析以辅助诊断疾病或进行疾病的病理分析已经成为一种行之有效的手段,其中拷贝数变异(Copy number variation,CNV)分析是非常重要的分析内容。拷贝数变异分析主要原理是通过二代测序技术确定人类基因组上重要区域片段的覆盖度并通过统计学手段确定是否与参考样本存在差异,从而判定是否有缺失或重复等突变,最终用来确定基因型或辅助诊断相关疾病。
目前由二代测序数据分析的拷贝数变异的结果存在一定的假阳性,因而需要经过行业金标准的一代测序(Sanger)来进行验证。一代测序技术验证拷贝数变异的方法是多重连接依赖的探针扩增技术(Mutiplex Ligation-dependent Probe Amplification,MLPA),该方法在检测拷贝数变异的准确性和分辨率上都非常高,也是目前比较公认的验证拷贝数变异的金标准之一。然而一代测序整体上效率低、操作繁琐。
发明内容
基于此,有必要提供一种拷贝数变异的分析方法、分析装置、设备及存储介质,以提高基于二代测序进行拷贝数变异分析的准确性和分辨率。
一种拷贝数变异的分析方法,包括如下步骤:
步骤S1:获取基因组靶标区域的DNA测序数据;
步骤S2:根据待抽取的read数目,从所述DNA测序数据中抽取出覆盖所述靶标区域的read,得到抽取后的测序数据,所述待抽取的read数目根据所述靶标区域的碱基数目、测序读长以及预设的平均深度来确定;
步骤S3:对所述抽取后的测序数据进行基因组比对,获得比对结果;
步骤S4:区分所述比对结果中的PCR重复read和非PCR重复read;
步骤S5:对非PCR重复且比对分值不小于预设值的read,统计落入各靶标区域的read数目;
步骤S6:按照各靶标区域的read数目确定CNV区域的read的占比和/或拷贝数。
在其中一个实施例中,在所述步骤S2中,所述待抽取的read数目=(靶标区域的碱基数目*预设的平均深度)/(测序读长*相关系数),其中,所述相关系数小于1;
所述预设的平均深度根据所检测的样本的突变分析类型来确定,其中体细胞突变的预设的平均深度不小于950×,胚系突变的预设的平均深度不小于80×。
在其中一个实施例中,在所述步骤S2之后且在所述步骤S3之前,还包括:
步骤S03:对所述抽取后的测序数据进行测序质量评估,对于满足预设要求的所述抽取后的测序数据执行步骤S3;否则调整参数后从所述DNA测序数据中按照所述待抽取的read数目重新抽取出覆盖所述靶标区域的read,得到新的抽取后的测序数据,再对所述新的抽取后的测序数据进行测序质量评估,对于满足预设要求的所述新的抽取后的测序数据执行步骤S3,否则回到步骤S1,获取新的基因组靶标区域的DNA测序数据。
在其中一个实施例中,所述预设要求是:read平均质量大于Q30的read数占总的read数目的85%以上,GC平均含量在40%~55%之间,碱基A、T、C及G各占25%±2%。
在其中一个实施例中,所述步骤S6包括:
步骤S61:分别对测试样本和参考样本的总的read数目进行beta-二项式分布模型的拟合,获得测试样本的第i个靶标区域的期望值pi
步骤S62:按照公式exp(Yi)=Yi*Pi/(1-Pi)确定测试样本的各靶标区域的期望read数目exp(Yi),其中,Yi为测试样本的第i个靶标区域的read数目;
步骤S63:按照公式确定相应染色体上CNV区域的read的占比,和/或
按照公式CNVcopy=CNVratio*2确定女性常染色体和X染色体的CNV区域的拷贝数,或按照公式CNVcopy=CNVratio*2确定男性常染色体的CNV区域的拷贝数和按照公式CNVcopy=CNVratio确定男性X或Y染色体的CNV区域的拷贝数;
其中,CNVratio为所述CNV区域的read的占比,CNVcopy为所述CNV区域的拷贝数,Xi-j是测试样本的CNV所在区域中第i个靶标区域到第j个靶标区域的read数目,
在其中一个实施例中,在所述步骤S62中,还包括:按照公式Ratioi=Yi/exp(Yi)确定测试样本的各靶标区域的read的占比Ratioi,其中,Yi为测试样本的第i个靶标区域的read数目。
在其中一个实施例中,所述的拷贝数变异的分析方法还包括步骤S7:对所有靶标区域和CNV区域的read的占比进行注释和图形化展示。
一种拷贝数变异的分析装置,包括:
测序数据获取模块,用于获取基因组靶标区域的DNA测序数据;
抽取模块,用于从所述DNA测序数据中按照待抽取的read数目抽取出覆盖所述靶标区域的read,得到抽取后的测序数据,所述待抽取的read数目是按照所述靶标区域的碱基数目、测序读长以及预设的平均深度来确定;
比对模块,用于对所述抽取后的测序数据进行基因组比对,获得比对结果;
区分模块,用于区分所述比对结果中的PCR重复read和非PCR重复read;
统计模块,用于对非PCR重复且比对分值不小于预设值的read,统计落入各靶标区域的read数目;以及
CNV分析模块,用于按照各靶标区域的read数目确定CNV区域的read的占比和/或拷贝数。
一种计算机设备,具有处理器和存储器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的拷贝数变异的分析方法的步骤。
一种计算机存储介质,其上存储有计算机程序,所述计算机程序被执行时实现上述任一实施例所述的拷贝数变异的分析方法的步骤。
传统的二代测序技术分析CNV要借助相关的生物信息软件来进行分析,研究发现,多数生物信息软件在预测CNV片段缺失或者重复的拷贝数与变异区域位置确定方面不够准确,与CNV的金标准(MLPA验证)数据偏离较大。本发明提供的上述拷贝数变异的分析方法、分析装置、设备和存储介质通过对二代测序的DNA测序数据依次进行抽提、比对、标记区分、统计分析,最终得到CNV区域的read的占比和/或拷贝数,最终结果准确性高,分辨率好,尤其是在抽提过程中,根据靶标区域的碱基数目、测序读长以及预设的平均深度来确定待抽取的read数目,这样可以有针对性的对不同的测序结果进行分析,分析结果的可靠性大大提高。
本发明的拷贝数变异的分析方法是一种非疾病诊断目的的分析方法,通过本发明的拷贝数变异的分析方法对基因组靶标区域的CNV区域进行分析,得到的结果可以用于各类CNV分析,以进一步用于研究各类有效或无效的CNV,尤其是涉及健康疾病的CNV,分析的结果虽然不能直接作为诊断结果用于诊断是否患有某种疾病,但可以作为中间结果与其他结果一起,用于疾病的辅助诊断和疾病的病理研究分析,具有重要的临床研究和使用价值。
附图说明
图1为本发明一实施例的拷贝数变异的分析方法的流程示意图;
图2为图1中步骤S16的一具体流程示意图;
图3为另一实施例的拷贝数变异的分析方法的流程示意图;
图4为本发明一实施例的拷贝数变异的分析装置的结构示意图;
图5为图4中CNV分析模块的一具体结构示意图;
图6为另一实施例的拷贝数变异的分析装置的结构示意图;
图7为TEST001 CNV可视化图;
图8为TEST002 CNV可视化图;
图9为TEST003 CNV可视化图;
图10为TEST001 CNV MLPA验证结果;
图11为TEST002 CNV MLPA验证结果;
图12为TEST003 CNV MLPA验证结果。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体地实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本文所述的“read”即高通量测序平台(如各类二代测序平台)所产生的测序序列;所述的测序“深度”是指测序得到的总碱基数与待测基因组大小的比值,通常用单位“×”表示倍数;所述的“测序读长”是指测序过程一次测序的长度;所述的“PCR重复read”是指PCR对同一个分子进行多次镜像复制得到的read,判断是否为镜像分子的标准是:reads的起始和终止位置一样,起点和终点之间的碱基序列一样,只要起点、终点、或者起点与终点之间的序列三者之中有一个不同,就是不同的read;所述的“比对分值”是指序列比对的打分机制,反应序列比对到基因组上的质量,比对分值越高,序列比对到基因组上的准确率越高;所述的“参考样本”是理论上在基因组上不存在CNV区域的正常样本,然而现实中很难获得这样的理想样本,为了减少不同批次实验的捕获效率不同导致的数据偏激,所以在同一批做实验的样本中进行选择,选择条件:计算测试样本和备选样本在靶标区域的read数之间的相关系数,相关系数满足预设要求(如≥0.97)的样本被选为参考样本,利用参考样本相关数据对测试样本进行CNV计算。
如图1所示,本发明一实施例的拷贝数变异的分析方法包括如下步骤:
步骤S11:获取基因组靶标区域的DNA测序数据。
本实施例采用二代测序的方式对捕获的基因组靶标区域的DNA(全外显子区域或者特定基因集合的外显子区域)进行测序,得到DNA测序数据。一般下机获得的数据是bcl格式。
在一个实施例中,步骤S11还包括:使用bcl2fastq(Illumina公司)等软件将bcl格式的数据文件转换成后续软件分析的fastq格式的数据文件。
步骤S12:根据待抽取的read数目,从DNA测序数据中抽取出覆盖靶标区域的read,得到抽取后的测序数据。
本实施例的待抽取的read数目根据靶标区域的碱基数目、测序读长以及预设的平均深度来确定。
通过抽取相应的read,可以减少不同批次的测序样本,或者样本之间因数据来不同导致的样本件差异。具体地,抽取多少深度的数据,可根据检测的样本是要做体细胞突变还是胚系突变来决定,一般体细胞突变的预设的平均深度不小于950×,如常用的可以是1000×±20×,胚系突变的预设的平均深度不小于80×,如常用的可以为100×±20×、200×±20×等。
在一个实施例中,定义Tsize为靶标区域的碱基数目(单位:bp),DM为预设的平均深度(可根据要求自行选择,只要所有样本标准一致即可),readsize:为测序读长(测序仪器测出的read的序列长度),待抽取的read数目readnum可按照如下公式计算:
readnum=Tsize*DM/(readsize*相关系数)
其中,相关系数小于1,如相关系数可以在0.8~0.98范围内,又如可以是0.8、0.85、0.9、0.95等。通过选择合适的相关系数,使得抽取的read数目比理论上预设的要多,这样可以在后续进行基因组比对和区分PCR重复read时,去除一定数量的无效read,保证分析结果的准确性和可靠性。
在一个实施例中,步骤S12可以使用seqtk等软件从fastq格式的DNA测序数据中按照待抽取的read数目抽取相应的read。
步骤S13:对抽取后的测序数据进行基因组比对,获得比对结果。
比对的作用是对测序read进行基因组定位,获得记录所有read的比对信息的比对结果,如序列名称、比对分值、基因组位置、序列比对详情等内容。
在一个实施例中,步骤S13可以使用bwa、bowie等比对软件来实现,对符合质量评估标准的抽取后的fastq格式的测序数据进行基因组比对,比对后获得bam格式文件的比对结果。
步骤S14:区分比对结果中的PCR重复read和非PCR重复read。
在一个实施例中,步骤S14可以使用picardtools、samtools等标记软件对比对结果进行标记,将PCR重复read标记出来,以与非PCR重复read区分,后续计算时,去除这些PCR过程产生的重复read。
步骤S15:对非PCR重复且比对分值不小于预设值的read,统计落入各靶标区域的read数目。
在一个实施例中,步骤S15可以采用R语言的Rsamtools工具包等来统计所有样本(包括测试样本和参考样本)的常染色体、女性样本的X染色体、男性样本的X和Y染色体在靶标区域的测序深度,也即落在靶标区域的read数目,以及靶标区域的GC含量。按照上述步骤S13和步骤S14的处理,对read的要求是:1)非PCR重复read;2)比对分值不小于预设值,如≥20。
测序的靶标区域为panle设计中包含的所有探针捕获的区域,如可以以bed文件的格式存储,如在一个更具体的实施例中,格式为:第一列:染色体号,第二列:靶标区域的起点位置,第三列:靶标区域的终点位置,第四列:靶标区域的名称。对于男性和女性在性染色体上要分开统计,因为女性和男性性染色体组成不同,女性为2条X染色体,男性为一条X染色体,一条Y染色体,所以在后续计算性染色体的CNV区域的read的占比或拷贝数时,需要按照性别单独计算。
步骤S16:按照各靶标区域的read数目确定CNV区域的read的占比和/或拷贝数。
在步骤16中,对所有样本(包括测试样本和参考样本)的常染色体、女性的X染色体和男性的X、Y染色体进行CNV分析。在一个实施例中,该步骤可以使用R语言的ExomeDepth工具包来实现。
在一个实施例中,如图2所示,步骤S16包括:
步骤S161:分别对测试样本和参考样本的总的read数目进行beta-二项式分布模型的拟合,获得测试样本的第i个靶标区域的期望值pi
步骤S162:确定测试样本的各靶标区域的期望read数目。
具体地,在一个实施例中,如可以按照公式exp(Yi)=Yi*Pi/(1-Pi)确定测试样本的各靶标区域的期望read数目exp(Yi),其中,Yi为测试样本的第i个靶标区域的read数目。
步骤S163:确定相应染色体上CNV区域的read的占比,和/或CNV区域的拷贝数。
具体地,在一个实施例中,如可以按照公式确定相应染色体上CNV区域的read的占比。
在CNV区域的read的占比CNVratio确定之后,可以进一步按照公式CNVcopy=CNVratio*2确定女性常染色体和X染色体的CNV区域的拷贝数,或按照公式CNVcopy=CNVratio*2确定男性常染色体的CNV区域的拷贝数和按照公式CNVcopy=CNVratio确定男性X或Y染色体的CNV区域的拷贝数。
其中,CNVratio为所述CNV区域的read的占比,CNVcopy为所述CNV区域的拷贝数,Xi-j是测试样本的CNV所在区域中第i个靶标区域到第j个靶标区域的read数目,
在计算CNV区域的read的占比(CNVratio)时,CNV区域通常可以是一个或者多个相邻的外显子区域,所以CNV区域的read的占比需要根据CNV区域重新计算。上述计算的CNVratio还不能反映CNV具体的重复或者确实的数值,因此,可进一步计算CNVcopy,以直接反映基因组上CNV区域的拷贝数数值。常染色体1-22号和女性X染色体上的CNV区域拷贝数的计算公式为:CNVcopy=CNVratio*2,男性X或Y染色体的CNV区域的拷贝数的计算公式为:CNVcopy=CNVratio
若位于常染色体或者女性的X染色体上的CNVcopy=2,说明该CNV区域为正常区域,不存在重复或者缺失,因为人类是二倍体,正常情况常染色体每条染色体有两个拷贝,CNVcopy<2表示该CNV区域存在缺失,CNVcopy>2表示该CNV区域存在重复。男性X和Y染色体上的CNV区域的拷贝数和CNVratio值相同,因为男性的X和Y染色体都是1个拷贝,若位于男性X、Y染色体上的CNVcopy=1,表示该CNV区域是正常区域,若CNVcopy<1表示该CNV区域为缺失区域,CNVcopy>1表示该CNV区域为重复区域。
进一步,在一个实施例中,上述步骤S162中,还包括:按照公式Ratioi=Yi/exp(Yi)确定测试样本的各靶标区域的read的占比Ratioi,其中,Yi为测试样本的第i个靶标区域的read数目。
如图3所示,在本发明另一个实施例的拷贝数变异的分析方法中,在步骤S22之后,且在步骤S23之前还进一步包括步骤S023:
对抽取后的测序数据进行测序质量评估,对于满足预设要求的抽取后的测序数据执行步骤S23;否则在第一次不通过时返回步骤S22,调整参数后从DNA测序数据中按照待抽取的read数目重新抽取出覆盖靶标区域的read,得到新的抽取后的测序数据,再对新的抽取后的测序数据进行测序质量评估,对于满足预设要求的新的抽取后的测序数据执行步骤S23,否则在第二次不通过时回到步骤S21,获取新的基因组靶标区域的DNA测序数据。
步骤S21、S22、S23、S24、S25以及S26分别同上述步骤S11、S12、S13、S14、S15以及S16。步骤S26可以进一步包括上述步骤S161、S162及S163。
步骤S023主要评估内容有碱基质量分数、Q30、GC含量等、read中的碱基组成等内容,筛选质量较差的read。步骤S023可以直接在fastqc、fastx、ClinQC等质量控制软件实现。具体地,在一个实施例中,预设要求是:read平均质量大于Q30的read数占总的read数目的85%以上,GC平均含量在40%~55%之间,碱基A、T、C及G各占25%±2%。
随机种子数是seqtk软件中的一个参数,研究发现,调整随机种子数,会导致最终抽提的read也不同,也即可以得到新的抽取后的测序数据。
如果两次测序质量评估都不满足预设要求,则要求对样本进行重新测序,步骤S21重新获取新的基因组靶标区域的DNA测序数据。
通过对抽取后的测序数据进行测序质量评估,也即进行质量控制,可以摒弃不合格的测序数据,有利于保证后续数据分析的准确性和可靠性。
进一步,如图3所示,在一个实施例中,该拷贝数变异的分析方法还包括步骤S27:对所有靶标区域和CNV区域的read的占比进行注释和图形化展示。
在步骤S27中,对步骤S26计算的CNV进行基因及外显子、OMIM数据库等方面的数值,对所有的靶标区域的read的占比Ratioi值以及CNV区域的read的占比CNVratio值进行可视化展示。该步骤可以采用perl语言对数据格式进行整理,并采用R语言的ggplot包实现画图。
通过对相应的结果进行注释和图形化展示,可以更为直观、明了的反映拷贝数变异的情况。
基于与上述方法相同的思想,如图4所示,本发明还提供了一种拷贝数变异的分析装置30,其包括测序数据获取模块31、抽取模块32、比对模块33、区分模块34、统计模块35以及CNV分析模块36。
其中,测序数据获取模块31用于获取基因组靶标区域的DNA测序数据。抽取模块32用于从DNA测序数据中按照待抽取的read数目抽取出覆盖靶标区域的read,得到抽取后的测序数据,待抽取的read数目是按照靶标区域的碱基数目、测序读长以及预设的平均深度来确定。比对模块33用于对抽取后的测序数据进行基因组比对,获得比对结果。区分模块34用于区分比对结果中的PCR重复read和非PCR重复read。统计模块35用于对非PCR重复且比对分值不小于预设值的read,统计落入各靶标区域的read数目。CNV分析模块36用于按照各靶标区域的read数目确定CNV区域的read的占比和/或拷贝数。
测序数据获取模块31可进一步含有格式转换模块,如将直接测序获取的bcl格式的DNA测序数据转换为fastq格式的DNA测序数据。
抽取模块32可进一步含有read数计算模块,该read数计算模块用于根据公式readnum=Tsize*DM/(readsize*相关系数)计算待抽取的read数目,其中,Tsize为靶标区域的碱基数目(单位:bp),DM为预设的平均深度(可根据要求自行选择,只要所有样本标准一致即可),readsize:为测序读长(测序仪器测出的read的序列长度)。相关系数小于1,如可以在0.8~0.98之间等。
如图5所示,具体地,在一个实施例中,CNV分析模块36包括期望值计算模块361、期望read数目计算模块362和read占比计算模块363。
期望值计算模块361用于分别对测试样本和参考样本的总的read数目进行beta-二项式分布模型的拟合,获得测试样本的第i个靶标区域的期望值pi
期望read数目计算模块362用于按照公式exp(Yi)=Yi*Pi/(1-Pi)确定测试样本的各靶标区域的期望read数目exp(Yi),其中,Yi为测试样本的第i个靶标区域的read数目。
read占比计算模块363用于按照公式确定相应染色体上CNV区域的read的占比。
进一步,该CNV分析模块36还包括拷贝数计算模块364。拷贝数计算模块364用于按照公式CNVcopy=CNVratio*2确定女性常染色体和X染色体的CNV区域的拷贝数,或按照公式CNVcopy=CNVratio*2确定男性常染色体的CNV区域的拷贝数和按照公式CNVcopy=CNVratio确定男性X或Y染色体的CNV区域的拷贝数。
更进一步,在一个实施例中,read占比计算模块363还用于按照公式Ratioi=Yi/exp(Yi)确定测试样本的各靶标区域的read的占比Ratioi,其中,Yi为测试样本的第i个靶标区域的read数目。
如图6所示,在另一实施例中,该拷贝数变异的分析装置40还包括质量控制模块043。质量控制模块043用于对抽取后的测序数据进行测序质量评估。对于满足预设要求的抽取后的测序数据由比对模块43对抽取后的测序数据进行基因组比对,获得比对结果;否则抽取模块42调整参数后从DNA测序数据中按照待抽取的read数目重新抽取出覆盖靶标区域的read,得到新的抽取后的测序数据,再由质量控制模块043对新的抽取后的测序数据进行测序质量评估,对于满足预设要求的新的抽取后的测序数据由比对模块43对该新的抽取后的测序数据进行基因组比对,获得比对结果,否则在第二次不通过时由测序数据获取模块41获取新的基因组靶标区域的DNA测序数据。
在图6所示的具体实施例中,测序数据获取模块41、抽取模块42、比对模块43、区分模块44、统计模块45以及CNV分析模块46的功能分别同图5中的测序数据获取模块31、抽取模块32、比对模块33、区分模块34、统计模块35以及CNV分析模块36。CNV分析模块46也可以进一步包括期望值计算模块361、期望read数目计算模块362和read占比计算模块363,或者包括期望值计算模块361、期望read数目计算模块362、read占比计算模块363和拷贝数计算模块364。
进一步,如图6所示的实施例中,拷贝数变异的分析装置40还可以包括注释和图形化展示模块47。注释和图形化展示模块47用于对所有靶标区域和CNV区域的read的占比进行注释和图形化展示。注释和图形化展示模块47用于对计算的CNV进行基因及外显子、OMIM数据库等方面的数值,对所有的靶标区域的read的占比Ratioi值以及CNV区域的read的占比CNVratio值进行可视化展示。
基于如上所述的实施例,本发明还提供了一种可用于分析拷贝数变异的计算机设备,具有处理器和存储器,存储器上存储有计算机程序,处理器执行该计算机程序时实现上述任一实施例的拷贝数变异的分析方法的步骤。
本领域普通技术人员可以理解实现上述方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
据此,本发明还提供了一种可用于分析拷贝数变异的计算机存储介质,其上存储有计算机程序,计算机程序被执行时实现上述任一实施例的拷贝数变异的分析方法的步骤。
本发明的拷贝数变异的分析方法适用于所有全外显子测序技术,为了说明该分析方法产生的技术效果,在此采用一个基因缺陷病筛查套餐项目作为案例分析,该项目是采用提取的血液样本进行疾病的筛查,从传统的单位点筛查转移为二代测序平台进行分析。本案例选择2个阳性样本1个阴性样本(样本名称分别为:TEST001、TEST002、TEST003)。具体的分析流程如下:
第一步:采用Illumina Nextseq500平台测序,测序采用读长150bp,单接头8bp碱基测序。获得下机bcl数据,进行bcl数据转换,bcl2fastq -R<下机目录><输出目录>--sample-sheet<samplesheet文件>--use-bases-mask y150n,I8,y150n。获得3个样本的fastq文件。下机数据量统计见表1。
表1样本下机数据量统计
样本名称 Clusters(Raw) Clusters(PF) Yield(MBases)
TEST001 255,944 255,944 77
TEST002 218,307 218,307 65
TEST003 219,816 219,816 66
第二步:选取特定测序深度的fastq文件
该检测项目的靶标区域80kb左右,因为是胚系突变,每个样本可要求最低深度为200×即可。待抽取的read数目=(81314*200)/(150*0.9)=120465条。采用seqtk软件实现抽取:seqtk sample -s100 infastq 120465>outfastq。
第三步:测序质量评估
fastqc<outfastq>,经过质量控制分析,三个样本的测序数据在GC含量、Q30百分比、碱基组成等方面都符合要求。
第四步:基因组比对和PCR重复read标记
基因组比对:bwa mem -M -t 2<R1.fastq.gz><R2.fastq.gz>获得比对的结果bam文件,对bam文件建立索引文件:samtools index<mapping.bam>。
PCR重复read标记:read:java -Xmx5g-jar MarkDuplicates.jar INPUT=<mapping.bam>OUTPUT=<out.dup.bam>METRICS_FILE=<dup.metrics>。
基因组比对结果统计见表2。
表2样本基因组比对以及测序深度统计
第五步:靶标区域深度
为了方便分析流程化以及文档的标准化,把深度计算的算法整合在R语言脚本getDepth_NB.R中,根据不同的性别统计不同的靶标区域的深度。男性和女性的常染色体放在一起统计,女性的X和男性的X、Y分别统计。具体把所有样本的比对结果bam文件放在bam.list文件中,女性样本的比对结果bam放在bamX.list中,男性样本的比对结果文件放在bamY.list中,常染色体的靶标区域存储在chrA.bed中,X染色体的靶标区域放在chrX.bed中,XY靶标区域放在chrY.bed中,统计深度的命令如下:
R --slave --args chrA.bed bam.list outdir A<getDepth_NB.R
R --slave --args chrX.bed bamX.list outdir X<getDepth_NB.R
R --slave --args chrY.bed bamY.list outdir Y<getDepth_NB.R
统计结果放在chrA.data.info,chrX.data.info和chrY.Data.info文件里。
第六步:CNV计算
为了方便分析流程化以及文档标准化,把CNV计算步骤过程中的各种算法(靶标区域期望read数计算和ratio值的算法;CNV ratio值的算法)全部整合在R语言脚本callCNV_NB.R中。
具体操作同第五步,计算CNV的命令如下:
R --slave --args chrA.bed bam.list outdir A<callCNV_NB.R
R --slave --args chrX.bed bamX.list outdir X<callCNV_NB.R
R --slave --args chrY.bed bamY.list outdir Y<callCNV_NB.R
该步骤获得CNV在常染色体、X、Y染色体的CNV结果。
第七步:CNV注释及图形化展示
根据第六步的分析结果,对CNV进行注释以及可视化。TEST001样本CNV注释结果参见表3和图7;TEST002样本CNV注释结果参见表4和图8;TEST003样本CNV注释结果参见图9,其为一阴性样本。
表3 TEST001 CNV注释结果
表4 TEST002 CNV注释结果
根据第七步产生的CNV结果,设计MLPA探针,对CNV结果进行验证,3个样本的MLPAratio值参见图10、11和12。如图10、11和12所示,三个样本计算出的CNV拷贝数的位置与MLPA方法得出的CNV的位置与拷贝异常类型全部一致,计算出TEST001样本的CNV为DMD基因的第3-第9个外显子区域出现重复,与MLPA结果一致;计算出TEST002样本在DMD基因的外显子3-外显子7区域出现重复区域,与MLPA验证结果一致。计算出TEST003样本不存在缺失重复区域,与MLPA验证结果一致。
所有阳性CNV与MLPA验证的拷贝数差异基本非常接近,计算TEST001重复的ratio值为1.98,MLPA验证得出DMD的拷贝ratio值为2左右。计算TEST002重复的ratio值为1.3,MLPA验证得出DMD的拷贝ratio值为1.3左右,经过后续其他样本的测试,算法算出的ratio值与MLPA验证结果之间的差异不大于0.3。计算出的CNV假阳性率为0%,即该算法算出的阳性CNV全部可以通过MLPA实验手段验证出来。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种拷贝数变异的分析方法,其特征在于,包括如下步骤:
步骤S1:获取基因组靶标区域的DNA测序数据;
步骤S2:根据待抽取的read数目,从所述DNA测序数据中抽取出覆盖所述靶标区域的read,得到抽取后的测序数据,所述待抽取的read数目根据所述靶标区域的碱基数目、测序读长以及预设的平均深度来确定;
步骤S3:对所述抽取后的测序数据进行基因组比对,获得比对结果;
步骤S4:区分所述比对结果中的PCR重复read和非PCR重复read;
步骤S5:对非PCR重复且比对分值不小于预设值的read,统计落入各靶标区域的read数目;
步骤S6:按照各靶标区域的read数目确定CNV区域的read的占比和/或拷贝数。
2.如权利要求1所述的拷贝数变异的分析方法,其特征在于,在所述步骤S2中,所述待抽取的read数目=(靶标区域的碱基数目*预设的平均深度)/(测序读长*相关系数),其中,所述相关系数小于1;
所述预设的平均深度根据所检测的样本的突变分析类型来确定,其中体细胞突变的预设的平均深度不小于950×,胚系突变的预设的平均深度不小于80×。
3.如权利要求1所述的拷贝数变异的分析方法,其特征在于,在所述步骤S2之后且在所述步骤S3之前,还包括:
步骤S03:对所述抽取后的测序数据进行测序质量评估,对于满足预设要求的所述抽取后的测序数据执行步骤S3;否则调整参数后从所述DNA测序数据中按照所述待抽取的read数目重新抽取出覆盖所述靶标区域的read,得到新的抽取后的测序数据,再对所述新的抽取后的测序数据进行测序质量评估,对于满足预设要求的所述新的抽取后的测序数据执行步骤S3,否则回到步骤S1,获取新的基因组靶标区域的DNA测序数据。
4.如权利要求3所述的拷贝数变异的分析方法,其特征在于,所述预设要求是:read平均质量大于Q30的read数占总的read数目的85%以上,GC平均含量在40%~55%之间,碱基A、T、C及G各占25%+2%。
5.如权利要求1~4中任一项所述的拷贝数变异的分析方法,其特征在于,所述步骤S6包括:
步骤S61:分别对测试样本和参考样本的总的read数目进行beta-二项式分布模型的拟合,获得测试样本的第i个靶标区域的期望值pi
步骤S62:按照公式exp(Yi)=Yi*Pi/(1-Pi)确定测试样本的各靶标区域的期望read数目exp(Yi),其中,Yi为测试样本的第i个靶标区域的read数目;
步骤S63:按照公式确定相应染色体上CNV区域的read的占比,和/或
按照公式CNVcopy=CNVratio*2确定女性常染色体和X染色体的CNV区域的拷贝数,或按照公式CNVcopy=CNVratio*2确定男性常染色体的CNV区域的拷贝数和按照公式CNVcopy=CNVratio确定男性X或Y染色体的CNV区域的拷贝数;
其中,CNVratio为所述CNV区域的read的占比,CNVcopy为所述CNV区域的拷贝数,Xi-j是测试样本的CNV所在区域中第i个靶标区域到第j个靶标区域的read数目,
6.如权利要求5所述的拷贝数变异的分析方法,其特征在于,在所述步骤S62中,还包括:按照公式Ratioi=Yi/exp(Yi)确定测试样本的各靶标区域的read的占比Ratioi,其中,Yi为测试样本的第i个靶标区域的read数目。
7.如权利要求6所述的拷贝数变异的分析方法,其特征在于,还包括步骤S7:对所有靶标区域和CNV区域的read的占比进行注释和图形化展示。
8.一种拷贝数变异的分析装置,其特征在于,包括:
测序数据获取模块,用于获取基因组靶标区域的DNA测序数据;
抽取模块,用于从所述DNA测序数据中按照待抽取的read数目抽取出覆盖所述靶标区域的read,得到抽取后的测序数据,所述待抽取的read数目是按照所述靶标区域的碱基数目、测序读长以及预设的平均深度来确定;
比对模块,用于对所述抽取后的测序数据进行基因组比对,获得比对结果;
区分模块,用于区分所述比对结果中的PCR重复read和非PCR重复read;
统计模块,用于对非PCR重复且比对分值不小于预设值的read,统计落入各靶标区域的read数目;以及
CNV分析模块,用于按照各靶标区域的read数目确定CNV区域的read的占比和/或拷贝数。
9.一种计算机设备,其特征在于,具有处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~7中任一项所述的拷贝数变异的分析方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1~7中任一项所述的拷贝数变异的分析方法的步骤。
CN201810481391.1A 2018-05-18 2018-05-18 拷贝数变异的分析方法、分析装置、设备及存储介质 Active CN108664766B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810481391.1A CN108664766B (zh) 2018-05-18 2018-05-18 拷贝数变异的分析方法、分析装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810481391.1A CN108664766B (zh) 2018-05-18 2018-05-18 拷贝数变异的分析方法、分析装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108664766A true CN108664766A (zh) 2018-10-16
CN108664766B CN108664766B (zh) 2020-01-31

Family

ID=63776942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810481391.1A Active CN108664766B (zh) 2018-05-18 2018-05-18 拷贝数变异的分析方法、分析装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108664766B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109727638A (zh) * 2018-12-27 2019-05-07 北京优迅医学检验实验室有限公司 测序深度的矫正方法及装置
CN110993031A (zh) * 2019-11-07 2020-04-10 广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院) 自闭症候选基因的分析方法、分析装置、设备及存储介质
WO2020124625A1 (zh) * 2018-12-20 2020-06-25 北京优迅医学检验实验室有限公司 基于ctDNA的基因检测方法、装置、存储介质及计算机系统
CN111599408A (zh) * 2020-04-15 2020-08-28 至本医疗科技(上海)有限公司 基因变异顺反位置关系检测方法、装置、设备和存储介质
CN111782609A (zh) * 2020-05-22 2020-10-16 北京和瑞精准医学检验实验室有限公司 一种快速将fastq文件均匀分片的方法
CN111793678A (zh) * 2020-07-30 2020-10-20 臻悦生物科技江苏有限公司 一种基于二代测序技术检测同源重组通路基因突变的方法及试剂盒
CN111968701A (zh) * 2020-08-27 2020-11-20 北京吉因加科技有限公司 检测指定基因组区域体细胞拷贝数变异的方法和装置
CN112768000A (zh) * 2021-01-25 2021-05-07 深圳吉因加医学检验实验室 一种预测met基因拷贝数变化类型的方法及装置
CN114400046A (zh) * 2022-03-08 2022-04-26 北京吉因加医学检验实验室有限公司 一种基于探针叠加检测基因拷贝数变异的方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012006291A2 (en) * 2010-07-06 2012-01-12 Life Technologies Corporation Systems and methods to detect copy number variation
US20130184999A1 (en) * 2012-01-05 2013-07-18 Yan Ding Systems and methods for cancer-specific drug targets and biomarkers discovery
US20130325360A1 (en) * 2011-10-06 2013-12-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CN104221022A (zh) * 2012-04-05 2014-12-17 深圳华大基因医学有限公司 一种拷贝数变异检测方法和系统
CN105986008A (zh) * 2015-01-27 2016-10-05 深圳华大基因科技有限公司 Cnv检测方法和装置
CN106055923A (zh) * 2016-05-13 2016-10-26 万康源(天津)基因科技有限公司 一种基因拷贝数变异分析方法
CN106055926A (zh) * 2016-05-13 2016-10-26 万康源(天津)基因科技有限公司 一种基因拷贝数变异分析系统
WO2017189677A1 (en) * 2016-04-27 2017-11-02 Arc Bio, Llc Machine learning techniques for analysis of structural variants
CN107423534A (zh) * 2016-05-24 2017-12-01 郝柯 基因组拷贝数变异的检测方法和系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012006291A2 (en) * 2010-07-06 2012-01-12 Life Technologies Corporation Systems and methods to detect copy number variation
US20130325360A1 (en) * 2011-10-06 2013-12-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20130184999A1 (en) * 2012-01-05 2013-07-18 Yan Ding Systems and methods for cancer-specific drug targets and biomarkers discovery
CN104221022A (zh) * 2012-04-05 2014-12-17 深圳华大基因医学有限公司 一种拷贝数变异检测方法和系统
CN105986008A (zh) * 2015-01-27 2016-10-05 深圳华大基因科技有限公司 Cnv检测方法和装置
WO2017189677A1 (en) * 2016-04-27 2017-11-02 Arc Bio, Llc Machine learning techniques for analysis of structural variants
CN106055923A (zh) * 2016-05-13 2016-10-26 万康源(天津)基因科技有限公司 一种基因拷贝数变异分析方法
CN106055926A (zh) * 2016-05-13 2016-10-26 万康源(天津)基因科技有限公司 一种基因拷贝数变异分析系统
CN107423534A (zh) * 2016-05-24 2017-12-01 郝柯 基因组拷贝数变异的检测方法和系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020124625A1 (zh) * 2018-12-20 2020-06-25 北京优迅医学检验实验室有限公司 基于ctDNA的基因检测方法、装置、存储介质及计算机系统
CN109727638B (zh) * 2018-12-27 2021-08-17 北京优迅医学检验实验室有限公司 测序深度的矫正方法及装置
CN109727638A (zh) * 2018-12-27 2019-05-07 北京优迅医学检验实验室有限公司 测序深度的矫正方法及装置
CN110993031A (zh) * 2019-11-07 2020-04-10 广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院) 自闭症候选基因的分析方法、分析装置、设备及存储介质
CN111599408A (zh) * 2020-04-15 2020-08-28 至本医疗科技(上海)有限公司 基因变异顺反位置关系检测方法、装置、设备和存储介质
CN111599408B (zh) * 2020-04-15 2022-05-06 至本医疗科技(上海)有限公司 基因变异顺反位置关系检测方法、装置、设备和存储介质
CN111782609A (zh) * 2020-05-22 2020-10-16 北京和瑞精准医学检验实验室有限公司 一种快速将fastq文件均匀分片的方法
CN111782609B (zh) * 2020-05-22 2023-10-13 北京和瑞精湛医学检验实验室有限公司 一种快速将fastq文件均匀分片的方法
CN111793678A (zh) * 2020-07-30 2020-10-20 臻悦生物科技江苏有限公司 一种基于二代测序技术检测同源重组通路基因突变的方法及试剂盒
CN111968701A (zh) * 2020-08-27 2020-11-20 北京吉因加科技有限公司 检测指定基因组区域体细胞拷贝数变异的方法和装置
CN111968701B (zh) * 2020-08-27 2022-10-04 北京吉因加科技有限公司 检测指定基因组区域体细胞拷贝数变异的方法和装置
CN112768000A (zh) * 2021-01-25 2021-05-07 深圳吉因加医学检验实验室 一种预测met基因拷贝数变化类型的方法及装置
CN112768000B (zh) * 2021-01-25 2021-07-20 深圳吉因加医学检验实验室 一种预测met基因拷贝数变化类型的方法及装置
CN114400046A (zh) * 2022-03-08 2022-04-26 北京吉因加医学检验实验室有限公司 一种基于探针叠加检测基因拷贝数变异的方法及装置

Also Published As

Publication number Publication date
CN108664766B (zh) 2020-01-31

Similar Documents

Publication Publication Date Title
CN108664766A (zh) 拷贝数变异的分析方法、分析装置、设备及存储介质
Peter et al. Genome evolution across 1,011 Saccharomyces cerevisiae isolates
CN107679052B (zh) 大数据分析方法以及利用了该分析方法的质谱分析系统
CN112635063B (zh) 一种肺癌预后综合预测模型、构建方法及装置
US10289802B2 (en) Spanning-tree progression analysis of density-normalized events (SPADE)
US8676510B2 (en) Clinical-result confirming device, clinical-result confirming method, and computer program therefor
CN110021364B (zh) 基于病人临床症状数据和全外显子组测序数据筛选单基因遗传病致病基因的分析检测系统
JP4437050B2 (ja) 診断支援システム、診断支援方法および診断支援サービスの提供方法
US9607375B2 (en) Biological data annotation and visualization
US7949475B2 (en) System and method for analyzing metabolomic data
CN106021984A (zh) 一种全外显子组测序数据分析系统
CN104271033A (zh) 一种评价胃肠癌风险的方法和系统
US6868342B2 (en) Method and display for multivariate classification
CN109416313A (zh) 图像地图集系统和方法
CN107025384A (zh) 一种复杂数据预测模型的构建方法
CN109074426A (zh) 用于检测异常核型的方法和系统
CN110021346B (zh) 基于RNAseq数据的基因融合与突变检测方法及系统
TW201248425A (en) Comprehensive glaucoma determination method utilizing glaucoma diagnosis chip and deformed proteomics cluster analysis
CN107169264B (zh) 一种复杂疾病诊断系统
Folcarelli et al. Automated flow cytometric identification of disease-specific cells by the ECLIPSE algorithm
US9953133B2 (en) Biological data annotation and visualization
CN108959853A (zh) 一种拷贝数变异的分析方法、分析装置、设备及存储介质
CN112102884A (zh) 多基因位点联合疾病风险分析评估平台及方法
Wrobel et al. Statistical analysis of multiplex immunofluorescence and immunohistochemistry imaging data
CN116469552A (zh) 一种用于乳腺癌多基因遗传风险评估的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20181016

Assignee: Zhengzhou Jinyu Clinical Laboratory Center Co.,Ltd.

Assignor: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd.

Contract record no.: X2021980010019

Denomination of invention: Analysis method, analysis device, equipment and storage medium of copy number variation

Granted publication date: 20200131

License type: Common License

Record date: 20210928

TR01 Transfer of patent right

Effective date of registration: 20211021

Address after: 510320 No. 10, helix 3 Road, International Biological Island, development zone, Guangzhou, Guangdong

Patentee after: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd.

Address before: 510005 Jinyu inspection building, No. 10, helix 3 Road, Guangzhou International Biological Island, development zone, Guangzhou, Guangdong

Patentee before: GUANGZHOU KINGMED CENTER FOR CLINICAL LABORATORY

Patentee before: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd.

TR01 Transfer of patent right
EC01 Cancellation of recordation of patent licensing contract

Assignee: Zhengzhou Jinyu Clinical Laboratory Center Co.,Ltd.

Assignor: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd.

Contract record no.: X2021980010019

Date of cancellation: 20220922

EC01 Cancellation of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20181016

Assignee: Zhengzhou Jinyu Clinical Laboratory Center Co.,Ltd.

Assignor: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd.

Contract record no.: X2022980016522

Denomination of invention: Analysis method, analysis device, equipment and storage medium of copy number variation

Granted publication date: 20200131

License type: Common License

Record date: 20220927

EE01 Entry into force of recordation of patent licensing contract