CN117953966A - 一种基于扩增捕获的小panel检测CNV的方法 - Google Patents
一种基于扩增捕获的小panel检测CNV的方法 Download PDFInfo
- Publication number
- CN117953966A CN117953966A CN202410145404.3A CN202410145404A CN117953966A CN 117953966 A CN117953966 A CN 117953966A CN 202410145404 A CN202410145404 A CN 202410145404A CN 117953966 A CN117953966 A CN 117953966A
- Authority
- CN
- China
- Prior art keywords
- cnv
- sequencing
- data
- sample
- amplicon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 230000003321 amplification Effects 0.000 title claims abstract description 17
- 238000003199 nucleic acid amplification method Methods 0.000 title claims abstract description 17
- 238000012163 sequencing technique Methods 0.000 claims abstract description 75
- 108091093088 Amplicon Proteins 0.000 claims abstract description 42
- 239000013642 negative control Substances 0.000 claims abstract description 25
- 239000000523 sample Substances 0.000 claims description 54
- 108090000623 proteins and genes Proteins 0.000 claims description 11
- 238000011282 treatment Methods 0.000 claims description 9
- 108020004414 DNA Proteins 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000003908 quality control method Methods 0.000 claims description 4
- 238000002864 sequence alignment Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 21
- 230000035945 sensitivity Effects 0.000 abstract description 4
- 150000007523 nucleic acids Chemical group 0.000 abstract description 2
- 101100494566 Escherichia coli cap2 gene Proteins 0.000 description 9
- 241000976806 Genea <ascomycete fungus> Species 0.000 description 5
- 239000013068 control sample Substances 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 3
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Biochemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于扩增捕获的小pane l检测CNV的方法,利用带UM I的特异性引物快速捕获目标区域,通过UM I回溯到每个检测区域的核酸片段的起始含量,再与同批次的CNV阴性对照样本的测序深度比较,计算两组样本在SNV、I nde l区域测序深度的相关系数,将扩增子的深度差异降至最小,然后计算两组样本在CNV区域的测序深度的差异,从而快速准确地检测出待测样本中的拷贝数变异情况,可以最大程度减少不同样本的扩增效率不均一造成的扩增子测序深度的差异,提高CNV检测的灵敏度和特异性,保证CNV检测的准确性。
Description
技术领域
本发明涉及生物信息学领域,特别是涉及一种基于扩增捕获的小panel检测CNV的方法。
背景技术
拷贝数变异是指基因组中DNA序列的重复、缺失或插入等变异,其中CNV的检测对于疾病的诊断、分型、预后预测和治疗策略制定具有重要意义,传统的CNV检测方法通常需要大量的基因组信息,一般需要全基因组测序或全外显子测序,检测过程复杂、耗时,难以满足临床试剂需求,因此,如何进行快速、准确、高效的CNV检测方法对于临床用药具有非常重要的意义,目前针对大部分检测需求,小panel由于仅包含几十到几百个测序基因,检测结果稳定,成本低,分析速度快,得到了越来越多的应用,一般的CNV检测在拷贝数变异影响区域长度与设计总长度的比值20%的时候,拷贝数变异检测则会遇到困难。但是在小Panel中,由于设计总长度有限,容易出现高达50%占比的拷贝数变异,无法使用目前的CNV检测,因此小panel检测CNV特别受到CNV待测区域占比过高这一情况的局限。
目前针对小panel检测CNV受限的问题,有提出在设计小Panel时引入若干拷贝数稳定的对照基因,降低CNV待测区域的占比,使得加入对照基因后预计出现的CNV区域占Panel总设计长度的比例变小,一般小于Panel总设计长度的20%,从而降低CNV检测软件基于测序数据覆盖度分布检测CNV信号的影响,使得大型CNV可以被正常检出,但是由于不同的引物存在不同的扩增效率,以及不同样本不同人员不同批次试剂等原因造成的PCR扩增过程的不一致性,导致每个扩增子的深度大不相同,不同的样本的扩增子测序深度分布差异很大,基于原始测序深度来计算拷贝数变异容易导致假阳性和假阴性的出现。上述增加拷贝数稳定的对照基因的方法虽然解决了CNV待测区域占比过高的问题,但是增加了很多对的引物,导致扩增系统的复杂度上升,扩增过程更容易出现偏差。而且不同批次的样本,扩增子的测序深度变化很大,选用多个对照样本并不能完全排除这种深度变化对CNV检测的影响,导致容易出现CNV检测的假阳性和假阴性。
发明内容
针对上述问题,本发明提供了一种基于扩增捕获的小panel检测CNV的方法,利用同批次CNV阴性样本做对照来检测拷贝数变异,可以改善现有的基于小panel进行的CNV检测中易于出现假阳性和假阴性的问题。
本发明的技术方案是:
一种基于扩增捕获的小panel检测CNV的方法,包括如下步骤:
S1、将同批次的待测样本与CNV阴性对照样本的DNA,进行基于带UMI引物的扩增捕获建库测序;
S2、获得带有UMI标签的待测样本测序数据和同批次CNV阴性对照样本测序数据;
S3、对步骤S2获得的测序数据进行质控并与参考基因组进行比对,获得待测样本和同批次CNV阴性对照样本的测序数据在参考基因组上的比对数据;
S4、对步骤S3获得的比对数据进行UMI去重处理,获得两个样本的每个扩增子的起始DNA片段数量的数据,即UMI去重处理后的扩增子测序深度数据;
S5、计算步骤S4获得的UMI去重处理后的扩增子测序深度数据,并采用归一化的方法消除下机数据量的影响;
S6、计算待测样本测序数据和同批次CNV阴性对照样本测序数据在非CNV区域的扩增子测序深度的相关系数;
S7、根据步骤S6得到的相关数据,计算待测样本相对同批次CNV阴性对照样本在CNV区域每个扩增子测序深度的变化值,取平均值作为该CNV区域的测序深度变化值;
S8、根据变化值结果进行分析判断目标区域拷贝数情况:
变化值 | 拷贝数情况 |
小于0.75 | 拷贝数减少 |
大于等于0.75,小于等于1.25 | 拷贝数不变 |
大于1.25 | 拷贝数增加 |
根据拷贝数情况分析CNV结果。
所述步骤S2,所述测序数据为fastq文件。
所述步骤S3,所述数据质控为去掉接头序列和低质量序列。
所述步骤S3,所述参考基因组进行比对后得到测序序列比对到参考基因组的文件即bam文件。
所述步骤S4,所述UMI去重处理为合并相同UMI的reads,得到参考基因组的去重UMI序列比对文件即deUMI bam文件,其中包含了样本中的扩增子区域的起始片段数量。
所述步骤S6,所述测序深度相关系数为皮尔逊相关系数,若该系数大于等于0.9,则进行下一步,否则需要重新选择CNV阴性对照样本。
所述步骤S1,所述PCR建库测序采用的引物,包括SNV、Indel点位和CNV基因,其中CNV基因的扩增子占比不超过50%。
本发明的有益效果是:
1.利用UMI回溯核酸的起始含量,并使用同批次的CNV阴性样本做对照,最大程度减少了不同样本的扩增效率不均一造成的扩增子测序深度的差异,提高了CNV检测的灵敏度和特异性;
2.利用待测样本和对照样本的非CNV区域测序深度的相关性来确保两组样本的扩增效率具有高度一致性,保证CNV检测的准确性。
附图说明
图1是本发明实施例所述一种基于扩增捕获的小panel检测CNV的方法的逻辑流程图。
具体实施方式
下面结合附图对本发明的实施例作进一步说明。
实施例:
如图1所示,一种基于扩增捕获的小panel检测CNV的方法,包括如下步骤:
S1、将同批次的待测样本与CNV阴性对照样本的DNA,进行基于带有UMI引物的扩增捕获建库测序;
S2、获得带有UMI标签的待测样本测序数据和同批次CNV阴性对照样本测序数据;
S3、对步骤S2获得的测序数据进行质控并与参考基因组进行比对,获得待测样本和同批次CNV阴性对照样本的测序数据在参考基因组上的比对数据;
S4、对步骤S3获得的比对数据进行UMI去重处理,获得两个样本的每个扩增子的起始DNA片段数量的数据,即UMI去重处理后的扩增子测序深度数据;
S5、计算步骤S4获得的UMI去重处理后的扩增子测序深度数据,并采用归一化的方法消除下机数据量的影响;
S6、计算待测样本测序数据和同批次CNV阴性对照样本测序数据在非CNV区域的扩增子测序深度的相关系数;
S7、根据步骤S6得到的相关数据,计算待测样本相对同批次CNV阴性对照样本在CNV区域的每个扩增子测序深度的变化值,取平均值作为该CNV区域的测序深度变化值;
S8、根据变化值结果进行分析判断目标区域拷贝数情况:
变化值 | 拷贝数情况 |
小于0.75 | 拷贝数减少 |
大于等于0.75,小于等于1.25 | 拷贝数不变 |
大于1.25 | 拷贝数增加 |
根据拷贝数情况分析CNV结果。
以肺癌测序小panel为例:
肺癌的二代测序小panel,包括geneA的50个SNV、Indel位点和2个CNV基因(以下简称geneB和geneC),其中geneA有50个扩增子,geneB有30个扩增子,geneC有20个扩增子,CNV的区域占比为50%,扩增子的特异性引物带有UMI序列,列表如下。
基因名称 | 突变类型 | 扩增子数 | 是否CNV区域 | 扩增子分组 |
geneA | CNV | 20 | 否 | 非CNV区域 |
geneB | CNV | 30 | 是 | CNV区域B |
geneC | SNV、Indel | 50 | 是 | CNV区域C |
选取阴性对照样本3个(CNV2_sam1、CNV2_sam2、CNV2_sam3),geneA、geneB、geneC的拷贝数都是2,另外选择CNV阳性样本3个(CNV3_sam1、CNV4_sam1、CNV5_sam1),geneA的拷贝数是2,geneB的拷贝数分别是3、4、5,geneC的拷贝数也分别是3、4、5,一共6个样本,提取基因组DNA,用前面设计的小panel引物同批次建库并测序,其中,阴性对照的3个样本各做了3个重复,阳性对照3个样本各1个重复,一共12个测序数据,见下表。
对得到的测序数据进行数据质控,去掉接头序列和低质量序列,得到高质量序列文件(clean fastq);
将clean fastq和人参考基因组对比,得到raw bam文件;
合并相同UMI的reads,得到deUMI bam文件,其中包含了样本中的扩增子区域的原始片段数量;
阴性对照样本是从9个阴性样本文库中选择1个数据,例如CNV2_sam1_lib1,其余样本作为待测样本,本实验只选择了一个待测样本,例如CNV4_sam1_lib1是从剩余8个阴性样本文库和3个阳性样本文库选择的1个数据;
计算待测样本数据和对照样本数据的每个扩增子的测序深度,并对测序深度进行归一化处理,具体为待测样本每个扩增子的深度除以待测样本数据所有扩增子的深度相加之和乘以1000000,对照样本每个扩增子的深度除以对照样本数据所有扩增子的深度相加之和乘以1000000,归一化后,两个数据的每个扩增子测序深度都是在相同数据量(1百万mapped reads)下,后续才可以比较,从而可以消除下机数据量的影响;
计算待测样本相对CNV阴性对照样本在CNV检测区域的每个扩增子测序深度的比值;
选择非CNV区域的扩增子,计算待测样本和对照样本在非CNV区域(SNV、Indel区域)的测序深度的皮尔逊相关系数,如果大于等于0.9,则继续下一步,如果小于0.9,则返回第一步重新选择对照CNV阴性样本数据;
若相关系数大于等于0.9,则进行计算CNV检测区域的每个扩增子测序深度的比值的平均值r来确定待测样本中的拷贝数变异,如果r>0.75,则判定该区域拷贝数减少,拷贝数CN=r×2,如果r≥0.75且r≤1.25,则判定该区域拷贝数不变,如果r>1.25,则判定该区域拷贝数增加,拷贝数具体的值CN=r×2。
阴性对照样本CNV2_sam1_lib1(CNV=2),待测样本CNV4_sam1_lib1(已知geneB的CNV=4,geneC的CNV=4),最终计算得到每个扩增子的测序深度,分别计算geneB和geneC的待测样本相对阴性对照样本的扩增子测序深度的变化的平均值再乘以2,最终得到geneB和geneC的拷贝数值如下表。
Control | Test | geneB拷贝数 | geneC拷贝数 | 相关系数 |
CNV2_sam1_lib1 | CNV4_sam1_lib1 | 3.6 | 3.8 | 0.985 |
任意选择9个阴性样本数据中的一个作为CNV阴性对照数据,剩余8个阴性样本数据和3个阳性样本数据作为待测样本数据,重复上述geneB和geneC的拷贝数值计算方法,一共有9×(8+3)=99个分析结果,灵敏度、特异性和准确性都达到100%,结果如下表。
CNV基因 | TP | FP | TN | FN | 灵敏度 | 特异性 | 准确度 |
geneB | 27 | 0 | 72 | 0 | 100.0% | 100.0% | 100.0% |
geneC | 27 | 0 | 72 | 0 | 100.0% | 100.0% | 100.0% |
同批次样本对照可以减少样本间的建库测序等操作造成的差异,因此待测样本和对照样本的相关性非常高,最终计算出来的拷贝数变异也非常准确。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (7)
1.一种基于扩增捕获的小panel检测CNV的方法,其特征在于,包括如下步骤:
S1、将同批次的待测样本与CNV阴性对照样本的DNA,进行基于带UMI引物的扩增捕获建库测序;
S2、获得带有UMI标签的待测样本测序数据和同批次CNV阴性对照样本测序数据;
S3、对步骤S2获得的测序数据进行质控并与参考基因组进行比对,获得待测样本和同批次CNV阴性对照样本的测序数据在参考基因组的比对数据;
S4、对步骤S3获得的比对数据进行UMI去重处理,获得两个样本的每个扩增子的起始DNA片段数量的数据,即UMI去重处理后的扩增子测序深度数据;
S5、计算步骤S4获得的UMI去重处理后的扩增子测序深度数据,并采用归一化的方法消除下机数据量的影响;
S6、计算待测样本测序数据和同批次CNV阴性对照样本测序数据在非CNV区域的扩增子测序深度的相关系数;
S7、根据步骤S6得到的相关数据,计算待测样本相对同批次CNV阴性对照样本在CNV区域的每个扩增子测序深度的变化值,取平均值作为该CNV区域的测序深度变化值;
S8、根据变化值结果进行分析判断目标区域拷贝数情况:
根据拷贝数情况分析CNV结果。
2.根据权利要求1所述的一种基于扩增捕获的小panel检测CNV的方法,其特征在于,所述步骤S2,所述测序数据为fastq文件。
3.根据权利要求1所述的一种基于扩增捕获的小panel检测CNV的方法,其特征在于,所述步骤S3,所述数据质控为去掉接头序列和低质量序列。
4.根据权利要求1所述的一种基于扩增捕获的小panel检测CNV的方法,其特征在于,所述步骤S3,所述参考基因组进行比对后得到测序序列比对到参考基因组的文件即bam文件。
5.根据权利要求1所述的一种基于扩增捕获的小panel检测CNV的方法,其特征在于,所述步骤S4,所述UMI去重处理为合并相同UMI的reads,得到参考基因组的去重UMI序列比对文件即deUMI bam文件,其中包含了样本中的扩增子区域的起始DNA片段数量。
6.根据权利要求1所述的一种基于扩增捕获的小panel检测CNV的方法,其特征在于,所述步骤S6,所述测序深度相关系数为皮尔逊相关系数,若该系数大于等于0.9,则进行下一步,否则需要重新选择CNV阴性对照样本。
7.根据权利要求1所述的一种基于扩增捕获的小panel检测CNV的方法,其特征在于,所述步骤S1,所述PCR建库测序采用的引物,包括SNV、Indel点位和CNV基因,其中CNV基因的扩增子占比不超过50%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410145404.3A CN117953966A (zh) | 2024-02-02 | 2024-02-02 | 一种基于扩增捕获的小panel检测CNV的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410145404.3A CN117953966A (zh) | 2024-02-02 | 2024-02-02 | 一种基于扩增捕获的小panel检测CNV的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117953966A true CN117953966A (zh) | 2024-04-30 |
Family
ID=90794235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410145404.3A Pending CN117953966A (zh) | 2024-02-02 | 2024-02-02 | 一种基于扩增捕获的小panel检测CNV的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117953966A (zh) |
-
2024
- 2024-02-02 CN CN202410145404.3A patent/CN117953966A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102665592B1 (ko) | 유전적 변이의 비침습 평가를 위한 방법 및 프로세스 | |
CN109767810B (zh) | 高通量测序数据分析方法及装置 | |
EP2926288B1 (en) | Accurate and fast mapping of targeted sequencing reads | |
US20240247306A1 (en) | Detecting Cross-Contamination in Sequencing Data Using Regression Techniques | |
Hung et al. | Analysis of microarray and RNA-seq expression profiling data | |
CN110029157B (zh) | 一种检测肿瘤单细胞基因组单倍体拷贝数变异的方法 | |
WO2015173222A1 (en) | Rare variant calls in ultra-deep sequencing | |
CN105441432A (zh) | 组合物及其在序列测定和变异检测中的用途 | |
CN108256289B (zh) | 一种基于目标区域捕获测序基因组拷贝数变异的方法 | |
US20190338349A1 (en) | Methods and systems for high fidelity sequencing | |
TR201904345T4 (tr) | Genetik Varyasyonları Non-İnvazif Değerlendirme Yöntemi | |
EP3378001B1 (en) | Methods for detecting copy-number variations in next-generation sequencing | |
CN109887546B (zh) | 基于二代测序的单基因或多基因拷贝数检测系统及方法 | |
Hills et al. | BAIT: Organizing genomes and mapping rearrangements in single cells | |
CN110993029B (zh) | 一种检测染色体异常的方法及系统 | |
CN112746097A (zh) | 一种检测样本交叉污染的方法以及预测交叉污染源的方法 | |
Lawrence et al. | Assignment of position-specific error probability to primary DNA sequence data | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
CN113555121B (zh) | 一种胃癌预后标志物的筛选和分类方法、胃癌预后标志物和检测胃癌预后的试剂及应用 | |
CN117253539B (zh) | 基于胚系突变检测高通量测序中样本污染的方法和系统 | |
CN113930492A (zh) | 对被污染样品进行亲子鉴定的生物信息处理方法 | |
CN111180012A (zh) | 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 | |
CN117953966A (zh) | 一种基于扩增捕获的小panel检测CNV的方法 | |
WO2019132010A1 (ja) | 塩基配列における塩基種を推定する方法、装置及びプログラム | |
WO2022074034A1 (en) | Haplotype-block-based imputation of genomic markers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |