CN113403371A - 一种用于检测基因长片段拷贝数变异的方法 - Google Patents
一种用于检测基因长片段拷贝数变异的方法 Download PDFInfo
- Publication number
- CN113403371A CN113403371A CN202110791634.3A CN202110791634A CN113403371A CN 113403371 A CN113403371 A CN 113403371A CN 202110791634 A CN202110791634 A CN 202110791634A CN 113403371 A CN113403371 A CN 113403371A
- Authority
- CN
- China
- Prior art keywords
- artificial sequence
- copy number
- seq
- gene
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000012634 fragment Substances 0.000 title claims abstract description 70
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000006243 chemical reaction Methods 0.000 claims abstract description 73
- 230000003321 amplification Effects 0.000 claims abstract description 19
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 19
- 238000007403 mPCR Methods 0.000 claims abstract description 18
- 102000002260 Alkaline Phosphatase Human genes 0.000 claims abstract description 7
- 108020004774 Alkaline Phosphatase Proteins 0.000 claims abstract description 7
- 238000011033 desalting Methods 0.000 claims abstract description 3
- 108020004414 DNA Proteins 0.000 claims description 164
- 239000000203 mixture Substances 0.000 claims description 45
- 238000001514 detection method Methods 0.000 claims description 40
- 102000004190 Enzymes Human genes 0.000 claims description 28
- 108090000790 Enzymes Proteins 0.000 claims description 28
- 238000001819 mass spectrum Methods 0.000 claims description 17
- 238000012217 deletion Methods 0.000 claims description 10
- 230000037430 deletion Effects 0.000 claims description 10
- 102000053602 DNA Human genes 0.000 claims description 9
- 230000004544 DNA amplification Effects 0.000 claims description 9
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 claims description 9
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L magnesium chloride Substances [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 claims description 9
- 101000693913 Homo sapiens Albumin Proteins 0.000 claims description 8
- 101001065295 Homo sapiens Fas-binding factor 1 Proteins 0.000 claims description 8
- 101000780650 Homo sapiens Protein argonaute-1 Proteins 0.000 claims description 8
- 102100034183 Protein argonaute-1 Human genes 0.000 claims description 8
- 229910001629 magnesium chloride Inorganic materials 0.000 claims description 8
- 108010000178 IGF-I-IGFBP-3 complex Proteins 0.000 claims description 7
- 102100027211 Albumin Human genes 0.000 claims description 3
- 238000007400 DNA extraction Methods 0.000 claims description 3
- 239000013612 plasmid Substances 0.000 claims description 3
- 239000011347 resin Substances 0.000 claims description 3
- 229920005989 resin Polymers 0.000 claims description 3
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 claims description 2
- 238000002288 cocrystallisation Methods 0.000 claims description 2
- 239000013078 crystal Substances 0.000 claims description 2
- 239000005549 deoxyribonucleoside Substances 0.000 claims description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 claims description 2
- 239000000758 substrate Substances 0.000 claims description 2
- 235000011178 triphosphate Nutrition 0.000 claims description 2
- 239000001226 triphosphate Substances 0.000 claims description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 2
- 238000003752 polymerase chain reaction Methods 0.000 claims 11
- 238000006911 enzymatic reaction Methods 0.000 claims 3
- 241000238557 Decapoda Species 0.000 claims 2
- 230000004907 flux Effects 0.000 abstract description 7
- 241000143060 Americamysis bahia Species 0.000 abstract description 5
- 238000001269 time-of-flight mass spectrometry Methods 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 72
- 108700040618 BRCA1 Genes Proteins 0.000 description 11
- 101150072950 BRCA1 gene Proteins 0.000 description 11
- 238000012408 PCR amplification Methods 0.000 description 8
- 239000013641 positive control Substances 0.000 description 5
- 108091007743 BRCA1/2 Proteins 0.000 description 4
- 108700024394 Exon Proteins 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000012154 double-distilled water Substances 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 208000033640 Hereditary breast cancer Diseases 0.000 description 2
- 101100036896 Schizosaccharomyces pombe (strain 972 / ATCC 24843) uep1 gene Proteins 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 208000025581 hereditary breast carcinoma Diseases 0.000 description 2
- 238000007838 multiplex ligation-dependent probe amplification Methods 0.000 description 2
- 230000036438 mutation frequency Effects 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 239000013558 reference substance Substances 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 208000036878 aneuploidy Diseases 0.000 description 1
- 231100001075 aneuploidy Toxicity 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 231100000005 chromosome aberration Toxicity 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010612 desalination reaction Methods 0.000 description 1
- 230000001516 effect on protein Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于检测基因长片段拷贝数变异的新方法;包括以下步骤:(1)得到待测样本的人基因组DNA;(2)添加人工内标(competitor)进行多重PCR扩增反应;(3)进行虾碱性磷酸酶(SAP)反应;(4)延伸反应得到人基因组DNA的延伸产物和人工内标的延伸产物;(5)纯化脱盐;(6)MassARRAY飞行时间质谱;(7)根据FREQ数据,计算拷贝数变异系数(TR值),并判断基因片段的拷贝数;本发明适用于基因长片段拷贝数变异的检测,是一种新的检测基因长片段拷贝数变异的方法,具有大通量、准确性高、成本低等特点。
Description
技术领域
本发明涉及一种用于检测基因长片段拷贝数变异的方法,特别涉及一种添加人工内标(competitor)并基于MassARRAY飞行时间质谱的多重PCR反应,并对基因片段的拷贝数进行检测的新方法。
背景技术
人类基因组存在着广泛的变异,其中包括单核苷酸多态(SNP)、可变数目串联重复序列多态(VNTR)和基因结构改变等。基因组结构变异根据大小可分为两个层次:显微水平和亚显微水平。显微水平主要是指显微镜下可见的染色体畸变,包括整倍体、非整倍体、缺失、插入、倒位、易位、脆性位点等结构变异。亚显微水平是指DNA片段长度在1Kb至数Mb的基因组结构变异,包括缺失、重复、插入、倒位、易位以及复杂的重排等,这些统称为大片段重排(large genomic rearrangement,LGR)。而其中能够引起拷贝数的数量变化的称为拷贝数变异(copy number variation,CNV)。据研究估计,CNV至少占到基因组的12%,已成为基因组多态性的又一重要来源。
基因突变可能导致蛋白截断、mRNA加工破坏或对蛋白功能有显著影响的氨基酸替换,从而引起各种疾病。基因突变的检测对人类疾病的预防、治疗和预后的监测都有很重要的意义。例如中国家族性乳腺癌中乳腺癌易感基因BRCA1/2突变频率为10.5%,高加索人种家族性乳腺癌中BRCA1/2突变频率为15%~20%。BRCA1/2基因拷贝数变异(CNV)在不同地区人群中的发生频率为0.2%~12.2%,占BRCA1/2全部致病性基因突变的0.9%~21.4%。
大部分的点突变和短片段的插入缺失很容易通过PCR和测序进行检测。然而大于1Kb的DNA长片段拷贝数变异(CNV),目前难以通过测序检测。现有的检测CNV的方法较少,使用最多的是多重连接探针扩增技术(multiplex ligation-dependent probeamplification,MLPA)。但是该方法覆盖的片段短,成本高,样本用量大,通量小。因此急需探索新的方法,能够低成本高通量的检测CNV。
发明内容
本发明的目的在于提供一种用于检测基因长片段拷贝数变异的新方法。本方法开创性的添加人工内标(competitor),采用特异的PCR引物和延伸引物,基于MassARRAY飞行时间质谱的多重PCR反应,可以高通量检测样本,降低成本。拷贝数变异结果更全面的提供了基因检测的信息,有助于辅助医生进行诊断。
为实现上述目的,本发明包括如下步骤:
(1)采用商业化的DNA提取试剂盒提取待测样本的人基因组DNA;
(2)以待测样本的人基因组DNA为模板,并添加人工内标(competitor),通过多重PCR扩增反应,同时获得人基因组DNA的扩增产物和人工内标的扩增产物;
添加的人工内标(competitor)为合成的双链DNA片段或含有合成的双链DNA片段的质粒。其中合成的双链DNA片段与待测样本的目标扩增片段只有1个碱基不同,并且两个片段上不同的碱基均与延伸引物的3’端相邻。
反应得到的人基因组DNA的扩增产物、人工内标的扩增产物均包含目标检测基因片段以及内参基因的片段。目标检测基因片段的长度为70-600bp;内参基因为RNaseP、EIF2C1、ALB、GAPDH中的一种或几种。
多重PCR扩增反应的体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、UNG酶以及PCR酶;且每次实验需设置阴性样本。
PCR引物Pool为特异性的目的片段扩增引物混合物。PCR引物Pool为目标检测基因扩增引物、内参基因扩增引物的混合物。一个PCR引物Pool包含若干对引物,引物的数量≤30。如果超过30对引物,需分成2个或多个PCR引物Pool,用2个或多个样品检测孔进行检测;
(3)将上述扩增反应的产物通过虾碱性磷酸酶(SAP)反应,除去多余的脱氧核糖核苷三磷酸(dNTP/dUTP)。虾碱性磷酸酶(SAP)反应的体系包括SAP酶以及SAP Buffer;
(4)将步骤(3)的产物通过延伸反应,在延伸引物的3’端延伸一个碱基,得到人基因组DNA的延伸产物和人工内标的延伸产物。
延伸反应的体系包括Buffer Plus、Termination Mix、延伸引物混合物以及iPLEXEnzyme。
延伸引物混合物为与步骤(2)中人基因组DNA的扩增产物、人工内标的扩增产物的序列相匹配的延伸引物混合物,且延伸引物混合物中任意一条延伸引物在3’端延伸一个碱基,得到相应的延伸产物。
一个延伸引物混合物包含若干条引物,引物的数量≤30。如果超过30条引物,需分成2个或多个延伸引物混合物,用2个或多个样品检测孔进行检测;
(5)将上述延伸反应的产物通过树脂纯化,脱盐;
(6)将脱盐后的产物点样在质谱芯片基质上共结晶,再将晶体转入质谱仪的真空管,用激光激发进行MassARRAY飞行时间质谱检测;
(7)根据MassARRAY飞行时间质谱检测得到的FREQ数据,计算拷贝数变异系数TR值,并判断基因片段的拷贝数。
延伸产物经过纯化和MassARRAY飞行时间质谱检测,得到两个质谱峰,用两个质谱峰的FREQ数据根据下列公式进行计算,可以得到拷贝数变异系数(TR值);其中两个质谱峰分别为人基因组DNA(gDNA)片段的峰以及人工内标片段的峰;目标检测基因片段的人工内标拷贝数、内参基因片段的人工内标拷贝数为添加进入体系的拷贝数。
由于有n个内参基因,每个待测样本与每个阴性样本拷贝数比值有n个数值,取中位数。由于有n个阴性样本,所以得到了n个中位数,取平均值,得到最终的拷贝数变异系数(TR值)。
根据拷贝数变异系数(TR值),当TR≤0.65时,待测样本目标检测基因片段为缺失阳性;当0.8<TR<1.2时,待测样本目标检测基因片段拷贝数正常,结果为阴性;当TR≥1.5时,待测样本目标检测基因片段为重复阳性。
一种基于上述用于检测基因长片段拷贝数变异的方法的试剂盒,包括样品检测孔W1和样品检测孔W2;样品检测孔W1包括W1多重PCR反应体系、虾碱性磷酸酶(SAP)反应体系以及W1延伸反应体系;样品检测孔W2包括W2多重PCR反应体系、虾碱性磷酸酶(SAP)反应体系以及W2延伸反应体系。
W1多重PCR反应体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、人工内标(competitor)、UNG酶和PCR酶。
进一步的,W1多重PCR反应体系中PCR引物Pool的序列如下:
进一步的,W1多重PCR反应体系中人工内标的序列如下:
W2多重PCR反应体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、人工内标、UNG酶和PCR酶。
进一步的,W2多重PCR反应体系中PCR引物Pool的序列如下:
F17 | GTTGGATGTGTGAATTTTCTGAGACGGATG | SEQ ID NO:66 |
F18 | ACGTTGGATGTGACGTGTCTGCTCCACTTC | SEQ ID NO:67 |
F19 | GGATGTTTGTTTTCTCATTCCATTTAAAGC | SEQ ID NO:68 |
F20 | CGTTGGATGTTTTTAGCAAAAGCGTCCAGA | SEQ ID NO:69 |
F21 | TGGATGTCTCCTGAACATCTAAAAGATGAA | SEQ ID NO:70 |
F22 | ACGTTGGATGCAGAGGGATACCATGCAACA | SEQ ID NO:71 |
F23 | CGTTGGATGAAAGCAGATTTGGCAGTTCAA | SEQ ID NO:72 |
F24 | GTTGGATGAACTTCTCCCATTCCTTTCAGA | SEQ ID NO:73 |
F25 | ACGTTGGATGGGTAGAGGGCCTGGGTTAAG | SEQ ID NO:74 |
F26 | ACGTTGGATGGCTCTTTAGCTTCTTAGGAC | SEQ ID NO:75 |
F27 | TGGTTTTTCTAATGTGTTAAAGTTCATTGG | SEQ ID NO:76 |
F28 | ACGTTGGATGTTTCTCAGATAACTGGGCCCCTG | SEQ ID NO:77 |
F29 | ACGTTGGATGTTCCCCTGTCCCTCTCTCTT | SEQ ID NO:78 |
F30 | CGTTGGATGTTCAGGAGGAAAAGCACAGAA | SEQ ID NO:79 |
R17 | ACGTTGGATGGCTGTAATGAGCTGGCATGA | SEQ ID NO:80 |
R18 | ACGTTGGATGTGTCCTGGGATTCTCTTGCT | SEQ ID NO:81 |
R19 | CGTTGGATGCCTTTCCACTCCTGGTTCTTT | SEQ ID NO:82 |
R20 | ACGTTGGATGAAGTGTTGGAAGCAGGGAAG | SEQ ID NO:83 |
R21 | ACGTTGGATGGCCACAGAGCAAGACTCCAT | SEQ ID NO:84 |
R22 | ACGTTGGATGTTTGGCCAACAATACACACC | SEQ ID NO:85 |
R23 | GTTGGATGGCTTTCGTTTTGAAAGCAGATT | SEQ ID NO:86 |
R24 | ACGTTGGATGTGACTCTGGGGCTCTGTCTT | SEQ ID NO:87 |
R25 | ACGTTGGATGTGTGTCCTCCCTCTCTGACA | SEQ ID NO:88 |
R26 | ACGTTGGATGCATTTTCCTCCCGCAATTCC | SEQ ID NO:89 |
R27 | ACGTTGGATGCAGAGTGGATGGAGAACAAGG | SEQ ID NO:90 |
R28 | ACGTTGGATGCCTCTCAGGTTCCGCCCC | SEQ ID NO:91 |
R29 | ACGTTGGATGGGTTCTCCCAGGCTCTTACC | SEQ ID NO:92 |
R30 | CGTTGGATGCCTGAGACCCTTACCCAATTC | SEQ ID NO:93 |
F31 | ACGTTGGATGGGTCAGCTCTTCCCTTCATC | SEQ ID NO:94 |
F32 | ACGTTGGATGGTGGTTCGGCTTTCACCAGTCTG | SEQ ID NO:95 |
F33 | ACGTTGGATGAGCAACCTGTTACATATTAAAGTT | SEQ ID NO:96 |
R31 | ACGTTGGATGCCTCCCACATGTAATGTGTTG | SEQ ID NO:97 |
R32 | ACGTTGGATGGGTGTGGTCACTGGACTTGGG | SEQ ID NO:98 |
R33 | ACGTTGGATGATACTGAGCAAAGGCAATCAAC | SEQ ID NO:99 |
进一步的,W2多重PCR反应体系中人工内标的序列如下:
W1和W2的SAP反应体系均包括SAP酶以及SAP Buffer。
W1延伸反应体系包括Buffer Plus、Termination Mix、W1延伸引物混合物以及iPLEX Enzyme;W2延伸反应体系包括Buffer Plus、Termination Mix、W2延伸引物混合物以及iPLEX Enzyme。
进一步的,W1延伸引物混合物的序列如下:
UEP1 | GCTGAAACTTCTCAACC | SEQ ID NO:1 |
UEP2 | CTGGGAGCTCCTCTCACTC | SEQ ID NO:2 |
UEP3 | GAGTTGATCAAGGAACCTG | SEQ ID NO:3 |
UEP4 | CACAGCAGAAACCTACAACTC | SEQ ID NO:4 |
UEP5 | AAAGGCATCTGGCTGCACAACC | SEQ ID NO:5 |
UEP6 | GGGTGAGAGGATAGCCCTGAGC | SEQ ID NO:6 |
UEP7 | ACAAGAAAGTACGAGATTTAGTC | SEQ ID NO:7 |
UEP8 | ATTCAGCATTTTTCTTTCTTTAAT | SEQ ID NO:8 |
UEP9 | ATTAGATTAGTTAAAGTGATGTGG | SEQ ID NO:9 |
UEP10 | TGGAGATCAAGAATTGTTACAAATC | SEQ ID NO:10 |
UEP11 | GGATGTTCTCATTTCCCATTTCTCTT | SEQ ID NO:11 |
UEP12 | CCCTCTGAAGATACCGTTAATAAGGC | SEQ ID NO:12 |
UEP13 | TGAGATGGGTAGTTTCTATTCTGAAG | SEQ ID NO:13 |
UEP14 | CACCCTTCCATCATAAGTGAC | SEQ ID NO:14 |
UEP15 | TCAACATTGATGGTG | SEQ ID NO:15 |
UEP16 | GGGAAACAAAGGACACCGTTA | SEQ ID NO:16 |
W2延伸引物混合物的序列如下:
由于采用了以上技术,本发明较现有技术相比,具有的有益效果如下:
本发明成功建立了一种用于检测基因长片段拷贝数变异的新方法,应用本发明对基因长片段拷贝数变异进行检测,覆盖的检测序列更长,可同时进行384个检测,具有大通量、准确性高、成本低等特点。
附图说明
图1是基因片段发生缺失的MassARRAY结果图;
图2是基因片段发生重复的MassARRAY结果图;
图3是基因片段发生缺失的结果计算柱状图;
图4是基因片段发生重复的结果计算柱状图;
图5是人工内标与人基因组DNA的对比示意图,其中在延伸引物3’端的延伸位置有一个碱基的不同;
图6是人工内标的延伸产物峰(人工内标峰)与人基因组DNA的延伸产物峰(目标峰)的示意图。
具体实施方式
下面结合具体实施方式,进一步阐明本发明。
实施例1
1.BRCA1基因长片段拷贝数变异的检测:
1)DNA样本的准备
人基因组DNA的提取采用商业化的DNA提取试剂盒。得到的DNA质量,用Nano300检测须符合OD260/OD280在1.8-2.0之间,浓度>10ng/μl。将质量合格的DNA样本稀释至10ng/μl,置于4℃备用。
2)PCR扩增反应
本申请当中优选的扩增引物组合序列见表1-表4,扩增引物为内参基因和BRCA1基因的23个外显子的特异性引物。内参基因扩增引物和延伸引物的目标片段为人源基因RNaseP、EIF2C1和ALB的一段。由于超过30对引物,每个样本分2个孔检测,分别为W1和W2。W1中的16对引物分别按照终浓度0.5μM进行混合,配制成W1的PCR引物Pool;W2中的17对引物分别按照终浓度0.5μM进行混合,配制成W2的PCR引物Pool。
表1.W1的BRCA1基因扩增引物序列
F1 | GATGTTTGCCTTTTGAGTATTCTTTCTACA | SEQ ID NO:34 |
F2 | ACGTTGGATGACTCTACCAGTGCCAGGAGC | SEQ ID NO:35 |
F3 | ACGTTGGATGTTCTTTTTCTCCCCCCCTAC | SEQ ID NO:36 |
F4 | ACGTTGGATGGTTGTTCTAGCAGTGAAGAG | SEQ ID NO:37 |
F5 | GGATGGATGAAGTGACAGTTCCAGTAGTCC | SEQ ID NO:38 |
F6 | ACGTTGGATGCACGCTTTTTACCTGAGTGG | SEQ ID NO:39 |
F7 | GTTGGATGCACTTGCTGAGTGTGTTTCTCA | SEQ ID NO:40 |
F8 | CGTTGGATGAAAGAGCACGTTCTTCTGCTG | SEQ ID NO:41 |
F9 | CGTTGGATGTTCTGAGCTGTGTGCTAGAGG | SEQ ID NO:42 |
F10 | GTTGGATGTGGTCAGCTTTCTGTAATCGAA | SEQ ID NO:43 |
F11 | ACGTTGGATGACGGCTAATTGTGCTCACTG | SEQ ID NO:44 |
F12 | GTTGGATGAGGATCTGATTCTTCTGAAGATAC | SEQ ID NO:45 |
F13 | ACGTTGGATGATGAGCTCCTCTTGAGATGG | SEQ ID NO:46 |
F14 | ACGTTGGATGCAGAGGGATACCATGCAACA | SEQ ID NO:47 |
R1 | ACGTTGGATGCCTACTGTGGTTGCTTCCAA | SEQ ID NO:48 |
R2 | ACGTTGGATGATAATTTTGTGCTCATGGCAGA | SEQ ID NO:49 |
R3 | ACGTTGGATGTGGAGCCACATAACACATTC | SEQ ID NO:50 |
R4 | ACGTTGGATGACTCTTCTTGGCTCCAGTTG | SEQ ID NO:51 |
R5 | ACGTTGGATGTACATGCAGGCACCTTACCA | SEQ ID NO:52 |
R6 | ACGTTGGATGTAAGGTGAAGCAGCATCTGG | SEQ ID NO:53 |
R7 | ACGTTGGATGTCCAAACCTGTGTCAAGCTG | SEQ ID NO:54 |
R8 | ACGTTGGATGGGTGCATTGATGGAAGGAAG | SEQ ID NO:55 |
R9 | ACGTTGGATGTTTATGCAGCAGATGCAAGG | SEQ ID NO:56 |
R10 | CGTTGGATGTTTTTGCAGAATCCAAACTGA | SEQ ID NO:57 |
R11 | ACGTTGGATGGCTAGAGGAAAACTTTGAGG | SEQ ID NO:58 |
R12 | ACGTTGGATGGTTCTCTTTGACTCACCTGCAA | SEQ ID NO:59 |
R13 | ACGTTGGATGGTCATCCCCTTCTAAATGCC | SEQ ID NO:60 |
R14 | ACGTTGGATGTTTGGCCAACAATACACACC | SEQ ID NO:61 |
表2.W1的内参基因扩增引物序列
F15 | ACGTTGGATGGTGGTTCGGCTTTCACCAGTCTG | SEQ ID NO:62 |
F16 | ACGTTGGATGGGTCAGCTCTTCCCTTCATC | SEQ ID NO:63 |
R15 | ACGTTGGATGGGTGTGGTCACTGGACTTGGG | SEQ ID NO:64 |
R16 | ACGTTGGATGCCTCCCACATGTAATGTGTTG | SEQ ID NO:65 |
表3.W2的BRCA1基因扩增引物序列
F17 | GTTGGATGTGTGAATTTTCTGAGACGGATG | SEQ ID NO:66 |
F18 | ACGTTGGATGTGACGTGTCTGCTCCACTTC | SEQ ID NO:67 |
F19 | GGATGTTTGTTTTCTCATTCCATTTAAAGC | SEQ ID NO:68 |
F20 | CGTTGGATGTTTTTAGCAAAAGCGTCCAGA | SEQ ID NO:69 |
F21 | TGGATGTCTCCTGAACATCTAAAAGATGAA | SEQ ID NO:70 |
F22 | ACGTTGGATGCAGAGGGATACCATGCAACA | SEQ ID NO:71 |
F23 | CGTTGGATGAAAGCAGATTTGGCAGTTCAA | SEQ ID NO:72 |
F24 | GTTGGATGAACTTCTCCCATTCCTTTCAGA | SEQ ID NO:73 |
F25 | ACGTTGGATGGGTAGAGGGCCTGGGTTAAG | SEQ ID NO:74 |
F26 | ACGTTGGATGGCTCTTTAGCTTCTTAGGAC | SEQ ID NO:75 |
F27 | TGGTTTTTCTAATGTGTTAAAGTTCATTGG | SEQ ID NO:76 |
F28 | ACGTTGGATGTTTCTCAGATAACTGGGCCCCTG | SEQ ID NO:77 |
F29 | ACGTTGGATGTTCCCCTGTCCCTCTCTCTT | SEQ ID NO:78 |
F30 | CGTTGGATGTTCAGGAGGAAAAGCACAGAA | SEQ ID NO:79 |
R17 | ACGTTGGATGGCTGTAATGAGCTGGCATGA | SEQ ID NO:80 |
R18 | ACGTTGGATGTGTCCTGGGATTCTCTTGCT | SEQ ID NO:81 |
R19 | CGTTGGATGCCTTTCCACTCCTGGTTCTTT | SEQ ID NO:82 |
R20 | ACGTTGGATGAAGTGTTGGAAGCAGGGAAG | SEQ ID NO:83 |
R21 | ACGTTGGATGGCCACAGAGCAAGACTCCAT | SEQ ID NO:84 |
R22 | ACGTTGGATGTTTGGCCAACAATACACACC | SEQ ID NO:85 |
R23 | GTTGGATGGCTTTCGTTTTGAAAGCAGATT | SEQ ID NO:86 |
R24 | ACGTTGGATGTGACTCTGGGGCTCTGTCTT | SEQ ID NO:87 |
R25 | ACGTTGGATGTGTGTCCTCCCTCTCTGACA | SEQ ID NO:88 |
R26 | ACGTTGGATGCATTTTCCTCCCGCAATTCC | SEQ ID NO:89 |
R27 | ACGTTGGATGCAGAGTGGATGGAGAACAAGG | SEQ ID NO:90 |
R28 | ACGTTGGATGCCTCTCAGGTTCCGCCCC | SEQ ID NO:91 |
R29 | ACGTTGGATGGGTTCTCCCAGGCTCTTACC | SEQ ID NO:92 |
R30 | CGTTGGATGCCTGAGACCCTTACCCAATTC | SEQ ID NO:93 |
表4.W2的内参基因扩增引物序列
F31 | ACGTTGGATGGGTCAGCTCTTCCCTTCATC | SEQ ID NO:94 |
F32 | ACGTTGGATGGTGGTTCGGCTTTCACCAGTCTG | SEQ ID NO:95 |
F33 | ACGTTGGATGAGCAACCTGTTACATATTAAAGTT | SEQ ID NO:96 |
R31 | ACGTTGGATGCCTCCCACATGTAATGTGTTG | SEQ ID NO:97 |
R32 | ACGTTGGATGGGTGTGGTCACTGGACTTGGG | SEQ ID NO:98 |
R33 | ACGTTGGATGATACTGAGCAAAGGCAATCAAC | SEQ ID NO:99 |
上述用于检测BRCA1基因长片段拷贝数变异的试剂盒设有人工内标(competitor),人工内标为与目标扩增片段仅有1碱基不同的双链DNA合成片段或含有该片段的质粒。不同的碱基为延伸引物在延伸反应时延伸的3’端碱基(如图5、图6所示),作为内部对照。具体的人工内标序列见表5-表6。W1的15个人工内标按终浓度相当于3000拷贝/μl人基因组DNA的量混合;W2的15个人工内标也按终浓度相当于3000拷贝/μl人基因组DNA的量混合。分别得到W1人工内标混合物和W2人工内标混合物。
表5.W1的人工内标序列
表6.W2的人工内标序列
上述用于检测BRCA1基因长片段拷贝数变异的试剂盒所使用的多重PCR反应体系中含有PCR Buffer、MgCl2、dNTPs、UNG酶和PCR酶(购于AgenaBioScience公司,货号21327L),以及dUTP(购于上海兆维,货号D5331)、PCR引物Pool和人工内标混合物。每个样本分两个孔检测,分别为样品检测孔W1和样品检测孔W2。PCR扩增反应体系见表7,其中W1孔使用W1的PCR引物Pool和人工内标混合物,W2孔使用W2的PCR引物Pool和人工内标混合物。PCR扩增反应程序见表8。
表7.PCR扩增反应体系
试剂 | 单孔体积/μl |
ddH<sub>2</sub>O | 6.4 |
10×PCR Buffer | 2 |
MgCl<sub>2</sub>(25mM) | 3.2 |
dNTP Mix(25mM) | 0.4 |
dUTP(100mM) | 0.1 |
PCR引物Pool | 2.4 |
UNG Enzyme(5U/μl) | 0.5 |
PCR Enzyme(5U/μl) | 1 |
人工内标混合物 | 2 |
DNA(10ng/μl) | 2 |
总体积 | 20 |
表8.PCR扩增反应程序
3)SAP反应
上述SAP反应体系含有SAP酶和SAP Buffer(购于Agena BioScience公司,货号10141)。PCR扩增后,取5ul产物进行SAP反应。SAP反应体系见表9,反应程序见表10。
表9.SAP反应体系
试剂 | 单孔体积/μl |
PCR扩增产物 | 5 |
ddH<sub>2</sub>O | 1.53 |
SAP Buffer | 0.17 |
SAP酶 | 0.30 |
总体积 | 7 |
表10.SAP反应程序
37℃ | 40min |
85℃ | 5min |
4℃ | Forever |
4)延伸反应
上述延伸反应体系含有Buffer Plus、Termination Mix和iPLEX Enzyme(购于Agena BioScience公司,货号10141),以及延伸引物混合物。本申请当中优选的延伸引物组合序列见表12-表15,延伸引物为BRCA1基因和内参基因的特异性引物。W1中的16条延伸引物(UEP)按照表11的规则进行混合,配制成W1的UEP混合物;W2中的17条延伸引物(UEP)按照表11的规则进行混合,配制成W2的UEP混合物。SAP反应结束后,进行延伸反应。延伸反应体系见表16,其中W1孔使用W1的UEP混合物,W2孔使用W2的UEP混合物。反应程序见表17。
表11.延伸引物(UEP)混合物配制表
UEP分子量/Da | UEP混合物中终浓度/μM |
<5000 | 4 |
5000-6000 | 6 |
6000-7000 | 8 |
>7000 | 12 |
表12.W1的BRCA1基因延伸引物序列
UEP1 | GCTGAAACTTCTCAACC | SEQ ID NO:1 |
UEP2 | CTGGGAGCTCCTCTCACTC | SEQ ID NO:2 |
UEP3 | GAGTTGATCAAGGAACCTG | SEQ ID NO:3 |
UEP4 | CACAGCAGAAACCTACAACTC | SEQ ID NO:4 |
UEP5 | AAAGGCATCTGGCTGCACAACC | SEQ ID NO:5 |
UEP6 | GGGTGAGAGGATAGCCCTGAGC | SEQ ID NO:6 |
UEP7 | ACAAGAAAGTACGAGATTTAGTC | SEQ ID NO:7 |
UEP8 | ATTCAGCATTTTTCTTTCTTTAAT | SEQ ID NO:8 |
UEP9 | ATTAGATTAGTTAAAGTGATGTGG | SEQ ID NO:9 |
UEP10 | TGGAGATCAAGAATTGTTACAAATC | SEQ ID NO:10 |
UEP11 | GGATGTTCTCATTTCCCATTTCTCTT | SEQ ID NO:11 |
UEP12 | CCCTCTGAAGATACCGTTAATAAGGC | SEQ ID NO:12 |
UEP13 | TGAGATGGGTAGTTTCTATTCTGAAG | SEQ ID NO:13 |
UEP14 | CACCCTTCCATCATAAGTGAC | SEQ ID NO:14 |
表13.W1的内参基因延伸引物序列
UEP15 | TCAACATTGATGGTG | SEQ ID NO:15 |
UEP16 | GGGAAACAAAGGACACCGTTA | SEQ ID NO:16 |
表14.W2的BRCA1基因延伸引物序列
UEP17 | ACTGAGAAGCGTGCAGC | SEQ ID NO:17 |
UEP18 | CGACCTTGGTGGTTTC | SEQ ID NO:18 |
UEP19 | CCTCAAACTTGTCAGCAGAA | SEQ ID NO:19 |
UEP20 | CTCCGGAGTCCTAGCCCTTTC | SEQ ID NO:20 |
UEP21 | GGTTCACTCTGTAGAAGTCTTT | SEQ ID NO:21 |
UEP22 | CCATGTTCTAACACAGCTTCTAG | SEQ ID NO:22 |
UEP23 | GGAGTCTGCTCCGTTTGGTTAGT | SEQ ID NO:23 |
UEP24 | AACACTTACCTGGAATCTGGAATC | SEQ ID NO:24 |
UEP25 | GGATGGTGAATGATGAAAGCTCCT | SEQ ID NO:25 |
UEP26 | GGGGAGATGCTGAGTTTGTGTGTG | SEQ ID NO:26 |
UEP27 | TAAGAAGTACAAAATGTC | SEQ ID NO:27 |
UEP28 | CCTGTCCCTTTCCCGGG | SEQ ID NO:28 |
UEP29 | TGTTGGCATGTTGGTGAAGGGCCCAT | SEQ ID NO:29 |
UEP30 | CGGGTCCAACTCTCTAACCTTGGAACTG | SEQ ID NO:30 |
表15.W2的内参基因延伸引物序列
UEP31 | TGATAACAAAGGACACCGTTA | EQ ID NO31 |
UEP32 | GGGAGGCTCAACATTGATGGTG | EQ ID NO32 |
UEP33 | TTACTACATTTTTCTACATCCTTTGTTT | EQ ID NO33 |
表16.延伸反应体系
试剂 | 单孔体积/μl |
SAP产物 | 7 |
ddH<sub>2</sub>O | 0.619 |
Buffer Plus(10×) | 0.2 |
Termination Mix | 0.2 |
UEP混合物 | 0.94 |
iPLEX Pro Enzyme | 0.041 |
总体积 | 9 |
表17.延伸反应程序
5)脱盐
向延伸反应的产物中加入19ul超纯水,放入MassARRAY-CPM机器中,设置机器加入10ul的树脂,进行脱盐纯化,并静置沉降。
6)质谱检测
MassARRAY-CPM自动化地将产物点样在芯片上,并移入真空管中,然后用激光激发,进行飞行时间质谱。一张芯片最多可以同时检测192个样本,增加了通量,减少了成本。
2.数据分析
用Typer软件打开实验结果,可以对散点图进行分析。外显子缺失或者重复的样本,其结果会散落在正常样本的聚堆之外(如图1和图2圈出的部分)。我们需要对数据进行进一步的分析,在Typer软件中点击View--Plate Data Pane导出数据表,得到FREQ值(表18)。以BRCA1基因片段Exon15为例。
表18.FREQ值
样本名称 | 检测片段 | gDNA的FREQ | 人工内标的FREQ |
待测样本1 | ALB | 0.383216 | 0.616784 |
待测样本2 | ALB | 0.361839 | 0.638161 |
阴性样本1 | ALB | 0.461943 | 0.538056 |
阴性样本2 | ALB | 0.384088 | 0.615913 |
阴性样本3 | ALB | 0.356612 | 0.64339 |
待测样本1 | EIF2C1 | 0.573677 | 0.426323 |
待测样本2 | EIF2C1 | 0.514017 | 0.485983 |
阴性样本1 | EIF2C1 | 0.627566 | 0.372434 |
阴性样本2 | EIF2C1 | 0.535629 | 0.464371 |
阴性样本3 | EIF2C1 | 0.495153 | 0.504847 |
待测样本1 | RNaseP | 0.441841 | 0.558159 |
待测样本2 | RNaseP | 0.399637 | 0.600362 |
阴性样本1 | RNaseP | 0.3908 | 0.6092 |
阴性样本2 | RNaseP | 0.463194 | 0.536802 |
阴性样本3 | RNaseP | 0.403123 | 0.596877 |
待测样本1 | Exon15 | 0.488966 | 0.511034 |
待测样本2 | Exon15 | 0.340837 | 0.659161 |
阴性样本1 | Exon15 | 0.546832 | 0.453167 |
阴性样本2 | Exon15 | 0.496558 | 0.503443 |
阴性样本3 | Exon15 | 0.438126 | 0.561872 |
根据数据表中的每个BRCA1基因片段的人基因组DNA(gDNA)的FREQ参数和人工内标的FREQ参数,按照以下公式计算拷贝数。
由于本实施例中有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数。由于有3个阴性样本,所以得到了3个中位数,取平均值,得到最终的拷贝数变异系数(TR值)。
以Well1的Exon15片段为例,其中本实施例中添加的目标检测基因片段和内参基因片段的人工内标拷贝数为6000。
1)阴性样本1拷贝数比值
2)阴性样本2拷贝数比值
3)阴性样本3拷贝数比值
4)待测样本1拷贝数比值
5)待测样本2拷贝数比值
6)待测样本1拷贝数变异系数
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.99。
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.97。
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为1.05。
由于有3个阴性样本,所以得到了3个中位数,再将3个中位数取平均值,得到最终的拷贝数变异系数(TR值)。
7)待测样本2拷贝数变异系数
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.65。
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.58。
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.65。
由于有3个阴性样本,所以得到了3个中位数,再将3个中位数取平均值,得到最终的拷贝数变异系数(TR值)。
根据TR值,判断如下:
TR值 | 结果判断 | ||
1 | 待测样本1 | 0.8<TR<1.2 | Exon15正常 |
2 | 待测样本2 | TR≤0.65 | Exon15缺失 |
根据上述算法,用RStudio编辑器编写代码后,可直接上传实验数据,得到最终的TR值。用同样的方法计算待测样本1和待测样本2的其他外显子拷贝数,待测样本1的Exon13拷贝数变异系数(TR值)为1.9,结果判断为Exon13重复;待测样本2的Exon16拷贝数变异系数(TR值)为0.56,结果判断为Exon16缺失。根据TR值做柱状图,待测样本1的Exon13柱形图明显高于其他柱形图(如图4所示)。待测样本2的Exon15和Exon16的柱形图明显低于其他柱形图(如图3所示)。
3.质控标准
质量控制,每次试验需做2个阳性对照、3个阴性对照和3个空白对照。缺失阳性对照的TR≤0.65,重复阳性对照TR≥1.5,空白对照的TR=0。
TR值 | 结果判断 | |
1 | TR=0 | 空白对照 |
2 | TR≤0.65 | 缺失阳性对照 |
3 | TR≥1.5 | 重复阳性对照 |
4.产品性能指标:
本方法能特异检测BRCA1的23个外显子的1个或多个缺失和重复。
检测2份阳性参考品、10份阴性参考品,符合率为100%;企业重复性参考品重复检测10次,10次结果相同。检测未知样本,其符合率为98.6%。
本发明开发了一种用于检测基因长片段拷贝数变异的新方法,开创性的添加人工内标(competitor),采用特异的PCR引物和延伸引物,基于MassARRAY飞行时间质谱的多重PCR反应,可以大通量、准确性高、成本低地检测基因长片段拷贝数变异。弥补大多数基因测序检测的漏洞,有助于更全面的提供基因检测信息辅助医生进行诊断。
上述实施例仅为本发明的优选技术方案,而不应视为对于本发明的限制,本发明的保护范围应以权利要求记载的技术方案,包括权利要求记载的技术方案中技术特征的等同替换方案为保护范围,即在此范围内的等同替换改进,也在本发明的保护范围之内。
序列表
<110> 申友基因组研究院(南京)有限公司
<120> 一种用于检测基因长片段拷贝数变异的方法
<150> 2020113518391
<151> 2020-11-26
<160> 129
<170> SIPOSequenceListing 1.0
<210> 1
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gctgaaactt ctcaacc 17
<210> 2
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ctgggagctc ctctcactc 19
<210> 3
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gagttgatca aggaacctg 19
<210> 4
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cacagcagaa acctacaact c 21
<210> 5
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aaaggcatct ggctgcacaa cc 22
<210> 6
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gggtgagagg atagccctga gc 22
<210> 7
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
acaagaaagt acgagattta gtc 23
<210> 8
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
attcagcatt tttctttctt taat 24
<210> 9
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
attagattag ttaaagtgat gtgg 24
<210> 10
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tggagatcaa gaattgttac aaatc 25
<210> 11
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ggatgttctc atttcccatt tctctt 26
<210> 12
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ccctctgaag ataccgttaa taaggc 26
<210> 13
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tgagatgggt agtttctatt ctgaag 26
<210> 14
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
cacccttcca tcataagtga c 21
<210> 15
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tcaacattga tggtg 15
<210> 16
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gggaaacaaa ggacaccgtt a 21
<210> 17
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
actgagaagc gtgcagc 17
<210> 18
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
cgaccttggt ggtttc 16
<210> 19
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cctcaaactt gtcagcagaa 20
<210> 20
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ctccggagtc ctagcccttt c 21
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ggttcactct gtagaagtct tt 22
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ccatgttcta acacagcttc tag 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ggagtctgct ccgtttggtt agt 23
<210> 24
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aacacttacc tggaatctgg aatc 24
<210> 25
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ggatggtgaa tgatgaaagc tcct 24
<210> 26
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ggggagatgc tgagtttgtg tgtg 24
<210> 27
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
taagaagtac aaaatgtc 18
<210> 28
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
cctgtccctt tcccggg 17
<210> 29
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tgttggcatg ttggtgaagg gcccat 26
<210> 30
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
cgggtccaac tctctaacct tggaactg 28
<210> 31
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tgataacaaa ggacaccgtt a 21
<210> 32
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gggaggctca acattgatgg tg 22
<210> 33
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ttactacatt tttctacatc ctttgttt 28
<210> 34
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gatgtttgcc ttttgagtat tctttctaca 30
<210> 35
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
acgttggatg actctaccag tgccaggagc 30
<210> 36
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
acgttggatg ttctttttct ccccccctac 30
<210> 37
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
acgttggatg gttgttctag cagtgaagag 30
<210> 38
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ggatggatga agtgacagtt ccagtagtcc 30
<210> 39
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
acgttggatg cacgcttttt acctgagtgg 30
<210> 40
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gttggatgca cttgctgagt gtgtttctca 30
<210> 41
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
cgttggatga aagagcacgt tcttctgctg 30
<210> 42
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
cgttggatgt tctgagctgt gtgctagagg 30
<210> 43
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gttggatgtg gtcagctttc tgtaatcgaa 30
<210> 44
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
acgttggatg acggctaatt gtgctcactg 30
<210> 45
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gttggatgag gatctgattc ttctgaagat ac 32
<210> 46
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
acgttggatg atgagctcct cttgagatgg 30
<210> 47
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
acgttggatg cagagggata ccatgcaaca 30
<210> 48
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
acgttggatg cctactgtgg ttgcttccaa 30
<210> 49
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
acgttggatg ataattttgt gctcatggca ga 32
<210> 50
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
acgttggatg tggagccaca taacacattc 30
<210> 51
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
acgttggatg actcttcttg gctccagttg 30
<210> 52
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
acgttggatg tacatgcagg caccttacca 30
<210> 53
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
acgttggatg taaggtgaag cagcatctgg 30
<210> 54
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
acgttggatg tccaaacctg tgtcaagctg 30
<210> 55
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
acgttggatg ggtgcattga tggaaggaag 30
<210> 56
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
acgttggatg tttatgcagc agatgcaagg 30
<210> 57
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
cgttggatgt ttttgcagaa tccaaactga 30
<210> 58
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
acgttggatg gctagaggaa aactttgagg 30
<210> 59
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
acgttggatg gttctctttg actcacctgc aa 32
<210> 60
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
acgttggatg gtcatcccct tctaaatgcc 30
<210> 61
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
acgttggatg tttggccaac aatacacacc 30
<210> 62
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
acgttggatg gtggttcggc tttcaccagt ctg 33
<210> 63
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
acgttggatg ggtcagctct tcccttcatc 30
<210> 64
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
acgttggatg ggtgtggtca ctggacttgg g 31
<210> 65
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
acgttggatg cctcccacat gtaatgtgtt g 31
<210> 66
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
gttggatgtg tgaattttct gagacggatg 30
<210> 67
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
acgttggatg tgacgtgtct gctccacttc 30
<210> 68
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
ggatgtttgt tttctcattc catttaaagc 30
<210> 69
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
cgttggatgt ttttagcaaa agcgtccaga 30
<210> 70
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
tggatgtctc ctgaacatct aaaagatgaa 30
<210> 71
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
acgttggatg cagagggata ccatgcaaca 30
<210> 72
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
cgttggatga aagcagattt ggcagttcaa 30
<210> 73
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gttggatgaa cttctcccat tcctttcaga 30
<210> 74
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
acgttggatg ggtagagggc ctgggttaag 30
<210> 75
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
acgttggatg gctctttagc ttcttaggac 30
<210> 76
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
tggtttttct aatgtgttaa agttcattgg 30
<210> 77
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
acgttggatg tttctcagat aactgggccc ctg 33
<210> 78
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
acgttggatg ttcccctgtc cctctctctt 30
<210> 79
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
cgttggatgt tcaggaggaa aagcacagaa 30
<210> 80
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
acgttggatg gctgtaatga gctggcatga 30
<210> 81
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
acgttggatg tgtcctggga ttctcttgct 30
<210> 82
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
cgttggatgc ctttccactc ctggttcttt 30
<210> 83
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
acgttggatg aagtgttgga agcagggaag 30
<210> 84
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
acgttggatg gccacagagc aagactccat 30
<210> 85
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
acgttggatg tttggccaac aatacacacc 30
<210> 86
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gttggatggc tttcgttttg aaagcagatt 30
<210> 87
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
acgttggatg tgactctggg gctctgtctt 30
<210> 88
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
acgttggatg tgtgtcctcc ctctctgaca 30
<210> 89
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
acgttggatg cattttcctc ccgcaattcc 30
<210> 90
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
acgttggatg cagagtggat ggagaacaag g 31
<210> 91
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
acgttggatg cctctcaggt tccgcccc 28
<210> 92
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
acgttggatg ggttctccca ggctcttacc 30
<210> 93
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
cgttggatgc ctgagaccct tacccaattc 30
<210> 94
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
acgttggatg ggtcagctct tcccttcatc 30
<210> 95
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
acgttggatg gtggttcggc tttcaccagt ctg 33
<210> 96
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
acgttggatg agcaacctgt tacatattaa agtt 34
<210> 97
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
acgttggatg cctcccacat gtaatgtgtt g 31
<210> 98
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
acgttggatg ggtgtggtca ctggacttgg g 31
<210> 99
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
acgttggatg atactgagca aaggcaatca ac 32
<210> 100
<211> 287
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
ttctttttct ccccccctac cctgctagtc tggagttgat caaggaacct gactccacaa 60
agtgtgacca catattttgc aagtaagttt gaatgtgtta tgtggctcca ttttcaaaac 120
tgaaaaactc atatattcag tattttactc ccacagcacc tccccccaat ttgacccaca 180
gggaccccca tccaggtgca gggtcctcgc ctgtgtacag ggcacacctt tggtcactcc 240
aaattcccag agctcccagg gtccttctca gggtctccac ctggatg 287
<210> 101
<211> 372
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
tttgcctttt gagtattctt tctacaaaag gaagtaaatt aaattgttct ttctttcttt 60
ataatttata gattttgcat gctgaaactt ctcaacctga agaaagggcc ttcacagtgt 120
cctttatgta agaatgatat aaccaaaagg tatataattt ggtaatgatg ctaggttgga 180
agcaaccaca gtaggttttc aaaactgaaa aactcatata ttcagtattt tactcccaca 240
gcacctcccc ccaatttgac ccacagggac ccccatccag gtgcagggtc ctcgcctgtg 300
tacagggcac acctttggtc actccaaatt cccagagctc ccagggtcct tctcagggtc 360
tccacctgga tg 372
<210> 102
<211> 302
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
cacttgctga gtgtgtttct caaacaattt aatttcagga gcctacaaga aagtacgaga 60
tttagtctac ttgttgaaga gctattgaaa atcatttgtg cttttcagct tgacacaggt 120
ttggattttc aaaactgaaa aactcatata ttcagtattt tactcccaca gcacctcccc 180
ccaatttgac ccacagggac ccccatccag gtgcagggtc ctcgcctgtg tacagggcac 240
acctttggtc actccaaatt cccagagctc ccagggtcct tctcagggtc tccacctgga 300
tg 302
<210> 103
<211> 366
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
ctcagtaaat atttctagtt gaatatctgt ttttcaacaa gtacattttt ttaacccttt 60
taattaagaa aacttttatt gatttatttt ttggggggaa attttttagg atctgattct 120
tctgaagata ccgttaataa ggctacttat tgcaggtgag tcaaagagaa cctttgtcta 180
tgaagctggt tttcaaaact gaaaaactca tatattcagt attttactcc cacagcacct 240
ccccccaatt tgacccacag ggacccccat ccaggtgcag ggtcctcgcc tgtgtacagg 300
gcacaccttt ggtcactcca aattcccaga gctcccaggg tccttctcag ggtctccacc 360
tggatg 366
<210> 104
<211> 361
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
tggtcagctt tctgtaatcg aaagagctaa aatgtttgat cttggtcatt tgacagttct 60
gcatacatgt aactagtgtt tcttattagg actctgtctt ttccctatag tgtgggagat 120
caagaattgt tacaaatctc ccctcaagga accagggatg aaatcagttt ggattctgca 180
aaaattttca aaactgaaaa actcatatat tcagtatttt actcccacag cacctccccc 240
caatttgacc cacagggacc cccatccagg tgcagggtcc tcgcctgtgt acagggcaca 300
cctttggtca ctccaaattc ccagagctcc cagggtcctt ctcagggtct ccacctggat 360
g 361
<210> 105
<211> 293
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
gttgttctag cagtgaagag ataaagaaaa aaaagtacaa ccaaatgcca gtcaggcaca 60
gcagaaacct acaactcttg gaaggtaaag aacctgcaac tggagccaag aagagttttt 120
caaaactgaa aaactcatat attcagtatt ttactcccac agcacctccc cccaatttga 180
cccacaggga cccccatcca ggtgcagggt cctcgcctgt gtacagggca cacctttggt 240
cactccaaat tcccagagct cccagggtcc ttctcagggt ctccacctgg atg 293
<210> 106
<211> 268
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
gctagaggaa aactttgagg aacattcaat gtcacctgta agagaaatgg gaaatgagaa 60
cattccaagt acagtgagca caattagccg tttttcaaaa ctgaaaaact catatattca 120
gtattttact cccacagcac ctccccccaa tttgacccac agggaccccc atccaggtgc 180
agggtcctcg cctgtgtaca gggcacacct ttggtcactc caaattccca gagctcccag 240
ggtccttctc agggtctcca cctggatg 268
<210> 107
<211> 282
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
taaggtgaag cagcatctgg gtgtgagagt gaaacaagcg tctctgaaga cagctcaggg 60
ctatcctctc agagtgacat tttaaccact caggtaaaaa gcgtgttttc aaaactgaaa 120
aactcatata ttcagtattt tactcccaca gcacctcccc ccaatttgac ccacagggac 180
ccccatccag gtgcagggtc ctcgcctgtg tacagggcac acctttggtc actccaaatt 240
cccagagctc ccagggtcct tctcagggtc tccacctgga tg 282
<210> 108
<211> 279
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
gtcatcccct tctaaatgcc catcattaga tgataggtgg tacatgcaca gttgctctgg 60
gagacttcag aatagaaact acccatctca agaggagctc atttttcaaa actgaaaaac 120
tcatatattc agtattttac tcccacagca cctcccccca atttgaccca cagggacccc 180
catccaggtg cagggtcctc gcctgtgtac agggcacacc tttggtcact ccaaattccc 240
agagctccca gggtccttct cagggtctcc acctggatg 279
<210> 109
<211> 367
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
ttctgagctg tgtgctagag gtaactcatg ataatggaat atttgattta atttcagatg 60
ctcgtgtaca agtttgccag aaaactccac atcactttaa ctaatctaat tactgaagag 120
actactcatg ttgttatgaa aacaggtata ccaagaacct ttacagaata ccttgcatct 180
gctgcataaa ttttcaaaac tgaaaaactc atatattcag tattttactc ccacagcacc 240
tccccccaat ttgacccaca gggaccccca tccaggtgca gggtcctcgc ctgtgtacag 300
ggcacacctt tggtcactcc aaattcccag agctcccagg gtccttctca gggtctccac 360
ctggatg 367
<210> 110
<211> 357
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
aaagagcacg ttcttctgct gtatgtaacc tgtcttttct atgatctctt taggggtgac 60
ccagtcaatt aaagaaagaa aaatgctgaa tgaggtaagt acttgatgtt acaaactaac 120
cagagatatt cattcagtca tatagttaaa aatgtatttg cttccttcca tcaatgcacc 180
ttttcaaaac tgaaaaactc atatattcag tattttactc ccacagcacc tccccccaat 240
ttgacccaca gggaccccca tccaggtgca gggtcctcgc ctgtgtacag ggcacacctt 300
tggtcactcc aaattcccag agctcccagg gtccttctca gggtctccac ctggatg 357
<210> 111
<211> 319
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
aagtgacagt tccagtagtc ctactttgac actttgaatg ctctttcctt cctggggatc 60
cagggtgtcc acccaattga ggttgtgcag ccagatgcct ggacagagga caatggcttc 120
catggtaagg tgcctgcatg tattttcaaa actgaaaaac tcatatattc agtattttac 180
tcccacagca cctcccccca atttgaccca cagggacccc catccaggtg cagggtcctc 240
gcctgtgtac agggcacacc tttggtcact ccaaattccc agagctccca gggtccttct 300
cagggtctcc acctggatg 319
<210> 112
<211> 292
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
gtggttcggc tttcaccagt ctgtgcgccc tgccatgtgg aagatgatgc tcaacattga 60
tggtgtgtgg ggagagctat ggagccaggg gcaccccaag tccagtgacc acaccttttc 120
aaaactgaaa aactcatata ttcagtattt tactcccaca gcacctcccc ccaatttgac 180
ccacagggac ccccatccag gtgcagggtc ctcgcctgtg tacagggcac acctttggtc 240
actccaaatt cccagagctc ccagggtcct tctcagggtc tccacctgga tg 292
<210> 113
<211> 259
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
ggtcagctct tcccttcatc acatacttgg agaacaaagg acaccgttat ccatgctttt 60
tcaacacatt acatgtggga ggttttcaaa actgaaaaac tcatatattc agtattttac 120
tcccacagca cctcccccca atttgaccca cagggacccc catccaggtg cagggtcctc 180
gcctgtgtac agggcacacc tttggtcact ccaaattccc agagctccca gggtccttct 240
cagggtctcc acctggatg 259
<210> 114
<211> 368
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
cagagggata ccatgcaaca taacctgata aagctccagc aggaaatggc tgatctagaa 60
gctgtgttag aacagcatgg gagccagcct tctaacagct acccttccat cataagtgac 120
acttctgccc ttgaggacct gcgaaatcca gaacaaagca catcagaaaa aggtgtgtat 180
tgttggccaa attttcaaaa ctgaaaaact catatattca gtattttact cccacagcac 240
ctccccccaa tttgacccac agggaccccc atccaggtgc agggtcctcg cctgtgtaca 300
gggcacacct ttggtcactc caaattccca gagctcccag ggtccttctc agggtctcca 360
cctggatg 368
<210> 115
<211> 366
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
tctcctgaac atctaaaaga tgaagtttct atcatccaaa gtatgggcta cagaaaccgt 60
gcctaaagac ttctacagag tgaacccgaa aatccttcct tggtaaaacc atttgttttc 120
ttcttcttct tcttcttctt ttcttttttt tttctttttt ttttttgaga tggagtcttg 180
ctctgtggct tttcaaaact gaaaaactca tatattcagt attttactcc cacagcacct 240
ccccccaatt tgacccacag ggacccccat ccaggtgcag ggtcctcgcc tgtgtacagg 300
gcacaccttt ggtcactcca aattcccaga gctcccaggg tccttctcag ggtctccacc 360
tggatg 366
<210> 116
<211> 360
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
ttcaggagga aaagcacaga actggccaac aattgcttga ctgttcttta ccatactgtt 60
tagcaggaaa ccagtctcag tgtccaactc tctaaccttg gaactgagag aactctgagg 120
acaaagcagc ggatacaacc tcaaaagacg tctgtctaca ttgaattggg taagggtctc 180
aggttttcaa aactgaaaaa ctcatatatt cagtatttta ctcccacagc acctcccccc 240
aatttgaccc acagggaccc ccatccaggt gcagggtcct cgcctgtgta cagggcacac 300
ctttggtcac tccaaattcc cagagctccc agggtccttc tcagggtctc cacctggatg 360
<210> 117
<211> 355
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
tgtgaatttt ctgagacgga tgtaacaaat actgaacatc atcaacccag taataatgat 60
ttgaacacca ctgagaagcg tgcagcagag aggcatccag aaaagtatca gggtagttct 120
gtttcaaact tgcatgtgga gccatgtggc acaaatactc atgccagctc attacagctt 180
ttcaaaactg aaaaactcat atattcagta ttttactccc acagcacctc cccccaattt 240
gacccacagg gacccccatc caggtgcagg gtcctcgcct gtgtacaggg cacacctttg 300
gtcactccaa attcccagag ctcccagggt ccttctcagg gtctccacct ggatg 355
<210> 118
<211> 371
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
aaagcagatt tggcagttca aaagactcct gaaatgataa atcagggtac taaccaaacg 60
gagcagaatg gtcaagtgat gaatattact aatagtggtc atgagaataa aacaaaaggt 120
gattctattc agaatgagaa aaatcctaac ccaatagaat cactcgaaaa agaatctgct 180
ttcaaaacga aagcttttca aaactgaaaa actcatatat tcagtatttt actcccacag 240
cacctccccc caatttgacc cacagggacc cccatccagg tgcagggtcc tcgcctgtgt 300
acagggcaca cctttggtca ctccaaattc ccagagctcc cagggtcctt ctcagggtct 360
ccacctggat g 371
<210> 119
<211> 337
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
tttttagcaa aagcgtccag aaaggagagc ttagcaggag tcctagccct ttctcccata 60
cacatttggc tcagggttac cgaagagggg ccaagaaatt agagtcctca gaagagaact 120
tatctagtga ggatgaagag cttccctgct tccaacactt ttttcaaaac tgaaaaactc 180
atatattcag tattttactc ccacagcacc tccccccaat ttgacccaca gggaccccca 240
tccaggtgca gggtcctcgc ctgtgtacag ggcacacctt tggtcactcc aaattcccag 300
agctcccagg gtccttctca gggtctccac ctggatg 337
<210> 120
<211> 368
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
cagagggata ccatgcaaca taacctgata aagctccagc aggaaatggc tgatctagaa 60
gctgtgttag aacagcatgg gagccagcct tctaacagct acccttccat cataagtgac 120
acttctgccc ttgaggacct gcgaaatcca gaacaaagca catcagaaaa aggtgtgtat 180
tgttggccaa attttcaaaa ctgaaaaact catatattca gtattttact cccacagcac 240
ctccccccaa tttgacccac agggaccccc atccaggtgc agggtcctcg cctgtgtaca 300
gggcacacct ttggtcactc caaattccca gagctcccag ggtccttctc agggtctcca 360
cctggatg 368
<210> 121
<211> 329
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
tttgttttct cattccattt aaagcagtat taacttcaca gaaaagtagt gaatacccta 60
taagccagaa tccagaaggc cattctgctg acaagtttga ggtgtctgca gatagttcta 120
ccagtaaaaa taaagaacca ggagtggaaa ggttttcaaa actgaaaaac tcatatattc 180
agtattttac tcccacagca cctcccccca atttgaccca cagggacccc catccaggtg 240
cagggtcctc gcctgtgtac agggcacacc tttggtcact ccaaattccc agagctccca 300
gggtccttct cagggtctcc acctggatg 329
<210> 122
<211> 284
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
aacttctccc attcctttca gagggaaccc cttacctgga atctggaatc tgcctcttct 60
ctgatgaccc tgaatctgat ccttctgaag acagagcccc agagtcattt tcaaaactga 120
aaaactcata tattcagtat tttactccca cagcacctcc ccccaatttg acccacaggg 180
acccccatcc aggtgcaggg tcctcgcctg tgtacagggc acacctttgg tcactccaaa 240
ttcccagagc tcccagggtc cttctcaggg tctccacctg gatg 284
<210> 123
<211> 315
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
gctctttagc ttcttaggac agcacttcct gattttgttt tcaacttcta atcctttgag 60
tgtttttcat tctgcagatg ctgagtttgt gtgtgtacgg acactgaaat attttctagg 120
aattgcggga ggaaaatgtt ttcaaaactg aaaaactcat atattcagta ttttactccc 180
acagcacctc cccccaattt gacccacagg gacccccatc caggtgcagg gtcctcgcct 240
gtgtacaggg cacacctttg gtcactccaa attcccagag ctcccagggt ccttctcagg 300
gtctccacct ggatg 315
<210> 124
<211> 333
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
tgacgtgtct gctccacttc cattgaagga agcttctctt tctcttatcc tgatgggttg 60
tgtttggttt ctttcagcat gattttgaag tcagaggaga tgtggtcaat ggatgaaacc 120
accaaggtcc aaagcgagca agagaatccc aggacatttt caaaactgaa aaactcatat 180
attcagtatt ttactcccac agcacctccc cccaatttga cccacaggga cccccatcca 240
ggtgcagggt cctcgcctgt gtacagggca cacctttggt cactccaaat tcccagagct 300
cccagggtcc ttctcagggt ctccacctgg atg 333
<210> 125
<211> 286
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
ttcccctgtc cctctctctt cctctcttct tccagatctt cagggggcta gaaatctgtt 60
gcaatgggcc cttcaccaac atgcccacag gtaagagcct gggagaacct tttcaaaact 120
gaaaaactca tatattcagt attttactcc cacagcacct ccccccaatt tgacccacag 180
ggacccccat ccaggtgcag ggtcctcgcc tgtgtacagg gcacaccttt ggtcactcca 240
aattcccaga gctcccaggg tccttctcag ggtctccacc tggatg 286
<210> 126
<211> 353
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
ggtagagggc ctgggttaag tatgcagatt actgcagtga ttttacatct aaatgtccat 60
tttagatcaa ctggaatgga tggtacagct gtgtggtgct tctgtggtgt aggagctttc 120
atcattcacc cttggcacag taagtattgg gtgccctgtc agagagggag gacacatttt 180
caaaactgaa aaactcatat attcagtatt ttactcccac agcacctccc cccaatttga 240
cccacaggga cccccatcca ggtgcagggt cctcgcctgt gtacagggca cacctttggt 300
cactccaaat tcccagagct cccagggtcc ttctcagggt ctccacctgg atg 353
<210> 127
<211> 292
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
gtggttcggc tttcaccagt ctgtgcgccc tgccatgtgg aagatgatgc tcaacattga 60
tggtgtgtgg ggagagctat ggagccaggg gcaccccaag tccagtgacc acaccttttc 120
aaaactgaaa aactcatata ttcagtattt tactcccaca gcacctcccc ccaatttgac 180
ccacagggac ccccatccag gtgcagggtc ctcgcctgtg tacagggcac acctttggtc 240
actccaaatt cccagagctc ccagggtcct tctcagggtc tccacctgga tg 292
<210> 128
<211> 259
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
ggtcagctct tcccttcatc acatacttgg agaacaaagg acaccgttat ccatgctttt 60
tcaacacatt acatgtggga ggttttcaaa actgaaaaac tcatatattc agtattttac 120
tcccacagca cctcccccca atttgaccca cagggacccc catccaggtg cagggtcctc 180
gcctgtgtac agggcacacc tttggtcact ccaaattccc agagctccca gggtccttct 240
cagggtctcc acctggatg 259
<210> 129
<211> 262
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
agcaacctgt tacatattaa agttttatta tactacattt ttctacatcc tttgttttag 60
ggtgttgatt gcctttgctc agtatttttc aaaactgaaa aactcatata ttcagtattt 120
tactcccaca gcacctcccc ccaatttgac ccacagggac ccccatccag gtgcagggtc 180
ctcgcctgtg tacagggcac acctttggtc actccaaatt cccagagctc ccagggtcct 240
tctcagggtc tccacctgga tg 262
Claims (10)
1.一种用于检测基因长片段拷贝数变异的方法,包括如下步骤:
(1)采用DNA提取试剂盒提取待测样本的人基因组DNA;
(2)以待测样本的人基因组DNA为模板,添加人工内标,通过多重PCR扩增反应,获得人基因组DNA的扩增产物和人工内标的扩增产物;
(3)将扩增反应的产物通过虾碱性磷酸酶反应,除去多余的脱氧核糖核苷三磷酸;
(4)将步骤(3)的产物通过延伸反应,在延伸引物的3’端延伸一个碱基,得到人基因组DNA的延伸产物和人工内标的延伸产物;
(5)将延伸反应的产物通过树脂纯化,脱盐;
(6)将脱盐后的产物点样在质谱芯片基质上共结晶,再将晶体转入质谱仪的真空管,用激光激发进行MassARRAY飞行时间质谱检测;
(7)根据MassARRAY飞行时间质谱检测得到的FREQ数据,计算拷贝数变异系数(TR值),并判断基因片段的拷贝数。
2.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(2)中人工内标为合成的双链DNA片段或含有合成的双链DNA片段的质粒;其中合成的双链DNA片段与待测样本的目标扩增片段只有1个碱基不同,并且两个片段上不同的碱基均与延伸引物的3’端相邻。
3.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(2)得到的人基因组DNA的扩增产物、人工内标的扩增产物均包含目标检测基因片段以及内参基因的片段;目标检测基因片段的长度为70-600bp;内参基因为RNaseP、EIF2C1、ALB、GAPDH中的一种或几种。
4.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(2)中,多重PCR扩增反应的体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、UNG酶以及PCR酶。
5.根据权利要求4所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:PCR引物Pool为目标检测基因扩增引物、内参基因扩增引物的混合物。
6.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(3)中,虾碱性磷酸酶反应的体系包括SAP酶以及SAP Buffer。
7.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(4)中,延伸反应的体系包括Buffer Plus、Termination Mix、延伸引物混合物以及iPLEXEnzyme;其中,延伸引物混合物为与步骤(2)中人基因组DNA的扩增产物、人工内标的扩增产物的序列相匹配的延伸引物混合物,且延伸引物混合物中任意一条延伸引物在3’端延伸一个碱基,得到相应的延伸产物。
8.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(7)中,根据MassARRAY飞行时间质谱检测,得到两个质谱峰,用两个质谱峰的FREQ数据根据下列公式进行计算,可以得到拷贝数变异系数(TR值);其中,两个质谱峰分别为人基因组DNA(gDNA)片段的峰以及人工内标片段的峰;目标检测基因片段的人工内标拷贝数、内参基因片段的人工内标拷贝数为添加进入体系的拷贝数;
根据拷贝数变异系数TR值,当TR≤0.65时,待测样本目标检测基因片段为缺失阳性;当0.8<TR<1.2时,待测样本目标检测基因片段拷贝数正常,结果为阴性;当TR≥1.5时,待测样本目标检测基因片段为重复阳性。
9.一种基于权利要求1-8任一项所述的用于检测基因长片段拷贝数变异的方法的试剂盒,其特征在于:包括样品检测孔W1和样品检测孔W2;样品检测孔W1内含有W1多重PCR反应体系、SAP反应体系以及W1延伸反应体系;W1多重PCR反应体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、人工内标、UNG酶以及PCR酶;其中人工内标的序列如SEQ ID NO:100-114所示;样品检测孔W2内含有W2多重PCR反应体系、SAP反应体系以及W2延伸反应体系;W2多重PCR反应体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、人工内标、UNG酶和PCR酶;其中人工内标的序列如SEQ ID NO:115-129所示。
10.根据权利要求9所述的试剂盒,其特征在于:W1多重PCR反应体系中PCR引物Pool的序列如SEQ ID NO:34-65所示;W1延伸反应体系包括Buffer Plus、Termination Mix、W1延伸引物混合物以及iPLEX Enzyme;W1延伸引物混合物的序列如SEQ ID NO:1-16所示;W2多重PCR反应体系中PCR引物Pool的序列如SEQ ID NO:66-99所示;W2延伸反应体系包括Buffer Plus、Termination Mix、W2延伸引物混合物以及iPLEX Enzyme;W2延伸引物混合物的序列如SEQ ID NO:17-33所示;SAP反应体系包括SAP酶以及SAP Buffer。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020113518391 | 2020-11-26 | ||
CN202011351839.1A CN112501266A (zh) | 2020-11-26 | 2020-11-26 | 一种用于检测brca1基因长片段拷贝数变异的试剂盒 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113403371A true CN113403371A (zh) | 2021-09-17 |
CN113403371B CN113403371B (zh) | 2024-04-16 |
Family
ID=74966517
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011351839.1A Pending CN112501266A (zh) | 2020-11-26 | 2020-11-26 | 一种用于检测brca1基因长片段拷贝数变异的试剂盒 |
CN202110791634.3A Active CN113403371B (zh) | 2020-11-26 | 2021-07-13 | 一种用于检测基因长片段拷贝数变异的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011351839.1A Pending CN112501266A (zh) | 2020-11-26 | 2020-11-26 | 一种用于检测brca1基因长片段拷贝数变异的试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN112501266A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102517282A (zh) * | 2011-12-30 | 2012-06-27 | 中国人民解放军军事医学科学院放射与辐射医学研究所 | 一种富集分离内源转录因子及其复合物的方法及其专用转录因子串联结合序列 |
CN106191269A (zh) * | 2016-07-22 | 2016-12-07 | 上海产业技术研究院 | 通用型brca1基因多重pcr建库试剂盒 |
US20180340234A1 (en) * | 2017-05-26 | 2018-11-29 | Life Technologies Corporation | Methods and systems to detect large rearrangements in brca1/2 |
-
2020
- 2020-11-26 CN CN202011351839.1A patent/CN112501266A/zh active Pending
-
2021
- 2021-07-13 CN CN202110791634.3A patent/CN113403371B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102517282A (zh) * | 2011-12-30 | 2012-06-27 | 中国人民解放军军事医学科学院放射与辐射医学研究所 | 一种富集分离内源转录因子及其复合物的方法及其专用转录因子串联结合序列 |
CN106191269A (zh) * | 2016-07-22 | 2016-12-07 | 上海产业技术研究院 | 通用型brca1基因多重pcr建库试剂盒 |
US20180340234A1 (en) * | 2017-05-26 | 2018-11-29 | Life Technologies Corporation | Methods and systems to detect large rearrangements in brca1/2 |
Non-Patent Citations (2)
Title |
---|
PRAMOD GAUTAM等: "Spectrum of large copy number variations in 26 diverse Indian populations: potential involvement in phenotypic diversity", 《HUM GENET》, pages 1 - 13 * |
UMI SHAKINA HARIDAN等: "A Comparison of Assays for Accurate Copy Number Measurement of the Low-Affinity Fc Gamma Receptor Genes FCGR3A and FCGR3B", 《PLOS ONE》, vol. 0116791, pages 1 - 13 * |
Also Published As
Publication number | Publication date |
---|---|
CN112501266A (zh) | 2021-03-16 |
CN113403371B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102329876B (zh) | 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法 | |
KR101074841B1 (ko) | 방광암 특이적 메틸화 마커 유전자를 이용한 방광암 진단용키트 및 칩 | |
CN102703595B (zh) | 一种碱基选择性可控延伸的str序列高通量检测方法及其检测试剂 | |
CN109022579B (zh) | 染色体1p/19q杂合性缺失的检测方法、试剂盒及引物组 | |
CN103898199A (zh) | 一种高通量核酸分析方法及其应用 | |
CN108070658B (zh) | 检测msi的非诊断方法 | |
JP2014519310A (ja) | Dnaメチル化のデジタル配列分析 | |
EP3029148B1 (en) | Method for determining nucleic acid composition of nucleic acid mixture | |
JP2013090622A (ja) | 多型検出用プローブ、多型検出方法、薬効判定方法及び多型検出用キット | |
CN105463116A (zh) | 一种基于20个三等位基因snp遗传标记的法医学复合检测试剂盒及检测方法 | |
Perucho et al. | [18] Fingerprinting of DNA and RNA by arbitrarily primed polymerase chain reaction: Applications in cancer research | |
JP2018528780A (ja) | 短いホモポリマー反復の改良された検出 | |
CA2905461C (en) | Method for detecting cystic fibrosis | |
CN111893192B (zh) | 混合检材分析微单倍型复合扩增体系及构建及单倍型频率 | |
KR101387663B1 (ko) | 방광암 특이적 메틸화 마커 유전자를 이용한 방광암 검출방법 | |
CN112342303A (zh) | 一种基于ngs的人类y染色体str和snp遗传标记联合检测体系及检测方法 | |
EP3722444B1 (en) | Method for determining rcc subtypes | |
CN113403371B (zh) | 一种用于检测基因长片段拷贝数变异的方法 | |
CN113416769B (zh) | 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途 | |
JP2007202552A (ja) | 核酸における点変異及び/又は大規模変更をアッセイするための方法及び組成物、並びに遺伝疾病及び癌の診断におけるそれらの使用 | |
CN103103267B (zh) | 检测人21号染色体str基因型的试剂盒 | |
EP1092782B1 (en) | Genetic screening method and genetic screening apparatus | |
CN111020034B (zh) | 新型的诊断肿瘤的标志物及其应用 | |
De Lellis et al. | Combined use of MLPA and nonfluorescent multiplex PCR analysis by high performance liquid chromatography for the detection of genomic rearrangements | |
CN102134595A (zh) | 样品中核酸质量检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |