CN110656156A - 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂 - Google Patents
一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂 Download PDFInfo
- Publication number
- CN110656156A CN110656156A CN201910971050.7A CN201910971050A CN110656156A CN 110656156 A CN110656156 A CN 110656156A CN 201910971050 A CN201910971050 A CN 201910971050A CN 110656156 A CN110656156 A CN 110656156A
- Authority
- CN
- China
- Prior art keywords
- primer
- sequence
- nucleic acid
- enrichment
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 114
- 238000001514 detection method Methods 0.000 title claims abstract description 66
- 230000035772 mutation Effects 0.000 title claims abstract description 55
- 150000007523 nucleic acids Chemical group 0.000 title claims abstract description 54
- 238000010276 construction Methods 0.000 title claims abstract description 26
- 239000003153 chemical reaction reagent Substances 0.000 title claims abstract description 23
- 238000013461 design Methods 0.000 title claims abstract description 22
- 108091093088 Amplicon Proteins 0.000 claims abstract description 30
- 238000012408 PCR amplification Methods 0.000 claims abstract description 25
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 22
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 22
- 230000001105 regulatory effect Effects 0.000 claims abstract description 19
- 238000006243 chemical reaction Methods 0.000 claims description 166
- 108020004414 DNA Proteins 0.000 claims description 115
- 238000011144 upstream manufacturing Methods 0.000 claims description 40
- 239000000203 mixture Substances 0.000 claims description 36
- 238000012163 sequencing technique Methods 0.000 claims description 34
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 29
- 239000000047 product Substances 0.000 claims description 29
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 28
- 230000003321 amplification Effects 0.000 claims description 25
- 230000004927 fusion Effects 0.000 claims description 22
- 108090000623 proteins and genes Proteins 0.000 claims description 22
- 239000007795 chemical reaction product Substances 0.000 claims description 21
- 238000003752 polymerase chain reaction Methods 0.000 claims description 17
- 230000008685 targeting Effects 0.000 claims description 16
- 230000008439 repair process Effects 0.000 claims description 15
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 14
- 102000003960 Ligases Human genes 0.000 claims description 12
- 108090000364 Ligases Proteins 0.000 claims description 12
- 238000003780 insertion Methods 0.000 claims description 12
- 230000037431 insertion Effects 0.000 claims description 12
- 102000004190 Enzymes Human genes 0.000 claims description 11
- 108090000790 Enzymes Proteins 0.000 claims description 11
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 9
- 102000012410 DNA Ligases Human genes 0.000 claims description 8
- 108010061982 DNA Ligases Proteins 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 7
- 230000037430 deletion Effects 0.000 claims description 7
- 206010064571 Gene mutation Diseases 0.000 claims description 6
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 claims description 6
- 229920001213 Polysorbate 20 Polymers 0.000 claims description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 6
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 claims description 6
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 claims description 6
- 239000008223 sterile water Substances 0.000 claims description 6
- 241000588724 Escherichia coli Species 0.000 claims description 5
- 102000053602 DNA Human genes 0.000 claims description 4
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 4
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 4
- 108060002716 Exonuclease Proteins 0.000 claims description 4
- 102000013165 exonuclease Human genes 0.000 claims description 4
- 239000003381 stabilizer Substances 0.000 claims description 4
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 3
- 108010006785 Taq Polymerase Proteins 0.000 claims description 3
- 239000013504 Triton X-100 Substances 0.000 claims description 3
- 229920004890 Triton X-100 Polymers 0.000 claims description 3
- 229910001629 magnesium chloride Inorganic materials 0.000 claims description 3
- 230000011987 methylation Effects 0.000 claims description 3
- 238000007069 methylation reaction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 239000011780 sodium chloride Substances 0.000 claims description 3
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 claims description 3
- 230000004544 DNA amplification Effects 0.000 claims description 2
- 241001465754 Metazoa Species 0.000 claims description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 2
- 239000012190 activator Substances 0.000 claims description 2
- 238000000137 annealing Methods 0.000 claims description 2
- 239000003795 chemical substances by application Substances 0.000 claims description 2
- 239000003623 enhancer Substances 0.000 claims description 2
- 244000005700 microbiome Species 0.000 claims description 2
- 238000005580 one pot reaction Methods 0.000 claims description 2
- 229920001223 polyethylene glycol Polymers 0.000 claims description 2
- 229920000642 polymer Polymers 0.000 claims description 2
- 239000012744 reinforcing agent Substances 0.000 claims description 2
- 230000000087 stabilizing effect Effects 0.000 claims description 2
- 241000196324 Embryophyta Species 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 17
- 239000000539 dimer Substances 0.000 abstract description 5
- 230000015572 biosynthetic process Effects 0.000 abstract description 4
- 238000002372 labelling Methods 0.000 abstract description 2
- 230000035945 sensitivity Effects 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 39
- 238000000746 purification Methods 0.000 description 33
- 150000001413 amino acids Chemical class 0.000 description 32
- 239000000243 solution Substances 0.000 description 27
- 239000011324 bead Substances 0.000 description 26
- 238000002156 mixing Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 22
- 241000282414 Homo sapiens Species 0.000 description 20
- 238000011529 RT qPCR Methods 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 18
- 239000012149 elution buffer Substances 0.000 description 18
- 239000000126 substance Substances 0.000 description 16
- 101150105104 Kras gene Proteins 0.000 description 13
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 12
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 12
- 238000011002 quantification Methods 0.000 description 12
- 239000012264 purified product Substances 0.000 description 11
- 238000003908 quality control method Methods 0.000 description 11
- 101150039808 Egfr gene Proteins 0.000 description 10
- 108700021358 erbB-1 Genes Proteins 0.000 description 10
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 9
- 101150023956 ALK gene Proteins 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 238000011534 incubation Methods 0.000 description 9
- 238000005119 centrifugation Methods 0.000 description 8
- 238000006062 fragmentation reaction Methods 0.000 description 8
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 8
- 239000010931 gold Substances 0.000 description 8
- 229910052737 gold Inorganic materials 0.000 description 8
- 238000000246 agarose gel electrophoresis Methods 0.000 description 7
- 101150048834 braF gene Proteins 0.000 description 7
- 238000013467 fragmentation Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 210000002381 plasma Anatomy 0.000 description 7
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 7
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 6
- 238000001962 electrophoresis Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 238000011049 filling Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 230000026731 phosphorylation Effects 0.000 description 6
- 238000006366 phosphorylation reaction Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 239000012154 double-distilled water Substances 0.000 description 5
- 238000004445 quantitative analysis Methods 0.000 description 5
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000007664 blowing Methods 0.000 description 4
- 238000010804 cDNA synthesis Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000010790 dilution Methods 0.000 description 4
- 239000012895 dilution Substances 0.000 description 4
- 238000010828 elution Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000003753 real-time PCR Methods 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000007400 DNA extraction Methods 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 230000009089 cytolysis Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000007857 nested PCR Methods 0.000 description 3
- 239000012188 paraffin wax Substances 0.000 description 3
- 238000005086 pumping Methods 0.000 description 3
- 239000011535 reaction buffer Substances 0.000 description 3
- 108020004418 ribosomal RNA Proteins 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 238000007399 DNA isolation Methods 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102100030708 GTPase KRas Human genes 0.000 description 2
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 101710203526 Integrase Proteins 0.000 description 2
- 239000008118 PEG 6000 Substances 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 229920002584 Polyethylene Glycol 6000 Polymers 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 238000010802 RNA extraction kit Methods 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- 238000010009 beating Methods 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 239000012295 chemical reaction liquid Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 2
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 239000011259 mixed solution Substances 0.000 description 2
- 230000036438 mutation frequency Effects 0.000 description 2
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 238000010008 shearing Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 206010071975 EGFR gene mutation Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 208000037323 Rare tumor Diseases 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 101150068690 eml4 gene Proteins 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000002133 sample digestion Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种超低频突变核酸片段检测方法、突变核酸片段文库构建方法、引物设计方法和试剂。首先对待检样本的片段化核酸进行末端修复补平加A;进行分子标签接头连接;采用分子标签引物与单分子特异性引物组合,对连接接头产物进行扩增子法靶向富集;最后进行PCR扩增富集。本发明设计的单分子特异性引物使得可利用的有效模板数明显提高、其带有的调节序列可明显降低特异性引物之间形成引物二聚体的概率,还可明显提高模板利用率。本发明超低频突变核酸片段检测方法,使用单侧单引物扩增子法富集和分子标签技术,提高了有效模板利用率,降低了噪音源,降低假阳性,提高了检测的灵敏度和特异性,特别适合痕量超低频突变样本检测。同时本发明还能进行高效文库构建。
Description
技术领域
本发明属于分子生物学检测技术领域,具体涉及一种超低频突变核酸片段检测方法、突变核酸片段文库构建方法、引物设计方法和试剂。
背景技术
以第二代测序技术(Next Generation Sequencing)为手段检测体细胞突变在肿瘤研究和肿瘤诊断中起到重要作用。而应用到肿瘤罕见突变基因检测、肿瘤突变耐药鉴定、治疗应答效果评估等方面,需要检测到突变频率在0.1%或者更低。由于标准的建库流程采用DNA聚合酶方法引入背景噪音,超低频突变信号会被背景噪音掩盖而难以区分。而主要的噪音源可细分为三部分:第一部分来自于靶向捕获技术;第二部分是在文库扩增富集时由PCR聚合酶产生;最后就是测序仪本身的测序错误;针对前两种噪音源,目前主要是靶向富集技术降噪。现在流行的靶向富集技术主要有两种:一种是扩增子,一种是杂交捕获;杂交捕获存在两个明显的弊端,1)实验操作繁琐,流程比较长,2)探针杂交过程会对DNA造成损伤,导致碱基突变,噪音升高。而扩增子技术无杂交过程,不会产生额外的噪音,操作简单,流程便捷。
传统的扩增子富集技术是基于双侧富集,存在cfDNA模板丢失问题,痕量的ctDNA趁机溜走。而单侧富集技术能有效的解决上述问题,目前主要的单侧富集技术有两种,一种为单侧富集-链成环(背靠背引物)模式;一种单侧富集-巢式PCR引物(巢式PCR引物)模式;而单测富集-链成环模式无单分子标签技术降噪,单测富集-巢式PCR引物模式采用双引物导致引物3’端与待检位点必须保留一定距离,进而也会存在少量模板丢失,因此均严重影响检测限。而本发明中首次采用了单侧富集-单分子特异性引物(单引物)模式进行扩增子富集技术(如图1所述);扩大引物的适用范围、增加有效模板使用量,特别是大大提高检测低频突变样本的检测限。其次,本发明中单分子特异性引物由特异性序列、调节序列和测序序列组成,特异性序列和调节序列的组合可有效提供多重PCR的特异性和引物利用率。再次,本发明提供的YEA和YLA反应液,优化了建库流程,实现了扩增子富集之前无需进行预扩增(PCR-Free技术),降低了因PCR扩增引入错误概率。最后,本发明中提供带单分子标签接头技术,可进一步纠正建库和测序引物的错误。
发明内容
本发明的首要目的是提供一种超低频基因突变检测用单分子特异性引物设计方法。申请人经过前期大量探索和验证总结出该方法,利用该方法设计合成的单分子特异性引物可有效提高多重PCR的特异性和模板利用率。
所述的超低频突变核酸片段检测用单分子特异性引物设计方法,包括两种方式:只含有靶向序列和测序引物序列,所述的靶向序列为与待测突变区域上游或者下游特异性互补的序列,进而得到上游单分子特异性引物或者下游单分子特异性引物。或者除了靶向序列和测序引物序列,还包括调节序列,调节序列使靶向序列分成靶向上游序列和靶向下游序列两部分。优选含有调节序列的设计方式。
靶向序列在单分子特异性引物的3’端,测序引物序列在单分子特异性引物的5’端。
进一步的,上述设计方法中,所述的靶向序列要满足的条件具体包括:
1)靶向序列长度为20-100碱基对;
2)靶向序列的退火温度为50-80℃;
3)靶向序列的3’端碱基为C或G。
进一步的,上述设计方法中,所述的调节序列要满足的条件具体包括:
1)调节序列由4-30碱基对组成;
2)调节序列的碱基由天然碱基,或非天然碱基,或天然碱基与非天然碱基组成;
3)调节序列的3’端与靶向下游序列的3’端的距离为10-30碱基对。
所述的调节序列可明显降低特异性引物之间形成引物二聚体的概率,可明显提高引物利用率。
进一步的,上述设计方法中需要满足:所述的单分子特异性引物的3’端距离待测突变位点或区域1-30个碱基对。
本发明的第二个目的是提供一种超低频突变核酸片段检测方法,以解决现有检测技术捕获DNA片段特异性低、检测超低频基因准确性低的技术问题。
所述的超低频突变核酸片段检测方法,包括以下步骤:
(1)由上述的方法设计得到上游单分子特异性引物和下游单分子特异性引物;
(2)对待检DNA样本的片段化核酸进行末端修复补平加A;
(3)对末端修复补平加A的片段化核酸进行分子标签接头连接;
(4)采用分子标签引物分别与上游单分子特异性引物和下游单分子特异性引物组合,对连接接头产物进行扩增子法靶向富集;所述的上游单分子特异性引物为单条引物,或者是根据两个以上突变区域上游设计的引物集,所述的下游单分子特异性引物为单条引物,或者是根据两个以上突变区域下游设计的引物集;
(5)对扩增子法靶向富集产物进行PCR富集;对PCR富集产物检测。
进一步的,所述的超低频突变核酸片段检测方法,步骤(3)所述的分子标签接头为完全或部分互补的双链;分子标签接头包括分子标签序列和测序引物序列;分子标签序列由8-12个随机核苷酸组成。
进一步的,所述的超低频突变核酸片段检测方法,还包括以下任意一种或几种处理方式:
A,步骤(2)和(3)两步反应合并成一步反应同时进行;即对片段化核酸进行末端修复补平加A和分子标签接头连接的操作在同一反应体系中完成;
B,在步骤(3)后,对链接接头后的反应产物进行纯化,除去过量的接头;
C,在步骤(4)后,对上游单分子特异性引物富集产物和下游单分子特异性引物富集产物进行纯化,以除去过量的上游单分子特异性引物、下游单分子特异性引物和分子标签引物。
进一步的,所述的超低频突变核酸片段检测方法,还包括以下任意一种或几种的处理方式:
a,对纯化后的链接了接头的反应产物进行预扩增,然后进行扩增子法靶向富集;
b,步骤4)和5)两步富集合并成一步PCR反应富集。
进一步的,所述的预扩增包括:先采用分子标签引物与通用引物组合进行预扩增,然后采用单分子特异性引物与通用引物组合进行扩增子法靶向富集,或者先采用通用引物组合进行预扩增,然后采用单分子特异性引物与分子标签引物组合进行扩增子法靶向富集。
进一步的,所述的超低频突变核酸片段检测方法,所述的超低频突变包括点突变、缺失插入、基因扩增、基因甲基化,基因融合中的一种或多种。
进一步的,检测融合基因时,采用分子标签引物与上游单分子特异性引物或下游单分子特异性引物组合,进行扩增子法靶向富集和PCR反应富集。
进一步的,当确定基因融合发生在已知区域内,需要检测基因融合在该区域内的具体位点时,在该区域依次间隔30-50bp设计引物集,进行扩增子法靶向富集和PCR反应富集。
进一步的,所述的超低频突变核酸片段检测方法,核酸片段包括DNA或RNA,可以是完整或碎片化形式。
进一步的,完整的DNA或RNA末端修复补平前均需片段化处理。RNA需要转换成cDNA处理。
进一步的,核酸片段来源包括动物、植物或微生物。
进一步的,核酸来源包括血浆、尿液、汗液、唾液、精液、胸水、腹水、粪便、化石、石蜡包埋(FFPE)或刑侦样本。
本发明的第三个目的是提供一种超低频突变核酸片段文库构建方法,以解决现有检测技术捕获DNA片段特异性低、建库过程中引入错误突变、检测超低频基因准确性低的技术问题。
所述的超低频突变核酸片段文库构建方法,其流程与本发明所述的超低频突变核酸片段检测方法的步骤基本一致,区别在于仅在于将上述检测方法中最后步骤5)获得的PCR扩增产物进行文库构建。
本发明的第四个目的是提供与本发明超低频突变核酸片段检测方法配套的试剂盒。该试剂盒包括:对片段化核酸进行末端修复补平加A的试剂、对核酸进行分子标签接头连接的反应试剂、设计得到的超低频基因突变检测用单分子特异性引物。
本发明第五个目的是提供超低频突变核酸片段文库构建方法配套的试剂盒。该试剂盒包括:对片段化核酸进行末端修复补平加A的试剂、对核酸进行分子标签接头连接的反应试剂、设计得到的超低频基因突变检测用单分子特异性引物。
进一步的,所述的对核酸进行分子标签接头连接的反应试剂中含有分子标签接头,所述的分子标签接头包括单链接头、鼓泡状双链接头、‘Y’型接头或非正规的Y’型接头。
进一步的,所述的超低频突变核酸片段文库构建方法配套的试剂盒,还包括三条通用引物,即一条分子标签引物和二条测序通用引物;所述的分子标签引物是用于区分不同样本。
本发明的第六个目的是提供一种对片段化核酸进行末端修复补平加A的试剂,在本发明中称作YEA反应液。本发明提供的YEA反应液,优化了建库流程,实现了扩增子富集之前无需进行预扩增(PCR-Free技术),降低了因PCR扩增引入错误概率。
所述的YEA反应液包括:反应活性剂、反应酶和反应稳定剂;配制1L的YEA反应液,以下每种组分的浓度均是在整个试剂体系中的浓度:
反应活性剂包括:5-500mM pH 8.0的Tris-HCl、50-1000mM NaCl、50-200nMdNTPs、0.5-4mM ATP、1-100mM DTT、50-250mM MgCl2;其中的百分比以无菌水体积为计算基准;
反应酶为具有5’-3’DNA聚合酶活性、5’-3’外切酶活性与3’-5’外切酶活性以及产物3’端加碱基A的功能酶组成的酶混合物;优选包括:1-50U的Taq DNA聚合酶、10-50U的3’-5’exo klenow片段、2-100U的T4DNA聚合酶;
反应稳定剂为稳定酶活性的试剂;优选包括:0.05-1%Tween 20、1-50%甘油、20-100μg/mL BSA,0.02-0.1%Triton X-100,0.1-1%β-巯基乙醇,其中的百分比以无菌水体积为计算基准。
本发明的第七个目的是提供一种对核酸进行分子标签接头连接的反应试剂,在本发明中称作YLA反应液。本发明提供的YLA反应液,优化了建库流程,实现了扩增子富集之前无需进行预扩增(PCR-Free技术),降低了因PCR扩增引入错误概率。
进一步的,所述的YLA反应液包括:连接增强剂、高效连接酶、分子标签接头;配制1L的YLA反应液,以下每种组分的浓度均是在整个试剂体系中的浓度:
连接增强剂包括1-4mM ATP、1-100mM NAD+、1-200mM DTT、0.05-1%Tween 20、5-50%PEG聚合物(包括PEG4000、PEG6000、PEG8000中的一种或几种),其中的百分比以无菌水体积为计算基准;
高效连接酶为催化粘端或平端双链或单链DNA或RNA的5’-P末端和3’-OH末端之间以磷酸二酯键结合的连接酶;高效连接酶由一种或多种连接酶组成;
优选高效连接酶包括:500-2000U T4-DNA连接酶、50-500U Taq DNA连接酶和1-500U E·coli DNA连接酶;
所述的分子标签接头为完全或部分互补的双链;分子标签接头包括分子标签序列和测序引物序列。
图2为本发明突变位点检测原理。其中,表示待检测点突变、插入、缺失、甲基化等;d为单分子特异性引物,既可以位于待检测位点的上游也可以带测位点的下游;P5、P7和分子标签引物为通用引物;C为分子标签接头,包括测序序列和分子标签序列,分子标签序列由8-12随机碱基组成。
图3为本发明的建库流程的几种变形,具体包括如下几种形式:
1号流程包括:预文库扩增+单侧单引物PCR扩增富集+通用PCR扩增富集;
2号流程包括:单侧单引物PCR扩增富集+通用PCR扩增富集,但之前扩增富集之前无需预文库扩增;
3号流程包括:预文库扩增+单侧单引物PCR扩增富集与通用PCR扩增富集两步合并的一步PCR;
4号流程包括:单侧单引物PCR扩增富集与通用PCR扩增富集两步合并的一步PCR,但之前扩增富集之前无需预文库扩增。
其中4号流程为本发明的经典建库流程。
本发明设计的单分子特异性引物使得可利用的有效模板数明显提高、其带有的调节序列可明显降低特异性引物之间形成引物二聚体的概率,还可明显提高模板利用率。
本发明使用带分子标签的接头可纠错检测流程引入的噪音。
本发明超低频突变核酸片段检测方法,使用单侧单引物扩增子法富集和分子标签技术,提高了有效模板利用率,降低了噪音源,降低假阳性,提高了检测的灵敏度和特异性,特别适合痕量超低频突变样本检测。
本发明超低频突变核酸片段文库构建方法,除了具有上述检测方法的优势外,还能避免在建库过程中引入错误突变。
本发明的优势还在于:
1、实现了一步法文库构建,减低了模板损失、减少了操作步骤,降低了检测成本,缩短了检测周期;
2、既可适用于以DNA为模板检测,也适用于以RNA为模板检测。
本发明的高通量文库构建方法,可以用于Roche、Illumina、ThermoFisher、Pacific Biosciences、华大基因、Oxford Nanopore Technologies、华因康、瀚海基因等高通量测序平台。
附图说明
图1为本发明扩增子富集捕获原理与现有技术中其他富集捕获方法原理的比较。
图2为本发明突变位点检测原理。
图3为本发明的建库流程的几种变形;
1号流程包括:预文库扩增+单侧单引物PCR扩增富集+通用PCR扩增富集;
2号流程包括:单侧单引物PCR扩增富集+通用PCR扩增富集,但之前扩增富集之前无需预文库扩增;
3号流程包括:预文库扩增+单侧单引物PCR扩增富集与通用PCR扩增富集两步合并的一步PCR;
4号流程包括:单侧单引物PCR扩增富集与通用PCR扩增富集两步合并的一步PCR,但之前扩增富集之前无需预文库扩增。
图4为实施例1的文库电泳检测分析结果。
注:M:100bp DNA ladder(宝生物工程(大连)有限公司);
1:1号样本PCR反应管1的文库
2:1号样本PCR反应管2的文库
3:2号样本PCR反应管1的文库
4:2号样本PCR反应管2的文库。
图5为实施例2的文库电泳检测分析结果;
注:M:100bp DNA ladder(宝生物工程(大连)有限公司);
1:超低频突变DNA片段文库构建方法的文库。
图6为实施例3的文库电泳检测分析结果;
注:M:100bp DNA ladder(宝生物工程(大连)有限公司);
1:1号样本PCR反应管1的文库
2:1号样本PCR反应管2的文库
3:2号样本PCR反应管1的文库
4:2号样本PCR反应管2的文库
5:3号样本PCR反应管1的文库
6:3号样本PCR反应管2的文库。
图7为实施例4的文库电泳检测分析结果;
注:M:100bp DNA ladder(宝生物工程(大连)有限公司);
1:RNA文库构建方法的文库。
图8为实施例5的文库电泳检测分析结果;
注:M:100bp DNA ladder(宝生物工程(大连)有限公司);
1:total RNA一步法文库构建的文库。
图9为EML4-ALK基因融合检测原理图;
图10为实施例6的文库电泳检测分析结果;
注:M:100bp DNA ladder(宝生物工程(大连)有限公司);
1:FP001号样本PCR反应管1的文库
2:FP001号样本PCR反应管2的文库
3:FP002号样本PCR反应管1的文库
4:FP002号样本PCR反应管2的文库
5:FP003号样本PCR反应管1的文库
6:FP003号样本PCR反应管2的文库。
具体实施方式
以Illumina平台为例,结合实施例对本发明进一步说明,而非形成对本发明的限制。
实施例1微量碎片化DNA EGFR基因突变检测
1.1接头设计
Top-Adaptor:
5’-P-ACGTCACGCAGGGGAGAGCCAGGGATGACTAGG-3',见SEQ ID NO.1。
P表示磷酸化修饰。
Bottom-Adapter:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNCCCTGCGTGACGT*Y-3’,见SEQID NO.2。*代表硫代修饰,Y代表简并碱基A或T,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。
以上序列需退火成双链。
EGFR基因:(下面的EXON18、EXON19、EXON20、EXON21是EGFR基因的4个外显子上游内含子部分序列、外显子序列、下游部分内含子序列)
EXON18
CAAGTGCCGTGTCCTGGCACCCAAGCCCATGCCGTGGCTGCTGGTCCCCCTGCTGGGCCATGTCTGGCACTGCTTTCCAGCATGGTGAGGGCTGAGGTGACCCTTGTCTCTGTGTTCTTGTCCCCCCCAGCTTGTGGAGCCTCTTACACCCAGTGGAGAAGCTCCCAACCAAGCTCTCTTGAGGATCTTGAAGGAAACTGAATTCAAAAAGATCAAAGTGCTG[GG]CTCCGGTGCGTTCGGCACGGTGTATAAGGTAAGGTCCCTGGCACAGGCCTCTGGGCTGGGCCGCAGGGCCTCTCATGGTCTGGTGGGGAGCCCAGAGTCCTTGCAAGCTGTATATTTCCATCATCTACTTTACTCTTTGTTTCACTGAGTGTTTGG,见SEQ ID NO.3。
[]表示检测关注的突变位点
即EGFR基因表达的第719位的氨基酸G突变成S或C,碱基G突变成A或T;第719位的氨基酸G突变成A,碱基G突变成C。
上游单分子特异性引物
EGFR-E18
U:5’-AGATGTGTATAAGAGACAGGCTCCCAACCAAGCTCTCTTGAGGATCTTG-3’,见SEQ IDNO.4。
下游单分子特异性引物
D:5’-AGATGTGTATAAGAGACAGGGACCTTACCTTATACACCGTGCCGAACGC-3’,见SEQ IDNO.5。
EXON19
GCAATATCAGCCTTAGGTGCGGCTCCACAGCCCCAGTGTCCCTCACCTTCGGGGTGCATCGCTGGTAACATCCACCCAGATCACTGGGCAGCATGTGGCACCATCTCACAATTGCCAGTTAACGTCTTCCTTCTCTCTCTGTCATAGGGACTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAA[G][G]AAT[T]AAGAGAAGCAACATCTCCGAAAGCCAACAAGGAAATCCTCGATGTGAGTTTCTGCTTTGCTGTGTGGGGGTCCATGGCTCTGAACCTCAGGCCCACCTTTTCTCATGTCTGGCAGCTGCTCTGCTCTAGACCCTGCTCATCTCCACATCCTAAATGTTCACTTTCTATG,见SEQ ID NO.6。
[]表示检测关注的突变位点
即EGFR基因中从第2235-2249位碱基缺失(关注的第一个碱基G开始缺失),2236-2250位碱基缺失(关注的第二个碱基G开始缺失),2240-2257为碱基缺失(关注的第三个碱基T开始缺失)。
上游单分子特异性引物
EGFR-E19
U:5’-AGATGTGTATAAGAGACAGCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATC-3’,见SEQID NO.7;下游单分子特异性引物
D:5’-AGATGTGTATAAGAGACAGCCACACAGCAAAGCAGAAACTCACATCGAGG-3’,见SEQ IDNO.8。
EXON20
CCATGAGTACGTATTTTGAAACTCAAGATCGCATTCATGCGTCTTCACCTGGAAGGGGTCCATGTGCCCCTCCTTCTGGCCACCATGCGAAGCCACACTGACGTGCCTCTCCCTCCCTCCAGGAAGCCTACGTGATGGCCA[G]CGT[GG]A[CA]ACCCCCAC[GT]GTGCCGCCTGCTGGGCATCTGCCTCACCTCCACCGTGCAGCTCATCA[C]GCAGCTC[AT]GCCCTTCGGCTGCCTCCTGGACTATGTCCGGGAACACAAAGACAATATTGGCTCCCAGTACCTGCTCAACTGGTGTGTGCAGATCGCAAAGGTAATCAGGGAAGGGAGATACGGGGAGGGGAGATAAGGAGCCAGGATCCTCACATGCGGTCTGCGCTCCTGGGATAGCAAGAGTTTGCCATGGGGATATG,见SEQ ID NO,9。
[]表示检测关注的突变位点
即EGFR基因表达的第768位氨基酸S突变为I,碱基G突变成T;
EGFR基因表达的第769位氨基酸V和第770位氨基酸D之间插入三个氨基酸ASV;第2307-2308位碱基之间插入GCCAGCGTG;
EGFR基因表达的第770位氨基酸D和第771位氨基酸N之间插入氨基酸G;第2310-2311位碱基之间插入GGT;
EGFR基因表达的第773位氨基酸H和第774位氨基酸V之间插入氨基酸H;第2319-2320位碱基之间插入CAC;
EGFR基因表达的第790位氨基酸T突变为M,碱基C突变为T。
单分子特异性上游引物
EGFR-E20U-1:5’-AGATGTGTATAAGAGACAGACCATGCGAAGCCACACTGACGTGCCTCTC-3’,见SEQ ID NO.10。
EGFR-E20U-2:5’-AGATGTGTATAAGAGACAGGCATCTGCCTCACCTCCACCGTGCAGCTC-3’,见SEQ ID NO.11。
单分子特异性下游引物
EGFR-E20D-1:5’-AGATGTGTATAAGAGACAGATTGTCTTTGTGTTCCCGGACATAGTCCAGG-3’,见SEQ ID NO.12。
EGFR-E20D-2:5’-AGATGTGTATAAGAGACAGATGAGCTGCGTGATGAGCTGCACGGTGGAG-3’,见SEQ ID NO.13。
EXON21
TCTGTTTCAGGGCATGAACTACTTGGAGGACCGTCGCTTGGTGCACCGCGACCTGGCAGCCAGGAACGTACTGGTGAAAACACCGCAGCATGTCAAGATCACAGATTTTGGGC[T]GGCCAAAC[T]GCTGGGTGCGGAAGAGAAAGAATACCATGCAGAAGGAGGCAAAGTAAGGAGGTGGCTTTAGGTCAGCCAGCATTTTCCTGACACCAGGGACCAGGCTGCCTTCCCACTAGCTGTAT,见SEQ ID NO.14。
[]表示检测关注的突变位点
即EGFR基因表达的第858位氨基酸L突变成R,碱基T突变为G;第861位氨基酸L突变成Q,碱基T突变为A。
EGFR-E21U:5’-AGATGTGTATAAGAGACAGGGAACGTACTGGTGAAAACACCGCAGCATGTC-3’,见SEQ ID NO.15。
EGFR-E21D:5’-AGATGTGTATAAGAGACAGGCCTCCTTCTGCATGGTATTCTTTCTCTTCCG-3’,见SEQ ID NO.16。
预扩增用通用引物(Pre-lib-primer):
5'-CCTAGTCATCCCTGGCTCTC-3’,见SEQ ID NO.17。
分子标签引物(TS-Index primer):
5'-CAAGCAGAAGACGGCATACGAGAT[Index-7]GTGACTGGAGTTCAGACGTGT-3',见SEQ IDNO.18。
[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。
通用PCR富集引物
P7引物序列为:
5’-CAAGCAGAAGACGGCATACGAGAT-3’,见SEQ ID NO.19,
TN5-UNI-BLK序列为:
5'-AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAG-3',见SEQ ID NO.20。
1.2实验步骤
取2例样本(一例正常人和一例已知突变位点和频率的阳性样本)分别获得4ml血浆,将4ml血浆等体积分成两组,一组用本发明的检测方法进行建库检测,称为实验组;一组采用EGFR/ALK/BRAF/KRAS基因突变联合检测试剂盒(cat.广州燃石生物科技有限公司)使用说明书进行建库检测,样本编号为DD01、DD02。
1.2.1 ctDNA的提取
取1例2ml正常人血浆和1例2ml已知突变频率为0.01%T790M突变的阳性患者血浆样本,分别命名为CT01、CT02;按照MagMAXTMCell Free DNA Isolation Kit(ThermoFisherCat.A29319)说明书操作,提取游离DNA,包括以下步骤:
a)样本裂解
b)磁珠结合
c)磁珠洗涤
d)洗脱
e)定量
1.2.2微量碎片化DNA末端修复补平添加碱基A(本发明称作YEA反应)
使用本发明的YEA反应液(10mM Tris-HCl(pH 8.0)、50mM NaCl、50nM dNTPs、0.5mM ATP、0.05%Tween 20、20mM DTT、10U klenow片段(3’-5’exo)、20UT4DNAPolymerase、5%甘油、20μg/mL BSA,0.02%Triton X-100,0.1%β-巯基乙醇,50mM氯化镁和40U Taq DNA聚合酶),对回收的片段化DNA进行末端修复加A。按照下表配置反应体系,
组分 | 用量 |
YEA反应液 | 10μL |
游离DNA(0.05ng/μL) | 10μL |
双蒸水 | 补足至50μL |
Total体积 | 50μL |
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
37℃15min
72℃30min
4℃forever。
1.2.3接头连接(本发明称作YLA反应)
将YEA反应产物从热循环仪上取下置于室温冷却,将YLA反应液(1mM ATP、20mMNAD+、5mM DTT、0.05%Tween 20、5%PEG-6000、2000U T4-DNA连接酶)按照下表配置反应体系:
组分 | 用量 |
YLA反应液 | 46μL |
YEA反应产物 | 50μL |
接头(5μM) | 4μL |
Total体积 | 100μL |
涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
20℃15min
65℃10min。
1.2.4纯化
将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,25μL ElutionBuffer洗脱。
1.2.5预扩增
将1.2.4纯化产物按照下表配制PCR反应体系:
组份 | 用量 |
2x KAPA HiFiHostart buffer | 25μL |
Pre-lib-primer(15μM) | 1μL |
Ts-index primer(15μM) | 1μL |
纯化产物(0.02ng/μL) | 23μL |
按照下表,执行PCR扩增程序:
1.2.6预扩增产物纯化
使用60μLAmpure XP beads进行纯化,纯化产物50μL Elution Buffer洗脱。
1.2.7扩增子靶向富集
将所有EGFR上游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM;将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM;获得上游单分子特异性引物集(U)和下游单分子特异性引物集(D)分成两管进行扩增子富集。分别命名PCR反应管1和PCR反应管2;分别按照下表配置PCR反应体系:
PCR反应管1(U)
组分 | 用量 |
Gold 360 master Mix(2x) | 25μL |
预扩增反应产物 | 23μL |
上游单分子特异性引物集(U) | 0.2μL |
P7引物(10μM) | 1μL |
PCR反应管2(D)
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
按照下表,执行PCR扩增程序:
1.2.8纯化
将反应管1和反应管2从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。
1.2.9 PCR扩增富集
将反应管1和反应管2纯化产物分别按照下表配制PCR反应体系:
组份 | 用量 |
2x KAPA HiFiHostart buffer | 25μL |
TN5-UNI-BLK(15μM) | 1μL |
P7引物(15μM) | 1μL |
反应管1或2纯化产物 | 23μL |
按照下表,执行PCR扩增程序:
1.2.10 PCR产物纯化
使用60μLAmpure XP beads进行纯化,30μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。
1.2.11 qPCR质检及上机测序
按照KAPA Library Quantifcation Kit(Kapabiosystems,Cat No.KK4854)说明书进行操作,使用Roche Light Cycler 480实时荧光定量PCR仪检测,参照试剂盒里的标准品进行文库浓度的绝对定量。
1.2.12上机测序
按照MiSeq测序仪操作流程进行文库变性、稀释以及150bp双端测序。
1.3实验结果
1.3.1文库电泳检测分析结果
根据电泳分析结果(图4),文库主带清楚且主要分布在300bp左右,条带亮度明亮,与预期结果一致。
1.3.2qPCR定量分析结果
qPCR检测结果如下:
样品 | qPCR浓度(nM) |
1号样本反应管1文库 | 113.6 |
1号样本反应管2文库 | 109.8 |
2号样本反应管1文库 | 168.5 |
2号样本反应管2文库 | 177.5 |
建库文库达到上机要求浓度,可用于上机测试。
1.3.3上机质控数据
将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性。
分析结果如下:
1.3.4检测突变结果
将质控mapped比后的数据进行突变点分析,检测结果如下表:
实施例2BRAF基因靶向测序
2.1接头设计
Top-Adaptor:
5’P-ACGTCACGCAGGGNNNNNNNNAGATGTGTATAAGAGACAG-3’,见SEQ ID NO.21,
P表示磷酸化修饰。
Bottom-Adapter:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNCCCTGCGTGACGTT-3’,见SEQID NO.22。以上序列需退火成双链,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。
BRAF 11号外显子序列如下:
AAAACACTTGGTAGACGGGACTCGAGTGATGATTGGGAGATTCCTGATGGGCAGATTACAGTGGGACAAAGAATTG[G]ATCTGGATCATTT[GGA]ACAGTCT[A]CAAGGGAAAGTGGCATG,见SEQ ID NO.23,
BRAF 11号外显子及其上下游内含子序列如下:
CCTGTATCCCTCTCAGGCATAAGGTAATGTACTTAGGGTGAAACATAAGGTTTTCTTTTTCTGTTTGGCTTGACTTGACTTTTTTACTGTTTTTATCAAGAAAACACTTGGTAGACGGGACTCGAGTGATGATTGGGAGATTCCTGATGGGCAGATTACAGTGGGACAAAGAATTG[G]ATCTGGATCATTT[GGA]ACAGTCT[A]CAAGGGAAAGTGGCATGGTAAGTATGTAATGTGGTGACATTGTGACAAGTCATAATAGGATATGTTTAACAACTTTTATTTTGTAAAAAATATCATCAAAGGAAATATTCACTGTTC,见SEQ ID NO.24。
[]表示检测关注的突变位点
BRAF基因表达的第466位氨基酸G突变成V,第1397位碱基G突变成T;
BRAF基因表达的第469位氨基酸G突变成A,第1406位碱基G突变成C;
BRAF基因表达的第469位氨基酸G突变成L,第1405-1406位碱基GG替换为TT;
BRAF基因表达的第472位氨基酸Y突变成C,第1415位碱基A突变成G。
上游单分子特异性引物:
BRAF-E11
U:
5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTGGAGATTCCTGATGGGCIIIIIIIIAGATTACAGTGGGACAAAG-3’,见SEQ ID NO.25,
下游单分子特异性引物:
D:
5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCACATTACATACTTAIIIIIIIICCATGCCACTTTCCC-3’,见SEQ ID NO.26,
其中I为非天然产物碱基,为次黄嘌呤碱基,用于调节减少引物之间形成dimer。
BRAF 15号外显子序列:
ATATATTTCTTCATGAAGACCTCACAGTAAAAATAGGTGATTTTGGT[C]TAGCTACA
G[T]GAAATCTCGATGGAGTGGGTCCCATCAGTTTGAACAGTTGTCTGGATCCATTTT
GTGGATG,见SEQ ID NO.27,
BRAF 15号外显子及其上下游内含子序列如下:
ACAGAATTATAGAAATTAGATCTCTTACCTAAACTCTTCATAATGCTTGCTCTGATAG
GAAAATGAGATCTACTGTTTTCCTTTACTTACTACACCTCAGATATATTTCTTCATGA
AGACCTCACAGTAAAAATAGGTGATTTTGGT[C]TAGCTACAG[T]GAAATCTCGATGGA
GTGGGTCCCATCAGTTTGAACAGTTGTCTGGATCCATTTTGTGGATGGTAAGAATTG
AGGCTATTTTTCCACTGATTAAATTTTTGGCCCTGAGATGCTGCTGAGTTACTAGAA
AGTCATTGAAGGTCTCAACTATAGTATTTTCAT,见SEQ ID NO.28。
[]表示检测关注的突变位点
BRAF基因表达的第597位氨基酸L突变为V,第1789位碱基C突变成G;
BRAF基因表达的第600位氨基酸V突变为E,第1799位碱基T突变成A。
上游单分子特异性引物:
BRAF-E15
U:
5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTCTTCATGAAGACCTCACAGTAAIIIIIIIIAAATAGGTGATTTTGG-3’,见SEQ ID NO.29,
下游单分子特异性引物:
D:
5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTTCCAGACAACTGTTCAIIIIIIIIAACTGATGGGACCCACTCCATCAG-3’,见SEQ ID NO.30,
其中I为非天然产物碱基,为次黄嘌呤碱基,用于调节减少引物之间形成dimer。
通用引物序列如下:
P5引物:
5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGA-3’,见SEQ ID NO.31,
分子标签引物:
5’-CGGCATACGAGAT-[Index-7]-GTGACTGGAGTTC-3’,见SEQ ID NO.32。
[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。
P7引物:
5’-CAAGCAGAAGACGGCATACGAGAT-3’,见SEQ ID NO.19。
2.2实验步骤
2.2.1核酸提取
取200μL正常人全血样本,按照全血基因组DNA提供试剂盒说明书操作,提取基因组DNA,包括以下步骤:
a)样本裂解
b)磁珠结合
c)磁珠洗涤
d)洗脱
2.2.2核酸片段化处理
采用超声或酶切方法对基因组DNA进行片段化处理。按照片段大小回收需求片段化DNA。
2.2.3末端修复补平添加碱基A(本发明称作YEA反应)
使用本发明的YEA反应液(同实施例1),对回收的片段化DNA进行末端修复加A。按照下表配置反应体系,
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
37℃15min
72℃30min
4℃forever。
2.2.3接头连接(本发明称作YLA反应)
YLA反应液体系见实施例1部分,将YEA反应产物从热循环仪上取下置于室温冷却,按照下表配置反应体系:
组分 | 用量 |
YLA反应液 | 46μL |
YEA反应产物 | 50μL |
接头(5uM) | 4μL |
Total体积 | 100μL |
涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
20℃15min
65℃10min。
2.2.4纯化
将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,50μL ElutionBuffer洗脱
2.2.5单侧单引物扩增子富集
将所有上游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM;将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM;获得上游单分子特异性引物集(U)和下游单分子特异性引物集(D)分成两管进行扩增子富集。分别命名PCR反应管1和PCR反应管2;分别按照下表配置PCR反应体系:
PCR反应管1(U)
组分 | 用量 |
Gold 360 master Mix(2x) | 25μL |
YLA反应产物 | 23μL |
上游单分子特异性引物集(U) | 1μL |
分子标签引物(10uM) | 1μL |
PCR反应管2(D)
组分 | 用量 |
Gold 360 master Mix(2x) | 25μL |
YLA反应产物 | 23μL |
下游单分子特异性引物集(D) | 1μL |
分子标签引物(10uM) | 1μL |
涡旋振荡混匀,瞬时离心,,置于热循环仪上按照下列程序进行孵育:
按照下表,执行PCR扩增程序:
2.2.6纯化
将反应管1和反应管2从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μL Elution Buffer洗脱。
2.2.7PCR扩增富集
将反应管1和反应管2纯化产物按照等体积合并混匀,按照下表配制PCR反应体系:
组份 | 用量 |
2x KAPA HiFiHostart buffer | 25μL |
P5引物(20uM) | 1μL |
P7引物(20uM) | 1μL |
纯化产物 | 23μL |
按照下表,执行PCR扩增程序:
2.2.8 PCR产物纯化
使用60μLAmpure XP beads进行纯化,30μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。
2.2.9 qPCR质检
按照KAPA Library Quantifcation Kit(Kapabiosystems,Cat No.KK4854)说明书进行操作,使用Roche Light Cycler 480实时荧光定量PCR仪检测,参照试剂盒里的标准品进行文库浓度的绝对定量。
2.2.10上机测序
按照MiSeq测序仪操作流程进行文库变性、稀释以及150bp双端测序。
2.3实验结果:
2.3.1文库电泳检测分析结果
根据电泳分析结果(图5),文库主带清楚且主要分布在300bp左右,条带亮度明亮,与预期结果一致。
2.3.2qPCR定量分析结果
qPCR检测结果如下:
样品 | 1 |
qPCR浓度(nM) | 108.04 |
建库文库达到上机要求浓度,可用于上机测试。
2.3.3上机质控数据
将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果如下:
实施例3超低起始量cf-DNA基因检测一步法文库构建
3.1接头引物设计
3.1.1接头设计
Top-Adaptor:
5’-P-ACGTCACGCAGGGNNNNNNNNAGATGTGTATAAGAGACAG-3’,见SEQ ID NO.33,
P代表磷酸化修饰。
Bottom-Adapter:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNCCCTGCGTGACGT*Y-3’,见SEQID NO.34,*Y代表硫代修饰的简并碱基A或T,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。
以上序列需退火成双链。
针对KRAS基因2号外显子G12R位点设计
KRAS 2号外显子序列如下:
ATGACTGAATATAAACTTGTGGTAGTTGGAGCT[GG]T[GG]CGTAGGCAAGAGTGCCTTGACGATACAGCTAATTCAGAATCATTTTGTGGACGAATATGATCCAACAATAGAG,见SEQ ID NO.35,
KRAS 2号外显子及上下游内含子序列如下:
AATTTTGTAAGGTATTTTGAAATAATTTTTCATATAAAGGTGAGTTTGTATTAAAAGGTACTGGTGGAGTATTTGATAGTGTATTAACCTTATGTGTGACATGTTCTAATATAGTCACATTTTCATTATTTTTATTATAAGGCCTGCTGAAAATGACTGAATATAAACTTGTGGTAGTTGGAGCT[GG]T[GG]CGTAGGCAAGAGTGCCTTGACGATACAGCTAATTCAGAATCATTTTGTGGACGAATATGATCCAACAATAGAGGTAAATCTTGTTTTAATATGCATATTACTGGTGCAGGACCATTCTTTGATACAGATAAAGGTTTCTCTGACCATTTTCATGAGTACTTATTACAAGATAATTATGCTGAAAGTTAAGTTA,见SEQ ID NO.36。
[]表示检测关注的突变位点
KRAS基因表达的第12位氨基酸G突变成C,第34位碱基G突变成T;
KRAS基因表达的第12位氨基酸G突变成R,第34位碱基G突变成C;
KRAS基因表达的第12位氨基酸G突变成S,第34位碱基G突变成A;
KRAS基因表达的第12位氨基酸G突变成A,第35位碱基G突变成C;
KRAS基因表达的第12位氨基酸G突变成D,第35位碱基G突变成A;
KRAS基因表达的第12位氨基酸G突变成V,第35位碱基G突变成T;
KRAS基因表达的第13位氨基酸G突变成C,第37位碱基G突变成T;
KRAS基因表达的第13位氨基酸G突变成R,第37位碱基G突变成C;
KRAS基因表达的第13位氨基酸G突变成S,第37位碱基G突变成A;
KRAS基因表达的第13位氨基酸G突变成D,第38位碱基G突变成A;
KRAS基因表达的第13位氨基酸G突变成A,第38位碱基G突变成C。
上游单分子特异性引物:
KRAS-E2
U:5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTGACTGAATATAAACGGTAGTTGGGC-3’见SEQ ID NO.37,
下游单分子特异性引物:
D:5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCACAAAATGATTCTGAATTAGCTGTATCGTCAAGGCAC-3’见SEQ ID NO.38,
通用引物序列如下:
分子标签引物:
5’-CGGCATACGAGAT[Index-7]GTGACTGGAGTTC-3’见SEQ ID NO.39,[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。
P5引物:
5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGA-3’见SEQ ID NO.31,
P7引物:
5’-CAAGCAGAAGACGGCATACGAGAT-3’见SEQ ID NO.19。
3.2实验步骤
3.2.1 ct-DNA提取
取3例2ml正常人血浆,分别命名为CF001、CF002、CF003;按照MagMAXTMCell FreeDNA Isolation Kit(ThermoFisher Cat.A29319)说明书操作,提取游离DNA,包括以下步骤:
a)样本裂解
b)磁珠结合
c)磁珠洗涤
d)洗脱
e)定量
3.2.2末端修复补平添加碱基A(本发明称作YEA反应)
使用本发明的YEA反应液(具体参见实施例1相应部分),对回收的片段化DNA进行末端修复加A。按照下表配置反应体系,
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
37℃15min
72℃30min
4℃forever。
3.2.3接头连接(本发明称作YLA反应)(YLA的具体组分和浓度,参见实施例1相关部分)
将YEA反应产物从热循环仪上取下置于室温冷却,按照下表配置反应体系:
组分 | 用量 |
YLA反应液 | 46μL |
YEA反应产物 | 50μL |
接头(5uM) | 4μL |
Total体积 | 100μL |
涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
20℃15min
65℃10min。
3.2.4纯化
将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,50μL ElutionBuffer洗脱。
3.2.5一步法PCR(One-step PCR)靶向富集
将所有上游单分子特异性引物按照等物质的量混匀,使终物质的量为1uM;将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为1uM;获得上游单分子特异性引物集(U)和下游单分子特异性引物集(D)分成两管进行扩增子富集。分别命名PCR反应管1和PCR反应管2;分别按照下表配置PCR反应体系:
PCR反应管1(U)
组分 | 用量 |
Gold 360 master Mix(2x) | 25μL |
YLA反应产物 | 23μL |
上游单分子特异性引物集(U) | 0.2μL |
分子标签引物(10uM) | 0.2μL |
P5引物(20uM) | 1μL |
P7引物(20uM) | 1μL |
PCR反应管2(D)
组分 | 用量 |
Gold 360 master Mix(2x) | 25μL |
YLA反应产物 | 23μL |
下游单分子特异性引物集(D) | 1μL |
分子标签引物(10uM) | 0.2μL |
P5引物(20uM) | 1μL |
P7引物(20uM) | 1μL |
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
按照下表,执行PCR扩增程序:
3.2.6纯化
将反应管1和反应管2从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。
3.3 qPCR质检及上机测序
按照实施例1中方法对文库进行qPCR质控和上机测序。
3.4实验结果
3.4.1文库电泳检测分析结果
根据电泳分析结果(图6),文库主带清楚且主要分布在200bp左右,条带亮度明亮,与预期结果一致。
3.4.2 qPCR文库定量分析结果
qPCR检测结果如下:
建库文库达到上机要求浓度,可用于上机测试。
3.4.3测序数据分析结果
将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果如下:
实施例4 RNA核酸一步法文库构建
以mRNA为检测对象,对ALK基因融合进行RNA文库构建及检测。ALK基因融合断裂点主要是发生在19号intron区域。而基因组DNA转录成mRNA时,会进行剪切编辑,将intron区域剪切掉,因此,设计特异性引物时无需关注断裂点,只需要在ALK基因的20号外显子5’段设计引物,即可完成ALK基因融合检测。
4.1接头引物设计
4.1.1接头设计:
接头序列
Top-Adaptor:
5’-P-NNNNNNNNACGTCACGCAGGGGAGAGCCAGGGATGACTAGG-3'见SEQ ID NO.40,
P表示磷酸化修饰。
Bottom-Adapter:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNNN*Y-3’见SEQ ID NO.41,
*Y代表硫代修饰的简并碱基A或T,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。
以上序列需退火成双链。
ALK-Exon 20
TGTACCGCCGGAAGCACCAGGAGCTGCAAGCCATGCAGATGGAGCTGCAGAGCCCTGAGTACAAGCTGAGCAAGCTCCGCACCTCGACCATCATGACCGACTACAACCCCAACTACTGCTTTGCTGGCAAGACCTCCTCCATCAGTGACCTGAAGGAGGTGCCGCGGAAAAACATCACCCTCATTCG见SEQ ID NO.42。
下游单分子特异性引物:
ALK-Exon 20-1D:AGATGTGTATAAGAGACAGGCTTGCAGCTCCTGGTGCTTCC见SEQ IDNO.43
ALK-Exon 20-2D:AGATGTGTATAAGAGACAGCTCAGGGCTCTGCAGCTCCATCTGC见SEQ IDNO.44
ALK-Exon 20-3D:AGATGTGTATAAGAGACAGCAAGCTCCGCACCTCGACCATCATGACCGAC见SEQ ID NO.45TN5-UNI-BLK序列为:
5'-AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAG-3',见SEQ ID NO.20。分子标签引物(TS-Index序列)为:
5'-CAAGCAGAAGACGGCATACGAGAT[Index-7]GTGACTGGAGTTCAGACGTGT-3'见SEQ IDNO.46,[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。
P7引物:
5’-CAAGCAGAAGACGGCATACGAGAT-3'见SEQ ID NO.19。
4.2实验步骤
4.2.1人源总RNA提取。
按照血液/组织/细胞总RNA提取试剂盒说明书进行总RNA提取。并通过跑胶对RNA完整性进行质控。
4.2.2 cDNA第一链合成
a.按照下表配制反应cDNA第一链合成体系:
b.吹打混匀,瞬时离心,70℃孵育10min,孵育完成迅速转移至冰上。瞬时离心收集管盖液体;
c.按照下表加入下列反应组分:
组分 | 体积 |
5X First-Strand Reaction Buffer | 4μL |
0.1M DTT | 2μL |
10mM dNTP mix | 1μL |
d.吹打混匀,瞬时离心,45℃孵育2min;加入1uL SuperScriptR II RT,轻轻吹打混匀,45℃孵育1h。
4.2.3 cDNA第二链合成及纯化
a.将反应管置于冰上,按照下表依次将下列组分加入第一链合成反应管中:
组分 | 体积 |
DEPC-treated water | 91μL |
5X Second-Strand Reaction Buffer | 30μL |
10mM dNTP mix | 3μL |
E.coli DNA Ligase(10U/μL) | 1μL |
E.coli DNA Polymerase I(10U/μL) | 4μL |
E.coli RNase H(2U/μL) | 1μL |
Total volume | 150μL |
b.轻轻吹打混匀,瞬时离心,置于预冷的热循环仪上按照下列程序进行孵育:16℃孵育2h;关闭热盖。
c.孵育结束后,向反应管中加入2μL T4DNA聚合酶,轻轻吹打混匀,继续置于16℃孵育5min;
d.孵育结束后,将反应管置于冰上,向反应管中加入10μL 0.5M EDTA终止反应;
e.加入160μL苯酚:氯仿:异戊醇(25:24:1)混合液,涡旋剧烈混匀,室温14000g离心5min,反应管液体分层。小心移除140μL上层水相并转移至新的1.5mL离心管中;
f.向新的反应管中加入70μL 7.5M NH4OAc和500μL预冷的100%乙醇,涡旋振荡混匀;立即置于室温、14000g离心20min;
g.小心弃除上清,用500μL预冷的70%乙醇重悬沉淀物,14000g室温离心2min;小心弃除上清;
h.将反应管管盖打开,置于37℃孵育10min,蒸干残留的乙醇,用20μL DEPC水溶解。
4.2.4末端修复补平添加碱基A(本发明称作YEA反应)
使用本发明的YEA反应液(具体组分及浓度参见实施例1部分),对回收的片段化DNA进行末端修复加A。按照下表配置反应体系:
组分 | 用量 |
YEA反应液 | 10μL |
cDNA二链产物 | 1-100ng |
双蒸水 | 补足至50μL |
Total体积 | 50μL |
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
37℃15min
72℃30min
4℃forever。
4.2.5接头连接(本发明称作YLA反应)(YLA反应液参见实施例1)
将YEA反应产物从热循环仪上取下置于室温冷却,按照下表配置反应体系:
组分 | 用量 |
YLA反应液 | 46μL |
YEA反应产物 | 50μL |
接头(5uM) | 4μL |
Total体积 | 100μL |
涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
20℃15min
65℃10min。
4.2.6纯化
将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,50μL ElutionBuffer洗脱。
4.2.7单侧单引物扩增子富集
将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM,获得下游单分子特异性引物集(D);按照下表配置PCR反应体系:
PCR反应管(D)
组分 | 用量 |
Gold 360 master Mix(2x) | 25μL |
YLA反应产物 | 23μL |
下游单分子特异性引物集(D) | 1μL |
分子标签引物(10uM) | 1μL |
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
按照下表,执行PCR扩增程序:
4.2.8纯化
将反应管D从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μLElution Buffer洗脱。
4.2.9 PCR扩增富集
将反应管D按照下表配制PCR反应体系:
组份 | 用量 |
2x KAPA HiFiHostart buffer | 25μL |
TN5-UNI-BLK引物(20uM) | 1μL |
P7引物(20uM) | 1μL |
纯化产物 | 23μL |
按照下表,执行PCR扩增程序:
4.2.10 PCR产物纯化
使用60μLAmpure XP beads进行纯化,30μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。
4.2.11 qPCR质检
按照KAPA Library Quantifcation Kit(Kapabiosystems,Cat No.KK4854)说明书进行操作,使用Roche Light Cycler 480实时荧光定量PCR仪检测,参照试剂盒里的标准品进行文库浓度的绝对定量。
4.2.12上机测序
按照MiSeq测序仪操作流程进行文库变性、稀释以及150bp双端测序。
4.3实验结果:
4.3.1文库电泳检测分析结果
根据电泳分析结果(图7),文库主带清楚且主要分布在500-700bp左右,条带亮度明亮,与预期结果一致。
4.3.2qPCR定量分析结果
qPCR检测结果如下:
样品 | R001 |
qPCR浓度(nM) | 87.5 |
建库文库达到上机要求浓度,可用于上机测试。
4.3.3上机质控数据
将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果见。
实施例5 total RNA一步法文库构建
以除核糖体RNA以外total RNA为检测对象,对ALK基因融合进行RNA文库构建及检测。ALK基因融合断裂点主要是发生在19号intron区域。而基因组DNA转录成mRNA时,会进行剪切编辑,将intron区域剪切掉,因此,设计特异性引物时无需关注断裂点,只需要在ALK基因的20号外显子5’段设计引物,即可完成ALK基因融合检测。
5.1接头引物设计
5.1.1接头序列
接头序列参见实施例4所示;
5.1.2单分子特异性引物序列
特异性引物序列参见实施例4所示。
5.1.3其他引物序列
其他引物序列参见实施例4所示。
5.2实验步骤
5.2.1人源总RNA提取。
按照血液/组织/细胞总RNA提取试剂盒说明书进行总RNA提取。并通过跑胶对RNA完整性进行质控。
5.2.2去除rRNA
a.探针捕获杂交RNA;
b.RNase H酶消化;
c.DNase I消化;
d.纯化磁珠对去核糖体RNA产物进行纯化;
5.2.3 RNA碎片化
a.参照试剂盒说明书配制片段化反应体系,95℃,孵育1-5min;
b.RNA片段化产物纯化。
5.2.4 cDNA第一链合成
按照下表配制反应体系:
组份 | 体积(μL) |
碎片化RNA | 13.5 |
随机引物 | 1 |
轻轻吹打混匀,瞬时离心,将反应管置于热循环仪上,按照65℃,孵育5min,瞬时离心收集管盖液体,
a.按照下表加入下列反应组分:
组分 | 体积(μL) |
5X First-Strand Reaction Buffer | 4 |
0.1M DTT | 2 |
10mM dNTP mix | 1 |
b.吹打混匀,瞬时离心,45℃孵育2min;加入1uL SuperScriptR II RT,轻轻吹打混匀,45℃孵育1h。
5.2.5 cDNA第二链合成及纯化
a.将反应管置于冰上,按照下表依次将下列组分加入第一链合成反应管中:
b.轻轻吹打混匀,瞬时离心,置于预冷的热循环仪上按照下列程序进行孵育:16℃2h;关闭热盖。
c.孵育结束后,向反应管中加入2μL T4DNA聚合酶,轻轻吹打混匀,继续置于16℃孵育5min;
d.孵育结束后,将反应管置于冰上,向反应管中加入10μL 0.5M EDTA终止反应;
e.加入160μL苯酚:氯仿:异戊醇(25:24:1)混合液,涡旋剧烈混匀,室温14000g离心5min,反应管液体分层。小心移除140μL上层水相并转移至新的1.5mL离心管中;
f.向新的反应管中加入70μL 7.5M NH4OAc和500μL预冷的100%乙醇,涡旋振荡混匀;立即置于室温、14000g离心20min;
g.小心弃除上清,用500μL预冷的70%乙醇重悬沉淀物,14000g室温离心2min;小心弃除上清;
h.将反应管管盖打开,置于37℃孵育10min,蒸干残留的乙醇;用20μL DEPC水溶解。
5.2.6末端修复补平添加碱基A(本发明称作YEA反应)(YEA反应液具体组分和浓度参见实施例1)
使用本发明的YEA反应液,对回收的片段化DNA进行末端修复加A。按照下表配置反应体系,
组分 | 用量 |
YEA反应液 | 10μL |
cDNA | 1-100ng |
双蒸水 | 补足至50μL |
Total体积 | 50μL |
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
37℃15min
72℃30min
4℃forever。
5.2.7接头连接(本发明称作YLA反应)(YLA的组分和浓度参见实施例1)
将YEA反应产物从热循环仪上取下置于室温冷却,按照下表配置反应体系:
组分 | 用量 |
YLA反应液 | 46μL |
YEA反应产物 | 50μL |
接头(5uM) | 4μL |
Total体积 | 100μL |
涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
20℃15min
65℃10min。
5.2.8纯化
将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,50μL ElutionBuffer洗脱。
5.2.9 One-step PCR靶向富集
将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM,获得下游单分子特异性引物(D);按照下表配置PCR反应体系:
PCR反应管(D)
组分 | 用量 |
Gold 360 master Mix(2x) | 25μL |
YLA反应产物 | 23μL |
下游单分子特异性引物集(D) | 1μL |
分子标签引物(10uM) | 0.2μL |
TN5-UNI-BLK引物(20uM) | 1μL |
P7引物(20uM) | 1μL |
双蒸水 | 补足至50μL |
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
按照下表,执行PCR扩增程序:
5.2.10纯化
将反应管1从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μLElution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。
5.3 qPCR质检及上机测序
按照实施例1中方法对文库进行qPCR质控和上机测序。
5.4实验结果:
5.4.1文库电泳检测分析结果
根据电泳分析结果(图8),文库主带清楚且主要分布在500-700bp左右,条带亮度明亮,与预期结果一致。
5.4.2qPCR定量分析结果
qPCR检测结果如下:
样品 | R002 |
qPCR浓度(nM) | 97.3 |
建库文库达到上机要求浓度,可用于上机测试。
5.4.3上机质控数据
将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果见。
实施例6融合基因检测
EML4-ALK基因融合检测原理如图9所示:EML4基因与ALK基因融合以DNA为模板检测,因两个基因融合具体位点信息未知,但可以知道是在intron区域内,所以针对intron区域设计高特异性的单侧靶向捕获引物,以30-50bp移步进行引物集覆盖以确定具体的融合位点。与以RNA(实施例5和6)为检测模板最大的区别在于:RNA模板设计的引物覆盖的区域为外显子区域,对RNA完整度和丰度要求高。整个建库试剂成本和测序成本都偏高。却无法确定具体的融合基因断裂点。而以DNA为模板进行检测,可以确定到具体的断裂点坐标。
6.1接头引物设计
接头序列
Top-Adaptor:
5’-P-NNNNNNNNNNACGTCACGCAGGGGAGAGCCAGGGATGACTAGG-3'见SEQ ID NO.47,
P为磷酸化修饰,
Bottom-Adapter:5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNNN*Y-3’见SEQ ID NO.48
*Y代表硫代修饰的简并碱基A或T,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。
以上序列需退火成双链。
以EML4-ALK基因融合为例:
引物设计:
ALK-Intron 19
GTGAGTGCACAGAGCCCCAGGGACTCCCAAGGGGGCAGGAAGGCAGGACTGAATAGTGTC
TCAGGCTGTGCCACAGGTGCCAAGGTGTCACTTCGTTATGCTAGTCCCTGGAATTGGGTG
GGGTGGTGATTAGGGCAGCCCAGGCCAAGCCAAAACGGAAGCTCCCAACCTTCCCCCCAC
CAGAGCAGCTGCAGTTCCCTGAGGAGCCCCTGATTCTGCACCTCAGCCCCGTGTGTATCC
TCCTGGCTGATCAGGGGGTGGGGAGCTCCTTCAGTGTCCATCACGATGGTGAAAGCTCGC
CCCCACCCCTAGACGTCACTTCTAGCTCCCACATGCTTCCACCGGCGCAGCTCCTGTTTG
GCTCCCACCCTATGTAATGCACTAGCCCACTCTTCCCCAAACCAGCCCTCCACCACCCTC
CAGGCAGAGAGATAGGAAAATCGGTTTCTGAGTATATTTCTGTTCAGCCTGTGAGCCAAG
GTGAGCTGACCTGCAGGTCACAGAGAACTCAGTGTGGTCCCAACCAGCTCTTACTGCTGG
CAGAGACATGCCCAGGACAGATGGGCAGAGGCTTGAAAAGGGCAGAGGGAAAGGCTCTTG
AGAGCCCTCGCAGGCCAGGCCCCTGCAGGCAAAGGGATCTGCCGGTAGAAGGGAGATGGC
AGCACACACTGTGTCCCCATATGGTGCCATCCCTCAAAGGGACAGGATAATAGGAGCTAA
CACTTGTTGCATGGTTACTACGTGCTCGGCAATTTACACATTTCAATTCATTCGATCCTC
AGGTAACCCTAATCTGATCACGGTCGGTCCATTGCATAGAGGAGGGAACTGAGCACATAG
CGGGTGACTCATTTGCCCTGGCCCATGTGTTGGGGGGCTGGGCTTTACACACAGAATCTA
CCCACTGAATCACAATTTTGTTCTGGCTTCCATGGAGTTTGCCTTCCAGAACATCCTCAC
ATGTAGGAGTGATAATGGTCACTCACATTGGTAGAGCTCTTTAGGATTTTTCAAAACCAT
TTTATGTTGGTGAATTCATTTCATTGACAACCCTAGAGGGTGGGGAGTGGCAGTGGTTAG
GGAAACAGGGCAGGAGTTACCATCCCTGCCTACAGAGAGGGAAACTGCAGTCCAAAGAGG
TCCTGTGACCTGGTCCTCATGGCTCAGCTTGTAAGTAACAAGAGGCGGAATTAGAGCACA
GATCCCCAGACACCAATTCAGAGATCTTTTCATGATGTGGCTCTTCTCCAACTCTGTGGC
TTGGCAGTTCTCCAACTATAGGAAACACAACTGACCAAGATCCCAGCTGCACCCTCAAAT
CCACTGCTGTGATTGCACTGAAGCTGCCCTACCCAATGGCTGAGCACAGCAGAAATACTA
AGGCAGGCCAATTCCTGGGAGTCATGGGACTCCTCTGATGACTGACTTTGGCTCCAGAAC
CCCTTAGGGCCTTGCTGAAACTTCCTTAGGCTCCATGGCACCCAGGGTGCTTCCACCCAA
CCTTCCCTCCCTCCCTCGTTCACGTGGGGTTATACTTGCAACACAGTCTGCTGGTTCACC
CAGCCTTCCCTGGCTCCCTCCCCATTTCCTCTCATGGGCATTTCTTCTAATAAAATCTGC
AGACCATATTGGGTCTAATCCCATCTCCAGTCTGCTTCTTGGAGGAACCAGACTAACATG
ACTCTGCCCTATATAATACAAATAATTATTTTCCATATATCTGATTTTTAGCTTTGCATT
TACTTTAAATCATGCTTCAATTAAAGACACACCTTCTTTAATCATTTTATTAGTATTTCT
AAGTATGATGGAAAGGTTCAGAGCTCAGGGGAGGATATGGAGATCCAGGGAGGCTTCCTG
TAGGAAGTGGCCTGTGTAGTGCTTCAAGGGCCAGGCTGCCAGGCCATGTTGCAGCTGACC
ACCCACCTGCAG见SEQ ID NO.49。
Exon 20
TGTACCGCCGGAAGCACCAGGAGCTGCAAGCCATGCAGATGGAGCTGCAGAGCCCTGAGTACAAGCTGAGCAAGCTCCGCACCTCGACCATCATGACCGACTACAACCCCAACTACTGCTTTGCTGGCAAGACCTCCTCCATCAGTGACCTGAAGGAGGTGCCGCGGAAAAACATCACCCTCATTCG,见SEQ ID NO.50。
Intron 19-Exon20
GTGAGTGCACAGAGCCCCAGGGACTCCCAAGGGGGCAGGAAGGCAGGACTGAATAGTGTC
TCAGGCTGTGCCACAGGTGCCAAGGTGTCACTTCGTTATGCTAGTCCCTGGAATTGGGTG
GGGTGGTGATTAGGGCAGCCCAGGCCAAGCCAAAACGGAAGCTCCCAACCTTCCCCCCAC
CAGAGCAGCTGCAGTTCCCTGAGGAGCCCCTGATTCTGCACCTCAGCCCCGTGTGTATCC
TCCTGGCTGATCAGGGGGTGGGGAGCTCCTTCAGTGTCCATCACGATGGTGAAAGCTCGC
CCCCACCCCTAGACGTCACTTCTAGCTCCCACATGCTTCCACCGGCGCAGCTCCTGTTTG
GCTCCCACCCTATGTAATGCACTAGCCCACTCTTCCCCAAACCAGCCCTCCACCACCCTC
CAGGCAGAGAGATAGGAAAATCGGTTTCTGAGTATATTTCTGTTCAGCCTGTGAGCCAAG
GTGAGCTGACCTGCAGGTCACAGAGAACTCAGTGTGGTCCCAACCAGCTCTTACTGCTGG
CAGAGACATGCCCAGGACAGATGGGCAGAGGCTTGAAAAGGGCAGAGGGAAAGGCTCTTG
AGAGCCCTCGCAGGCCAGGCCCCTGCAGGCAAAGGGATCTGCCGGTAGAAGGGAGATGGC
AGCACACACTGTGTCCCCATATGGTGCCATCCCTCAAAGGGACAGGATAATAGGAGCTAA
CACTTGTTGCATGGTTACTACGTGCTCGGCAATTTACACATTTCAATTCATTCGATCCTC
AGGTAACCCTAATCTGATCACGGTCGGTCCATTGCATAGAGGAGGGAACTGAGCACATAG
CGGGTGACTCATTTGCCCTGGCCCATGTGTTGGGGGGCTGGGCTTTACACACAGAATCTA
CCCACTGAATCACAATTTTGTTCTGGCTTCCATGGAGTTTGCCTTCCAGAACATCCTCAC
ATGTAGGAGTGATAATGGTCACTCACATTGGTAGAGCTCTTTAGGATTTTTCAAAACCAT
TTTATGTTGGTGAATTCATTTCATTGACAACCCTAGAGGGTGGGGAGTGGCAGTGGTTAG
GGAAACAGGGCAGGAGTTACCATCCCTGCCTACAGAGAGGGAAACTGCAGTCCAAAGAGG
TCCTGTGACCTGGTCCTCATGGCTCAGCTTGTAAGTAACAAGAGGCGGAATTAGAGCACA
GATCCCCAGACACCAATTCAGAGATCTTTTCATGATGTGGCTCTTCTCCAACTCTGTGGC
TTGGCAGTTCTCCAACTATAGGAAACACAACTGACCAAGATCCCAGCTGCACCCTCAAAT
CCACTGCTGTGATTGCACTGAAGCTGCCCTACCCAATGGCTGAGCACAGCAGAAATACTA
AGGCAGGCCAATTCCTGGGAGTCATGGGACTCCTCTGATGACTGACTTTGGCTCCAGAAC
CCCTTAGGGCCTTGCTGAAACTTCCTTAGGCTCCATGGCACCCAGGGTGCTTCCACCCAA
CCTTCCCTCCCTCCCTCGTTCACGTGGGGTTATACTTGCAACACAGTCTGCTGGTTCACC
CAGCCTTCCCTGGCTCCCTCCCCATTTCCTCTCATGGGCATTTCTTCTAATAAAATCTGC
AGACCATATTGGGTCTAATCCCATCTCCAGTCTGCTTCTTGGAGGAACCAGACTAACATG
ACTCTGCCCTATATAATACAAATAATTATTTTCCATATATCTGATTTTTAGCTTTGCATT
TACTTTAAATCATGCTTCAATTAAAGACACACCTTCTTTAATCATTTTATTAGTATTTCT
AAGTATGATGGAAAGGTTCAGAGCTCAGGGGAGGATATGGAGATCCAGGGAGGCTTCCTG
TAGGAAGTGGCCTGTGTAGTGCTTCAAGGGCCAGGCTGCCAGGCCATGTTGCAGCTGACC
ACCCACCTGCAGTGTACCGCCGGAAGCACCAGGAGCTGCAAGCCATGCAGATGGAGCTGCAGAGCCCTGAGTACAAGCTGAGCAAGCTCCGCACCTCGACCATCATGACCGACTACAACCCCAACTACTGCTTTGCTGGCAAGACCTCCTCCATCAGTGACCTGAAGGAGGTGCCGCGGAAAAACATCACCCTCATTCG,见SEQ ID NO.51。
以Exon 20 5’端附近30-50bp左右为第一条特异性引物,依次以间隔30-50bp设计第二条引物、第三条引物......第n条引物,引物序列如下:
ALK-Exon20-D1 | AGATGTGTATAAGAGACAGCATGGCTTGCAGCTCCTGGTGCTTCCGGCGGTACAC |
ALK-Intron19-D2 | AGATGTGTATAAGAGACAGGCCACTTCCTACAGGAAGCCTCCCTGGATCTCC |
ALK-Intron19-D3 | AGATGTGTATAAGAGACAGGGTGTGTCTTTAATTGAAGCATGATTTAAAGTAAATG |
ALK-Intron19-D4 | AGATGTGTATAAGAGACAGGGCAGAGTCATGTTAGTCTGGTTCCTCCAAGAAGC |
ALK-Intron19-D5 | AGATGTGTATAAGAGACAGGAAATGCCCATGAGAGGAAATGGGGAGGGAGCC |
ALK-Intron19-D6 | AGATGTGTATAAGAGACAGGAGGGAAGGTTGGGTGGAAGCACCCTGG |
ALK-Intron19-D7 | AGATGTGTATAAGAGACAGAGAGGAGTCCCATGACTCCCAGGAATTGGCCTGC |
ALK-Intron19-D8 | AGATGTGTATAAGAGACAGGTGGATTTGAGGGTGCAGCTGGGATCTTGGTC |
ALK-Intron19-D9 | AGATGTGTATAAGAGACAGATGAAAAGATCTCTGAATTGGTGTCTGGGGATCTGTG |
ALK-Intron19-D10 | AGATGTGTATAAGAGACAGGACTGCAGTTTCCCTCTCTGTAGGCAGGGATGGTAAC |
ALK-Intron19-D11 | AGATGTGTATAAGAGACAGCCCCACCCTCTAGGGTTGTCAATGAAATG |
ALK-Intron19-D12 | AGATGTGTATAAGAGACAGGATGTTCTGGAAGGCAAACTCCATGGAAGCCAGAAC |
ALK-Intron19-D13 | AGATGTGTATAAGAGACAGCGCTATGTGCTCAGTTCCCTCCTCTATGCAATGGAC |
ALK-Intron19-D14 | AGATGTGTATAAGAGACAGGAGCACGTAGTAACCATGCAACAAGTGTTAGC |
ALK-Intron19-D15 | AGATGTGTATAAGAGACAGGCCATCTCCCTTCTACCGGCAGATCCCTTTG |
ALK-Intron19-D16 | AGATGTGTATAAGAGACAGCCTCTGCCCATCTGTCCTGGGCATG |
ALK-Intron19-D17 | AGATGTGTATAAGAGACAGGCTCACCTTGGCTCACAGGCTGAACAG |
ALK-Intron19-D18 | AGATGTGTATAAGAGACAGGAAGAGTGGGCTAGTGCATTACATAGGGTGGGAGC |
ALK-Intron19-D19 | AGATGTGTATAAGAGACAGCGTGATGGACACTGAAGGAGCTCCCCACC |
ALK-Intron19-D20 | AGATGTGTATAAGAGACAGGAACTGCAGCTGCTCTGGTGGGGGGAAGG |
ALK-Intron19-D21 | AGATGTGTATAAGAGACAGGCCCCCTTGGGAGTCCCTGGGGCTCTGTGCACTCAC |
上表中序列依次见SEQ ID NO.52—72。
TN5-UNI-BLK序列为:
5'-AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAG-3'见SEQID NO.20。分子标签引物(TS-Index序列)为:
5'-CAAGCAGAAGACGGCATACGAGAT[Index-7]GTGACTGGAGTTCAGACGTGT-3'见SEQ IDNO.73。
[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。
P7引物:
5’-CAAGCAGAAGACGGCATACGAGAT-3’,见SEQ ID NO.19。
6.2实验步骤
6.2.1石蜡组织切片(FFPE)样本DNA提取
取3例编号分别为FP001、FP002、FP003的FFPE样本;每例样本取5片石蜡切片,按照MagMAXTMFFPE DNA/RNA Ultra Kit(life,cat.A31881)说明书操作,提取DNA,包括以下步骤:
a)样本脱蜡
b)样本消化
c)磁珠结合
d)清洗
e)洗脱
f)定量
6.2.2DNA片段化处理
采用超声或酶切法对FFPE三例样本的DNA进行片段化处理,gap修复及纯化回收处理。
6.2.2末端修复补平添加碱基A及接头连接
使用本发明的YEA反应液(配方同实施例1),YLA反应液(配方同实施例1),对回收的片段化DNA进行末端修复加A和接头连接。按照下表配置反应体系,
组分 | 用量 |
YEA反应液 | 10μL |
FFPE样本DNA | 1~50ng |
YLA反应液 | 40μL |
接头(5uM) | 4μL |
双蒸水 | 补足至100μL |
Total体积 | 100μL |
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
25℃60min
72℃30min
4℃forever。
6.2.3纯化
将反应管从热循环仪上取下,加入80μLAmpure XP beads进行纯化,50μL ElutionBuffer洗脱,加入100μLAmpure XP beads进行纯化,50μL Elution Buffer洗脱,用于下游靶向捕获。
6.2.4单侧单引物扩增子靶向捕获
特异性引物集-D中每种引物都是等物质的量混合,终浓度为10uM。
分别按照下表配置PCR反应体系:
PCR反应管(D)
组分 | 用量 |
Gold 360 master Mix(2x) | 25μL |
纯化产物 | 23μL |
特异性引物集-D | 1μL |
TS-Index序列 | 1μL |
涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:
按照下表,执行PCR扩增程序:
6.2.5纯化
将反应管D从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μLElution Buffer洗脱。
6.2.6PCR扩增富集
将反应管D纯化产物分别按照下表配制PCR反应体系:
组份 | 用量 |
2x KAPA HiFiHostart buffer | 25μL |
TN5-UNI-BLK(10uM) | 1μL |
P7引物(10uM) | 1μL |
纯化产物 | 23μL |
按照下表,执行PCR扩增程序:
6.2.7 PCR产物纯化
使用60μLAmpure XP beads进行纯化,30μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。
6.2.8qPCR质检
按照KAPA Library Quantifcation Kit(Kapabiosystems,Cat No.KK4854)说明书进行操作,使用Roche Light Cycler 480实时荧光定量PCR仪检测,参照试剂盒里的标准品进行文库浓度的绝对定量。
6.2.9上机测序
按照MiSeq测序仪操作流程进行文库变性、稀释以及150bp双端测序。
6.3实验结果:
6.3.1文库电泳检测分析结果
根据电泳分析结果(图10),文库主带清楚且主要分布在300bp左右,条带亮度明亮,与预期结果一致。
6.3.2 qPCR定量结果
文库Qpcr定量结果如下:
文库名称 | FP001 | FP002 | FP003 |
qPCR浓度(nM) | 48.4 | 50.4 | 39.3 |
文库浓度达到上机要求。
6.3.3测序数据分析结果
测试数据经过fastqc软件进行Q30质控,再通过去除接头,过滤,Bowite2软件进行hg19参考基因组进行比对,评估引物特异性及捕获效率。分析结果如下表:
序列表
<110> 湖南大地同年生物科技有限公司
<120> 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂
<130> 无
<160> 73
<170> SIPOSequenceListing 1.0
<210> 1
<211> 33
<212> DNA
<213> 人工序列(Artificial)
<400> 1
acgtcacgca ggggagagcc agggatgact agg 33
<210> 2
<211> 56
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (35)..(42)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (56)..(56)
<223> Y为硫代修饰的简并碱基A或T
<400> 2
gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnccctgcgt gacgty 56
<210> 3
<211> 381
<212> DNA
<213> Homo sapiens
<400> 3
caagtgccgt gtcctggcac ccaagcccat gccgtggctg ctggtccccc tgctgggcca 60
tgtctggcac tgctttccag catggtgagg gctgaggtga cccttgtctc tgtgttcttg 120
tcccccccag cttgtggagc ctcttacacc cagtggagaa gctcccaacc aagctctctt 180
gaggatcttg aaggaaactg aattcaaaaa gatcaaagtg ctgggctccg gtgcgttcgg 240
cacggtgtat aaggtaaggt ccctggcaca ggcctctggg ctgggccgca gggcctctca 300
tggtctggtg gggagcccag agtccttgca agctgtatat ttccatcatc tactttactc 360
tttgtttcac tgagtgtttg g 381
<210> 4
<211> 49
<212> DNA
<213> 人工序列(Artificial)
<400> 4
agatgtgtat aagagacagg ctcccaacca agctctcttg aggatcttg 49
<210> 5
<211> 49
<212> DNA
<213> 人工序列(Artificial)
<400> 5
agatgtgtat aagagacagg gaccttacct tatacaccgt gccgaacgc 49
<210> 6
<211> 372
<212> DNA
<213> Homo sapiens
<400> 6
gcaatatcag ccttaggtgc ggctccacag ccccagtgtc cctcaccttc ggggtgcatc 60
gctggtaaca tccacccaga tcactgggca gcatgtggca ccatctcaca attgccagtt 120
aacgtcttcc ttctctctct gtcataggga ctctggatcc cagaaggtga gaaagttaaa 180
attcccgtcg ctatcaagga attaagagaa gcaacatctc cgaaagccaa caaggaaatc 240
ctcgatgtga gtttctgctt tgctgtgtgg gggtccatgg ctctgaacct caggcccacc 300
ttttctcatg tctggcagct gctctgctct agaccctgct catctccaca tcctaaatgt 360
tcactttcta tg 372
<210> 7
<211> 55
<212> DNA
<213> 人工序列(Artificial)
<400> 7
agatgtgtat aagagacagc cagaaggtga gaaagttaaa attcccgtcg ctatc 55
<210> 8
<211> 50
<212> DNA
<213> 人工序列(Artificial)
<400> 8
agatgtgtat aagagacagc cacacagcaa agcagaaact cacatcgagg 50
<210> 9
<211> 408
<212> DNA
<213> Homo sapiens
<400> 9
ccatgagtac gtattttgaa actcaagatc gcattcatgc gtcttcacct ggaaggggtc 60
catgtgcccc tccttctggc caccatgcga agccacactg acgtgcctct ccctccctcc 120
aggaagccta cgtgatggcc agcgtggaca acccccacgt gtgccgcctg ctgggcatct 180
gcctcacctc caccgtgcag ctcatcacgc agctcatgcc cttcggctgc ctcctggact 240
atgtccggga acacaaagac aatattggct cccagtacct gctcaactgg tgtgtgcaga 300
tcgcaaaggt aatcagggaa gggagatacg gggaggggag ataaggagcc aggatcctca 360
catgcggtct gcgctcctgg gatagcaaga gtttgccatg gggatatg 408
<210> 10
<211> 49
<212> DNA
<213> 人工序列(Artificial)
<400> 10
agatgtgtat aagagacaga ccatgcgaag ccacactgac gtgcctctc 49
<210> 11
<211> 48
<212> DNA
<213> 人工序列(Artificial)
<400> 11
agatgtgtat aagagacagg catctgcctc acctccaccg tgcagctc 48
<210> 12
<211> 50
<212> DNA
<213> 人工序列(Artificial)
<400> 12
agatgtgtat aagagacaga ttgtctttgt gttcccggac atagtccagg 50
<210> 13
<211> 49
<212> DNA
<213> 人工序列(Artificial)
<400> 13
agatgtgtat aagagacaga tgagctgcgt gatgagctgc acggtggag 49
<210> 14
<211> 239
<212> DNA
<213> Homo sapiens
<400> 14
tctgtttcag ggcatgaact acttggagga ccgtcgcttg gtgcaccgcg acctggcagc 60
caggaacgta ctggtgaaaa caccgcagca tgtcaagatc acagattttg ggctggccaa 120
actgctgggt gcggaagaga aagaatacca tgcagaagga ggcaaagtaa ggaggtggct 180
ttaggtcagc cagcattttc ctgacaccag ggaccaggct gccttcccac tagctgtat 239
<210> 15
<211> 51
<212> DNA
<213> 人工序列(Artificial)
<400> 15
agatgtgtat aagagacagg gaacgtactg gtgaaaacac cgcagcatgt c 51
<210> 16
<211> 51
<212> DNA
<213> 人工序列(Artificial)
<400> 16
agatgtgtat aagagacagg cctccttctg catggtattc tttctcttcc g 51
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial)
<400> 17
cctagtcatc cctggctctc 20
<210> 18
<211> 45
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (24)..(25)
<223> 第24和25个碱基之间插入7个作为分子标签的随机碱基
<400> 18
caagcagaag acggcatacg agatgtgact ggagttcaga cgtgt 45
<210> 19
<211> 24
<212> DNA
<213> 人工序列(Artificial)
<400> 19
caagcagaag acggcatacg agat 24
<210> 20
<211> 58
<212> DNA
<213> 人工序列(Artificial)
<400> 20
aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg tataagag 58
<210> 21
<211> 40
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (14)..(21)
<223> n is a, c, g, or t
<400> 21
acgtcacgca gggnnnnnnn nagatgtgta taagagacag 40
<210> 22
<211> 56
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (35)..(42)
<223> n is a, c, g, or t
<400> 22
gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnccctgcgt gacgtt 56
<210> 23
<211> 118
<212> DNA
<213> Homo sapiens
<400> 23
aaaacacttg gtagacggga ctcgagtgat gattgggaga ttcctgatgg gcagattaca 60
gtgggacaaa gaattggatc tggatcattt ggaacagtct acaagggaaa gtggcatg 118
<210> 24
<211> 318
<212> DNA
<213> Homo sapiens
<400> 24
cctgtatccc tctcaggcat aaggtaatgt acttagggtg aaacataagg ttttcttttt 60
ctgtttggct tgacttgact tttttactgt ttttatcaag aaaacacttg gtagacggga 120
ctcgagtgat gattgggaga ttcctgatgg gcagattaca gtgggacaaa gaattggatc 180
tggatcattt ggaacagtct acaagggaaa gtggcatggt aagtatgtaa tgtggtgaca 240
ttgtgacaag tcataatagg atatgtttaa caacttttat tttgtaaaaa atatcatcaa 300
aggaaatatt cactgttc 318
<210> 25
<211> 69
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (50)..(51)
<223> 第50和51个碱基之间插入8个次黄嘌呤碱基I
<400> 25
acactctttc cctacacgac gctcttccga tctggagatt cctgatgggc agattacagt 60
gggacaaag 69
<210> 26
<211> 65
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (50)..(51)
<223> 第50和51个碱基之间插入8个次黄嘌呤碱基I
<400> 26
acactctttc cctacacgac gctcttccga tctaccacat tacatactta ccatgccact 60
ttccc 65
<210> 27
<211> 119
<212> DNA
<213> Homo sapiens
<400> 27
atatatttct tcatgaagac ctcacagtaa aaataggtga ttttggtcta gctacagtga 60
aatctcgatg gagtgggtcc catcagtttg aacagttgtc tggatccatt ttgtggatg 119
<210> 28
<211> 319
<212> DNA
<213> Homo sapiens
<400> 28
acagaattat agaaattaga tctcttacct aaactcttca taatgcttgc tctgatagga 60
aaatgagatc tactgttttc ctttacttac tacacctcag atatatttct tcatgaagac 120
ctcacagtaa aaataggtga ttttggtcta gctacagtga aatctcgatg gagtgggtcc 180
catcagtttg aacagttgtc tggatccatt ttgtggatgg taagaattga ggctattttt 240
ccactgatta aatttttggc cctgagatgc tgctgagtta ctagaaagtc attgaaggtc 300
tcaactatag tattttcat 319
<210> 29
<211> 71
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (50)..(51)
<223> 第50和51个碱基之间插入8个次黄嘌呤碱基I
<400> 29
acactctttc cctacacgac gctcttccga tctcttcatg aagacctcac agtaaaaata 60
ggtgattttg g 71
<210> 30
<211> 73
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (49)..(50)
<223> 第49和50个碱基之间插入8个次黄嘌呤碱基I
<400> 30
acactctttc cctacacgac gctcttccga tcttccagac aactgttcaa actgatggga 60
cccactccat cag 73
<210> 31
<211> 44
<212> DNA
<213> 人工序列(Artificial)
<400> 31
aatgatacgg cgaccaccga gatctacact ctttccctac acga 44
<210> 32
<211> 26
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (14)..(15)
<223> 第13和14个碱基之间插入7个作为分子标签的随机碱基
<400> 32
cggcatacga gatgtgactg gagttc 26
<210> 33
<211> 40
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (14)..(21)
<223> n is a, c, g, or t
<400> 33
acgtcacgca gggnnnnnnn nagatgtgta taagagacag 40
<210> 34
<211> 56
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (35)..(42)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (56)..(56)
<223> Y为硫代修饰的简并碱基A或T
<400> 34
gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnccctgcgt gacgty 56
<210> 35
<211> 111
<212> DNA
<213> Homo sapiens
<400> 35
atgactgaat ataaacttgt ggtagttgga gctggtggcg taggcaagag tgccttgacg 60
atacagctaa ttcagaatca ttttgtggac gaatatgatc caacaataga g 111
<210> 36
<211> 383
<212> DNA
<213> Homo sapiens
<400> 36
aattttgtaa ggtattttga aataattttt catataaagg tgagtttgta ttaaaaggta 60
ctggtggagt atttgatagt gtattaacct tatgtgtgac atgttctaat atagtcacat 120
tttcattatt tttattataa ggcctgctga aaatgactga atataaactt gtggtagttg 180
gagctggtgg cgtaggcaag agtgccttga cgatacagct aattcagaat cattttgtgg 240
acgaatatga tccaacaata gaggtaaatc ttgttttaat atgcatatta ctggtgcagg 300
accattcttt gatacagata aaggtttctc tgaccatttt catgagtact tattacaaga 360
taattatgct gaaagttaag tta 383
<210> 37
<211> 58
<212> DNA
<213> 人工序列(Artificial)
<400> 37
acactctttc cctacacgac gctcttccga tctgactgaa tataaacggt agttgggc 58
<210> 38
<211> 72
<212> DNA
<213> 人工序列(Artificial)
<400> 38
acactctttc cctacacgac gctcttccga tctccacaaa atgattctga attagctgta 60
tcgtcaaggc ac 72
<210> 39
<211> 26
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (13)..(14)
<223> 第13和14个碱基之间插入7个作为分子标签的随机碱基
<400> 39
cggcatacga gatgtgactg gagttc 26
<210> 40
<211> 41
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (1)..(8)
<223> n is a, c, g, or t
<400> 40
nnnnnnnnac gtcacgcagg ggagagccag ggatgactag g 41
<210> 41
<211> 45
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (35)..(44)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (45)..(45)
<223> Y为硫代修饰的简并碱基A或T
<400> 41
gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnny 45
<210> 42
<211> 187
<212> DNA
<213> Homo sapiens
<400> 42
tgtaccgccg gaagcaccag gagctgcaag ccatgcagat ggagctgcag agccctgagt 60
acaagctgag caagctccgc acctcgacca tcatgaccga ctacaacccc aactactgct 120
ttgctggcaa gacctcctcc atcagtgacc tgaaggaggt gccgcggaaa aacatcaccc 180
tcattcg 187
<210> 43
<211> 41
<212> DNA
<213> 人工序列(Artificial)
<400> 43
agatgtgtat aagagacagg cttgcagctc ctggtgcttc c 41
<210> 44
<211> 44
<212> DNA
<213> 人工序列(Artificial)
<400> 44
agatgtgtat aagagacagc tcagggctct gcagctccat ctgc 44
<210> 45
<211> 50
<212> DNA
<213> 人工序列(Artificial)
<400> 45
agatgtgtat aagagacagc aagctccgca cctcgaccat catgaccgac 50
<210> 46
<211> 45
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (24)..(25)
<223> 第24和25个碱基之间插入7个作为分子标签的随机碱基
<400> 46
caagcagaag acggcatacg agatgtgact ggagttcaga cgtgt 45
<210> 47
<211> 43
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (1)..(10)
<223> n is a, c, g, or t
<400> 47
nnnnnnnnnn acgtcacgca ggggagagcc agggatgact agg 43
<210> 48
<211> 45
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (35)..(44)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (45)..(45)
<223> Y为硫代修饰的简并碱基A或T
<400> 48
gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnny 45
<210> 49
<211> 1932
<212> DNA
<213> Homo sapiens
<400> 49
gtgagtgcac agagccccag ggactcccaa gggggcagga aggcaggact gaatagtgtc 60
tcaggctgtg ccacaggtgc caaggtgtca cttcgttatg ctagtccctg gaattgggtg 120
gggtggtgat tagggcagcc caggccaagc caaaacggaa gctcccaacc ttccccccac 180
cagagcagct gcagttccct gaggagcccc tgattctgca cctcagcccc gtgtgtatcc 240
tcctggctga tcagggggtg gggagctcct tcagtgtcca tcacgatggt gaaagctcgc 300
ccccacccct agacgtcact tctagctccc acatgcttcc accggcgcag ctcctgtttg 360
gctcccaccc tatgtaatgc actagcccac tcttccccaa accagccctc caccaccctc 420
caggcagaga gataggaaaa tcggtttctg agtatatttc tgttcagcct gtgagccaag 480
gtgagctgac ctgcaggtca cagagaactc agtgtggtcc caaccagctc ttactgctgg 540
cagagacatg cccaggacag atgggcagag gcttgaaaag ggcagaggga aaggctcttg 600
agagccctcg caggccaggc ccctgcaggc aaagggatct gccggtagaa gggagatggc 660
agcacacact gtgtccccat atggtgccat ccctcaaagg gacaggataa taggagctaa 720
cacttgttgc atggttacta cgtgctcggc aatttacaca tttcaattca ttcgatcctc 780
aggtaaccct aatctgatca cggtcggtcc attgcataga ggagggaact gagcacatag 840
cgggtgactc atttgccctg gcccatgtgt tggggggctg ggctttacac acagaatcta 900
cccactgaat cacaattttg ttctggcttc catggagttt gccttccaga acatcctcac 960
atgtaggagt gataatggtc actcacattg gtagagctct ttaggatttt tcaaaaccat 1020
tttatgttgg tgaattcatt tcattgacaa ccctagaggg tggggagtgg cagtggttag 1080
ggaaacaggg caggagttac catccctgcc tacagagagg gaaactgcag tccaaagagg 1140
tcctgtgacc tggtcctcat ggctcagctt gtaagtaaca agaggcggaa ttagagcaca 1200
gatccccaga caccaattca gagatctttt catgatgtgg ctcttctcca actctgtggc 1260
ttggcagttc tccaactata ggaaacacaa ctgaccaaga tcccagctgc accctcaaat 1320
ccactgctgt gattgcactg aagctgccct acccaatggc tgagcacagc agaaatacta 1380
aggcaggcca attcctggga gtcatgggac tcctctgatg actgactttg gctccagaac 1440
cccttagggc cttgctgaaa cttccttagg ctccatggca cccagggtgc ttccacccaa 1500
ccttccctcc ctccctcgtt cacgtggggt tatacttgca acacagtctg ctggttcacc 1560
cagccttccc tggctccctc cccatttcct ctcatgggca tttcttctaa taaaatctgc 1620
agaccatatt gggtctaatc ccatctccag tctgcttctt ggaggaacca gactaacatg 1680
actctgccct atataataca aataattatt ttccatatat ctgattttta gctttgcatt 1740
tactttaaat catgcttcaa ttaaagacac accttcttta atcattttat tagtatttct 1800
aagtatgatg gaaaggttca gagctcaggg gaggatatgg agatccaggg aggcttcctg 1860
taggaagtgg cctgtgtagt gcttcaaggg ccaggctgcc aggccatgtt gcagctgacc 1920
acccacctgc ag 1932
<210> 50
<211> 187
<212> DNA
<213> Homo sapiens
<400> 50
tgtaccgccg gaagcaccag gagctgcaag ccatgcagat ggagctgcag agccctgagt 60
acaagctgag caagctccgc acctcgacca tcatgaccga ctacaacccc aactactgct 120
ttgctggcaa gacctcctcc atcagtgacc tgaaggaggt gccgcggaaa aacatcaccc 180
tcattcg 187
<210> 51
<211> 2119
<212> DNA
<213> Homo sapiens
<400> 51
gtgagtgcac agagccccag ggactcccaa gggggcagga aggcaggact gaatagtgtc 60
tcaggctgtg ccacaggtgc caaggtgtca cttcgttatg ctagtccctg gaattgggtg 120
gggtggtgat tagggcagcc caggccaagc caaaacggaa gctcccaacc ttccccccac 180
cagagcagct gcagttccct gaggagcccc tgattctgca cctcagcccc gtgtgtatcc 240
tcctggctga tcagggggtg gggagctcct tcagtgtcca tcacgatggt gaaagctcgc 300
ccccacccct agacgtcact tctagctccc acatgcttcc accggcgcag ctcctgtttg 360
gctcccaccc tatgtaatgc actagcccac tcttccccaa accagccctc caccaccctc 420
caggcagaga gataggaaaa tcggtttctg agtatatttc tgttcagcct gtgagccaag 480
gtgagctgac ctgcaggtca cagagaactc agtgtggtcc caaccagctc ttactgctgg 540
cagagacatg cccaggacag atgggcagag gcttgaaaag ggcagaggga aaggctcttg 600
agagccctcg caggccaggc ccctgcaggc aaagggatct gccggtagaa gggagatggc 660
agcacacact gtgtccccat atggtgccat ccctcaaagg gacaggataa taggagctaa 720
cacttgttgc atggttacta cgtgctcggc aatttacaca tttcaattca ttcgatcctc 780
aggtaaccct aatctgatca cggtcggtcc attgcataga ggagggaact gagcacatag 840
cgggtgactc atttgccctg gcccatgtgt tggggggctg ggctttacac acagaatcta 900
cccactgaat cacaattttg ttctggcttc catggagttt gccttccaga acatcctcac 960
atgtaggagt gataatggtc actcacattg gtagagctct ttaggatttt tcaaaaccat 1020
tttatgttgg tgaattcatt tcattgacaa ccctagaggg tggggagtgg cagtggttag 1080
ggaaacaggg caggagttac catccctgcc tacagagagg gaaactgcag tccaaagagg 1140
tcctgtgacc tggtcctcat ggctcagctt gtaagtaaca agaggcggaa ttagagcaca 1200
gatccccaga caccaattca gagatctttt catgatgtgg ctcttctcca actctgtggc 1260
ttggcagttc tccaactata ggaaacacaa ctgaccaaga tcccagctgc accctcaaat 1320
ccactgctgt gattgcactg aagctgccct acccaatggc tgagcacagc agaaatacta 1380
aggcaggcca attcctggga gtcatgggac tcctctgatg actgactttg gctccagaac 1440
cccttagggc cttgctgaaa cttccttagg ctccatggca cccagggtgc ttccacccaa 1500
ccttccctcc ctccctcgtt cacgtggggt tatacttgca acacagtctg ctggttcacc 1560
cagccttccc tggctccctc cccatttcct ctcatgggca tttcttctaa taaaatctgc 1620
agaccatatt gggtctaatc ccatctccag tctgcttctt ggaggaacca gactaacatg 1680
actctgccct atataataca aataattatt ttccatatat ctgattttta gctttgcatt 1740
tactttaaat catgcttcaa ttaaagacac accttcttta atcattttat tagtatttct 1800
aagtatgatg gaaaggttca gagctcaggg gaggatatgg agatccaggg aggcttcctg 1860
taggaagtgg cctgtgtagt gcttcaaggg ccaggctgcc aggccatgtt gcagctgacc 1920
acccacctgc agtgtaccgc cggaagcacc aggagctgca agccatgcag atggagctgc 1980
agagccctga gtacaagctg agcaagctcc gcacctcgac catcatgacc gactacaacc 2040
ccaactactg ctttgctggc aagacctcct ccatcagtga cctgaaggag gtgccgcgga 2100
aaaacatcac cctcattcg 2119
<210> 52
<211> 55
<212> DNA
<213> 人工序列(Artificial)
<400> 52
agatgtgtat aagagacagc atggcttgca gctcctggtg cttccggcgg tacac 55
<210> 53
<211> 52
<212> DNA
<213> 人工序列(Artificial)
<400> 53
agatgtgtat aagagacagg ccacttccta caggaagcct ccctggatct cc 52
<210> 54
<211> 56
<212> DNA
<213> 人工序列(Artificial)
<400> 54
agatgtgtat aagagacagg gtgtgtcttt aattgaagca tgatttaaag taaatg 56
<210> 55
<211> 54
<212> DNA
<213> 人工序列(Artificial)
<400> 55
agatgtgtat aagagacagg gcagagtcat gttagtctgg ttcctccaag aagc 54
<210> 56
<211> 52
<212> DNA
<213> 人工序列(Artificial)
<400> 56
agatgtgtat aagagacagg aaatgcccat gagaggaaat ggggagggag cc 52
<210> 57
<211> 47
<212> DNA
<213> 人工序列(Artificial)
<400> 57
agatgtgtat aagagacagg agggaaggtt gggtggaagc accctgg 47
<210> 58
<211> 53
<212> DNA
<213> 人工序列(Artificial)
<400> 58
agatgtgtat aagagacaga gaggagtccc atgactccca ggaattggcc tgc 53
<210> 59
<211> 51
<212> DNA
<213> 人工序列(Artificial)
<400> 59
agatgtgtat aagagacagg tggatttgag ggtgcagctg ggatcttggt c 51
<210> 60
<211> 56
<212> DNA
<213> 人工序列(Artificial)
<400> 60
agatgtgtat aagagacaga tgaaaagatc tctgaattgg tgtctgggga tctgtg 56
<210> 61
<211> 56
<212> DNA
<213> 人工序列(Artificial)
<400> 61
agatgtgtat aagagacagg actgcagttt ccctctctgt aggcagggat ggtaac 56
<210> 62
<211> 48
<212> DNA
<213> 人工序列(Artificial)
<400> 62
agatgtgtat aagagacagc cccaccctct agggttgtca atgaaatg 48
<210> 63
<211> 55
<212> DNA
<213> 人工序列(Artificial)
<400> 63
agatgtgtat aagagacagg atgttctgga aggcaaactc catggaagcc agaac 55
<210> 64
<211> 55
<212> DNA
<213> 人工序列(Artificial)
<400> 64
agatgtgtat aagagacagc gctatgtgct cagttccctc ctctatgcaa tggac 55
<210> 65
<211> 51
<212> DNA
<213> 人工序列(Artificial)
<400> 65
agatgtgtat aagagacagg agcacgtagt aaccatgcaa caagtgttag c 51
<210> 66
<211> 50
<212> DNA
<213> 人工序列(Artificial)
<400> 66
agatgtgtat aagagacagg ccatctccct tctaccggca gatccctttg 50
<210> 67
<211> 44
<212> DNA
<213> 人工序列(Artificial)
<400> 67
agatgtgtat aagagacagc ctctgcccat ctgtcctggg catg 44
<210> 68
<211> 46
<212> DNA
<213> 人工序列(Artificial)
<400> 68
agatgtgtat aagagacagg ctcaccttgg ctcacaggct gaacag 46
<210> 69
<211> 54
<212> DNA
<213> 人工序列(Artificial)
<400> 69
agatgtgtat aagagacagg aagagtgggc tagtgcatta catagggtgg gagc 54
<210> 70
<211> 48
<212> DNA
<213> 人工序列(Artificial)
<400> 70
agatgtgtat aagagacagc gtgatggaca ctgaaggagc tccccacc 48
<210> 71
<211> 48
<212> DNA
<213> 人工序列(Artificial)
<400> 71
agatgtgtat aagagacagg aactgcagct gctctggtgg ggggaagg 48
<210> 72
<211> 55
<212> DNA
<213> 人工序列(Artificial)
<400> 72
agatgtgtat aagagacagg cccccttggg agtccctggg gctctgtgca ctcac 55
<210> 73
<211> 45
<212> DNA
<213> 人工序列(Artificial)
<220>
<221> misc_feature
<222> (24)..(25)
<223> 第24和25个碱基之间插入7个作为分子标签的随机碱基
<400> 73
caagcagaag acggcatacg agatgtgact ggagttcaga cgtgt 45
Claims (17)
1.一种超低频突变核酸片段检测用单分子特异性引物设计方法,其特征在于,包括靶向序列和测序引物序列,或者还包括调节序列,调节序列使靶向序列分成靶向上游序列和靶向下游序列两部分;所述的靶向序列为与待测突变区域上游或者下游特异性互补的序列,进而得到上游单分子特异性引物或者下游单分子特异性引物。
2.根据权利要求1所述的超低频突变核酸片段检测用单分子特异性引物设计方法,其特征在于,所述的靶向序列要满足的条件包括:
1)靶向序列长度为20-100碱基对;
2)靶向序列的退火温度为50-80℃;
3)靶向序列的3’端碱基为C或G。
3.根据权利要求1所述的超低频突变核酸片段检测用单分子特异性引物设计方法,其特征在于,所述的调节序列要满足的条件包括:
1)调节序列由4-30碱基对组成;
2)调节序列的碱基由天然碱基,或非天然碱基,或天然碱基与非天然碱基组成;
3)调节序列的3’端与靶向下游序列的3’端的距离为10-30碱基对。
4.根据权利要求1所述的超低频突变核酸片段检测用单分子特异性引物设计方法,其特征在于,单分子特异性引物的3’端距离待测突变位点或区域1-30个碱基对。
5.一种超低频突变核酸片段检测方法,其特征在于,包括以下步骤:
(1)由权利要求1-4任一项所述的方法设计得到上游单分子特异性引物和下游单分子特异性引物;
(2)对待检DNA样本的片段化核酸进行末端修复补平加A;
(3)对末端修复补平加A的片段化核酸进行分子标签接头连接;
(4)采用分子标签引物分别与上游单分子特异性引物和下游单分子特异性引物组合,对连接接头产物进行扩增子法靶向富集;所述的上游单分子特异性引物为单条引物,或者是根据两个以上突变区域上游设计的引物集,所述的下游单分子特异性引物为单条引物,或者是根据两个以上突变区域下游设计的引物集;
(5)对扩增子法靶向富集产物进行PCR富集;对PCR富集产物检测。
6.根据权利要求5所述的方法,其特征在于,步骤(3)所述的分子标签接头为完全或部分互补的双链;分子标签接头包括分子标签序列和测序引物序列。
7.根据权利要求5所述的方法,其特征在于,还包括以下任意一种或几种处理方式:
A,步骤(2)和(3)两步反应合并成一步反应同时进行;
B,在步骤(3)后,对链接接头后的反应产物进行纯化,除去过量的接头;
C,在步骤(4)后,对上游单分子特异性引物富集产物和下游单分子特异性引物富集产物进行纯化,以除去过量的上游单分子特异性引物、下游单分子特异性引物和分子标签引物。
8.根据权利要求5或7所述的方法,其特征在于,还包括以下任意一种或几种的处理方式:
a,对步骤(3)接了接头的反应产物进行预扩增,然后进行扩增子法靶向富集;
b,步骤(4)和(5)两步富集合并成一步PCR反应富集。
9.根据权利要求8所述的方法,其特征在于,所述的预扩增包括两种方式:
先采用分子标签引物与通用引物进行预扩增,然后采用单分子特异性引物与通用引物进行扩增子法靶向富集,或者先采用通用引物进行预扩增,然后采用单分子特异性引物与分子标签引物进行扩增子法靶向富集。
10.根据权利要求5所述的方法,其特征在于,所述的超低频突变包括点突变、缺失、插入、基因扩增、基因甲基化、基因融合中的一种或多种。
11.根据权利要求10所述的方法,其特征在于,
检测融合基因时,采用分子标签引物与上游单分子特异性引物或下游单分子特异性引物组合,进行扩增子法靶向富集和PCR反应富集;
当确定基因融合发生在已知区域内,需要检测基因融合在该区域内的具体位点时,在该区域依次间隔30-50bp设计引物集,进行扩增子法靶向富集和PCR反应富集。
12.根据权利要求5所述的方法,其特征在于,核酸片段包括DNA或RNA;来源包括动物、植物或微生物。
13.一种超低频突变核酸片段文库构建方法,其特征在于,是采用权利要求5-12任一项所述的方法中步骤5)获得的PCR扩增产物进行文库构建。
14.一种超低频突变核酸片段检测试剂盒,其特征在于:包括:对片段化核酸进行末端修复补平加A的试剂、对核酸进行分子标签接头连接的反应试剂、权利要求1-4任一项所述的方法设计得到的超低频基因突变检测用单分子特异性引物。
15.一种超低频突变核酸片段文库构建试剂盒,其特征在于,包括:对片段化核酸进行末端修复补平加A的试剂、对核酸进行分子标签接头连接的反应试剂、权利要求1-4任一项所述的方法设计得到的超低频基因突变检测用单分子特异性引物。
16.一种对片段化核酸进行末端修复补平加A的试剂,其特征在于,包括:反应活性剂、反应酶和反应稳定剂;
反应活性剂包括:5-500mM pH 8.0的Tris-HCl、50-1000mM NaCl、50-200nMdNTPs、0.5-4mM ATP、1-100mM DTT、50-250mM MgCl2;其中的百分比以无菌水体积为计算基准;
反应酶为具有5’-3’DNA聚合酶活性、5’-3’外切酶活性与3’-5’外切酶活性以及产物3’端加碱基A的功能酶组成的酶混合物;优选包括:1-50U的Taq DNA聚合酶、10-50U的3’-5’exo klenow片段、2-100U的T4 DNA聚合酶;
反应稳定剂为稳定酶活性的试剂;优选包括:0.05-1%Tween 20、1-50%甘油、20-100μg/mL BSA,0.02-0.1%Triton X-100,0.1-1%β-巯基乙醇,其中的百分比以无菌水体积为计算基准。
17.一种对核酸进行分子标签接头连接的反应试剂,其特征在于,包括:连接增强剂、高效连接酶、分子标签接头;
连接增强剂包括1-4mM ATP、1-100mM NAD+、1-200mM DTT、0.05-1%Tween 20、5-50%PEG聚合物,其中的百分比以无菌水体积为计算基准;
高效连接酶为催化粘端或平端双链或单链DNA或RNA的5’-P末端和3’-OH末端之间以磷酸二酯键结合的连接酶;高效连接酶由一种或多种连接酶组成;
优选高效连接酶包括:500-2000U T4-DNA连接酶、50-500U Taq DNA连接酶和1-500UE·coli DNA连接酶;
所述的分子标签接头为完全或部分互补的双链;分子标签接头包括分子标签序列和测序引物序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910971050.7A CN110656156A (zh) | 2019-10-14 | 2019-10-14 | 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910971050.7A CN110656156A (zh) | 2019-10-14 | 2019-10-14 | 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110656156A true CN110656156A (zh) | 2020-01-07 |
Family
ID=69040753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910971050.7A Pending CN110656156A (zh) | 2019-10-14 | 2019-10-14 | 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110656156A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111379033A (zh) * | 2020-04-21 | 2020-07-07 | 深圳易倍科华生物科技有限公司 | 一种添加分子标签的多重pcr方法及建库仪器 |
CN112626189A (zh) * | 2020-04-24 | 2021-04-09 | 北京吉因加医学检验实验室有限公司 | 基因测序仪的短接头、双index接头引物和双index建库体系 |
CN113025761A (zh) * | 2021-05-27 | 2021-06-25 | 广州赛哲生物科技股份有限公司 | 病原微生物鉴定的多重扩增配合高通量测序方法及试剂盒 |
CN113035271A (zh) * | 2020-12-22 | 2021-06-25 | 苏州奥根诊断科技有限公司 | 一种检测异源cfDNA的多重PCR引物设计、引物组及检测方法及其用途 |
CN113278717A (zh) * | 2021-06-10 | 2021-08-20 | 广州赛哲生物科技股份有限公司 | 一种靶向测序法检测血流感染的引物池、试剂盒及方法 |
CN113862263A (zh) * | 2021-12-01 | 2021-12-31 | 江苏为真生物医药技术股份有限公司 | 测序文库构建方法及应用 |
CN114015757A (zh) * | 2021-08-31 | 2022-02-08 | 廖端芳 | 检测融合基因的方法 |
CN114134219A (zh) * | 2021-12-14 | 2022-03-04 | 广州市金圻睿生物科技有限责任公司 | 一种多重核酸检测系统及其制备方法与应用 |
CN114134206A (zh) * | 2021-12-06 | 2022-03-04 | 武汉臻和医学检验实验室有限公司 | 一种ffpe样本rna文库及其构建方法 |
CN114214734A (zh) * | 2020-12-22 | 2022-03-22 | 深圳市睿法生物科技有限公司 | 一种单分子靶标基因建库方法及其试剂盒 |
CN114350782A (zh) * | 2021-12-31 | 2022-04-15 | 深圳市核子基因科技有限公司 | 一种基因突变位点的定位方法 |
CN114592035A (zh) * | 2022-03-21 | 2022-06-07 | 深圳金域医学检验实验室 | 基于不对称扩增的文库构建引物组及其应用 |
CN116790718A (zh) * | 2023-08-22 | 2023-09-22 | 迈杰转化医学研究(苏州)有限公司 | 一种多重扩增子文库的构建方法及其应用 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105821481A (zh) * | 2016-04-28 | 2016-08-03 | 元码基因科技(北京)有限公司 | 一种游离dna文库构建方法以及游离dna中低频突变的检测方法 |
CN106676182A (zh) * | 2017-02-07 | 2017-05-17 | 北京诺禾致源科技股份有限公司 | 一种低频率基因融合的检测方法及装置 |
CN106755454A (zh) * | 2017-01-06 | 2017-05-31 | 杭州杰毅麦特医疗器械有限公司 | 一种分子标签核酸检测方法 |
CN106811460A (zh) * | 2015-11-30 | 2017-06-09 | 安诺优达基因科技(北京)有限公司 | 用于低频突变检测的二代测序文库的构建方法及试剂盒 |
CN106834275A (zh) * | 2017-02-22 | 2017-06-13 | 天津诺禾医学检验所有限公司 | ctDNA超低频突变检测文库的构建方法、试剂盒及文库检测数据的分析方法 |
CN107058310A (zh) * | 2016-08-12 | 2017-08-18 | 艾吉泰康生物科技(北京)有限公司 | 一种提高基因低频突变检测灵敏度的扩增子文库构建方法 |
WO2018090373A1 (zh) * | 2016-11-21 | 2018-05-24 | 深圳华大智造科技有限公司 | 一种dna末端修复与加a的方法 |
CN108192955A (zh) * | 2018-01-17 | 2018-06-22 | 湖南大地同年生物科技有限公司 | 一种低频突变dna片段检测方法及文库建立方法 |
CN108251503A (zh) * | 2018-01-17 | 2018-07-06 | 湖南大地同年生物科技有限公司 | 一种快速构建链特异性rna高通量测序文库的方法 |
-
2019
- 2019-10-14 CN CN201910971050.7A patent/CN110656156A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106811460A (zh) * | 2015-11-30 | 2017-06-09 | 安诺优达基因科技(北京)有限公司 | 用于低频突变检测的二代测序文库的构建方法及试剂盒 |
CN105821481A (zh) * | 2016-04-28 | 2016-08-03 | 元码基因科技(北京)有限公司 | 一种游离dna文库构建方法以及游离dna中低频突变的检测方法 |
CN107058310A (zh) * | 2016-08-12 | 2017-08-18 | 艾吉泰康生物科技(北京)有限公司 | 一种提高基因低频突变检测灵敏度的扩增子文库构建方法 |
WO2018090373A1 (zh) * | 2016-11-21 | 2018-05-24 | 深圳华大智造科技有限公司 | 一种dna末端修复与加a的方法 |
CN106755454A (zh) * | 2017-01-06 | 2017-05-31 | 杭州杰毅麦特医疗器械有限公司 | 一种分子标签核酸检测方法 |
CN106676182A (zh) * | 2017-02-07 | 2017-05-17 | 北京诺禾致源科技股份有限公司 | 一种低频率基因融合的检测方法及装置 |
CN106834275A (zh) * | 2017-02-22 | 2017-06-13 | 天津诺禾医学检验所有限公司 | ctDNA超低频突变检测文库的构建方法、试剂盒及文库检测数据的分析方法 |
CN108192955A (zh) * | 2018-01-17 | 2018-06-22 | 湖南大地同年生物科技有限公司 | 一种低频突变dna片段检测方法及文库建立方法 |
CN108251503A (zh) * | 2018-01-17 | 2018-07-06 | 湖南大地同年生物科技有限公司 | 一种快速构建链特异性rna高通量测序文库的方法 |
Non-Patent Citations (2)
Title |
---|
刘亮伟等主编: "《基因工程原理与实验指导》", vol. 2010, 中国轻工业出版社, pages: 52 - 53 * |
苏琰等: "基于双启动寡聚核苷酸引物的PCR技术及其研究应用", 《基因组学与应用生物学》, vol. 37, no. 07, 25 July 2018 (2018-07-25), pages 2906 - 2912 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111379033A (zh) * | 2020-04-21 | 2020-07-07 | 深圳易倍科华生物科技有限公司 | 一种添加分子标签的多重pcr方法及建库仪器 |
CN112626189A (zh) * | 2020-04-24 | 2021-04-09 | 北京吉因加医学检验实验室有限公司 | 基因测序仪的短接头、双index接头引物和双index建库体系 |
CN113035271B (zh) * | 2020-12-22 | 2024-01-23 | 苏州奥根诊断科技有限公司 | 一种检测异源cfDNA的多重PCR引物设计、引物组及检测方法及其用途 |
CN113035271A (zh) * | 2020-12-22 | 2021-06-25 | 苏州奥根诊断科技有限公司 | 一种检测异源cfDNA的多重PCR引物设计、引物组及检测方法及其用途 |
CN114214734A (zh) * | 2020-12-22 | 2022-03-22 | 深圳市睿法生物科技有限公司 | 一种单分子靶标基因建库方法及其试剂盒 |
CN113025761A (zh) * | 2021-05-27 | 2021-06-25 | 广州赛哲生物科技股份有限公司 | 病原微生物鉴定的多重扩增配合高通量测序方法及试剂盒 |
CN113278717A (zh) * | 2021-06-10 | 2021-08-20 | 广州赛哲生物科技股份有限公司 | 一种靶向测序法检测血流感染的引物池、试剂盒及方法 |
CN113278717B (zh) * | 2021-06-10 | 2024-04-19 | 湖南赛哲智造科技有限公司 | 一种靶向测序法检测血流感染的引物池、试剂盒及方法 |
CN114015757A (zh) * | 2021-08-31 | 2022-02-08 | 廖端芳 | 检测融合基因的方法 |
CN114015757B (zh) * | 2021-08-31 | 2024-02-02 | 江门市灿明生物科技有限公司 | 检测融合基因的方法 |
CN113862263A (zh) * | 2021-12-01 | 2021-12-31 | 江苏为真生物医药技术股份有限公司 | 测序文库构建方法及应用 |
WO2023098492A1 (zh) * | 2021-12-01 | 2023-06-08 | 江苏为真生物医药技术股份有限公司 | 测序文库构建方法及应用 |
CN114134206B (zh) * | 2021-12-06 | 2023-11-24 | 武汉臻和医学检验实验室有限公司 | 一种ffpe样本rna文库及其构建方法 |
CN114134206A (zh) * | 2021-12-06 | 2022-03-04 | 武汉臻和医学检验实验室有限公司 | 一种ffpe样本rna文库及其构建方法 |
CN114134219A (zh) * | 2021-12-14 | 2022-03-04 | 广州市金圻睿生物科技有限责任公司 | 一种多重核酸检测系统及其制备方法与应用 |
CN114350782A (zh) * | 2021-12-31 | 2022-04-15 | 深圳市核子基因科技有限公司 | 一种基因突变位点的定位方法 |
CN114350782B (zh) * | 2021-12-31 | 2024-07-09 | 深圳市核子基因科技有限公司 | 一种基因突变位点的定位方法 |
CN114592035A (zh) * | 2022-03-21 | 2022-06-07 | 深圳金域医学检验实验室 | 基于不对称扩增的文库构建引物组及其应用 |
CN116790718A (zh) * | 2023-08-22 | 2023-09-22 | 迈杰转化医学研究(苏州)有限公司 | 一种多重扩增子文库的构建方法及其应用 |
CN116790718B (zh) * | 2023-08-22 | 2024-05-14 | 迈杰转化医学研究(苏州)有限公司 | 一种多重扩增子文库的构建方法及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110656156A (zh) | 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂 | |
JP5794572B2 (ja) | 核酸を修飾するためのトランスポゾン末端組成物及び方法 | |
Glenn et al. | Isolating microsatellite DNA loci | |
US9540687B2 (en) | DNA fragment detection method, DNA fragment detection kit and the use thereof | |
CN108018301B (zh) | 确定miR-27a基因的核心启动子及其内转录因子Myod结合位点的方法 | |
CN108192955B (zh) | 一种低频突变dna片段检测方法及文库建立方法 | |
CN114438184B (zh) | 游离dna甲基化测序文库构建方法及应用 | |
CN110603326B (zh) | 扩增靶核酸的方法 | |
CN111020031A (zh) | 序列特异性阻断剂结合特定pcr程序检测肿瘤基因突变的方法 | |
CN107475779A (zh) | 适用于单细胞rrbs测序的文库建立方法及其应用 | |
JP2015516814A (ja) | 標的化されたdnaの濃縮および配列決定 | |
CN110468211B (zh) | 膀胱癌肿瘤突变基因特异性引物、试剂盒和文库构建方法 | |
CN112941635A (zh) | 一种提高文库转化率的二代测序建库试剂盒及其方法 | |
CN110804652B (zh) | 一种快速检测dna的实时定量pcr的添加剂、试剂盒及反应方法 | |
US20150099670A1 (en) | Method of preparing post-bisulfite conversion DNA library | |
JP2012165755A (ja) | サブトラクション・ポリヌクレオチドの取得方法 | |
CN112626173A (zh) | Rna建库方法 | |
JP2023153732A (ja) | Dna配列の標的特異的rna転写のための方法 | |
CN113943763B (zh) | 一种还原核酸的方法及其检测方法 | |
CN112662763A (zh) | 一种检测常见两性癌症的探针组合物 | |
CN109971843B (zh) | 一种单细胞转录组的测序方法 | |
CN113667714B (zh) | 一种目标区域捕获方法、试剂盒及测序方法 | |
CN110452958B (zh) | 一种微量碎片化核酸甲基化检测的接头、引物、试剂盒及其应用 | |
US11174511B2 (en) | Methods and compositions for selecting and amplifying DNA targets in a single reaction mixture | |
CN113817723B (zh) | 一种多核苷酸及其标准品、试剂盒与用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200107 |
|
RJ01 | Rejection of invention patent application after publication |