CN112708665A - 用于肺癌多基因突变测序文库的构建方法与试剂盒 - Google Patents
用于肺癌多基因突变测序文库的构建方法与试剂盒 Download PDFInfo
- Publication number
- CN112708665A CN112708665A CN201911025079.2A CN201911025079A CN112708665A CN 112708665 A CN112708665 A CN 112708665A CN 201911025079 A CN201911025079 A CN 201911025079A CN 112708665 A CN112708665 A CN 112708665A
- Authority
- CN
- China
- Prior art keywords
- seq
- gene
- capture probe
- aiming
- sequence shown
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 53
- 206010058467 Lung neoplasm malignant Diseases 0.000 title claims abstract description 40
- 201000005202 lung cancer Diseases 0.000 title claims abstract description 40
- 208000020816 lung neoplasm Diseases 0.000 title claims abstract description 40
- 230000035772 mutation Effects 0.000 title claims description 24
- 238000010276 construction Methods 0.000 title abstract description 26
- 239000000523 sample Substances 0.000 claims abstract description 202
- 238000000034 method Methods 0.000 claims abstract description 42
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 29
- 239000000203 mixture Substances 0.000 claims description 26
- 206010064571 Gene mutation Diseases 0.000 claims description 20
- 101150105382 MET gene Proteins 0.000 claims description 18
- 239000012634 fragment Substances 0.000 claims description 18
- 238000012408 PCR amplification Methods 0.000 claims description 16
- 101150023956 ALK gene Proteins 0.000 claims description 9
- 101150039808 Egfr gene Proteins 0.000 claims description 9
- 101150054472 HER2 gene Proteins 0.000 claims description 9
- 101150105104 Kras gene Proteins 0.000 claims description 9
- 101150100676 Map2k1 gene Proteins 0.000 claims description 9
- 101150073096 NRAS gene Proteins 0.000 claims description 9
- 101150111783 NTRK1 gene Proteins 0.000 claims description 9
- 101150117329 NTRK3 gene Proteins 0.000 claims description 9
- 101150056950 Ntrk2 gene Proteins 0.000 claims description 9
- 101150063858 Pik3ca gene Proteins 0.000 claims description 9
- 101150077555 Ret gene Proteins 0.000 claims description 9
- 101150035397 Ros1 gene Proteins 0.000 claims description 9
- 101150048834 braF gene Proteins 0.000 claims description 9
- 108700021358 erbB-1 Genes Proteins 0.000 claims description 9
- 108700020302 erbB-2 Genes Proteins 0.000 claims description 9
- 238000000746 purification Methods 0.000 claims description 9
- 238000011002 quantification Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 abstract description 18
- 238000001514 detection method Methods 0.000 abstract description 12
- 230000035945 sensitivity Effects 0.000 abstract description 8
- -1 MET Proteins 0.000 abstract description 6
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 abstract description 5
- 206010069754 Acquired gene mutation Diseases 0.000 abstract description 5
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 abstract description 5
- 238000012217 deletion Methods 0.000 abstract description 5
- 230000037430 deletion Effects 0.000 abstract description 5
- 238000003780 insertion Methods 0.000 abstract description 5
- 230000037431 insertion Effects 0.000 abstract description 5
- 238000007481 next generation sequencing Methods 0.000 abstract description 5
- 230000037439 somatic mutation Effects 0.000 abstract description 5
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 abstract description 4
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 abstract description 4
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 abstract description 4
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 abstract description 4
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 abstract description 4
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 abstract description 4
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 abstract description 4
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 abstract description 4
- 102100030708 GTPase KRas Human genes 0.000 abstract description 3
- 102100039788 GTPase NRas Human genes 0.000 abstract description 3
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 abstract description 3
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 abstract description 3
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 abstract description 3
- 108010068342 MAP Kinase Kinase 1 Proteins 0.000 abstract description 3
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 abstract description 3
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 abstract description 3
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 abstract description 3
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 abstract description 3
- 239000013614 RNA sample Substances 0.000 abstract description 2
- 239000002699 waste material Substances 0.000 abstract description 2
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 126
- 238000006243 chemical reaction Methods 0.000 description 35
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 24
- 239000006228 supernatant Substances 0.000 description 19
- 239000000243 solution Substances 0.000 description 18
- 239000007788 liquid Substances 0.000 description 17
- 238000005406 washing Methods 0.000 description 17
- 239000011324 bead Substances 0.000 description 16
- 238000002156 mixing Methods 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 14
- 239000003153 chemical reaction reagent Substances 0.000 description 11
- 102000012410 DNA Ligases Human genes 0.000 description 8
- 108010061982 DNA Ligases Proteins 0.000 description 8
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 8
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 8
- 108010006785 Taq Polymerase Proteins 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 239000000872 buffer Substances 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 7
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 7
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 239000007853 buffer solution Substances 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 239000002981 blocking agent Substances 0.000 description 5
- 238000007664 blowing Methods 0.000 description 4
- 238000007480 sanger sequencing Methods 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000001179 sorption measurement Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 102000002576 MAP Kinase Kinase 1 Human genes 0.000 description 2
- 206010041067 Small cell lung cancer Diseases 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 239000007984 Tris EDTA buffer Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010009 beating Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000007847 digital PCR Methods 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 238000007403 mPCR Methods 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 208000000587 small cell lung carcinoma Diseases 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000002525 ultrasonication Methods 0.000 description 2
- 238000003260 vortexing Methods 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000005411 L01XE02 - Gefitinib Substances 0.000 description 1
- 239000005551 L01XE03 - Erlotinib Substances 0.000 description 1
- 239000002146 L01XE16 - Crizotinib Substances 0.000 description 1
- 229960001686 afatinib Drugs 0.000 description 1
- ULXXDDBFHOBEHA-CWDCEQMOSA-N afatinib Chemical compound N1=CN=C2C=C(O[C@@H]3COCC3)C(NC(=O)/C=C/CN(C)C)=CC2=C1NC1=CC=C(F)C(Cl)=C1 ULXXDDBFHOBEHA-CWDCEQMOSA-N 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000005576 amination reaction Methods 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960001602 ceritinib Drugs 0.000 description 1
- VERWOWGGCGHDQE-UHFFFAOYSA-N ceritinib Chemical compound CC=1C=C(NC=2N=C(NC=3C(=CC=CC=3)S(=O)(=O)C(C)C)C(Cl)=CN=2)C(OC(C)C)=CC=1C1CCNCC1 VERWOWGGCGHDQE-UHFFFAOYSA-N 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 229960005061 crizotinib Drugs 0.000 description 1
- KTEIFNKAUNYNJU-GFCCVEGCSA-N crizotinib Chemical compound O([C@H](C)C=1C(=C(F)C=CC=1Cl)Cl)C(C(=NC=1)N)=CC=1C(=C1)C=NN1C1CCNCC1 KTEIFNKAUNYNJU-GFCCVEGCSA-N 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 229960002465 dabrafenib Drugs 0.000 description 1
- BFSMGDJOXZAERB-UHFFFAOYSA-N dabrafenib Chemical compound S1C(C(C)(C)C)=NC(C=2C(=C(NS(=O)(=O)C=3C(=CC=CC=3F)F)C=CC=2)F)=C1C1=CC=NC(N)=N1 BFSMGDJOXZAERB-UHFFFAOYSA-N 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 229940121647 egfr inhibitor Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 229960001433 erlotinib Drugs 0.000 description 1
- AAKJLRGGTJKAMG-UHFFFAOYSA-N erlotinib Chemical compound C=12C=C(OCCOC)C(OCCOC)=CC2=NC=NC=1NC1=CC=CC(C#C)=C1 AAKJLRGGTJKAMG-UHFFFAOYSA-N 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 229960002584 gefitinib Drugs 0.000 description 1
- XGALLCVXEZPNRQ-UHFFFAOYSA-N gefitinib Chemical compound C=12C=C(OCCCN3CCOCC3)C(OC)=CC2=NC=NC=1NC1=CC=C(F)C(Cl)=C1 XGALLCVXEZPNRQ-UHFFFAOYSA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229960004066 trametinib Drugs 0.000 description 1
- LIRYPHYGHXZJBZ-UHFFFAOYSA-N trametinib Chemical compound CC(=O)NC1=CC=CC(N2C(N(C3CC3)C(=O)C3=C(NC=4C(=CC(I)=CC=4)F)N(C)C(=O)C(C)=C32)=O)=C1 LIRYPHYGHXZJBZ-UHFFFAOYSA-N 0.000 description 1
- 229940121358 tyrosine kinase inhibitor Drugs 0.000 description 1
- 239000005483 tyrosine kinase inhibitor Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种用于扩增肺癌驱动基因的捕获探针,其能够覆盖EGFR、ALK、ROS1、KRAS、BRAF、PIK3CA,HER2、RET、MET、NRAS、NTRK1‑3、MAP2K1等多个肺癌驱动基因的热点体细胞突变、插入缺失、结构变异与基因融合类型,且针对NTRK1‑3基因融合,目前国内未有二代测序文库覆盖该融合类型。该探针及制备的试剂盒相对于传统的PCR法对于靶向测序所使用的文库构建方法为杂交捕获法,可有效检出热点体细胞突变、插入缺失、结构变异与基因融合等多种变异类型,且对于多基因多位点的检测也有良好的均一性与灵敏度。而且,使用杂交捕获法进行文库构建仅需要使用DNA样本,对于基因融合的检测无需额外提取RNA样本,减少样本浪费,也无需考虑RNA质量对文库构建的影响。
Description
技术领域
本发明属于生物医学技术领域,特别涉及一种用于肺癌多基因突变测序文库的构建方法与试剂盒。
背景技术
肺癌每年在我国的发病约有78.1万例,死亡约有62.6万例,是目前我国发病率和死亡率均最高的癌症。基于组织病理学结果,肺癌分为小细胞肺癌(SCLC)和非小细胞肺癌(NSCLC),其中非小细胞肺癌占约80%。近年来,随着分子诊断技术不断发展与新型靶向药物陆续出现,非小细胞肺癌治疗已进入靶向治疗时代。
非小细胞肺癌驱动基因包括EGFR、ALK、ROS1、KRAS、BRAF、PIK3CA,HER2、RET、MET、NRAS、NTRK1-3、MAP2K1等多个基因,与肿瘤的发生、发展、药物疗效相关。目前国内已有多种针对非小细胞肺癌的靶向药物上市,包括EGFR酪氨酸激酶抑制剂(TKI)如吉非替尼、厄洛替尼、阿法替尼、奥希替尼,ALK与ROS1抑制剂克唑替尼等。此外,美国FDA上市NSCLC靶向药物还包括针对ALK融合的色瑞替尼、针对BRAF突变的达拉非尼与曲美替尼、针对NTRK融合的拉罗替尼等多种药物。针对HER2外显子20插入突变、RET融合与MET外显子14跳跃突变,美国国立综合癌症网络(NCCN)也推荐相关药物作为新的治疗选择。此外还有多种靶向药物正在进行临床试验。
目前市场上用于检测基因突变、扩增与融合等基因变异的方法主要包括Sanger测序法、荧光PCR法、液相芯片法、FISH法、IHC法等。然而这些方法均无法同时检出所有上述突变类型,且检测通量与灵敏度也不够高。下一代测序技术(NGS)可满足一次性平行对多样本多位点进行高通量检测的需求,其灵敏度与准确度高,且对于未知突变或融合类型也能检出,更适用于肺癌驱动基因多种基因变异类型检测的应用。目前国内已有几个基于NGS平台的肺癌驱动基因检测的同类产品,然而这些产品检测变异类型与位点相对较少,针对多基因的覆盖度、捕获率及均一性均有待提高,尤其是未有产品检测范围覆盖FDA新上市的抗癌药物拉罗替尼的靶点NTRK1-3的基因融合。
目前市面上对于靶向测序所使用的文库构建方法多为多重PCR法,随着检测位点增加,所需引物数量增加,由于各PCR反应相互竞争,导致均一性下降,甚至部分位点难以检出。且对于基因融合,多重PCR法需使用mRNA进行文库构建,RNA的质量与保存时间也对文库质量存在影响;此外,使用多重PCR法所构建的文库也无法检出基因扩增/缺失等结构变异。
发明内容
基于此,本发明的目的在于提供一种肺癌多基因突变测序文库的构建方法与试剂盒,以实现应用于二代测序的靶向捕获时,具有覆盖度高、捕获率高、均一性好等特点。
为实现上述目的,本发明具体技术方案如下:
一种用于肺癌多基因突变测序的捕获探针,包括如下至少一个基因的捕获探针:
序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针;
序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针;
序列如SEQ ID NO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针;
序列如SEQ ID NO.15-SEQ ID NO.16所示的至少一条针对MAP2K1基因的捕获探针;
序列如SEQ ID NO.17-SEQ ID NO.25所示的至少一条针对ALK基因的捕获探针;
序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针;
序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针;
序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针;
序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;
序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;
序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针;
序列如SEQ ID NO.66-SEQ ID NO.70所示的至少一条针对HER2基因的捕获探针;
序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针;
序列如SEQ ID NO.73-SEQ ID NO.75所示的至少一条针对NTRK2基因的捕获探针;
序列如SEQ ID NO.76-SEQ ID NO.77所示的至少一条针对NTRK3基因的捕获探针。
本发明还提供一种用于肺癌多基因突变测序的试剂盒,具体技术方案如下:
一种用于肺癌多基因突变测序的试剂盒,包括如上所述的用于肺癌多基因突变测序的捕获探针和接头混合物。
本发明还提供一种非诊断目的构建肺癌多基因突变测序文库的方法,具体技术方案如下:
一种非诊断目的构建肺癌多基因突变测序文库的方法,包括以下步骤:
对DNA样本末端修复加尾、接头连接,得预文库;
对所述预文库进行PCR扩增、纯化、定量;
加入如上所述的捕获探针,杂交;
靶向捕获,得靶向捕获文库;
对所述靶向捕获文库进行PCR扩增、纯化、定量,得肺癌多基因突变测序文库。
基于上述技术方案,本发明具有以下有益效果:
本发明中用于扩增肺癌驱动基因的捕获探针,其能够覆盖EGFR、ALK、ROS1、KRAS、BRAF、PIK3CA,HER2、RET、MET、NRAS、NTRK1-3、MAP2K1等多个肺癌驱动基因的热点体细胞突变、插入缺失、结构变异与基因融合类型,且针对NTRK1-3基因融合,目前国内未有二代测序文库覆盖该融合类型。
本发明所述的文库构建方法与试剂盒,相对于传统的PCR法对于靶向测序所使用的文库构建方法为杂交捕获法,可有效检出热点体细胞突变、插入缺失、结构变异与基因融合等多种变异类型,且对于多基因多位点的检测也有良好的均一性与灵敏度。而且,使用杂交捕获法进行文库构建仅需要使用DNA样本,对于基因融合的检测无需额外提取RNA样本,减少样本浪费,也无需考虑RNA质量对文库构建的影响。
附图说明
图1为构建肺癌驱动基因的多基因测序文库的流程示意图。
具体实施方式
为了便于理解本发明,下面将参照实施例对本发明进行更全面的描述,以下给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。应理解,下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用试剂,均为市售产品。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本发明的一种用于肺癌多基因突变测序的捕获探针,其特征在于,包括如下至少一个基因的捕获探针:
序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针;序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针;序列如SEQ IDNO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针;序列如SEQ ID NO.15-SEQID NO.16所示的至少一条针对MAP2K1基因的捕获探针;序列如SEQ ID NO.17-SEQ IDNO.25所示的至少一条针对ALK基因的捕获探针;序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针;序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针;序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针;序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针;序列如SEQID NO.66-SEQ ID NO.70所示的至少一条针对HER2基因的捕获探针;序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针;序列如SEQ ID NO.73-SEQ IDNO.75所示的至少一条针对NTRK2基因的捕获探针;序列如SEQ ID NO.76-SEQ ID NO.77所示的至少一条针对NTRK3基因的捕获探针。
在其中一些实施例中,包括如下捕获探针:序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针;和序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针;和序列如SEQ ID NO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针;和序列如SEQ ID NO.15-SEQ ID NO.16所示的至少一条针对MAP2K1基因的捕获探针;和序列如SEQ ID NO.17-SEQ ID NO.25所示的至少一条针对ALK基因的捕获探针;和序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针;和序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针;和序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针;和序列如SEQID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;和序列如SEQ IDNO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;和序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针;和序列如SEQ ID NO.66-SEQ IDNO.70所示的至少一条针对HER2基因的捕获探针;和序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针;和序列如SEQ ID NO.73-SEQ ID NO.75所示的至少一条针对NTRK2基因的捕获探针;和序列如SEQ ID NO.76-SEQ ID NO.77所示的至少一条针对NTRK3基因的捕获探针。
在其中一些实施例中,包括如下至少一个基因的捕获探针:序列如SEQ ID NO.1-SEQ ID NO.2所示的针对NRAS基因的捕获探针;序列如SEQ ID NO.2-SEQ ID NO.10所示的针对RET基因的捕获探针;序列如SEQ ID NO.11-SEQ ID NO.14所示的针对KRAS基因的捕获探针;序列如SEQ ID NO.15-SEQ ID NO.16所示的针对MAP2K1基因的捕获探针;序列如SEQID NO.17-SEQ ID NO.25所示的针对ALK基因的捕获探针;序列如SEQ ID NO.26-SEQ IDNO.32所示的针对PIK3CA基因的捕获探针;序列如SEQ ID NO.33-SEQ ID NO.42所示的针对ROS1基因的捕获探针;序列如SEQ ID NO.43-SEQ ID NO.53所示的针对EGFR基因的捕获探针;序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针;序列如SEQ IDNO.54-SEQ ID NO.59所示的针对MET基因的捕获探针;序列如SEQ ID NO.60-SEQ ID NO.65所示的针对BRAF基因的捕获探针;序列如SEQ ID NO.66-SEQ ID NO.70所示的针对HER2基因的捕获探针;序列如SEQ ID NO.71-SEQ ID NO.72所示的针对NTRK1基因的捕获探针;序列如SEQ ID NO.73-SEQ ID NO.75所示的针对NTRK2基因的捕获探针;序列如SEQ IDNO.76-SEQ ID NO.77所示的针对NTRK3基因的捕获探针。
优选地,包括如下捕获探针:序列如SEQ ID NO.1-SEQ ID NO.2所示的针对NRAS基因的捕获探针;和序列如SEQ ID NO.2-SEQ ID NO.10所示的针对RET基因的捕获探针;和序列如SEQ ID NO.11-SEQ ID NO.14所示的针对KRAS基因的捕获探针;和序列如SEQ IDNO.15-SEQ ID NO.16所示的针对MAP2K1基因的捕获探针;和序列如SEQ ID NO.17-SEQ IDNO.25所示的针对ALK基因的捕获探针;和序列如SEQ ID NO.26-SEQ ID NO.32所示的针对PIK3CA基因的捕获探针;和序列如SEQ ID NO.33-SEQ ID NO.42所示的针对ROS1基因的捕获探针;和序列如SEQ ID NO.43-SEQ ID NO.53所示的针对EGFR基因的捕获探针;和序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针;和序列如SEQ ID NO.54-SEQID NO.59所示的针对MET基因的捕获探针;和序列如SEQ ID NO.60-SEQ ID NO.65所示的针对BRAF基因的捕获探针;和序列如SEQ ID NO.66-SEQ ID NO.70所示的针对HER2基因的捕获探针;和序列如SEQ ID NO.71-SEQ ID NO.72所示的针对NTRK1基因的捕获探针;和序列如SEQ ID NO.73-SEQ ID NO.75所示的针对NTRK2基因的捕获探针;和序列如SEQ IDNO.76-SEQ ID NO.77所示的针对NTRK3基因的捕获探针。
更优选地,所述捕获探针序列经过修饰。进一步优选地,所述修饰的方法为生物素标记。
本发明的一种用于肺癌多基因突变测序的试剂盒,其特征在于,包括如上任一项所述的用于肺癌多基因突变测序的捕获探针和接头混合物。
优选地,所述捕获探针的工作浓度为0.4pM-0.8pM。
优选地,所述接头混合物包括:P5接头和P7接头。
优选地,所述P5接头上包含有i5index片段与测序引物片段。
优选地,所述P7接头上包含有i7index片段、测序引物片段与分子条形码片段。
更优选地,所述分子条形码片段的核苷酸序列长度为8-10nt。
进一步优选地,所述分子条形码片段的序列为:NVNNDNHNN(SEQ ID NO.78)。
其中,N为简并碱基,对应A/T/C/G;V为简并碱基,对应G/A/C;D为简并碱基,对应G/A/T;H为简并碱基,对应A/T/C。
所述接头序列可去人不同样本来源的子文库,并通过分子条形码片段消除PCR扩增错误与测序错误导致的假阳性从而提高检测灵敏度。不同DNA样本来源的文库构建对应使用不同的接头混合物,每种接头混合物中P5/P7接头的i5/i7index序列各不相同,且i5/i7index序列组合方式唯一。
本发明的文库构建方法所构建的文库所带有的测序引物序列与i5/i7index序列可应用于Illumina公司NextSeq 500等市面上多种常用的二代测序平台。且每一条片段化DNA加上接头之后带有唯一的UMI标签,使其在测序结果处理中可过滤去除存在PCR扩增错误或测序错误的reads(序列),确保有效reads能真实反映样本DNA的序列信息,降低测出假阳性结果的可能性,从而提高检出灵敏度。
优选地,所述接头混合物中每个接头的工作浓度为140μM-160μM。更优选地,所述接头混合物中每个接头的工作浓度为145μM-155μM。进一步优选为150μM。
更优选地,所述接头的核苷酸序列经修饰。进一步优选地,所述修饰为反向dT、间臂、磷酸化、氨基化、硫代磷酸化中的一种或多种。
优选地,所述试剂盒还包含有末端修复加尾反应体系,包括末端修复加尾酶。
具体地,所述末端修复加尾反应体系包括以下组分:T4DNA连接酶、T4多聚核苷酸激酶与Taq DNA聚合酶。
优选地,所述末端修复加尾反应体系包括以下组分:T4DNA连接酶4U-6U、T4多聚核苷酸激酶9U-11U与Taq DNA聚合酶4U-6U。
更优选地,所述末端修复加尾反应体系包括以下组分:T4DNA连接酶4.5U-5.5U、T4多聚核苷酸激酶9.5U-10.5U与Taq DNA聚合酶4.5U-5.5U。
进一步优选地,所述末端修复加尾反应体系包括以下组分:T4DNA连接酶5U、T4多聚核苷酸激酶10U与Taq DNA聚合酶5U。
本发明的一种非诊断目的构建肺癌多基因突变测序文库的方法,包括以下步骤:
对DNA样本末端修复加尾、接头连接,得预文库;
对所述预文库进行PCR扩增、纯化、定量;
加入如上任一项所述的捕获探针,杂交;
靶向捕获,得靶向捕获文库;
对所述靶向捕获文库进行PCR扩增、纯化、定量,得肺癌多基因突变测序文库。
优选地,所述DNA样本包括:由细胞、组织、FFPE、血浆、肺泡灌洗液等样本中提取的DNA。
其中,当DNA样本为由细胞、组织、FFPE中提取的DNA时,在对DNA样本末端修复加尾前,还需对DNA样本进行片段化处理。当DNA样本为由血浆、肺泡灌洗液中提取的DNA时,无需进行样本DNA片段化。
优选地,所述样本DNA起始量为50-1000ng。在一些实施例中,所述样本DNA起始量为50ng、100ng、200ng、300ng或500ng。
优选地,所述样本DNA片段化,其方法为:超声破碎法和/或酶切法。更优选为超声破碎法。
优选地,所述对DNA样本末端修复加尾的反应体系为:DNA样本45-55μL、末端修复加尾缓冲液5-10μL、末端修复加尾酶1.5-2.5μL。
更优选地,末端修复加尾酶包括以下组分:T4DNA连接酶、T4多聚核苷酸激酶与TaqDNA聚合酶。更优选为:T4DNA连接酶4U-6U、T4多聚核苷酸激酶9U-11U与Taq DNA聚合酶4U-6U。进一步优选为:T4DNA连接酶4.5U-5.5U、T4多聚核苷酸激酶9.5U-10.5U与Taq DNA聚合酶4.5U-5.5U。
优选地,所述对DNA样本末端修复加尾的反应程序为:于18-22℃反应28-32min、于65-75℃反应18-22min。
优选地,所述接头连接的反应体系为:如上所述末端修复加尾反应的产物58-62μL、接头混合物4.5-5.5μL、连接缓冲液18-22μL、连接酶4.5-5.5μL,加水至90μL。
优选地,所述接头连接的反应程序为:于18-22℃反应13-17min。
优选地,对所述预文库进行PCR扩增的反应程序如下:
优选地,所述加入捕获探针杂交的反应体系为:杂交缓冲液8-12μL、捕获探针7-9μL、封闭剂1.5-2.5μL、加水至19-21μL。
本发明以下实施例中所用的试剂,包括:末端修复加尾缓冲液、连接缓冲液、连接酶、PCR扩增反应液、封闭剂1、杂交缓冲液、封闭剂2、洗涤液1、洗涤液2、洗涤液3、洗涤液4、磁珠清洗液、杂交缓冲液等,均为IDT公司产品。主要有xGen Hybridization and Wash Kit和缓冲液Buffers。
实施例1
一种检测肺癌多基因体细胞突变与基因融合试剂盒,包含捕获探针混合物、接头混合物与末端修复与加尾反应体系。捕获探针序列如下:
表1 捕获探针序列
所述接头混合物组合,其特征为不同DNA样本来源的文库构建使用不同的接头混合物,每种接头混合物中P5/P7接头的i5/i7index序列各不相同,且i5/i7index序列组合方式唯一。其中各接头混合物中,每种接头的工作浓度为150μM。针对不同样本的文库构建,应使用不同的接头混合物。
所述末端修复与加尾反应体系,包括末端修复与加尾酶,其组分包括:5U T4DNA连接酶、10U T4多聚核苷酸激酶与5U Taq DNA聚合酶。
例如在实施例5中,针对7例样本,接头序列如下表所示:
表2 接头序列
实施例2
使用实施例1所述试剂盒进行样本检测。
一、样本DNA片段化
本实施例中,使用CovarisTM DNA超声破碎仪将DNA样本片段化至150-400bp,也可选择酶切法进行DNA片段化。
二、末端修复加尾:
按比例配置反应体系如表3。
表3 末端修复加尾反应体系
试剂 | 用量 |
片段化的DNA | 50μl |
末端修复加尾缓冲液 | 8μl |
末端修复加尾酶 | 2μl |
Total | 60μl |
混匀并瞬时离心,按表4的程序进行反应。
表4 末端修复加尾反应程序
温度 | 时间 |
20℃ | 30min |
70℃ | 20min |
4℃ | ∞ |
三、接头连接
配置反应体系,如表5所示。
表5 接头连接反应体系
试剂 | 用量 |
上一步反应产物 | 60μl |
接头混合物* | 5μl |
连接缓冲液 | 20μl |
连接酶 | 5μl |
Total | 90μl |
*不同样本应使用不同接头混合物。
混匀并瞬时离心,按表6的程序进行反应。
表6 接头连接反应程序
温度 | 时间 |
20℃ | 15min |
4℃ | ∞ |
四、连接产物纯化。
1)样品纯化磁珠提前取出,室温静置30min;
2)向上步PCR管的反应产物中加入45μl样品纯化磁珠,混匀,25℃孵育10min;
3)将PCR管短暂离心后置于磁力架上至液体完全澄清,小心弃去上清;
4)沿管壁缓慢加入200μl 80%乙醇,静置30s,小心弃去上清;
5)重复步骤4)一次;
6)将PCR管瞬时离心并置于磁力架上,小心吸走残留乙醇,室温干燥至乙醇挥发完全;
7)取下PCR管,加入26μl无核酸酶水,均匀悬浮磁珠,室温孵育2min;
8)将PCR管置于磁力架上至液体完全澄清,吸取20μl上清至新的PCR管中,置于冰上备用。
五、预文库PCR扩增
配置反应体系(表7)。
表7 预文库扩增反应体系
试剂 | 用量 |
片段筛选产物 | 25μl |
2×PCR扩增反应液 | 25μl |
Total | 50μl |
混匀并瞬时离心,扩增反应(程序如表8)。
表8 预文库扩增反应程序
六、预文库纯化与定量
1)向PCR管中加入等体积样品纯化磁珠,室温孵育10min。
2)将PCR管短暂离心后置于磁力架上至液体完全澄清,小心弃去上清。
3)沿管壁缓慢加入200μl 80%乙醇,静置30s,小心弃去上清。
4)重复步骤3)一次。
5)将PCR管瞬时离心并置于磁力架上,小心吸走残留乙醇,室温干燥至乙醇挥发完全。
6)向管中加入20μl TE buffer,室温孵育2min。
7)瞬间离心并将PCR管置于磁力架上至液体完全澄清,小心吸取上清至新的PCR管中。
8)用Qubit 4.0定量。
9)进行琼脂糖凝胶电泳或使用Bioanalyzer(Agilent)进行片段检测。
七、探针杂交
1)按表9将各组分混合于1.5mL低吸附离心管。
表9 文库混合体系
试剂 | 用量 |
上步纯化的预文库(1-12个) | 500ng/预文库 |
封闭剂1 | 7.5μl |
2)加入2倍体积的样本纯化磁珠;
3)涡旋混匀,25℃孵育10min;
4)将离心管置于磁力架上至液体完全澄清,小心弃去上清;
5)沿管壁小心加入大于1倍体积的80%乙醇,静置30s,弃去上清;
6)重复步骤4)一次;
7)短暂离心后将离心管置于磁力架上,吸弃残留乙醇,室温干燥至乙醇完全挥发;
8)按表10配置杂交反应液,加入离心管中;
表10 杂交反应体系
试剂 | 用量 |
杂交缓冲液 | 10μl |
捕获探针混合物 | 8μl |
封闭剂2 | 2μl |
Total | 20μl |
9)涡旋混匀,室温孵育5min;
10)将离心管置于磁力架上5-10min至液体完全澄清,使用移液器转移18μl上清至新的PCR管,按表11的程序进行杂交反应。
表11 杂交反应程序
温度 | 时间 |
95℃ | 10min |
60℃ | 12-16h |
八、文库靶向捕获
1)按表12稀释下列试剂;
表12 各试剂稀释配方
所需体积(μl) | 加入NF水体积(μl) | |
洗涤液1 | 176 | 176 |
洗涤液2 | 277 | 31 |
洗涤液3 | 158 | 18 |
洗涤液4 | 158 | 18 |
磁珠清洗液 | 317 | 35 |
2)分装洗涤液1 120μl与洗涤液4 330μl至PCR管中,置于60℃孵育备用;
3)按表13配置磁珠悬浮液;
表13 磁珠悬浮液
试剂 | 用量 |
杂交缓冲液 | 12μl |
无核酸酶水 | 5μl |
Total | 17μl |
4)将链霉亲和素磁珠旋涡混匀,吸取500μl磁珠至1.5mL低吸附管中;
5)加入100μl磁珠洗涤液,轻柔吹打混匀,瞬时离心,置于磁力架上至液体完全澄清,吸弃上清,将离心管移出磁力架;
6)重复步骤4)2次;
7)向离心管中加入17μl磁珠悬浮液,轻柔吹打混匀,将全部磁珠悬浮液转移至1个新的低吸附PCR管;
8)杂交反应后,调整PCR仪热盖温度为70℃;
9)将重悬的链霉亲和素磁珠加到杂交体系中,涡旋混匀;
10)60℃孵育45min,每10-12min轻柔涡旋一次,确保完全重悬;
11)孵育结束后取下PCR管,加入100μl 60℃孵育的洗涤液1,吹打混匀;
12)将PCR管置于磁力架上至液体完全澄清,吸弃上清;
13)将PCR管取下,加入150μl洗涤液4,吹打混匀,60℃孵育5min;
14)重复步骤11)和12)一次;
15)将PCR管瞬时离心,置于磁力架上至液体完全澄清,吸弃上清,加入150μl室温的洗涤液1,涡旋混匀,室温孵育2min;
16)将PCR管瞬时离心,置于磁力架上至液体完全澄清,吸弃上清,加入150μl室温的洗涤液2,涡旋混匀,室温孵育2min;
17)将PCR管瞬时离心,置于磁力架上至液体完全澄清,吸弃上清,加入150μl室温的洗涤液3,涡旋混匀,室温孵育2min;
18)将PCR管瞬时离心,置于磁力架上至液体完全澄清,吸弃上清,用10μl吸头吸弃残留液体;
19)取下PCR管,加入25μl无核酸酶水,吹打混匀,将所有液体移至新的PCR管中。
九、PCR扩增靶向捕获文库
1)按表14配置PCR体系:
表14 PCR扩增靶向捕获文库反应体系
试剂 | 用量 |
2×PCR扩增反应液 | 25μl |
上一步捕获产物 | 25μl |
Total | 50μl |
2)按表15的程序进行PCR反应;
表15 PCR扩增靶向捕获文库反应程序
十、文库纯化与定量
1)PCR完成后,取出PCR管置于磁力架上至完全澄清,转移上清至一新的PCR管;
2)向管中加入60μl纯化磁珠,涡旋混匀,室温孵育10min;
3)瞬间离心后,将PCR管置于磁力架上至完全澄清,弃去上清;
4)沿管壁加入150μl 80%乙醇,静置1min,吸弃上清;
5)重复步骤4)一次;
6)将PCR管瞬间离心并置于磁力架上至完全澄清,用10μl吸头吸弃残留乙醇;
7)打开管盖室温干燥至乙醇挥发完全;
8)取下PCR管,加入25μl TE buffer,室温孵育5min;
9)将PCR管置于磁力架上至完全澄清,小心转移上清至一个新的PCR管;
10)使用Qubit对文库进行定量。
十一、文库测序与结果分析
本实施例针对20个DNA样本进行了文库构建,并将所构建文库进行混合、上机测序与数据分析,结果表明(见表16),所有样本的检测数据Q30>80%,平均深度>500×,覆盖度高,捕获效率高,均一性好,说明使用本发明的文库构建方法可构建出高质量的测序文库。
表16 样本数据质量
序号 | 样本编号 | Q30/% | 平均测序深度/× | 覆盖度/% | 捕获效率/% | 均一性/% |
1 | 144912 | 89.94 | 731.14 | 100 | 83.75 | 97.03 |
2 | 134323 | 88.4 | 751.62 | 100 | 82.08 | 97.29 |
3 | 149282 | 88.29 | 743.46 | 100 | 83.04 | 97.07 |
4 | 134453 | 86.15 | 770.79 | 100 | 84.83 | 98.01 |
5 | 137541 | 89.46 | 738.95 | 100 | 83.21 | 98.46 |
6 | 130832 | 85.21 | 728.02 | 100 | 75.01 | 98.56 |
7 | 145363 | 88.62 | 766.78 | 100 | 80.88 | 98.58 |
8 | 136859 | 88.53 | 754.54 | 100 | 76.59 | 97.62 |
9 | 139172 | 88.82 | 754.89 | 100 | 84.59 | 97.94 |
10 | 131198 | 86.98 | 771.08 | 100 | 79.29 | 97.55 |
11 | 147038 | 89.02 | 745.19 | 100 | 84.77 | 97.14 |
12 | 148786 | 85.42 | 736.02 | 100 | 83.94 | 98.63 |
13 | 131685 | 86.69 | 736.27 | 100 | 78.68 | 98.02 |
14 | 147869 | 88.85 | 763.54 | 100 | 80.44 | 97.96 |
15 | 131258 | 87.54 | 736.10 | 100 | 78.15 | 97.92 |
实施例3不同来源DNA样本对文库测序结果的影响
选择30例来源于石蜡组织切片、新鲜组织或血浆的DNA样本,包括经Sanger测序/FISH法/数字PCR法验证过的20例存在基因变异阳性的样本与10例检测范围内基因变异阴性的样本,使用实施例1的试剂盒,按照实施例2的方法进行文库构建,并进行测序分析,结果表明(见表17):使用本发明的方法对不同来源的DNA样本进行文库构建并测序,其定性结果与Sanger测序或FISH等金标准检验结果完全一致,稳定可靠。
表17 不同来源DNA样本构建文库测序结果
实施例4不同样本DNA起始量对文库构建的影响
选择6例经Sanger测序验证突变类型不同的样本,使用实施例1的试剂盒,按实施例2的方法,分别加入50ng,100ng,200ng,500ng,1000ng样本DNA进行文库构建,结果表明(如表18),构建文库的样本核酸浓度低至50ng时,使用本发明所提供的文库构建试剂盒与构建方法仍可正确检测出相应突变,且使用不同起始量的DNA所构建的文库所测得突变率接近。
表18 不同核酸浓度样本文库构建检测结果
实施例5灵敏度验证
选择7例突变类型不同、经数字PCR确定突变率的样本,用野生型样本混合成突变率为0.5%、1%、2%的样本,使用实施例1的试剂盒,按实施例2的方法进行文库构建并上机测序,结果表明(如表19):本发明所提供的文库构建试剂盒与构建方法可正确检出相应突变类型,且所测突变率与理论值接近。
表19 灵敏度测试结果
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对以上实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 益善生物技术股份有限公司
<120> 用于肺癌多基因突变测序文库的构建方法与试剂盒
<160> 91
<170> SIPOSequenceListing 1.0
<210> 1
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aatgcataac aacaaagaat atgaatatgg atcacatctc taccagagtt aatcaactga 60
tgcaaactct tgcacaaatg ctgaaagctg taccatacct gtctggtctt ggctgaggtt 120
<210> 2
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tcaatgaatg gaatcccgta actcttggcc agttcgtggg cttgttttgt atcaactgtc 60
cttgttggca aatcacactt gtttcccact agcaccatag gtacatcatc cgagtctttt 120
<210> 3
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tgctgctgct gccgctgcta ggcaaaggtg agttctgccg gccgccggct cccgcagggg 60
ccagggcgaa gttggcgccg agcagcggag cgggcgcgtt cagaagcgcc tttctgtttg 120
<210> 4
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gaaaaactcc tgctaagatc ggaattttaa attaatgatt tttttttttt ttgtccttga 60
agaagcctta ttctcaccat ccctcactca cttccctact tcccacagtg gcattgggcc 120
<210> 5
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tctacttctc gagggatgct tactgggaga agctgtatgt ggaccaggca gccggcacgc 60
ccttgctgta cgtccatgcc ctgcgggacg cccctgagga ggtgcccagc ttccgcctgg 120
<210> 6
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gccagcatct ctacggcacg taccgcacac ggctgcatga gaacaactgg atctgcatcc 60
aggaggacac cggcctcctc taccttaacc ggagcctgga ccatagctcc tgggagaagc 120
<210> 7
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tcagtgtccg cagtaaggga gccgccccaa cacccacccc gtgccccacc ccaccccttc 60
ctcaagccgc ccttatcaca gccgctgaca ctgaagcttg gcatggcttc ccccccaccg 120
<210> 8
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gggtttacac cagccctgga gctcctgcct cctccccatt cccgactgcc tggcagatgt 60
ggccgatgcc cccacagacc tgacttctct ctgcagaccg cggctttccc ctgctcaccg 120
<210> 9
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gcctggagag agtcctgtac cactcacgag agctgatggc actaacactg ggtttccaag 60
atatccaaat gatagtgtat atgctaactg gatgctttca ccctcagcgg caaaattaat 120
<210> 10
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ggacacgttt gatagttaac atttctttgt gaaaggtaat ggactcacaa ggggaagaaa 60
catgctgaga atggaaagtc taccggccct ttctttgtga acgtcacatt ggccgagccg 120
<210> 11
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tgctgtctac tatagctcat atctttttct ccctactaaa aaaaaaaaaa aaaaaaaaaa 60
agctgctgat tatctcaaaa cttttccctt aaaaataaag gtaaatatca gtttccaaat 120
<210> 12
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
atttagttta cttaagactc attaaatcat tagactttat gccaaatata gattagtcta 60
ctacagccat caaaattgtc tcaattataa ttaattccca ctagattaaa aataaatgta 120
<210> 13
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ctaattatgg aaacaagttt cttatctttt aatacttcaa gttagaatac tacacctaag 60
tagttctaaa gtggttgcca ccttgttacc tttaaaagac atctgctttc tgccaaaatt 120
<210> 14
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aatgtgctga acttaaactt accagattac attataatgc attttttaat tttcacacag 60
ccaggagtct tttcttcttt gctgattttt ttcaatctgt attgtcggat ctccctcacc 120
<210> 15
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
cctccctctt tctttcataa aacctctctt tcttccacct ttctccagct aattcatctg 60
gagatcaaac ccgcaatccg gaaccagatc ataagggagc tgcaggttct gcatgagtgc 120
<210> 16
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aactctccgt acatcgtggg cttctatggt gcgttctaca gcgatggcga gatcagtatc 60
tgcatggagc acatggtatg tgacaccctc tcagcctctg gagcaatggc cttaagagtt 120
<210> 17
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tttggtctct ggtttgtgaa ggagccattg cctctctctc ctccacggtc ttagggatcc 60
caaggaagag aagtgagtgt gcgaccgagc tcagggccca ggctggttca tgctattctt 120
<210> 18
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gcttttcaga atggtatcct cgtaatgacc agctccaggg gcagtagcgg cttctaaggg 60
caagccctgt tgctggtagc cgtaattgac attcccacaa gggaagtgac gtagcctgaa 120
<210> 19
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cagaggtacc tccttcatat tggcagtcag cgaagagggc tctaggagca gtgaggcccc 60
cggaagtctc ccagttgcaa cgttaggtgg gacagtacag cttccctcca gccccaggtt 120
<210> 20
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
acccctgtcg tgtggctcct tctttgctat aggattattc tttttggtgg gtttctctgt 60
aaaccaggag ccgtacgttg ggttccacaa gctggtgggc ttgtttctgg atccgtggac 120
<210> 21
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
cttgtgcaac tccgaaggag ggttggactg agagaatgcc atattcacgt gtcccccttc 60
cacggccggc cctctaggga ctcgaacaga gatctctgca gctgtgggtt tctttgcagc 120
<210> 22
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
cttgccagag gaggtggtag gcagaggtgg tggggcagct gggctgcgct cctcctcccg 60
ttttgcctgt tgagagacca ggagaggagg aaccccctca gggtccttgg gcctcacagg 120
<210> 23
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cactttctct tcctcttcca caagtggacc atattctatc ggcaaagcgg tgttgattac 60
atccgggtcc tgccgtaggg gaaattatta aaactttgaa tcagagacaa aaaatgttg 119
<210> 24
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
catatttcgg tatttgccat ctttaagact gtttcatata gagtaaatgt tgaccaaagg 60
gagaaaatgt tttacctggg tgcagtattc aatcctctcc aaaatgatgg caaagttggg 120
<210> 25
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
cctgtcttca ggctgatgtt gccagcactg agtcattatc cggtatctaa aagaagaagc 60
acattaatta aaataaggag aagcacaatg atgaaaaata tattttcttc cagccccagg 120
<210> 26
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ggacaaccat acatctaatt ccttaaagta gttttatatg taaaacttgc aaagaatcag 60
aacaatgcct ccacgaccat catcaggtga actgtggggc atccacttga tgcccccaag 120
<210> 27
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
aatcctagta gaatgtttac taccaaatgg aatgatagtg actttagaat gcctccgtga 60
ggctacatta ataaccataa agcatgaact atttaaagaa gcaagaaaat accccctcca 120
<210> 28
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tcaacttctt caagatgaat cttcttacat tttcgtaagt gttactcaag aagcagaaag 60
ggaagaattt tttgatgaaa caagacgact ttgtgacctt cggctttttc aacccttttt 120
<210> 29
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
aaaagtaatt gaaccagtag gcaaccgtga agaaaagatc ctcaatcgag aaattggtat 60
gatacaatat cctattctaa aatgcaaata accataaagc ttaactgttg tccctttcta 120
<210> 30
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
ttattgtgat cttccaaatc tacagagttc cctgtttgca aaaaaaacat gttcatgctg 60
tgtatgtaat agaatgttat attctttatg taattttatt aaaggttttg ctatcggcat 120
<210> 31
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gccagtgtgt gaatttgata tggttaaaga tccagaagta caggacttcc gaagaaatat 60
tctgaacgtt tgtaaagaag ctgtggatct tagggacctc aattcacctc atagtagagc 120
<210> 32
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
aatgtatgtc tatcctccaa atgtagaatc ttcaccagaa ttgccaaagc acatatataa 60
taaattagat aaaggtaaga aaatgactaa tctactctaa tcattactat agtgcagtc 119
<210> 33
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
acatttatca ttctagcaga gttttctttc agtaactact gaatgagagt gtttatctca 60
actctctatt tcccaaacaa cgctattaat cagacccatc tccatatcca ctgtgagtga 120
<210> 34
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gacaggcata gttcaggcct tcaggcttgc cagaagggca gtaagccact tgtttttctt 60
ggcagaaatc tttgtctgca tgtggttcct tctcttcttt cctcagacca caagattcag 120
<210> 35
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
attcctggga gcctagagga ccctcagact tttcttcacc ttggccacat tctgtagcaa 60
gtaccatata gtttaaccct tctcggttct tcgtttccat taaagcaact ggcataatgt 120
<210> 36
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
catctgaatt caaacaaatc acatcgccat cttcacctgt gaaaaaaata tgaatgttat 60
tctagcatgt atttaattat ttatttgtaa taatatacaa gctatatcag aattatagca 120
<210> 37
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
tttgcctacc ccaaaatgct ttctgtgtac attccatttt aactttgttc agttcacagt 60
gcagcgaaaa ctagaaaatt ctgaagaatc aaacttacct tcaaagcttt catttatgac 120
<210> 38
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
tccactgttg tttgcttcat ctctggactt ataaatgcta tttaagaaaa aatttctgaa 60
taactgaagt tggtcctgaa ttctatgaaa agtaggtctt tggtcgggtt cttgagccca 120
<210> 39
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
gcactgggtc attaaattcc acctaaatat atggggaaag atgggaaagt aaatagcaat 60
tggatataat tactgataac ccaggtaggg tcattttaga aaggaaagaa tctgagttat 120
<210> 40
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
atttaagttc cagttcttat tttaacaatt taacaaacta tatcaagagg cctaagattg 60
tatgtgcaca tgtttttgtt tgggggatac atatgttaac ataattaact tacagatcat 120
<210> 41
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
caggacaatt tcttggtggc tccagtctcc ctcctgtttg cacatagttt aacacatcaa 60
ggttggaatg agctggataa ggctgatgac caagagttaa aatctcccaa atcagaattc 120
<210> 42
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
caaaagacct aagaatagta gagggtttgc tttaattata cttattacaa acaccaggtt 60
tacagtagtt tctccaacaa catttttcct ggggctagca gggtctactt tgtcagtgta 120
<210> 43
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
caaccaccgc gcacggcccc ctgactccgt ccagtattga tcgggagagc cggagcgagc 60
tcttcgggga gcagcgatgc gaccctccgg gacggccggg gcagcgctcc tggcgctgct 120
<210> 44
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
ggctgcgctc tgcccggcga gtcgggctct ggaggaaaag aaaggtaagg gcgtgtctcg 60
ccggctcccg cgccgccccc ggatcgcgcc ccggaccccg cagcccgccc aaccgcgcac 120
<210> 45
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gctcttaaag ggatatcctc tcctggttta ggtataaact tttgactcac aggacaaatt 60
ctatcattcc tttgggccta ggattgcatt tatttccatg acaaaagggc ctgtctggtg 120
<210> 46
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
tttcagcaaa tgaaaacaaa aatataaagc ccatctcctt ttgaatgagc tctaaaacag 60
ttctccactg gacttcagaa caagagggag ctctgggctg ctggctggtt gtgcatttgc 120
<210> 47
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
tgtgggttcc ctccggcagg cgacctctcc gcgctgagaa ggttatccgg ataaccaagt 60
aagaaagtac atgaggaggc acagaaagaa aaatgtgaga gataacagca taaacacaca 120
<210> 48
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
gtgaagaaac tgctaccctt aatacctgga ccttgaggga ttgttttatt ttagtttttc 60
tgcatttctc agtatttcat gtgatatctg tctttttctt ccagtttgcc aaggcacgag 120
<210> 49
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
taacaagctc acgcagttgg gcacttttga agatcatttt ctcagcctcc agaggatgtt 60
caataactgt gaggtggtcc ttgggaattt ggaaattacc tatgtgcaga ggaattatga 120
<210> 50
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tctttccttc ttaaaggttg gtgactttga ttttcctaca caaataaaat tggagaaaat 60
ctaagtggag aaaggcctgg gcagaattcc acttgaagtg tgtttatttt tgctatggca 120
<210> 51
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
cgtcctaggg ctccctggac ccattttaga ccttgagttc ttgagttcct caaaagagaa 60
atcacgcatt tatgttttct cttcttagac catccaggag gtggctggtt atgtcctcat 120
<210> 52
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
tgccctcaac acagtggagc gaattccttt ggaaaacctg cagatcatca gaggaaatat 60
gtactacgaa aattcctatg ccttagcagt cttatctaac tatgatgcaa ataaaaccgg 120
<210> 53
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
actgaaggag ctgcccatga gaaatttaca gggtgagagg ctgggatgcc aaggctgggg 60
gttcataaat gcagacagca gttccgatgg ctcccagcga gcttgtcact caattccacc 120
<210> 54
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gtaaaagtcc agttgggaag ctttatttct gatagattaa atggtatagg tctttcagtt 60
ttctcttcat ttctgacaac tgaactgctc tcgccttgaa cctgttttgg cagataaacc 120
<210> 55
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
tctcataatg aaggcccccg ctgtgcttgc acctggcatc ctcgtgctcc tgtttacctt 60
ggtgcagagg agcaatgggg agtgtaaaga ggcactagca aagtccgaga tgaatgtgaa 120
<210> 56
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
tatgaagtat cagcttccca acttcaccgc ggaaacaccc atccagaatg tcattctaca 60
tgagcatcac attttccttg gtgccactaa ctacatttat gttttaaatg aggaagacct 120
<210> 57
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
tcagaaggtt gctgagtaca agactgggcc tgtgctggaa cacccagatt gtttcccatg 60
tcaggactgc agcagcaaag ccaatttatc aggaggtgtt tggaaagata acatcaacat 120
<210> 58
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ggctctagtt gtcgacacct actatgatga tcaactcatt agctgtggca gcgtcaacag 60
agggacctgc cagcgacatg tctttcccca caatcatact gctgacatac agtcggaggt 120
<210> 59
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
tcactgcata ttctccccac agatagaaga gcccagccag tgtcctgact gtgtggtgag 60
cgccctggga gccaaagtcc tttcatctgt aaaggaccgg ttcatcaact tctttgtagg 120
<210> 60
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gcaacaaaat ttgacttcta catgagcgag acatccttaa tgtattttaa aaaaagctat 60
ttaaaagaaa ctccaattta taacattttc ccgctaaaaa tccgaagtta agacatttta 120
<210> 61
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
ctcatgtcaa acgtgccact cctcagcaat atttttggtc acctgcactc aaaatttata 60
aaaagaaact tagtttattg cttcaaggaa ataaaagaca tccacatttt ccaaattgtt 120
<210> 62
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
ataaaaagaa atagttatag aaaaattatt aagaataata atagaattat taaattctac 60
tgacttccta aattagatct gttcagtttg ccttatctaa cccaggctaa ccgactgcca 120
<210> 63
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
acttctcacc tgcaaacaca ggcataggta gggtcttctt ctggagtccc tagtggacat 60
gtgatagctg gcaacaaaag ttgcatgaga aactgaagtt tactacttaa aataaccaag 120
<210> 64
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
tgaatgatac aaacccggaa cagaaagtaa agcctctaga agaggctctg ccaattttta 60
gcaatgtcta tgtattttaa cccttggatg ttaaaaatcc aatgttaagt ataaatttta 120
<210> 65
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
gtttggggaa aaattatatc tagtctttaa ccacacaagt gttctttggt tcaccttaaa 60
aaaaaagaga gtattttatt caatttaaca tataagcaaa catatgttca tttattttcc 120
<210> 66
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ttcgatgtga ctgtctcctc ccaaatttgt agaccctctt aagatcatgc ttttcagata 60
cttcaaagat tccagaagat atgccccggg ggtcctggaa gccacaaggt aaacacaac 119
<210> 67
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
gctgggagtt gccactccca gacttgttgg aatgcagttg gagggggcga gctgggagcg 60
cgcttgctcc caatcacagg agaaggagga ggtggaggag gagggctgct tgaggaagta 120
<210> 68
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
taagaatgaa gttgtgaagc tgagattccc ctccattggg accggagaaa ccaggggagc 60
cccccgggca gccgcgcgcc ccttcccacg gggcccttta ctgcgccgcg cgcccggccc 120
<210> 69
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
ccacccctcg cagcaccccg cgccccgcgc cctcccagcc gggtccagcc ggagccatgg 60
ggccggagcc gcagtgagca ccatggagct ggcggccttg tgccgctggg ggctcctcct 120
<210> 70
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
cgccctcttg ccccccggag ccgcgagcac ccaaggtggg tctggtgtgg ggaggggacg 60
gagcagcggc gggaccctgc cctgtggatg ccccgccgag gtcccgcggc cggcggggcc 120
<210> 71
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
gccccaagct ggctaaagct ccttcttatt cccccctctc tttcctgatc tagaaatctg 60
ggggtctgcc atccctgggg ctgaccctgg ccaatgtcac cagtgacctc aacaggaaga 120
<210> 72
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
acgtgacgtg ctgggcagag aacgatgtgg gccgggcaga ggtctctgtt caggtcaacg 60
tctcctgtga gtctcagtgg cagctccggc acccaccccc tactcatctc ttcttccctc 120
<210> 73
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
ccacttaaga ttatggaact gcagcgaatg acatcgggga caccacgaac agaagtaatg 60
aaatcccttc cacagacgtc actgataaaa ccggtcggga acatctctcg gtgagtggaa 120
<210> 74
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
aatatatata tttttccatc tccaggccca gcctccgtta tcagcaatga tgatgactct 60
gccagcccac tccatcacat ctccaatggg agtaacactc catcttcttc ggaaggtggc 120
<210> 75
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
ccagatgctg tcattattgg aatgaccaag atccctgtca ttgaaaatcc ccagtacttt 60
ggcatcacca acagtcagct caagccagac acatgtaagt acagctgttt gtacttattg 120
<210> 76
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
ccctgggccc tcagccagcc ctcctcctgg tgccggcatg cctctggggt ttaccttcac 60
agccacaagc atcttgtcct tggtcgggct gaggttgtag cactcggcca ggaagacctt 120
<210> 77
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
tccaaaggct ccctcaccca gttctcgctt cagcacgatg tctctcctct taatgtgctg 60
cacatctgta ggatggggac aaagaggagg gcagcaaatc agtcctcgtt tggtgacaca 120
<210> 78
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
ctgaacgt 8
<210> 79
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
actccatc 8
<210> 80
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
gatggagt 8
<210> 81
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
tggactct 8
<210> 82
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
cgatgttc 8
<210> 83
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
ccttgatc 8
<210> 84
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
aatgacgc 8
<210> 85
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
ttgcagac 8
<210> 86
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
tgagctgt 8
<210> 87
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
acgacttg 8
<210> 88
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
atagagcg 8
<210> 89
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
cagtccaa 8
<210> 90
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
gaagtgct 8
<210> 91
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
aactgagc 8
Claims (10)
1.一种用于肺癌多基因突变测序的捕获探针,其特征在于,包括如下至少一个基因的捕获探针:
序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针;
序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针;
序列如SEQ ID NO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针;
序列如SEQ ID NO.15-SEQ ID NO.16所示的至少一条针对MAP2K1基因的捕获探针;
序列如SEQ ID NO.17-SEQ ID NO.25所示的至少一条针对ALK基因的捕获探针;
序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针;
序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针;
序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针;
序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;
序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;
序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针;
序列如SEQ ID NO.66-SEQ ID NO.70所示的至少一条针对HER2基因的捕获探针;
序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针;
序列如SEQ ID NO.73-SEQ ID NO.75所示的至少一条针对NTRK2基因的捕获探针;
序列如SEQ ID NO.76-SEQ ID NO.77所示的至少一条针对NTRK3基因的捕获探针。
2.根据权利要求1所述的用于肺癌多基因突变测序的捕获探针,其特征在于,包括如下捕获探针:
序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针;和
序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针;和
序列如SEQ ID NO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针;和
序列如SEQ ID NO.15-SEQ ID NO.16所示的至少一条针对MAP2K1基因的捕获探针;和
序列如SEQ ID NO.17-SEQ ID NO.25所示的至少一条针对ALK基因的捕获探针;和
序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针;和
序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针;和
序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针;和
序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;和
序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针;和
序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针;和
序列如SEQ ID NO.66-SEQ ID NO.70所示的至少一条针对HER2基因的捕获探针;和
序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针;和
序列如SEQ ID NO.73-SEQ ID NO.75所示的至少一条针对NTRK2基因的捕获探针;和
序列如SEQ ID NO.76-SEQ ID NO.77所示的至少一条针对NTRK3基因的捕获探针。
3.根据权利要求1所述的用于肺癌多基因突变测序的捕获探针,其特征在于,包括如下至少一个基因的捕获探针:
序列如SEQ ID NO.1-SEQ ID NO.2所示的针对NRAS基因的捕获探针;
序列如SEQ ID NO.2-SEQ ID NO.10所示的针对RET基因的捕获探针;
序列如SEQ ID NO.11-SEQ ID NO.14所示的针对KRAS基因的捕获探针;
序列如SEQ ID NO.15-SEQ ID NO.16所示的针对MAP2K1基因的捕获探针;
序列如SEQ ID NO.17-SEQ ID NO.25所示的针对ALK基因的捕获探针;
序列如SEQ ID NO.26-SEQ ID NO.32所示的针对PIK3CA基因的捕获探针;
序列如SEQ ID NO.33-SEQ ID NO.42所示的针对ROS1基因的捕获探针;
序列如SEQ ID NO.43-SEQ ID NO.53所示的针对EGFR基因的捕获探针;
序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针;
序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针;
序列如SEQ ID NO.60-SEQ ID NO.65所示的针对BRAF基因的捕获探针;
序列如SEQ ID NO.66-SEQ ID NO.70所示的针对HER2基因的捕获探针;
序列如SEQ ID NO.71-SEQ ID NO.72所示的针对NTRK1基因的捕获探针;
序列如SEQ ID NO.73-SEQ ID NO.75所示的针对NTRK2基因的捕获探针;
序列如SEQ ID NO.76-SEQ ID NO.77所示的针对NTRK3基因的捕获探针。
4.根据权利要求1所述的用于肺癌多基因突变测序的捕获探针,其特征在于,包括如下捕获探针:
序列如SEQ ID NO.1-SEQ ID NO.2所示的针对NRAS基因的捕获探针;和
序列如SEQ ID NO.2-SEQ ID NO.10所示的针对RET基因的捕获探针;和
序列如SEQ ID NO.11-SEQ ID NO.14所示的针对KRAS基因的捕获探针;和
序列如SEQ ID NO.15-SEQ ID NO.16所示的针对MAP2K1基因的捕获探针;和
序列如SEQ ID NO.17-SEQ ID NO.25所示的针对ALK基因的捕获探针;和
序列如SEQ ID NO.26-SEQ ID NO.32所示的针对PIK3CA基因的捕获探针;和
序列如SEQ ID NO.33-SEQ ID NO.42所示的针对ROS1基因的捕获探针;和
序列如SEQ ID NO.43-SEQ ID NO.53所示的针对EGFR基因的捕获探针;和
序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针;和
序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针;和
序列如SEQ ID NO.60-SEQ ID NO.65所示的针对BRAF基因的捕获探针;和
序列如SEQ ID NO.66-SEQ ID NO.70所示的针对HER2基因的捕获探针;和
序列如SEQ ID NO.71-SEQ ID NO.72所示的针对NTRK1基因的捕获探针;和
序列如SEQ ID NO.73-SEQ ID NO.75所示的针对NTRK2基因的捕获探针;和
序列如SEQ ID NO.76-SEQ ID NO.77所示的针对NTRK3基因的捕获探针。
5.一种用于肺癌多基因突变测序的试剂盒,其特征在于,包括权利要求1-6任一项所述的用于肺癌多基因突变测序的捕获探针和接头混合物。
6.根据权利要求5所述的用于肺癌多基因突变测序的试剂盒,其特征在于,所述接头混合物包括:P5接头和P7接头。
7.根据权利要求6所述的用于肺癌多基因突变测序的试剂盒,其特征在于,所述P5接头上包含有i5 index片段与测序引物片段;和/或
所述P7接头上包含有i7 index片段、测序引物片段与分子条形码片段。
8.根据权利要求7所述的用于肺癌多基因突变测序的试剂盒,其特征在于,所述分子条形码片段的序列如SEQ ID NO.78所示。
9.根据权利要求5-8任一项所述的用于肺癌多基因突变测序的试剂盒,其特征在于,所述捕获探针的工作浓度为0.4pM-0.8pM;和/或
所述接头混合物中每个接头的工作浓度为140μM-160μM。
10.一种非诊断目的构建肺癌多基因突变测序文库的方法,其特征在于,包括以下步骤:
对DNA样本末端修复加尾、接头连接,得预文库;
末端修复加尾、接头连接,得预文库;
对所述预文库进行PCR扩增、纯化、定量;
加入如权利要求1-4任一项所述的捕获探针,杂交;
靶向捕获,得靶向捕获文库;
对所述靶向捕获文库进行PCR扩增、纯化、定量,得肺癌多基因突变测序文库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911025079.2A CN112708665A (zh) | 2019-10-25 | 2019-10-25 | 用于肺癌多基因突变测序文库的构建方法与试剂盒 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911025079.2A CN112708665A (zh) | 2019-10-25 | 2019-10-25 | 用于肺癌多基因突变测序文库的构建方法与试剂盒 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112708665A true CN112708665A (zh) | 2021-04-27 |
Family
ID=75540829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911025079.2A Pending CN112708665A (zh) | 2019-10-25 | 2019-10-25 | 用于肺癌多基因突变测序文库的构建方法与试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112708665A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104561303A (zh) * | 2014-12-31 | 2015-04-29 | 南京卡迪奥密生物技术有限公司 | 人肿瘤预测性生物标志组合物及其应用 |
KR20160059446A (ko) * | 2014-11-18 | 2016-05-26 | 사회복지법인 삼성생명공익재단 | 암 유전체 돌연변이 검출용 유전자 패널 |
CN106283199A (zh) * | 2016-08-27 | 2017-01-04 | 大连晶泰生物技术有限公司 | 检测肿瘤相关的50个热点突变基因的捕获文库和试剂盒 |
CN106520963A (zh) * | 2016-11-18 | 2017-03-22 | 埃提斯生物技术(上海)有限公司 | 高通量测序检测人循环肿瘤dna kras基因的捕获探针及试剂盒 |
CN107236818A (zh) * | 2017-07-19 | 2017-10-10 | 臻悦生物科技江苏有限公司 | 肺癌临床用药突变基因检测试剂盒 |
CN109337956A (zh) * | 2018-09-07 | 2019-02-15 | 上海思路迪生物医学科技有限公司 | 捕获探针的设计方法、捕获探针、捕获探针组和试剂盒 |
WO2019197541A1 (en) * | 2018-04-11 | 2019-10-17 | Université de Bourgogne | Detection method of somatic genetic anomalies, combination of capture probes and kit of detection |
-
2019
- 2019-10-25 CN CN201911025079.2A patent/CN112708665A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160059446A (ko) * | 2014-11-18 | 2016-05-26 | 사회복지법인 삼성생명공익재단 | 암 유전체 돌연변이 검출용 유전자 패널 |
CN104561303A (zh) * | 2014-12-31 | 2015-04-29 | 南京卡迪奥密生物技术有限公司 | 人肿瘤预测性生物标志组合物及其应用 |
CN106283199A (zh) * | 2016-08-27 | 2017-01-04 | 大连晶泰生物技术有限公司 | 检测肿瘤相关的50个热点突变基因的捕获文库和试剂盒 |
CN106520963A (zh) * | 2016-11-18 | 2017-03-22 | 埃提斯生物技术(上海)有限公司 | 高通量测序检测人循环肿瘤dna kras基因的捕获探针及试剂盒 |
CN107236818A (zh) * | 2017-07-19 | 2017-10-10 | 臻悦生物科技江苏有限公司 | 肺癌临床用药突变基因检测试剂盒 |
WO2019197541A1 (en) * | 2018-04-11 | 2019-10-17 | Université de Bourgogne | Detection method of somatic genetic anomalies, combination of capture probes and kit of detection |
CN109337956A (zh) * | 2018-09-07 | 2019-02-15 | 上海思路迪生物医学科技有限公司 | 捕获探针的设计方法、捕获探针、捕获探针组和试剂盒 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110734908B (zh) | 高通量测序文库的构建方法以及用于文库构建的试剂盒 | |
US11795501B2 (en) | Methods for next generation genome walking and related compositions and kits | |
CN106591441B (zh) | 基于全基因捕获测序的α和/或β-地中海贫血突变的检测探针、方法、芯片及应用 | |
CN106554957B (zh) | 测序文库及其制备和应用 | |
WO2012068919A1 (zh) | DNA文库及其制备方法、以及检测SNPs的方法和装置 | |
US11898204B2 (en) | Generation of single-stranded circular DNA templates for single molecule sequencing | |
CN111575380B (zh) | 多基因检测用的探针库、杂交试剂盒和多基因检测的方法 | |
EP3885445B1 (en) | Methods of attaching adapters to sample nucleic acids | |
CN102732629A (zh) | 利用高通量测序同时测定基因表达量和多聚腺苷酸加尾的方法 | |
CN106498082B (zh) | 卵巢癌易感基因变异文库构建方法 | |
CN111378720A (zh) | 长链非编码rna的测序文库构建方法及其应用 | |
CN111500679A (zh) | 长片段捕获测序探针组的制备方法 | |
EP3480319A1 (en) | Method for producing dna library and method for analyzing genomic dna using dna library | |
CN107236727B (zh) | 多基因捕获测序的单链探针制备方法 | |
CN111051524A (zh) | 从rna和dna制备核酸文库 | |
CN113564197A (zh) | 一种CRISPR/Cas9介导的植物多基因编辑载体的构建方法和应用 | |
CN112259165A (zh) | 用于检测微卫星不稳定性状态的方法及系统 | |
CN108103159A (zh) | 一种高特异性的碱基突变多重pcr检测方法 | |
CN112708665A (zh) | 用于肺癌多基因突变测序文库的构建方法与试剂盒 | |
CN113913493B (zh) | 一种靶基因区域快速富集方法 | |
CN105803055A (zh) | 一种基于多重循环延伸连接的靶基因区域富集新方法 | |
CN115125295A (zh) | 一种用于多位点可持续使用的基因分型标准品 | |
CN113969307A (zh) | Dna甲基化测序文库及制备方法和dna甲基化检测方法 | |
CN114196740A (zh) | 用于同时识别多种基因类型的数字扩增检测方法、检测产品和检测试剂盒 | |
CN110938681A (zh) | 等位基因核酸富集和检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: No. 29, Helix 3 Road, Guangzhou International Biological Island, Huangpu District, Guangzhou City, Guangdong Province, 510663 Applicant after: SUREXAM BIO-TECH Co.,Ltd. Address before: 5 / F, area C, Guangzhou innovation base, No. 80, guanyue Road, Science City, Guangzhou, Guangdong Province Applicant before: SUREXAM BIO-TECH Co.,Ltd. |