CN117512116A - 一种用于胆管癌检测的生物标志物及其应用 - Google Patents
一种用于胆管癌检测的生物标志物及其应用 Download PDFInfo
- Publication number
- CN117512116A CN117512116A CN202311675544.3A CN202311675544A CN117512116A CN 117512116 A CN117512116 A CN 117512116A CN 202311675544 A CN202311675544 A CN 202311675544A CN 117512116 A CN117512116 A CN 117512116A
- Authority
- CN
- China
- Prior art keywords
- detection
- bile duct
- data
- sequencing
- biomarker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 76
- 208000006990 cholangiocarcinoma Diseases 0.000 title claims abstract description 50
- 239000000090 biomarker Substances 0.000 title claims abstract description 42
- 206010004593 Bile duct cancer Diseases 0.000 title claims abstract description 40
- 208000026900 bile duct neoplasm Diseases 0.000 title claims abstract description 40
- 239000000523 sample Substances 0.000 claims abstract description 70
- 108020004414 DNA Proteins 0.000 claims abstract description 65
- 230000004927 fusion Effects 0.000 claims abstract description 44
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 34
- 208000032818 Microsatellite Instability Diseases 0.000 claims abstract description 20
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 16
- 238000009396 hybridization Methods 0.000 claims abstract description 14
- 239000002773 nucleotide Substances 0.000 claims abstract description 7
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 7
- 230000007614 genetic variation Effects 0.000 claims abstract description 5
- 239000011324 bead Substances 0.000 claims description 53
- 238000012163 sequencing technique Methods 0.000 claims description 48
- 230000035772 mutation Effects 0.000 claims description 44
- 238000004458 analytical method Methods 0.000 claims description 24
- 238000003908 quality control method Methods 0.000 claims description 24
- 239000012634 fragment Substances 0.000 claims description 21
- 239000003153 chemical reaction reagent Substances 0.000 claims description 12
- 210000000013 bile duct Anatomy 0.000 claims description 11
- 108700020796 Oncogene Proteins 0.000 claims description 10
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 claims description 9
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 claims description 7
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 claims description 7
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 claims description 7
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 claims description 7
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 claims description 7
- 102100027844 Fibroblast growth factor receptor 4 Human genes 0.000 claims description 7
- 101000917134 Homo sapiens Fibroblast growth factor receptor 4 Proteins 0.000 claims description 7
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 claims description 7
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 claims description 7
- 102100030334 Friend leukemia integration 1 transcription factor Human genes 0.000 claims description 6
- 101001062996 Homo sapiens Friend leukemia integration 1 transcription factor Proteins 0.000 claims description 6
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 claims description 6
- 101000893493 Homo sapiens Protein flightless-1 homolog Proteins 0.000 claims description 6
- 102100029166 NT-3 growth factor receptor Human genes 0.000 claims description 6
- 102000048238 Neuregulin-1 Human genes 0.000 claims description 6
- 108090000556 Neuregulin-1 Proteins 0.000 claims description 6
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 108010064892 trkC Receptor Proteins 0.000 claims description 6
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 claims description 5
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 claims description 5
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 claims description 5
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 claims description 4
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 claims description 4
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 claims description 4
- 238000003556 assay Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 101700002522 BARD1 Proteins 0.000 claims description 3
- 102100035080 BDNF/NT-3 growth factors receptor Human genes 0.000 claims description 3
- 102100028048 BRCA1-associated RING domain protein 1 Human genes 0.000 claims description 3
- 108700020462 BRCA2 Proteins 0.000 claims description 3
- 102000052609 BRCA2 Human genes 0.000 claims description 3
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 claims description 3
- 101150008921 Brca2 gene Proteins 0.000 claims description 3
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 claims description 3
- 102100038111 Cyclin-dependent kinase 12 Human genes 0.000 claims description 3
- 102100034484 DNA repair protein RAD51 homolog 3 Human genes 0.000 claims description 3
- 102100022334 Dihydropyrimidine dehydrogenase [NADP(+)] Human genes 0.000 claims description 3
- 102100038595 Estrogen receptor Human genes 0.000 claims description 3
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 claims description 3
- 102100034553 Fanconi anemia group J protein Human genes 0.000 claims description 3
- 102100030708 GTPase KRas Human genes 0.000 claims description 3
- 102100039788 GTPase NRas Human genes 0.000 claims description 3
- 102100035108 High affinity nerve growth factor receptor Human genes 0.000 claims description 3
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 claims description 3
- 101000596896 Homo sapiens BDNF/NT-3 growth factors receptor Proteins 0.000 claims description 3
- 101000884345 Homo sapiens Cyclin-dependent kinase 12 Proteins 0.000 claims description 3
- 101001132271 Homo sapiens DNA repair protein RAD51 homolog 3 Proteins 0.000 claims description 3
- 101000902632 Homo sapiens Dihydropyrimidine dehydrogenase [NADP(+)] Proteins 0.000 claims description 3
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 claims description 3
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 claims description 3
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 claims description 3
- 101000596894 Homo sapiens High affinity nerve growth factor receptor Proteins 0.000 claims description 3
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 claims description 3
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 claims description 3
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 claims description 3
- 101001025967 Homo sapiens Lysine-specific demethylase 6A Proteins 0.000 claims description 3
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 claims description 3
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 claims description 3
- 101000777293 Homo sapiens Serine/threonine-protein kinase Chk1 Proteins 0.000 claims description 3
- 101000813738 Homo sapiens Transcription factor ETV6 Proteins 0.000 claims description 3
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 claims description 3
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 claims description 3
- 102100037462 Lysine-specific demethylase 6A Human genes 0.000 claims description 3
- 108091092878 Microsatellite Proteins 0.000 claims description 3
- 101150097381 Mtor gene Proteins 0.000 claims description 3
- 102000007530 Neurofibromin 1 Human genes 0.000 claims description 3
- 108010085793 Neurofibromin 1 Proteins 0.000 claims description 3
- 108010065129 Patched-1 Receptor Proteins 0.000 claims description 3
- 102000012850 Patched-1 Receptor Human genes 0.000 claims description 3
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 claims description 3
- 102100040990 Platelet-derived growth factor subunit B Human genes 0.000 claims description 3
- 108010019674 Proto-Oncogene Proteins c-sis Proteins 0.000 claims description 3
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 claims description 3
- 102100031081 Serine/threonine-protein kinase Chk1 Human genes 0.000 claims description 3
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 claims description 3
- 102100039580 Transcription factor ETV6 Human genes 0.000 claims description 3
- 102100031638 Tuberin Human genes 0.000 claims description 3
- 102100033254 Tumor suppressor ARF Human genes 0.000 claims description 3
- 230000006641 stabilisation Effects 0.000 claims description 3
- 238000011105 stabilization Methods 0.000 claims description 3
- 239000000107 tumor biomarker Substances 0.000 claims description 3
- 102000000872 ATM Human genes 0.000 claims description 2
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 claims description 2
- 108700020463 BRCA1 Proteins 0.000 claims description 2
- 102000036365 BRCA1 Human genes 0.000 claims description 2
- 101150072950 BRCA1 gene Proteins 0.000 claims description 2
- 102100031561 Hamartin Human genes 0.000 claims description 2
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 claims description 2
- 101000795643 Homo sapiens Hamartin Proteins 0.000 claims description 2
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 claims description 2
- 101000795659 Homo sapiens Tuberin Proteins 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 claims description 2
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 claims description 2
- 102000016627 Fanconi Anemia Complementation Group N protein Human genes 0.000 claims 1
- 239000013614 RNA sample Substances 0.000 abstract description 26
- 230000001915 proofreading effect Effects 0.000 abstract description 3
- 238000011160 research Methods 0.000 abstract description 3
- 230000009897 systematic effect Effects 0.000 abstract description 2
- 239000000243 solution Substances 0.000 description 48
- 238000006243 chemical reaction Methods 0.000 description 29
- 239000006228 supernatant Substances 0.000 description 28
- 239000000203 mixture Substances 0.000 description 20
- 238000000034 method Methods 0.000 description 17
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 15
- 239000012295 chemical reaction liquid Substances 0.000 description 15
- 238000005119 centrifugation Methods 0.000 description 14
- 238000000746 purification Methods 0.000 description 14
- 238000002156 mixing Methods 0.000 description 13
- 210000004602 germ cell Anatomy 0.000 description 12
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 239000000872 buffer Substances 0.000 description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 9
- 238000012408 PCR amplification Methods 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 238000006062 fragmentation reaction Methods 0.000 description 7
- 238000001712 DNA sequencing Methods 0.000 description 6
- 208000009854 congenital contractural arachnodactyly Diseases 0.000 description 6
- 238000013467 fragmentation Methods 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 5
- 238000003559 RNA-seq method Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 238000010839 reverse transcription Methods 0.000 description 5
- 238000007792 addition Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000007853 buffer solution Substances 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 230000036438 mutation frequency Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 239000012264 purified product Substances 0.000 description 4
- 238000003757 reverse transcription PCR Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 238000003149 assay kit Methods 0.000 description 3
- 201000009036 biliary tract cancer Diseases 0.000 description 3
- 208000020790 biliary tract neoplasm Diseases 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 201000008819 extrahepatic bile duct carcinoma Diseases 0.000 description 3
- 201000010175 gallbladder cancer Diseases 0.000 description 3
- 239000012535 impurity Substances 0.000 description 3
- 208000014899 intrahepatic bile duct cancer Diseases 0.000 description 3
- 238000001921 nucleic acid quantification Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- HCDMJFOHIXMBOV-UHFFFAOYSA-N 3-(2,6-difluoro-3,5-dimethoxyphenyl)-1-ethyl-8-(morpholin-4-ylmethyl)-4,7-dihydropyrrolo[4,5]pyrido[1,2-d]pyrimidin-2-one Chemical compound C=1C2=C3N(CC)C(=O)N(C=4C(=C(OC)C=C(OC)C=4F)F)CC3=CN=C2NC=1CN1CCOCC1 HCDMJFOHIXMBOV-UHFFFAOYSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 102100040884 Partner and localizer of BRCA2 Human genes 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 210000003445 biliary tract Anatomy 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 101150088071 fgfr2 gene Proteins 0.000 description 2
- 201000007450 intrahepatic cholangiocarcinoma Diseases 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 102000010400 1-phosphatidylinositol-3-kinase activity proteins Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- MLDQJTXFUGDVEO-UHFFFAOYSA-N BAY-43-9006 Chemical compound C1=NC(C(=O)NC)=CC(OC=2C=CC(NC(=O)NC=3C=C(C(Cl)=CC=3)C(F)(F)F)=CC=2)=C1 MLDQJTXFUGDVEO-UHFFFAOYSA-N 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108091008794 FGF receptors Proteins 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 101150054472 HER2 gene Proteins 0.000 description 1
- 210000002370 ICC Anatomy 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 239000005511 L01XE05 - Sorafenib Substances 0.000 description 1
- 239000012828 PI3K inhibitor Substances 0.000 description 1
- 108091007960 PI3Ks Proteins 0.000 description 1
- 108091008611 Protein Kinase B Proteins 0.000 description 1
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 230000005773 cancer-related death Effects 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000004709 cell invasion Effects 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 201000009777 distal biliary tract carcinoma Diseases 0.000 description 1
- 239000000890 drug combination Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 108700020302 erbB-2 Genes Proteins 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 description 1
- 238000011354 first-line chemotherapy Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000010988 intraclass correlation coefficient Methods 0.000 description 1
- 229940124302 mTOR inhibitor Drugs 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000003628 mammalian target of rapamycin inhibitor Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 229940121317 pemigatinib Drugs 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 239000003197 protein kinase B inhibitor Substances 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 229960003787 sorafenib Drugs 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 238000010626 work up procedure Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Pathology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Oncology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Hospice & Palliative Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于胆管癌检测的生物标志物及其应用。本发明用于胆管癌检测的生物标志物组合,包含了DNA+RNA双水平检测肿瘤组织样本,检测广泛的遗传变异,包括单核苷酸变异(SNVs)、插入缺失(indels)、拷贝数变异(CNV)、基因融合(Fusion)以及微卫星不稳定(MSI),检测更全面;同时,生物标志物组合还包含了识别潜在样品混杂或污染的位点组合,可实现匹配和校对DNA+RNA样本,使得检测更准确;本发明的生物标志物组合可以用于胆管癌的诊断、治疗、预后等发生发展的各个阶段,为胆管癌的全面、系统化的检测和研究奠定了基础。
Description
技术领域
本发明涉及一种用于胆管癌检测的生物标志物及其应用,属于生物医学检测技术领域。
背景技术
胆道恶性肿瘤(biliary tract carcinoma,BTC)主要包括胆囊癌(gallbladdercancers,GBC)和肝内外胆管癌(cholangiocarcinomas,CC)。肝内外胆管癌(以下均称为胆管癌)的发病率在全球范围内呈上升趋势。据统计,目前胆管癌发病率占消化道恶性肿瘤的3%,病死率占全世界每年所有癌症相关死亡病例的2%。而在中国,每10万名居民中就有6例以上发病患者。胆管癌起源于胆管上皮,大多为腺癌,根据肿瘤发生的位置不同,分为肝内胆管癌(iCCA)和肝外胆管癌(eCCA),肝外胆管癌又可分为肝门部胆管癌(pCCA)和远端胆管癌(dCCA)。不同部位的胆管癌在临床表现上各有特征,因此诊断和治疗也不同。由于胆管癌的临床症状不典型,出现症状时常已经晚期,虽然有针对晚期的胆管癌患者一线化疗方案吉西他滨联合铂类,但有效率只有15~26%,疗效不理想,因此对胆管癌的诊断和治疗急需新的策略和方案。
随着下一代测序技术的应用,基因检测、靶向药物组合给癌症患者的治疗有了一个崭新的空间。根据基因组分析,在胆管癌中有近40%的患者存在潜在的可靶向性的基因突变,具有靶向治疗的可能。11%的ICC和3%的胆囊癌可检测到FGFR1-3基因变异;在11%~45%的CCA中检测到FGFR2基因融合,常见的形式主要有FGFR2-ZMYM4、FGFR2-BICC1融合等;晚期/转移性或手术无法切除CCA患者的二线治疗临床试验(FIGHT-202)显示,FGFR2基因易位的CCA患者Pemigatinib(INCB54828)临床治疗效果显著。在HCC中,PIK3CA突变频率约为4%,PTEN缺失突变频率约为7%,临床研究提示,PI3K、AKT和mTOR抑制剂可以作为PIK3CA突变的肿瘤患者潜在的治疗靶点。HER2基因突变在CCA中发生频率约为3.9%,在胆囊癌中约11.0%,研究显示HER2与胆囊癌的预后相关。MET突变在HCC中的发生频率约为1.89%;在CCA中的突变频率约为1.44%。研究发现,HCC患者的肿瘤组织中c-MET表达水平较高,并与索拉非尼的耐药相关;高表达c-MET的HCC细胞中,卡博替尼能够高效抑制MET活性,抑制血管生成、细胞增殖、细胞迁移和侵袭,促进细胞凋亡。因此,胆管癌的基因或者结构变异的识别对于胆管癌的诊断和治疗非常重要。
利用逆转录聚合酶链反应(RT-PCR)、荧光原位杂交(FISH)和最近的下一代测序(NGS)进行分子分析是非常有价值的诊断工具。FISH或RT-PCR分别用于检测基因组水平或转录水平的融合事件,然而这两种方法都有相应的局限性。FISH方法仅能用于鉴别是否发生融合突变,无法确定融合的伴侣基因以及具体断点位置;RT-PCR需要设计特异的引物和探针,仅限于检测已知融合突变,不能用于未知融合突变的检测。
NGS是一种高通量、低成本的工具,可以对多个染色体区域进行平行测序,以检测广泛的遗传变异,包括单核苷酸变异(SNVs)、插入缺失(indels)、易位和拷贝数变异(CNV)。全基因组测序和外显子组测序可以发现新的基因组变化,而靶向NGS是一种成本效益高的技术,用于检测已知的结构变异,可以对感兴趣的特定区域,并进行更深入的测序。特别是靶向NGS,可以在单一检测中富集和测序一组基因或区域,减少成本、周转时间和数据分析负担。这使得它更适合用于诸如FFPE或者活检等稀疏标本道。
发明内容
本发明的目的是:针对现有胆管癌检测技术的不足,本发明提供一种用于胆管癌检测的生物标志物组合及其应用,本发明用于胆管癌检测的生物标志物组合,包含了DNA+RNA双水平检测肿瘤组织样本,检测广泛的遗传变异,包括单核苷酸变异(SNVs)、插入缺失(Indels)、拷贝数变异(CNV)、基因融合(Fusion)以及微卫星不稳定(MSI),检测更全面;同时,该生物标志物组合还包含了识别潜在样品混杂或污染的位点组合,可实现匹配和校对DNA+RNA样本,使检测更准确;本发明的生物标志物组合可以用于胆管癌的诊断以及治疗和预后等发生发展的各个阶段的病情监测,为胆管癌的全面、系统化的检测和研究奠定了基础。
为达到解决上述问题的目的,本发明采取了以下技术方案:
本发明的第一方面,提供一种生物标志物在制备用于检测胆管癌基因变异的产品中的应用,所述生物标志物包括用于检测胆管癌DNA变异的生物标志物A和用于检测胆管癌RNA变异的生物标志物B;
所述生物标志物A由基因ALK,CDK12,FGFR1,MTOR,PIK3CA,AR,CDKN2A,FGFR3,NF1,PTCH1,ATM,CHEK1,FGFR4,NRAS,PTEN,BARD1,DPYD,FLI1,NRG1,RAD51C,BRAF,EGFR,IDH1,NTRK1,ROS1,BRCA1,ERBB2,IDH2,NTRK3,TSC1,BRCA2,ESR1,KDM6A,PALB2,TSC2,BRIP1,EZH2,KRAS和PDGFRA组成;
所述生物标志物B由ALK,BRAF,ETV6,FGFR1,FGFR2,FGFR3,FGFR4,NRG1,NTRK1,NTRK2,NTRK3,RET,ROS1,FLI1,PDGFB和MET组成。
优选地,所述DNA变异包括基因融合(Fusion)、单核苷酸变异(SNVs)、插入缺失(Indels)、拷贝数变异(CNV)以及微卫星不稳定(MSI);所述RNA变异包括基因融合(Fusion)。
优选地,所述应用包括以生物标志物的检测试剂制备用于检测胆管癌基因变异的试剂盒。
优选地,所述试剂盒中至少包括用于检测生物标志物的探针。
优选地,所述应用包括以生物标志物作为检测指标制备用于检测胆管癌基因变异的检测系统或检测设备。
本发明的第二方面,提供一种用于检测胆管癌基因变异的试剂盒,所述试剂盒中至少包括用于检测生物标志物的探针。
优选地,所述试剂盒中还包括用于提取样本中的DNA和/或RNA的试剂,所述样本为胆管癌肿瘤组织。
本发明的第三方面,提供一种用于检测胆管癌基因变异的系统或设备,所述系统或设备包括:
数据获取模块,用以获取样本测序数据,所述测序数据为采用检测胆管癌生物标志物组合的探针与预文库进行杂交捕获,经磁珠纯化后得到测序文库,测序文库通过基因测序仪NextSeq 550Dx/Novaseq 6000测序得到测序数据;
数据处理模块,用于将测序数据经过数据预处理、数据比对和质量控制得到符合质控要求的分析数据;
数据检测分析模块,用于测序数据的检测分析;
以及检测结果获取模块;
所述系统或设备通过以下步骤用以实现胆管癌基因变异的检测:
步骤1:获取待测受试者样本中的生物标志物组合表达谱数据,所述生物标志物组合来源于胆管癌患者的肿瘤组织样本;
步骤2:数据处理,所述数据处理具体包括:
步骤2.1,数据预处理:使用软件分析数据测序质量参数Q30碱基占比。如果Q30占比≥60%则质量控制通过;否则质量控制不通过。然后使用Illumina公司的软件将NextSeq550Dx/Novaseq 6000测序产生的BCL文件转化为Fastq文件。再使用Trimmomatic-0.36软件去掉建库中引入的接头序列和低质量碱基片段;
步骤2.2,数据比对:从原始下机数据中去除低质量的碱基和接头序列,对过滤的数据进行碱基质量统计,将测序片段read回帖到参考基因组并统计read数、比对率、测序深度及覆盖度、变异检测;
步骤2.3,数据质量控制:根据样本Q30碱基占比,序列比对到参考基因组比例,目标区域的平均测序深度等参数,决定样本测序质量是否合格;如果Q30≥60%,序列比对到参考基因组比例≥90%,平均测序深度≥300X,则样本测序数据质量控制通过;否则不通过,判定检测失败,需要重新测序;
步骤3:数据分析,SNV/Indels突变检测使用检测软件Vardict V1.8.2-2和MuTect2 V 4.0.12.0联合检测;MSI检测使用软件MSIsensor2;基因融合检测使用软件Manta V1.6.0和Delly2 V1.1.15;CNV检测使用软件cnvkit V0.9.6。分析参数设置要求序列比对质量≥20,碱基质量≥30,其余皆是默认设置;
步骤4:结果获取,如果SNV/Indels的突变丰度≥0.5%,则判定为阳性;反之为阴性;融合基因的突变丰度≥0.5%,则判定为阳性;反之为阴性;MSI的score≥10%,则判定为MSI-H;反之为MSS(微卫星稳定);CNV的CN≥3.25,则判为阳性,反之为阴性。
本发明的第四方面,提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有程序,所述处理器执行所述程序时实现上述技术方案中所述的步骤。
本发明的第五方面,一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;
其中,在所述计算机程序运行时控制所述计算机可读存储介质实现上述技术方案中所述的步骤。
与现有技术相比,本发明的有益效果在于:
(1)本发明提供的胆管癌相关生物标志物覆盖广,检测性能高
同一标本提取DNA与RNA,经不同前处理后进入相同检测流程,同步测序分析;通过DNA,可检测单核苷酸变异(SNVs)、插入缺失(Indels)拷贝数变异(CNV)以及微卫星不稳定(MSI);通过RNA,可检测基因融合(Fusion),DNA结构变异与RNA剪切变异都可产生融合基因,DNA受样本质量影响较小,但探针受未知断点与较大内含子区域限制,易造成漏检;RNA可弥补DNA融合检测不足,发现更多新融合形式,且可检测RNA层面的剪接变异;
(2)检测成本低,适用范围更广
本发明提供的胆管癌生物标志物组合及检测系统,能够实现DNA+RNA双水平检测胆管癌患者肿瘤组织样本的DNA和RNA层面的基因变异,包括单核苷酸变异(SNVs)、插入缺失(Indels)拷贝数变异(CNV)以及微卫星不稳定(MSI),一个检测分析流程检测多种,成本更低,具有更大的推广价值。
3)分析便捷,可操作性强
本发明的系统,从下机数据到各种变异结果一步即可完成,可同时分析胆管癌检测的多种生物标志物,分析时间大大缩短,为患者争取宝贵的检测分析时间。
附图说明
图1.66个DNA测序样本中检测到442个胚系突变位点上纯合子数目分布图;
图2.DNA和RNA样本匹配分数分布图。灰色框图是DNA和RNA样本不是来自同一个病人情况下的分数分布(共4290个分数);红色框图是DNA和RNA样本是来自同一个病人情况下的分数(共66个分数);
图3.SNV/INDEL分布情况;
图4.34例样本拷贝数变异结果;
图5.226例临床样本微卫星不稳定性检测结果;
图6.226例临床样本微卫星不稳定性检测结果;
图7.检测到的DNA和RNA FGFR融合。
具体实施方式
为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。
实施例1生物标志物的筛选
1、筛选方法
本实施例利用基因组学和技术,对胆管癌(CCA)组织和正常组织进行高通量的基因分析,识别胆管癌组织与正常组织的分子差异,以及在胆管癌中显著上调或下调的候选标志物基因。通过比较分析,寻找胆管癌特异性的表达模式和基因突变,筛选得到用于胆管癌检测的生物标志物组合,包括IDH1/2、FGFR2、PIK3CA、PTEN、BRAF等39种基因用于DNA变异检测,以及FGFR1、FGFR2、FGFR3、FGFR4等16种基因用于RNA融合变异检测,分别如下列表1和表2所示。
表1.DNA变异检测基因列表
ALK | CDK12 | FGFR1 | MTOR | PIK3CA |
AR | CDKN2A | FGFR3 | NF1 | PTCH1 |
ATM | CHEK1 | FGFR4 | NRAS | PTEN |
BARD1 | DPYD | FLI1 | NRG1 | RAD51C |
BRAF | EGFR | IDH1 | NTRK1 | ROS1 |
BRCA1 | ERBB2 | IDH2 | NTRK3 | TSC1 |
BRCA2 | ESR1 | KDM6A | PALB2 | TSC2 |
BRIP1 | EZH2 | KRAS | PDGFRA |
表2.RNA融合变异检测基因列表
ALK | BRAF | ETV6 | FGFR1 | FGFR2 |
FGFR3 | FGFR4 | NRG1 | NTRK1 | NTRK2 |
NTRK3 | RET | ROS1 | FLI1 | PDGFB |
MET |
本发明的上述生物标志物组合可用于识别潜在样品混杂或污染的位点组合,匹配和校对DNA+RNA样本,使检测更准确;DNA+RNA双水平检测胆管癌患者肿瘤组织样本的DNA和RNA层面的基因变异,更全面的反应肿瘤样本的基因变异情况。匹配和校对DNA+RNA样本使用设定位置的中国人高频胚系突变位点上的纯合子比例来估算样本间的关系。
2、胚系突变位点选择
从1000Genome项目公共胚系突变数据库中选取442个人群中高频率胚系突变,频率(AF,alternative allele frequency)在0.3-0.7之间(0.3<AF<0.7)。这些突变落在JUS70 panel目标范围内。这442个胚系突变在hg19参考基因组上的坐标和在1000Genome人群中的频率,具体如表3所示。
表3.用于计算DNA和RNA测序数据匹配情况的442个人群高频率胚系突变
/>
/>
/>
/>
/>
/>
3、DNA和RNA样本匹配判断方法
使用66个临床样本,分别使用JUS70 panel DNA和RNA测序分析。在分别进行DNA测序数据突变检测和RNA测序数据突变检测后,汇总在442个人群高频胚系位点的DNA和RNA基因型结果。以DNA测序数据结果中442个位点上纯合子突变为基准(假如是n个),观测RNA测序数据中这100个DNA纯合子突变位点上纯合子突变的个数(k个)。这样DNA样本和RNA样本的匹配分数为
理论上说,在一个位点上同一个人样本中,如果DNA样本是纯合子突变,那么RNA样本观测到的应该是纯合子突变。但是由于目标位点上测序深度也会有随机性的变化,造成在纯合子判断上有些误差。这样的误差会造成DNA纯合子位点上RNA的观测值不一定100%是纯合子突变。但是当这样的观测点较大时(>>60,见图1),公式1计算的匹配分数会趋向1。而当DNA样本和RNA样本不是来自同一个人时,这个匹配分数会远小于1(见下面)。这样就可以根据匹配分数,通过统计来判断DNA样本和RNA样本是不是来自同一个人。
4、DNA样本检测纯合子数目
在选取这些人群中高频率胚系突变的一个主要目的是保证任何一个人的样本在进行DNA和RNA样本匹配分析中有足够的纯合子突变供分析。我们先来看是否满足这一需要。根据表3中胚系突变的突变频率,可以估计纯合子发生的频率期望值,
这样计算的纯合子频率期望值为0.2363。那么一个DNA样本在442个胚系突变上检测到纯合子数量的期望值就是442×0.2363≈104个。这与我们在66个DNA样本上的观测值非常接近,见图1。
5、DNA和RNA样本匹配分数判别阈值
为了验证上述的理论分析以及寻找DNA和RNA样本匹配分数判别的阈值,我们使用66个人的DNA和RNA测序样本,采用JUS70试剂盒测序分析。分别用不同的DNA和RNA样本的组合匹配,计算匹配分数。总共有66×66=4356种组合,其中匹配的组合(DNA和RNA样本来自同一个人)有66种,不匹配的组合(DNA和RNA样本来自不同的人)有4290种。值得注意的是,由于匹配分析是以DNA样本纯合子为基准,因此如果DNA和RNA样本来自不同的人,以A人DNA样本为基准计算B人RNA样本的匹配分数,和以B人DNA样本为基准计算A人RNA样本的匹配分数是不同的分析。
分析结果显示,同一个人的DNA和RNA样本匹配分数分布在[0.75,1]这一区间(如图2所示,红色标注),而不同人的DNA和RNA样本匹配分数分布在[0.14,0.5]。2组分布之间有一个很大而且明显的间距。这一观察与上面的理论设想一致,并且很容易设定一个匹配分数阈值来区分这2组分类。因此,设定DNA和RNA样本匹配分数阈值为0.6。当匹配分数≥0.6时,判为DNA和RNA样本来自同一个人;否则,就是来自不同的人。
实施例2生物标志物的应用
本实施例提供了利用实施例1筛选得到的生物标志物检测胆管癌,方法及过程如下:
1.样本DNA、RNA提取
采用磁珠法石蜡总核酸提取试剂盒依据厂家说明进行FFPE样本的DNA、RNA提取和纯化。对提取的DNA、RNA分别进行精确定量(推荐使用Qubit荧光定量仪),提取产物DNA于-20℃保存,RNA于-70℃保存。
2.DNA预文库制备
采用文库制备试剂盒(KAPA HyperPlus Kit,Roche,货号07962428001)依据厂家说明进行FFPE样本的DNA文库制备,具体步骤如下:
2.1片段化处理
1)根据样本浓度,取100ng gDNA总量,35μL总体积进行片段化;如样本体积不足35μL,则使用10mM Tris-HCl,pH 8.0溶液补足至35μL。
2)片段化反应液按每个测试配制体系如下:
组分名称 | 体积(μL) |
剪切酶缓冲液(10X) | 5 |
剪切酶 | 10 |
合计 | 15 |
2)将混匀后的片段化反应液取15μL加入到待测样本中,混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:50℃)
步骤 | 温度 | 时间 |
预冷 | 4℃ | 1min |
片段化 | 37℃ | 10min |
Hold | 4℃ | ∞ |
2.2末端修复和加A
1)末端修复反应液按每个测试配制体系如下:
组分名称 | 体积(μL) |
末端修复缓冲液 | 7 |
末端修复酶 | 3 |
合计 | 10 |
2)将混匀后的末端修复反应液取10μL加入到片段化后的PCR管中,混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:85℃)
步骤 | 温度 | 时间 |
末端修复和加A | 65℃ | 30min |
Hold | 4℃ | ∞ |
3)反应结束后短暂离心置于冰盒上备用。
2.3接头连接
1)配制连接反应液按每个测试配制体系如下:
组分名称 | 体积(μL) |
连接酶缓冲液 | 30 |
DNA连接酶 | 10 |
无核酸酶水 | 5 |
合计 | 45 |
2)取通用接头5μL加入到末端修复后的PCR管中,震荡混匀短暂离心。
3)加入连接反应液取45μL,混匀并短暂离心,将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:50℃)
步骤 | 温度 | 时间 |
接头连接 | 20℃ | 15min |
Hold | 4℃ | ∞ |
4)反应结束后短暂离心置于冰盒上备用。
2.4连接产物磁珠纯化
1)推荐使用KAPA HyperPure Beads(Roche,货号08963860001),取88μL纯化磁珠加至连接产物PCR管中,按照纯化试剂盒说明进行磁珠纯化
2)纯化产物用22μL已平衡至室温的10mM Tris-HCl,pH 8.0溶液洗脱,吸取20μL上清至新的PCR管中,切勿碰触磁珠,置于冰盒上备用。
2.5文库扩增
1)每个样本中加入25μL PCR扩增反应液1和5μL PCR扩增引物(包含样本标签序列),混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:105℃)
2)反应结束后置于冰盒上备用。
2.6扩增产物磁珠纯化
1)推荐使用KAPA HyperPure Beads,取45μL纯化磁珠加至PCR管中,按照纯化试剂盒说明进行磁珠纯化。
2)纯化产物用32μL已平衡至室温的10mM Tris-HCl,pH 8.0溶液洗脱,吸取30μL上清至新的PCR管中,切勿碰触磁珠,置于冰盒上备用。
2.7文库质控
1)使用核酸定量试剂盒dsDNA HS Assay Kit及配套仪器测定样本DNA文库的浓度。
2)取样本DNA文库,使用毛细管电泳试剂High Sensitivity D5000 Reagents及配套仪器进行片段质控,文库平均片段长度在200-600bp之间,无明显小片段和大片段杂峰。
3.RNA预文库制备
采用文库制备试剂盒(KAPA RNA HyperPrep Kit,Roche,货号8105952001)依据厂家说明进行FFPE样本的RNA文库制备,具体步骤如下:
3.1RNA片段化
1)取200ng RNA总量,10μL总体积进行片段化;如样本体积不足10μL,则使用10mMTris-HCl,pH 8.0溶液补足至10μL。
2)取10uL剪切预混液(2X)分装到含有10μL RNA的样本中,混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:
步骤 | 温度 | 时间 |
预冷 | 4℃ | 1min |
片段化 | 65℃ | 1min |
Hold | 4℃ | ∞ |
3)反应结束后短暂离心置于冰盒上备用。
3.2一链合成
1)配制如下逆转录预混反应液1,振荡混匀,并短暂离心将反应液收集至管底
组分名称 | 体积(μL) |
逆转录缓冲液 | 11 |
逆转录酶 | 1 |
合计 | 12 |
2)将混匀后的逆转录预混反应液1取10μL加入到片段化后的PCR管中,混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:85℃)
温度 | 时间 |
25℃ | 10min |
42℃ | 15min |
70℃ | 15min |
4℃ | ∞ |
3)反应结束后短暂离心置于冰盒上备用。
3.3二链合成
1)配制如下逆转录预混反应液2,振荡混匀,并短暂离心将反应液收集至管底。
2)将混匀后的逆转录预混反应液2取30μL加入到一链合成后的PCR管中,混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:85℃)
温度 | 时间 |
16℃ | ∞ |
16℃ | 30min |
62℃ | 10min |
4℃ | ∞ |
3)反应结束后短暂离心置于冰盒上备用。
3.4接头连接
1)连接反应液按每个测试配制体系如下,振荡混匀,并短暂离心将反应液收集至管底
组分名称 | 体积(μL) |
连接酶缓冲液 | 40 |
DNA连接酶 | 10 |
合计 | 50 |
2)取通用接头5μL加入到二链合成后的PCR管中,震荡混匀短暂离心。
3)加入45μL连接反应液,混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:50℃)
步骤 | 温度 | 时间 |
接头连接 | 20℃ | 15min |
Hold | 4℃ | ∞ |
4)反应结束后短暂离心置于冰盒上备用。
3.5连接产物磁珠纯化
1)推荐使用KAPA HyperPure Beads(Roche),取70μL纯化磁珠加至连接产物PCR管中,涡旋振荡或使用移液器轻轻吹打至少10次充分混匀,室温静置孵育5min。
2)将PCR管置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去。
3)保持PCR管在磁力架上,并加入200μL新鲜配制的80%乙醇,计时30s,小心吸取上清并弃去。
4)再次并加入200μL新鲜配制的80%乙醇,计时30s,小心吸取上清并弃去。
5)保持PCR管始终置于磁力架上,开盖室温干燥磁珠5-10min至无乙醇残留。
6)加入50μL已平衡至室温的10mM Tris-HCl,pH 8.0溶液,涡旋混匀,短暂离心,室温静置孵育2min,以从磁珠上洗脱RNA。
7)加入35μL PEG/NaCl溶液,涡旋振荡或使用移液器轻轻吹打至少10次充分混匀,室温静置孵育5min。
8)孵育结束,短暂离心后将PCR管置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去。
9)保持PCR管在磁力架上,并加入200μL新鲜配制的80%乙醇,计时30s,小心吸取上清并弃去;
10)再次并加入200μL新鲜配制的80%乙醇,计时30s,小心吸取上清并弃去。
11)保持PCR管始终置于磁力架上,开盖室温干燥磁珠5-10min至无乙醇残留。
12)加入22μL已平衡至室温的10mM Tris-HCl,pH 8.0溶液,涡旋混匀,短暂离心。
13)室温静置孵育2min,后置于磁力架上,待溶液澄清后,吸取20μL上清至新的PCR管中,切勿碰触磁珠,置于冰盒上备用。
3.6文库扩增
1)每个样本中加入25μL PCR扩增反应液1和5μL PCR扩增引物(包含样本标签序列),混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:105℃)
/>
2)反应结束后置于冰盒上备用。
3.7扩增产物磁珠纯化
1)推荐使用KAPA HyperPure Beads,取50μL纯化磁珠加至PCR管中,按照纯化说明进行磁珠纯化。
2)纯化产物用22μL已平衡至室温的10mM Tris-HCl,pH 8.0溶液洗脱,吸取20μL上清至新的PCR管中,切勿碰触磁珠,置于冰盒上备用。
3.8文库质控
1)使用核酸定量试剂盒dsDNA HS Assay Kit及配套仪器测定样本RNA文库的浓度。
2)取样本RNA文库,使用毛细管电泳试剂High Sensitivity D5000 Reagents及配套仪器进行片段质控,文库平均片段长度在200-600bp之间,无明显小片段和大片段杂峰。
4.文库捕获
采用杂交捕获试剂盒(KAPA HyperCapture Reagent kit及KAPA HyperCaptureBead kit,Roche,货号09075828001和09075798001)对文库进行杂交捕获,捕获探针采用罗氏定制化的JUS70 panel(KAPA HyperChoice,Roche,9052771001)。
4.1文库杂交
1)样本准备
①使用1.5mL离心管,根据样本DNA文库浓度等量混合2-8个文库,一个pool的总量为1μg-4μg。
②使用1.5mL离心管,根据样本RNA文库浓度等量混合2-8个文库,一个pool的总量为1μg-4μg。
③如果pool的体积大于等于45μL,直接进行实验;如果pool的体积小于45μL,则用10mM Tris-HCl,pH 8.0溶液补足至45μL进行实验。
2)杂交反应
①在1.5mL离心管中加入20μL DNA封闭液,加入2倍体积(pool体积+20μL DNA封闭液)已平衡至室温且混匀的磁珠(推荐使用KAPA HyperPure Beads(Roche)),混匀,短暂离心后室温静置孵育10min。
②孵育结束后,将1.5mL离心管置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去。
③保持1.5mL离心管在磁力架上,并加入1000μL新鲜配制的80%乙醇,室温静置30s,小心吸取上清并弃去。
④保持1.5mL离心管始终置于磁力架上,开盖室温干燥磁珠至无乙醇残留(确保磁珠不干裂,否则会影响洗脱效率)。
⑤加入13.4μL已平衡至室温的封闭序列,充分涡旋混匀,短暂离心。
4.2探针杂交
1)在离心管种加入用于配制杂交反应液的杂交缓冲液和无核酸酶水;2)振荡混匀,并短暂离心将反应液收集至管底。
3)将混匀后的杂交反应液取43μL加入到杂交反应后的1.5mL离心管中,混匀,短暂离心,室温静置孵育2min。
4)将1.5mL离心管置于磁力架上吸附磁珠,待溶液澄清后,转移56.4μL上清至一个新的PCR管中。
5)向PCR管中加入4μL杂交探针,充分涡旋混匀,短暂离心将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:105℃)
步骤 | 温度 | 时间 |
变性 | 95℃ | 5min |
杂交 | 55℃ | 16-20h |
4.3洗涤
1)1X洗涤缓冲液按每个pool配制体系如下:
2)将1X洗涤缓冲液1分装到PCR管中,每管分装200μL(每个pool需要2管),置于55℃PCR仪中提前预热至少15min。
3)将1X洗涤缓冲液2分装到PCR管中,每管分装100μL(每个pool需要1管),置于55℃PCR仪中提前预热至少15min。
4)充分混匀已平衡至室温的捕获磁珠(推荐使用DynabeadsTMM-270Streptavidin(Thermo Fisher))。
5)按照一个pool使用50μL捕获磁珠分装到PCR管或1.5mL离心管中,置于磁力架上,待溶液澄清后,小心吸取上清并弃去。
6)保持PCR管或1.5mL离心管在磁力架上,并加入两倍捕获磁珠体积的1X磁珠洗涤缓冲液,充分混匀。
7)将PCR管或1.5mL离心管短暂离心,重新放回磁力架,待溶液澄清后,小心吸取上清并弃去;加入两倍捕获磁珠体积的1X磁珠洗涤缓冲液,充分混匀。
8)将PCR管或1.5mL离心管短暂离心,重新放回磁力架,待溶液澄清后,小心吸取上清并弃去。
9)加入一倍捕获磁珠体积的1X磁珠洗涤缓冲液,充分涡旋混匀,短暂离心,转移50μL至新的PCR管中。
10)将PCR管短暂离心,重新放回磁力架,待溶液澄清后,小心吸取上清并弃去。
11)将杂交结束的样本转移到含捕获磁珠的PCR管中,充分涡旋混匀,短暂离心后立即将PCR管放入PCR仪,55℃孵育15min。
12)保持PCR管在PCR仪上,加入100μL提前预热的1X洗涤缓冲液2,充分混匀。
13)短暂离心后将PCR管置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去。
14)保持PCR管在PCR仪上,并加入200μL提前预热的1X洗涤缓冲液1,充分涡旋混匀,短暂离心后立即将PCR管放入PCR仪,55℃孵育5min。
15)孵育结束后,将PCR管从PCR仪中取出,并置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去;并加入200μL提前预热的1X洗涤缓冲液1,充分涡旋混匀,短暂离心后立即将PCR管放入PCR仪,55℃孵育5min。
16)孵育结束后,将PCR管从PCR仪中取出,并置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去。
17)室温下,向PCR管中加入200μL室温的1X洗涤缓冲液2,充分混匀,短暂离心。
18)室温静置孵育1min后将PCR管置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去。
19)室温下,向PCR管中加入200μL室温的1X洗涤缓冲液3,充分混匀,短暂离心后转移至一个新的PCR管中。
20)室温静置孵育1min后将PCR管置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去。
21)室温下,向PCR管中加入200μL室温的1X洗涤缓冲液4,充分混匀,短暂离心。
22)室温静置孵育1min后将PCR管置于磁力架上吸附磁珠,待溶液澄清后,小心吸取上清并弃去。
23)将PCR管从磁力架上取下,并加入20μL无核酸酶水到PCR管中,充分涡旋混匀,短暂离心,室温静置孵育2min后进行下一步操作。
4.4捕获文库扩增
1)PCR扩增反应液按每个pool配制体系如下:
组分名称 | 体积(μL) |
PCR扩增反应液2 | 25 |
PCR扩增引物2 | 5 |
合计 | 30 |
2)振荡混匀,并短暂离心将反应液收集至管底。
3)将混匀后的PCR扩增反应液取30μL加入到洗涤后的PCR管中,混匀,短暂离心后将反应液收集至管底后立即将PCR管放入PCR仪,按如下设置程序并运行:(热盖温度:105℃)
注*:2-5个文库为一个pool,推荐使用12个循环,6-8个文库为一个pool,推荐使用11个循环。
4)程序结束后立即进行下一步操作。
4.5捕获产物磁珠纯化
1)将扩增后含文库的PCR管涡旋混匀,短暂离心,置于磁力架上吸附至澄清,转移全部上清液到新的PCR管中。
2)推荐使用KAPA HyperPure Beads(Roche),取70μL纯化磁珠加至PCR管中,按照试剂盒纯化说明进行磁珠纯化。
3)纯化产物用22μL已平衡至室温的10mM Tris-HCl,pH 8.0溶液洗脱,吸取20μL上清至新的PCR管中,切勿碰触磁珠,置于冰盒上备用
4.6捕获文库质控
1)使用核酸定量试剂盒dsDNA HS Assay Kit及配套仪器测定样本捕获文库的浓度。
2)取捕获文库,使用毛细管电泳试剂High Sensitivity D5000 Reagents及配套仪器进行文库片段质控,文库平均片段长度在200-600bp之间,无明显小片段和大片段杂峰。
5.测序
测序文库采用基因测序仪NextSeq 550Dx或Novaseq 6000及配套测序试剂按照厂家说明进行上机测序,产生测序数据。
6.样本数据分析及检测方法
6.1DNA样本数据分析处理过程
采用分析软件对原始下机数据进行分析,分析流程可分为以下步骤:
(1)数据预处理:使用软件分析数据测序质量参数Q30碱基占比。如果Q30占比≥60%则质量控制通过;否则质量控制不通过。然后使用Illumina公司的软件将测序产生的BCL文件转化为Fastq文件。再使用Trimmomatic-0.36软件去掉建库中引入的接头序列和低质量碱基片段。
(2)数据比对:使用bwa Version:0.7.10-r806将片段比对到hg19参考基因组上;
(3)数据质量控制:根据样本Q30碱基占比、序列比对到参考基因组比例,目标区域的平均测序深度等参数,决定样本测序质量是否合格。如Q30≥60%,序列比对到参考基因组比例≥90%,平均测序深度≥300X,则样本测序数据质量控制通过;否则不通过,判定检测失败,需要重新测序。
(4)突变分析:SNV/Indels突变检测使用检测软件Vardict V1.8.2-2和MuTect2 V4.0.12.0联合检测;MSI检测使用软件MSIsensor2;基因融合检测使用软件Manta V1.6.0和Delly2 V1.1.15;CNV检测使用软件cnvkit V0.9.6;使用bcftools v1.7检测样本中的胚系突变。分析参数设置要求序列比对质量≥20,碱基质量≥30,其余皆是默认设置。分析参数使用默认参数设置。
(5)突变注释:使用软件snpEff V5.0C对SNV/Indels,基因融合进行HGVS格式注释。并使用COSMIC数据库(v91),ClinVar数据库(v20191112),dbSNP数据库(v145),1000Genomes数据库(v201508),ExAC数据库(v0.3)注释。
(6)经过上面处理后质量符合要求的突变,如果SNV/Indels的突变丰度≥0.5%,则判定为阳性;反之为阴性;融合基因的突变丰度≥0.5%,则判定为阳性;反之为阴性;MSI的score≥10%,则判定为MSI-H;反之为MSS(微卫星稳定);CNV的CN≥3.25,则判为阳性,反之为阴性。
6.2RNA样本数据分析处理过程
(1)数据预处理:使用软件分析数据测序质量参数Q30碱基占比。如果Q30占比≥60%则质量控制通过;否则质量控制不通过。然后使用Illumina公司的软件将测序产生的BCL文件转化为Fastq文件。再使用Trimmomatic-0.36软件去掉建库中引入的接头序列和低质量碱基片段。
(2)数据比对:使用STAR v 2.7.9a比对软件将片段比对到hg19参考基因组上,参数使用默认参数;要求有90%的片段成功比对到人类参考基因组上,样本质量才算合格。
(3)使用arriba v2.1.0检测基因融合。分析参数使用默认参数设置。
(4)阳性判别标准:如果检测到的融合突变可信度(confidence)为high或medium,则为阳性;否则是阴性。
4、226例肝内胆管癌临床样本检测结果
按照上述流程,在226例样本中,共211例检测到SNV/INDEL、CNV、FUSION或MSI-H,总阳性率为93.36%;其中203例检测到了SNV/INDEL(图3),占比为89.82%;34例样本检测到了CNV(图4);5例样本检测结果为MSI-H,221例样本检测结果为MSS(图5~6);25例样本检测到了FGFR2融合(图7),占比11.06%,与文献报道相似;其中DNA共检测到18个FGFR2融合位点,RNA共检测到21个FGFR2融合位点(图7),DNA+RNA双水平检测肿瘤组织样本,可以提高FGFR2融合的检出率。
上述实施例仅为本发明的优选实施例,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
Claims (10)
1.一种生物标志物在制备用于检测胆管癌基因变异的产品中的应用,其特征在于,所述生物标志物包括用于检测胆管癌DNA变异的生物标志物A和用于检测胆管癌RNA变异的生物标志物B;
所述生物标志物A由基因ALK,CDK12,FGFR1,MTOR,PIK3CA,AR,CDKN2A,FGFR3,NF1,PTCH1,ATM,CHEK1,FGFR4,NRAS,PTEN,BARD1,DPYD,FLI1,NRG1,RAD51C,BRAF,EGFR,IDH1,NTRK1,ROS1,BRCA1,ERBB2,IDH2,NTRK3,TSC1,BRCA2,ESR1,KDM6A,PALB2,TSC2,BRIP1,EZH2,KRAS和PDGFRA组成;
所述生物标志物B由ALK,BRAF,ETV6,FGFR1,FGFR2,FGFR3,FGFR4,NRG1,NTRK1,NTRK2,NTRK3,RET,ROS1,FLI1,PDGFB和MET组成。
2.如权利要求1所述的应用,其特征在于,所述DNA变异包括基因融合(Fusion)、单核苷酸变异(SNVs)、插入缺失(Indels)、拷贝数变异(CNV)以及微卫星不稳定(MSI);所述RNA变异包括基因融合(Fusion)。
3.如权利要求1所述的应用,其特征在于,所述应用包括以生物标志物的检测试剂制备用于检测胆管癌基因变异的试剂盒。
4.如权利要求3所述的应用,其特征在于,所述试剂盒中至少包括用于检测生物标志物的探针。
5.如权利要求1所述的应用,其特征在于,所述应用包括以生物标志物作为检测指标制备用于检测胆管癌基因变异的检测系统或检测设备。
6.一种用于检测胆管癌基因变异的试剂盒,其特征在于,所述试剂盒中至少包括用于检测生物标志物的探针。
7.如权利要求6所述的试剂盒,其特征在于,所述试剂盒中还包括用于提取样本中的DNA和/或RNA的试剂,所述样本为胆管癌肿瘤组织。
8.一种用于检测胆管癌基因变异的系统或设备,其特征在于,所述系统或设备包括:
数据获取模块,用以获取样本测序数据,所述测序数据为采用检测胆管癌生物标志物组合的探针与预文库进行杂交捕获,经磁珠纯化后得到测序文库,测序文库通过基因测序仪NextSeq 550Dx/Novaseq 6000测序得到测序数据;
数据处理模块,用于将测序数据经过数据预处理、数据比对和质量控制得到符合质控要求的分析数据;
数据检测分析模块,用于测序数据的检测分析;
以及检测结果获取模块;
所述系统或设备通过以下步骤用以实现胆管癌基因变异的检测:
步骤1:获取待测受试者样本中的生物标志物组合表达谱数据,所述生物标志物组合来源于胆管癌患者的肿瘤组织样本;
步骤2:数据处理,所述数据处理具体包括:
步骤2.1,数据预处理:使用软件分析数据测序质量参数Q30碱基占比。如果Q30占比≥60%则质量控制通过;否则质量控制不通过。然后使用Illumina公司的软件将NextSeq550Dx/Novaseq 6000测序产生的BCL文件转化为Fastq文件。再使用Trimmomatic-0.36软件去掉建库中引入的接头序列和低质量碱基片段;
步骤2.2,数据比对:从原始下机数据中去除低质量的碱基和接头序列,对过滤的数据进行碱基质量统计,将测序片段read回帖到参考基因组并统计read数、比对率、测序深度及覆盖度、变异检测;
步骤2.3,数据质量控制:根据样本Q30碱基占比,序列比对到参考基因组比例,目标区域的平均测序深度等参数,决定样本测序质量是否合格;如果Q30≥60%,序列比对到参考基因组比例≥90%,平均测序深度≥300X,则样本测序数据质量控制通过;否则不通过,判定检测失败,需要重新测序;
步骤3:数据分析,SNV/Indels突变检测使用检测软件Vardict V1.8.2-2和MuTect2 V4.0.12.0联合检测;MSI检测使用软件MSIsensor2;基因融合检测使用软件Manta V1.6.0和Delly2 V1.1.15;CNV检测使用软件cnvkit V0.9.6。分析参数设置要求序列比对质量≥20,碱基质量≥30,其余皆是默认设置;
步骤4:结果获取,如果SNV/Indels的突变丰度≥0.5%,则判定为阳性;反之为阴性;融合基因的突变丰度≥0.5%,则判定为阳性;反之为阴性;MSI的score≥10%,则判定为MSI-H;反之为MSS(微卫星稳定);CNV的CN≥3.25,则判为阳性,反之为阴性。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有程序,所述处理器执行所述程序时实现权利要求8中所述的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序;
其中,在所述计算机程序运行时控制所述计算机可读存储介质实现权利要求8中所述的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311675544.3A CN117512116A (zh) | 2023-12-07 | 2023-12-07 | 一种用于胆管癌检测的生物标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311675544.3A CN117512116A (zh) | 2023-12-07 | 2023-12-07 | 一种用于胆管癌检测的生物标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117512116A true CN117512116A (zh) | 2024-02-06 |
Family
ID=89756758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311675544.3A Pending CN117512116A (zh) | 2023-12-07 | 2023-12-07 | 一种用于胆管癌检测的生物标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117512116A (zh) |
-
2023
- 2023-12-07 CN CN202311675544.3A patent/CN117512116A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022169566A (ja) | まれな変異およびコピー数多型を検出するためのシステムおよび方法 | |
JP2022031905A (ja) | 遺伝的バリアントを検出するための方法およびシステム | |
ES2831148T3 (es) | Identificación y uso de marcadores tumorales de ácido nucleico circulante | |
CN108753967A (zh) | 一种用于肝癌检测的基因集及其panel检测设计方法 | |
US20060115844A1 (en) | Enhanced amplifiability of minute fixative-treated tissue samples, minute stained cytology samples, and other minute sources of DNA | |
US20230040907A1 (en) | Diagnostic assay for urine monitoring of bladder cancer | |
EP3034624A1 (en) | Method for the prognosis of hepatocellular carcinoma | |
CN108138209A (zh) | 通过原位扩增制备细胞游离核酸分子的方法 | |
JP2021518107A (ja) | 組織特異的メチル化マーカー | |
WO2023142630A1 (zh) | 一种用于膀胱尿路上皮癌诊断的检测方法和试剂盒 | |
WO2020243722A1 (en) | Methods and systems for improving patient monitoring after surgery | |
CN106811517A (zh) | 一种用于检测c-MET基因外显子14跳读突变的组合物及试剂盒 | |
CN107881232A (zh) | 探针组合物及基于ngs方法检测肺癌和结直肠癌基因的应用 | |
CN113046437A (zh) | 一种检测met e14跳跃突变的方法 | |
WO2023226939A1 (zh) | 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用 | |
CN107151707B (zh) | 一种检测肺癌相关基因热点突变的试剂盒及其应用 | |
CN116555423A (zh) | 肺癌甲基化标志物组合、检测产品及其应用 | |
CN117512116A (zh) | 一种用于胆管癌检测的生物标志物及其应用 | |
CN108342483B (zh) | 一组用于非超突变型结直肠癌分子分型的基因及其应用 | |
CN110564851A (zh) | 一组用于非超突变型直肠癌分子分型的基因及其应用 | |
CN103397102A (zh) | 一种对基因突变丰度定量的检测方法 | |
CN115125296B (zh) | 瑞戈非尼药敏标记物及其相关试剂的应用 | |
CN112080566B (zh) | 基于高通量测序法的甲状腺癌检测产品及用途 | |
CN111379032A (zh) | 一种用于构建同时实现基因组拷贝数变异检测和基因突变检测的测序文库的方法和试剂盒 | |
US20240002953A1 (en) | Method for detecting polynucleotide variations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |