TWI653340B - Method for screening gene markers of gastric cancer, gene markers screened by the method, and uses thereof - Google Patents
Method for screening gene markers of gastric cancer, gene markers screened by the method, and uses thereof Download PDFInfo
- Publication number
- TWI653340B TWI653340B TW106146504A TW106146504A TWI653340B TW I653340 B TWI653340 B TW I653340B TW 106146504 A TW106146504 A TW 106146504A TW 106146504 A TW106146504 A TW 106146504A TW I653340 B TWI653340 B TW I653340B
- Authority
- TW
- Taiwan
- Prior art keywords
- hmc
- gastric cancer
- gene marker
- gene
- content
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 206010017758 gastric cancer Diseases 0.000 title claims abstract description 41
- 208000005718 Stomach Neoplasms Diseases 0.000 title claims abstract description 39
- 201000011549 stomach cancer Diseases 0.000 title claims abstract description 37
- 108090000623 proteins and genes Proteins 0.000 title claims description 78
- 238000012216 screening Methods 0.000 title description 21
- 239000003550 marker Substances 0.000 claims abstract description 61
- 239000000523 sample Substances 0.000 claims description 33
- 108020004414 DNA Proteins 0.000 claims description 28
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 239000012634 fragment Substances 0.000 claims description 11
- 102100021655 Extracellular sulfatase Sulf-1 Human genes 0.000 claims description 10
- 101000820630 Homo sapiens Extracellular sulfatase Sulf-1 Proteins 0.000 claims description 10
- 102000013340 FBXL7 Human genes 0.000 claims description 8
- 101150049384 Fbxl7 gene Proteins 0.000 claims description 8
- 102100040725 Zinc finger protein 714 Human genes 0.000 claims description 8
- 102100025440 BMP-binding endothelial regulator protein Human genes 0.000 claims description 7
- 102100024155 Cadherin-11 Human genes 0.000 claims description 7
- 101000934632 Homo sapiens BMP-binding endothelial regulator protein Proteins 0.000 claims description 7
- 101000580370 Homo sapiens RAD52 motif-containing protein 1 Proteins 0.000 claims description 7
- 101001072037 Homo sapiens cAMP and cAMP-inhibited cGMP 3',5'-cyclic phosphodiesterase 10A Proteins 0.000 claims description 7
- 102100030098 Oncostatin-M-specific receptor subunit beta Human genes 0.000 claims description 7
- 102100035032 Paralemmin-2 Human genes 0.000 claims description 7
- 102100027420 RAD52 motif-containing protein 1 Human genes 0.000 claims description 7
- 102100036377 cAMP and cAMP-inhibited cGMP 3',5'-cyclic phosphodiesterase 10A Human genes 0.000 claims description 7
- 102000004169 proteins and genes Human genes 0.000 claims description 7
- 101000989493 Homo sapiens Putative uncharacterized protein C9orf92 Proteins 0.000 claims description 6
- 101000964738 Homo sapiens Zinc finger protein 714 Proteins 0.000 claims description 6
- 102100029321 Putative uncharacterized protein C9orf92 Human genes 0.000 claims description 6
- 102100032583 Calcium-dependent secretion activator 2 Human genes 0.000 claims description 5
- 102100037102 Homeobox protein MOX-2 Human genes 0.000 claims description 5
- 101000762236 Homo sapiens Cadherin-11 Proteins 0.000 claims description 5
- 101000867778 Homo sapiens Calcium-dependent secretion activator 2 Proteins 0.000 claims description 5
- 101000955037 Homo sapiens Homeobox protein MOX-2 Proteins 0.000 claims description 5
- 101000586302 Homo sapiens Oncostatin-M-specific receptor subunit beta Proteins 0.000 claims description 5
- 101000735217 Homo sapiens Paralemmin-2 Proteins 0.000 claims description 5
- 101001075528 Homo sapiens Rho GTPase-activating protein 28 Proteins 0.000 claims description 5
- 101000814315 Homo sapiens Wilms tumor protein 1-interacting protein Proteins 0.000 claims description 5
- 108010008858 Nitric Oxide Synthase Type I Proteins 0.000 claims description 5
- 102100020896 Rho GTPase-activating protein 28 Human genes 0.000 claims description 5
- 102100039456 Wilms tumor protein 1-interacting protein Human genes 0.000 claims description 5
- 102100036689 Zinc finger protein 518B Human genes 0.000 claims description 5
- 210000003608 fece Anatomy 0.000 claims description 5
- 101000781873 Homo sapiens Zinc finger protein 518B Proteins 0.000 claims description 4
- 210000001124 body fluid Anatomy 0.000 claims description 4
- 239000010839 body fluid Substances 0.000 claims description 4
- 210000004027 cell Anatomy 0.000 claims description 4
- 230000028327 secretion Effects 0.000 claims description 4
- 102100037317 F-box/LRR-repeat protein 7 Human genes 0.000 claims description 3
- 210000004369 blood Anatomy 0.000 claims description 3
- 239000008280 blood Substances 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 3
- 206010003445 Ascites Diseases 0.000 claims description 2
- 108010082522 Oncostatin M Receptors Proteins 0.000 claims description 2
- 101710156800 Paralemmin-2 Proteins 0.000 claims description 2
- 208000002151 Pleural effusion Diseases 0.000 claims description 2
- 206010036790 Productive cough Diseases 0.000 claims description 2
- 230000004570 RNA-binding Effects 0.000 claims description 2
- 208000008383 Wilms tumor Diseases 0.000 claims description 2
- 208000026448 Wilms tumor 1 Diseases 0.000 claims description 2
- 102100022748 Wilms tumor protein Human genes 0.000 claims description 2
- 101710127857 Wilms tumor protein Proteins 0.000 claims description 2
- 101710158117 Zinc finger protein 518B Proteins 0.000 claims description 2
- 101710182148 Zinc finger protein 714 Proteins 0.000 claims description 2
- 210000000941 bile Anatomy 0.000 claims description 2
- 210000000170 cell membrane Anatomy 0.000 claims description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 2
- 108091006104 gene-regulatory proteins Proteins 0.000 claims description 2
- 102000034356 gene-regulatory proteins Human genes 0.000 claims description 2
- 239000003446 ligand Substances 0.000 claims description 2
- 108010000953 osteoblast cadherin Proteins 0.000 claims description 2
- 230000003647 oxidation Effects 0.000 claims description 2
- 238000007254 oxidation reaction Methods 0.000 claims description 2
- 210000001819 pancreatic juice Anatomy 0.000 claims description 2
- 102000007268 rho GTP-Binding Proteins Human genes 0.000 claims description 2
- 108010033674 rho GTP-Binding Proteins Proteins 0.000 claims description 2
- 210000003802 sputum Anatomy 0.000 claims description 2
- 208000024794 sputum Diseases 0.000 claims description 2
- 210000004243 sweat Anatomy 0.000 claims description 2
- 210000001519 tissue Anatomy 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims 2
- 239000013610 patient sample Substances 0.000 claims 2
- 102000006538 Nitric Oxide Synthase Type I Human genes 0.000 claims 1
- 102000053062 Rad52 DNA Repair and Recombination Human genes 0.000 claims 1
- 108700031762 Rad52 DNA Repair and Recombination Proteins 0.000 claims 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 claims 1
- 210000000349 chromosome Anatomy 0.000 claims 1
- 239000003999 initiator Substances 0.000 claims 1
- 229910052757 nitrogen Inorganic materials 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 abstract description 25
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 27
- 201000002313 intestinal cancer Diseases 0.000 description 26
- 238000012163 sequencing technique Methods 0.000 description 26
- 108700019961 Neoplasm Genes Proteins 0.000 description 16
- 102000048850 Neoplasm Genes Human genes 0.000 description 16
- 238000001514 detection method Methods 0.000 description 13
- 239000011324 bead Substances 0.000 description 12
- 230000035945 sensitivity Effects 0.000 description 11
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 10
- 206010028980 Neoplasm Diseases 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 238000012165 high-throughput sequencing Methods 0.000 description 10
- 238000002372 labelling Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 239000007790 solid phase Substances 0.000 description 8
- -1 RBMS3 Proteins 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 206010009944 Colon cancer Diseases 0.000 description 6
- 238000012408 PCR amplification Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 229960002685 biotin Drugs 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 102100022397 Nitric oxide synthase, brain Human genes 0.000 description 5
- 229920001213 Polysorbate 20 Polymers 0.000 description 5
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 5
- 235000020958 biotin Nutrition 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 5
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 4
- 101001128748 Homo sapiens Nucleoside diphosphate kinase 3 Proteins 0.000 description 4
- 101000814373 Homo sapiens Protein wntless homolog Proteins 0.000 description 4
- 101000618138 Homo sapiens Sperm-associated antigen 4 protein Proteins 0.000 description 4
- 102100032209 Nucleoside diphosphate kinase 3 Human genes 0.000 description 4
- 102100039471 Protein wntless homolog Human genes 0.000 description 4
- 102100021907 Sperm-associated antigen 4 protein Human genes 0.000 description 4
- 239000007983 Tris buffer Substances 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000002496 gastric effect Effects 0.000 description 4
- 230000000968 intestinal effect Effects 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 4
- 102100024345 Disintegrin and metalloproteinase domain-containing protein 20 Human genes 0.000 description 3
- 102100020921 Follistatin Human genes 0.000 description 3
- 102100032845 Gamma-2-syntrophin Human genes 0.000 description 3
- 229920002527 Glycogen Polymers 0.000 description 3
- 101000689653 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 20 Proteins 0.000 description 3
- 101000868450 Homo sapiens Gamma-2-syntrophin Proteins 0.000 description 3
- 101000583714 Homo sapiens Pleckstrin homology-like domain family A member 3 Proteins 0.000 description 3
- 101100078258 Homo sapiens RUNX1T1 gene Proteins 0.000 description 3
- 102100030925 Pleckstrin homology-like domain family A member 3 Human genes 0.000 description 3
- 102100024952 Protein CBFA2T1 Human genes 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 108700040655 RUNX1 Translocation Partner 1 Proteins 0.000 description 3
- 238000001369 bisulfite sequencing Methods 0.000 description 3
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 208000029742 colonic neoplasm Diseases 0.000 description 3
- 229940096919 glycogen Drugs 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 description 2
- 102100025475 Carcinoembryonic antigen-related cell adhesion molecule 5 Human genes 0.000 description 2
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 2
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 2
- 101000903725 Enterobacteria phage T4 DNA beta-glucosyltransferase Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 206010061968 Gastric neoplasm Diseases 0.000 description 2
- 108700023372 Glycosyltransferases Proteins 0.000 description 2
- 102000051366 Glycosyltransferases Human genes 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 101000931668 Homo sapiens Follistatin Proteins 0.000 description 2
- 101000632056 Homo sapiens Septin-9 Proteins 0.000 description 2
- 101001127470 Homo sapiens p53 apoptosis effector related to PMP-22 Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 102100028024 Septin-9 Human genes 0.000 description 2
- 239000000370 acceptor Substances 0.000 description 2
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 2
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 150000001540 azides Chemical class 0.000 description 2
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 2
- 238000009739 binding Methods 0.000 description 2
- 238000009534 blood test Methods 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000002052 colonoscopy Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 150000001993 dienes Chemical class 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002550 fecal effect Effects 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 229940084986 human chorionic gonadotropin Drugs 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 102100030898 p53 apoptosis effector related to PMP-22 Human genes 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 235000012431 wafers Nutrition 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- VZXTWGWHSMCWGA-UHFFFAOYSA-N 1,3,5-triazine-2,4-diamine Chemical compound NC1=NC=NC(N)=N1 VZXTWGWHSMCWGA-UHFFFAOYSA-N 0.000 description 1
- HKVRRPIGVZKBQT-UHFFFAOYSA-N 3,3-diphenylcyclooctyne Chemical compound C1CCCCC#CC1(C=1C=CC=CC=1)C1=CC=CC=C1 HKVRRPIGVZKBQT-UHFFFAOYSA-N 0.000 description 1
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 1
- SBHSUMUTJOPRIK-HPFNVAMJSA-N 5-(beta-D-glucosylmethyl)cytosine Chemical compound NC1=NC(=O)NC=C1CO[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 SBHSUMUTJOPRIK-HPFNVAMJSA-N 0.000 description 1
- UGQXLWWNSMGEBY-UHFFFAOYSA-N 6-amino-5-sulfanyl-1h-pyrimidin-2-one Chemical compound NC1=NC(=O)NC=C1S UGQXLWWNSMGEBY-UHFFFAOYSA-N 0.000 description 1
- 108091022885 ADAM Proteins 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101000870529 Enterobacteria phage T4 DNA alpha-glucosyltransferase Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000008857 Ferritin Human genes 0.000 description 1
- 108050000784 Ferritin Proteins 0.000 description 1
- 238000008416 Ferritin Methods 0.000 description 1
- 108010014612 Follistatin Proteins 0.000 description 1
- 102000016970 Follistatin Human genes 0.000 description 1
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000974009 Homo sapiens Nitric oxide synthase, brain Proteins 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 102100023252 Nucleoside diphosphate kinase A Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical class O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 description 1
- YLSUUMDTTUVTGP-UHFFFAOYSA-N [6-(azidomethyl)-3,4,5-trihydroxyoxan-2-yl] [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] hydrogen phosphate Chemical compound O1C(N2C(NC(=O)C=C2)=O)C(O)C(O)C1COP(O)(=O)OP(O)(=O)OC1OC(CN=[N+]=[N-])C(O)C(O)C1O YLSUUMDTTUVTGP-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 108010016752 endodeoxyribonuclease Rts1 Proteins 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 229920006268 silicone film Polymers 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
Abstract
本發明涉及用於檢測胃癌的基因標誌物及其用途。本發明還涉及使用所述基因標誌物對胃癌進行檢測的方法。
Description
本發明係涉及通過高通量定序篩選基因標誌物的領域。具體地,本發明涉及通過高通量定序對胃癌的基因標誌物進行篩選的方法,以及利用該方法篩選出的基因標誌物及其用途。
隨著生活環境和習慣的改變,近些年來癌症的發病率在世界範圍內逐年升高,人們對其關注也隨之增加。胃癌和腸癌分別是我國第二大和第三大高發癌,屬於發病率和病死率都非常高的惡性腫瘤,它們的發生和發展是一個多因素參與和多階段累積致癌的複雜過程。本著現有通行的癌症早發現早治療方案,越早期發現,越有可能早期控制甚至治癒癌症。如何對胃癌和腸癌進行早期篩檢,及時治療,正確地判斷預後,逐漸受到人們重視。
傳統篩查方法有胃腸鏡檢查和大便隱血試驗,但都有自身不可克服的缺點。胃腸鏡加病理活檢被認為是胃腸癌症篩查和診斷的金標準,但是因為鏡檢的侵入性和腸道準備的不適,很多病人不願意接受腸胃鏡檢查。最近有研究表明腸鏡對右側結腸內常見的扁平息肉的診斷效果不好,腸鏡篩查並不能降低右側結腸癌的發病率。大便隱血試驗是另一種臨床上常用的大腸癌篩查方法,該法有完全無創和廉價等優點,但是其檢測腫瘤的準確性低,通過免疫化學的改進方法也僅能檢測到50-60%的大腸癌和30%左右的癌前腺瘤。並且,該檢測方法假陽性率較高,故很難得到推廣和普及。
除以上傳統篩查方法以外,人們還在不斷探索其他方法,以提高早期篩檢率,腫瘤標誌物是其中之一。例如,通過DHPLC分析發現T1151A作為錯配修復基因hMLH1上的一個多態位點,可作為胃及大腸腫瘤,尤其是低齡胃及大腸腫瘤高危人群篩選的候選指標(參見張曉梅等,《腫瘤》,2005,25(1):62-65)。採用CA19-9(糖類胃腸癌相關抗原)和SA(唾液酸)的腫瘤標誌物聯合檢測對結/直腸癌和胃/賁門癌的檢測陽性率分別可以達到76.7%和82.5% (參見蔡發成等,《實用醫技雜誌》,2005,12(3B):722-723)。此外,我國還開發了C12蛋白晶片檢測系統,通過分析血清中CA19-9、神經元特異性烯醇化酶(NSE)、癌胚抗原(CEA)、糖原242(CA242)、糖原125(CA125)、糖原153 (CA15-3)、甲胎蛋白(AFP)、鐵蛋白、人絨毛膜促性腺激素(HCG)、人生長激素(HGH)中這十種腫瘤標誌物的表達水準,以實現腫瘤的早期篩檢和監測。然而,大多數發現的腫瘤標誌物還停留在研究階段,並沒有發展到臨床篩檢階段;或者已經應用在臨床篩檢上,但檢測準確度或靈敏度不高。例如,研究發現,上述C12系統對胃腸癌患者的總體篩檢率為39.21%,I、II、III、IV期患者的篩檢率分別為13.73%、33.33%、38.30%、58.03%,表明C12檢測系統對晚期胃腸癌的篩檢有一定的價值,但對早期的敏感性不高(參見楊雪琴等,《南京醫科大學學報(自然科學版)》,2008(10):1285-1289)。
近期,在現有常規基因標記物的基礎上又發展了另外兩種腸癌的體外篩檢方法:來自美國Exact Sciences公司的Cologuard技術和來自Epigenomics公司的Epi proColon技術。前者主要檢測糞便中的異常DNA變化及人類糞便中存在的潛血紅蛋白;後者檢測血液游離DNA中的SEPT9
甲基化標記物。大規模臨床實驗表明,Cologuard的檢出率效果較好,但需要操作糞便,使用者體驗較差;而SEPT9甲基化屬於液體活檢,雖然用戶體驗較好,但是特異性和靈敏度都較差(分別為80%和72%)。
因此迫切需要具有高特異性和高靈敏度並可供臨床檢測使用的胃癌的基因標誌物,使能夠以無創或微創、快捷的方法有效篩檢胃癌,以改善病人接受長期監測的意願。
發明人通過對正常樣品和腸癌或胃癌樣品進行高通量定序,並對其中各基因上的5-羥甲基胞嘧啶(5-hmC)含量進行分析,出乎意料地發現了多個極具資訊的可用於檢測腸癌或胃癌的基因標誌物。
因此,本發明的第一個方面涉及用於檢測腸癌的基因標誌物,包括一個或多個選自以下的基因:ADAM金屬肽酶域20 (ADAM20
)、F盒和富亮氨酸重複蛋白7(FBXL7
)、卵泡抑素(FST
)、TP53凋亡效應器(PERP
)、普列克底物蛋白同源相似域家族A成員3 (PHLDA3
)、Runt相關轉錄因子1移動伴侶1(RUNX1T1
)、互養蛋白γ2 (SNTG2
)、精子相關抗原4 (SPAG4
)、硫酸酯酶1 (SULF1
)和NME/NM23核苷二磷酸激酶(NME3
)。優選的,所述基因標誌物包括至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或十個選自以下的基因:ADAM20 、 FBXL7 、 FST 、 PERP 、 PHLDA3 、 RUNX1T1 、 SNTG2 、 SPAG4 、 SULF1
和NME3
。更優選的,所述基因標誌物包括ADAM20 、 FBXL7 、 FST 、 PERP 、 PHLDA3 、 RUNX1T1 、 SNTG2 、 SPAG4 、 SULF1
和NME3
。
本發明的第二個方面涉及用於檢測胃癌的基因標誌物,包括一個或多個選自以下的基因:Rho GTP酶啟動蛋白28 (ARHGAP28
)、BMP結合內皮調控者(BMPER
)、染色體9開放讀碼框92 (C9orf92
)、鈣依賴分泌啟動者2 (CADPS2
)、鈣黏蛋白11 (CDH11
)、F盒和富亮氨酸重複蛋白7(FBXL7
)、間質同源框2 (MEOX2
)、氧化一氮合成酶1 (NOS1
)、抑瘤素M受體(OSMR
)、細胞膜調控蛋白paralemmin 2 (PALM2
)、磷酸二酯酶10A (PDE10A
)、RNA結合模體單鏈相互作用蛋白3 (RBMS3)、硫酸酯酶1 (SULF1
)、wntless Wnt配體分泌調節者(WLS
)、Wilms瘤1作用蛋白(WTIP
)、鋅指蛋白518B (ZNF518B
)、鋅指蛋白714 (ZNF714
)和Rad52模體包含1 (RDM1
)。優選的,所述基因標誌物包括至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個、至少十個、至少11個、至少12個、至少13個、至少14個、至少15個、至少16個、至少17個或18個選自以下的基因:ARHGAP28 、 BMPER 、 C9orf92 、 CADPS2 、 CDH11 、 FBXL7 、 MEOX2 、 NOS1 、 OSMR 、 PALM2 、 PDE10A 、 RBMS3 、 SULF1 、 WLS 、 WTIP 、 ANF518B 、 ZNF714
和RDM1
。更優選的,所述基因標誌物包括ARHGAP28 、 BMPER 、 C9orf92 、 CADPS2 、 CDH11 、 FBXL7 、 MEOX2 、 NOS1 、 OSMR 、 PALM2 、 PDE10A 、 RBMS3 、 SULF1 、 WLS 、 WTIP 、 ANF518B 、 ZNF714
和RDM1
。
本發明還涉及上述基因標誌物在檢測腸癌或胃癌中的用途。本發明還涉及利用上述基因標誌物進行腸癌或胃癌檢測的試劑盒,其包括用於測定上述基因標誌物的5-hmC含量的試劑和說明書。
本發明的第三個方面涉及用於檢測胃癌或腸癌的方法,包括以下步驟: (a)測定正常樣品和受試者樣品中本發明所述的基因標誌物的5-hmC的含量; (b)用正常樣品中所述基因標誌物的5-hmC含量作為參照,將受試者樣品中對應的基因標誌物的5-hmC含量標準化; (c)對經標準化的所述基因標誌物的5-hmC含量進行數學關聯,並獲得評分;和 (d)根據所述評分獲得檢測結果。
在一個實施方案中,所述樣品是受試者或正常人體液中游離的DNA片段,或來源於胞器、細胞以及組織中的完整基因組DNA。其中,體液是血液、尿液、汗液、痰液、糞便、腦脊液、腹水、胸水、膽汁、胰腺液等。
在一個實施方案中,本發明所述的基因標誌物的5-hmC含量可通過本領域技術人員已知的任何方法進行測定,例如包括但不限於,葡糖基化法、限制性內切酶法、化學標記法、與高通量定序方法聯用的沉澱法、單分子即時定序法(SMRT)、氧化重亞硫酸鹽定序法(OxBS-Seq)等。葡糖基化法的原理是採用T4噬菌體β
-葡萄糖轉移酶(β
-GT),在葡萄糖供體受質(substrate)尿核苷二磷酸葡萄糖(UDP-Glu)存在下,將葡萄糖轉移至羥基位置,從而生成β
-葡萄糖基-5-羥甲基胞嘧啶(5-ghmC)。同時可採用同位素標記受質進行定量。在葡糖基化法基礎上進一步發展出限制性內切酶法和化學標記法。限制性內切酶法的原理是:葡糖基化反應改變了一些限制性內切酶的酶切特性。甲基化依賴的限制性內切酶MspI和HpaII 可識別同樣的序列(CCGG),但它們對甲基化狀態的敏感性是不同: MspI 識別並切割 5-甲基胞嘧啶(5-mC)和 5-hmC,但不能切割5-ghmC; HpaII 只切割完全未修飾的位點,胞嘧啶上的任何修飾(5-mC、5-hmC、5-ghmC)均阻礙切割。若CpG 位點含有5-hmC,那麼糖基化、酶解之後能檢測到條帶,未糖基化對照反應中沒有條帶; 同時可採用qPCR 進行定量分析。另外,其他限制性內切酶也同樣存在阻礙5-ghmC 酶切的情況,可應用於5-hmC 檢測(如: GmrSD,MspJI,PvuRts1I,Taq
I 等)。化學標記法的原理是:將酶反應受質上的葡萄糖進行化學修飾轉變成UDP-6-N3-glucose,將6-N3-glucose 轉移到羥甲基位置,生成N3-5ghmC。隨後,通過點擊化學方法在每個5-hmC 上添加一分子生物素,結合下一代高通量DNA 定序技術或單分子定序技術,可分析5-hmC在基因組DNA中的分佈情況。沉澱法是將5-hmC用特殊方式修飾後再將其特異性地從基因組DNA中捕獲下來,並進行定序分析。氧化重亞硫酸鹽定序法是首個以單鹼基解析度對5-hmC 進行定量定序的方法。首先將5-hmC 進行KRuO4 氧化處理,生成5-甲醯胞嘧啶(5fC),然後採用重亞硫酸鹽定序。在此過程中,5-hmC先氧化為5fC,而後脫氨形成U。通常,同時採用多種檢測方法對5-hmC進行定量檢測。
在本發明的一個實施方案中,利用化學標記法結合高通量定序來測定本發明的基因標誌物的5-hmC含量。在該具體的實施方案中,測定本發明的基因標誌物的5-hmC含量的方法包括以下步驟:將來自腸癌或胃癌患者和正常人的樣品的DNA片段化;將所述片段化的DNA末端修復並末端補齊;將末端補齊的DNA與定序接頭連接,獲得連接產物;通過標記反應對連接產物中的5-羥甲基胞嘧啶進行標記;收集濃化(enrichment、或稱之為富集)含有5-羥甲基胞嘧啶標記的DNA片段,獲得富集產物;對富集產物進行PCR擴增,獲得定序基因庫;對定序基因庫進行高通量定序,獲得定序結果;根據定序結果確定5-羥甲基胞嘧啶在基因上的含量。其中,標記反應包括:i)利用糖基轉移酶將帶有修飾基團的糖共價連接到5-羥甲基胞嘧啶的羥甲基上,和ii) 將直接或間接連有生物素的點擊化學受質與帶有修飾基團的5-羥甲基胞嘧啶反應。其中,步驟i)和步驟ii)可以按順序進行,也可以在一個反應中同時進行。這種標記方法減少了定序所需的樣本量,且5-羥甲基胞嘧啶上的生物素標籤使其在定序中顯示出更高的動力學信號,提高了核苷酸識別的準確性。在該實施方案中,所述糖基轉移酶包括但不限於: T4噬菌體β-葡糖基轉移酶(β-GT)、 T4噬菌體α-葡糖基轉移酶(α-GT)及其具有相同或相似活性的衍生物、類似物、或重組酶;所述帶有修飾基團的糖包括但不限於:帶有疊氮修飾的糖類(例如6-N3-葡萄糖)或帶有其他化學修飾(例如羰基、巰基、羥基、羧基、碳-碳雙鍵、碳-碳三鍵、二硫鍵、胺基、醯胺基、雙烯等)的糖類,其中優選帶有疊氮修飾的糖類;所述用於間接連接生物素和點擊化學受質的化學基團包括但不限於:羰基、巰基、羥基、羧基、碳-碳雙鍵、碳-碳三鍵、二硫鍵、胺基、醯胺基、雙烯。在該實施方案中,優選通過固相材料來收集濃化含有5-hmC標記的DNA片段。具體地,可以通過固相親和反應或其他特異性結合反應將含有5-羥甲基胞嘧啶標記的DNA片段結合在固相材料上,然後通過多次洗滌去除未結合的DNA片段。固相材料包括但不限於帶有表面修飾的矽片或其他晶片,例如人工高分子小球(優選直徑為1 nm-100 mm)、磁性小球(優選直徑為1 nm-100 mm)、瓊脂糖小球等(優選直徑為1 nm-100 mm)。固相富集中所用的洗滌液是本領域技術人員熟知的緩衝液,包括但不限於:含有Tris-HCl、MOPS、HEPES (pH=6.0-10.0,濃度在1 mM到1 M之間)、NaCl (0-2M)或表面活性劑如Tween20 (0.01%-5%)的緩衝液。在該實施方案中,優選直接在固相上進行PCR擴增從而製備定序基因庫。如有需要,在固相上進行PCR擴增後,可以回收擴增產物後進行第二輪PCR擴增來製備定序基因庫。所述第二輪PCR擴增可用本領域技術人員已知的常規方法進行。任選地,在製備定序基因庫的過程中可進一步包括一個或多個純化步驟。本領域技術人員知曉的或可商購的任何純化試劑盒均可用於本發明。純化方法包括但不限於:凝膠電泳切膠回收、矽膠膜離心柱法、磁珠法、乙醇或異丙醇沉澱法或其組合。任選地,在高通量定序之前,對定序基因庫進行品質檢查。例如,對文庫進行片段大小分析並使用qPCR方法對文庫的濃度進行絕對定量。通過品質檢查的定序基因庫可用於高通量定序。然後將一定數量(1-96個)含有不同barcode的文庫按相同濃度混勻並根據二代定序儀的標準上機方法上機定序,獲得定序結果。本領域已知的各種二代定序平臺及其相關的試劑可用於本發明。
在本發明的一個實施方案中,優選將定序結果與標準人類基因組參考序列進行比對,挑選出其中比對到本發明基因標誌物上的序列,即選擇比對位元點與基因特徵(如組蛋白修飾位點、轉錄因子結合位點、基因外顯子內含子區域以及基因啟動子等)重合區域的讀段數量,以代表5-hmC在該基因上的修飾水準,從而測定5-hmC在該基因標誌物上的含量。優選在進行比對前,首先將定序結果清除低品質定序位點,其中衡量定序位點品質的因素包括但不限於:鹼基品質、reads品質、GC含量、重複序列和Overrepresented 序列數量等。該步驟中涉及的各種比對軟體和分析方法是本領域已知的。
在本發明的一個實施方案中,測定基因標誌物的5-hmC含量是指測定該基因標誌物全長上的5-hmC含量或測定該基因標誌物上某一片段的5-hmC含量或其組合。
根據本發明,在測定各基因標誌物上5-hmC含量之後,用正常樣品中所述基因標誌物的5-hmC含量作為參照,將受試者樣品中對應的基因標誌物的5-hmC含量標準化。舉例而言,正常樣品和受試者樣品中同一基因標誌物的5-hmC含量分別為X和Y,則受試者樣品中該基因標誌物的標準化5-hmC含量為Y/X。
根據本發明,在資料標準化後,對各基因標誌物的標準化5-hmC含量進行數學關聯以獲得評分,從而根據所述評分獲得檢測結果。如本文所用,“數學關聯”是指將來自生物樣品的基因標誌物的5-hmC含量與腸癌或胃癌篩檢結果相關聯的任何計算方法或機器學習方法。本領域普通技術人員理解,可選擇不同的計算方法或工具用於提供本發明的數學關聯,例如彈性網路正則化、決策樹、廣義線性模型、邏輯回歸、最高分值對、神經網路、線性和二次判別式分析(LQA 和QDA)、樸素貝葉斯、隨機森林和支持向量機。
在本發明的一個實施方案中,對各基因標誌物的標準化5-hmC含量進行數學關聯並獲得評分的具體步驟如下:將各基因標誌物的標準化5-hmC含量乘以加權係數,獲得該基因標誌物的預測因子t;將各基因標誌物的預測因子t相加,獲得總預測因子T;將總預測因子T經過Logistic轉換獲得評分P;若P>0.5,則該受試者樣品患有腸癌或胃癌;若P<0.5,則該受試者樣品為正常。本文所述的加權係數是指在考慮可能影響5-hmC含量的因素(例如受試者地域、年齡、性別、低於、吸煙史、飲酒史、家族史等)的情況下,通過各種高級統計分析方法獲得的係數。
與現有技術相比,本發明中用於檢測腸癌和/或胃癌的方法是基於基因標誌物上的5-hmC含量,因此可以使用更為廣泛的DNA樣品來源。因此,本發明中用於檢測腸癌和/或胃癌的方法具有以下幾個優點:(1)安全無創,即使無症狀人群也對該檢測接受度高;(2)DNA來源廣泛,不存在影像學中的檢測盲區;(3)準確性高,有較高的靈敏度和特異性;(4)操作方便,用戶體驗好,容易進行疾病動態監測。
下面將參考附圖並結合實施例來詳細說明本發明,以使本領域的技術人員可以更好的理解本發明並能予以實施。需要說明的是,本領域的技術人員應該理解本發明的附圖及其實施例僅僅是為了說明的目的,並不能對本發明構成任何限制。在不矛盾的情況下,本申請中的實施例及實施例中的特徵可以相互組合。
實施例
1.
腸癌基因標誌物的篩選
(1)抽提血漿DNA:
從來自15位腸癌患者和18位正常人的樣品中分別抽提10 ng血漿DNA。可利用本領域技術人員所熟知的任何適用於抽提血漿DNA的方法、和試劑進行此步驟。
(2)將血漿DNA進行末端補齊、懸A並與定序接頭連接:
根據Kapa Hyper Perp Kit說明書製備含有50 mL 血漿DNA、7 mL End Repair & A-Tailing Buffer和3 mL End Repair & A-Tailing Enzyme mix的反應混合液(總體積為60 mL),在20ºC溫浴30分鐘,然後在65ºC溫浴30分鐘。在1.5 mL低吸附EP管中配置以下連接反應混合物:5 mL Nuclease free water,30 mL Ligation Buffer以及10 mL DNA Ligase。向45 mL連接反應混合物中加入5 mL的定序接頭,混合,於20ºC加熱20分鐘,然後保持於4ºC。使用AmpureXP beads對反應產物進行純化,用20 mL含Tris-HCl (10 mM,pH=8.0)及EDTA(0.1 mM)的緩衝液進行沖提獲得最終的DNA連接樣品。
(3)標記5-羥甲基胞嘧啶:
製備總體積為26 mL的標記反應混合液:疊氮修飾的二磷酸尿苷葡萄糖(即UDP-N3-Glu,終濃度為50 mM)、β-GT(終濃度為1 mM)、Mg2+
(終濃度為25mM)、HEPES(pH=8.0,終濃度為50mM)和來自上述步驟的20 mL DNA。將混合液在37ºC溫浴1小時。取出混合液,用AmpureXP beads純化,獲得純化的20 mL DNA。
然後在上述純化的20 mL DNA中加入1 mL連接有生物素的二苯基環辛炔(DBCO-Biotin),於37ºC反應2小時,接著用AmpureXP beads純化,獲得純化的標記產物。
(4)固相收集濃化含有標記的5-羥甲基胞嘧啶的DNA片段:
首先,按以下步驟準備磁珠:取出0.5 mL C1 streptadvin beads (life technology)並加入100 mL緩衝液(5mM Tris,pH=7.5,1M NaCl,0.02% Tween20),渦旋混合30秒,然後用100 mL洗滌液(5mM Tris,pH=7.5,1M NaCl,0.02% Tween20)洗滌磁珠3次,最後加入25 mL結合緩衝液(10mM Tris,pH=7.5,2M NaCl, 0.04% Tween20或其他表面活性劑),並混合均勻。
然後,在磁珠混合液中加入上述步驟獲得的純化的標記產物,並在旋轉混合器中混合15 min使其充分結合。
最後,用100 mL洗滌液(5mM Tris,pH=7.5,1M NaCl,0.02% Tween20)洗滌磁珠3次,離心去掉上清液,加入23.75 mL不含核酸酶的水。
(5)PCR擴增:
向上述步驟的最終體系中加入25 mL的2 X PCR master mix和1.25 mL PCR引子(總體積為50 mL),按照下述PCR反應循環的溫度和條件進行擴增:
將擴增產物用AmpureXP beads純化,得到最終定序基因庫。
(6)對定序基因庫進行質檢後進行高通量定序:
將獲得的定序基因庫通過qPCR進行濃度測定,並用Agilent2100對文庫中DNA片段大小含量進行確定。將通過質檢的定序基因庫以相同濃度混合,用Illumina Hiseq 4000進行定序。
(7)確定各基因標誌物的5-hmC含量和加權係數
將獲得的定序結果進行初步質控評估,清除低品質定序位點後,將達到定序品質標準的讀段利用Bowtie2工具與人類標準基因組參考序列進行比較。然後利用featureCounts和HtSeq-Count工具來統計讀段數量以確定各基因標誌物的5-hmC含量。同時利用高通量定序結果,將可能影響5-hmC含量的因素作為共變數,通過邏輯回歸和彈性網路正則化獲得各基因標誌物的加權係數。結果如表1所示。 表1:本發明的腸癌基因標誌物的平均標準化5-hmC含量和加權係數
如上所述,平均標準化5-hmC含量是指腸癌樣品中該基因標誌物的平均5-hmC含量與正常樣品中同一基因標誌物的平均5-hmC含量之比。從表1可以看出,本發明的腸癌基因標誌物的5-hmC含量在正常樣品中和腸癌樣品中存在顯著差異,並且除NME3之外,其餘基因標誌物的5-hmC含量相對於正常人均顯著增加。
實施例
2.
腸癌基因標誌物的有效性
本實施例驗證本發明的腸癌基因標誌物用於檢測腸癌的有效性。
根據實施例1的方法測定第一批59個樣品(24例腸癌和35例對照)中本發明所述的10個腸癌基因標誌物的5-hmC含量,並確定各基因標誌物的加權係數。
將各基因標誌物的標準化5-hmC含量乘以與其對應的加權係數,獲得該基因標誌物的預測因子t後,將各基因標誌物的預測因子t相加,獲得總預測因子T,然後將總預測因子T根據以下公式經過Logistic轉換獲得評分P:
若P>0.5,則該受試者樣品患有腸癌;若P<0.5,則該受試者樣品為正常。
圖1示出了根據本發明的方法區分該批樣品的結果。如圖1所示,本發明的方法能夠達到83%的靈敏度和94%的特異性。發明人進一步用本發明的方法區分第二批69個樣品(32例腸癌和37例對照),其結果表明該方法能夠達到88%的靈敏度和89%的特異性(圖2)。
這些結果表明,與現有技術相比,根據本發明的方法能夠以更高的靈敏度和特異性檢測腸癌。
實施例
3.
胃癌基因標誌物的篩選
根據實施例1所述的方法篩選胃癌的基因標誌物,唯一區別在於所用樣品是來自7位胃癌患者和18位正常人的血漿游離DNA。篩選到的胃癌標誌物如表2所示。 表2:本發明的胃癌基因標誌物的平均標準化5-hmC含量和加權係數
如上所述,平均標準化5-hmC含量是指胃癌樣品中該基因標誌物的平均5-hmC含量與正常樣品中同一基因標誌物的平均5-hmC含量之比。從表2可以看出,本發明的胃癌基因標誌物的5-hmC含量在正常樣品中和腸癌樣品中存在顯著差異,其中在胃癌樣品中,3種基因標誌物顯示5-hmC含量降低:RDM1 、 ZNF714
和ZNF518B
,15種基因標誌物顯示5-hmC含量升高:ARHGAP28 、 BMPER 、 C9orf92 、 CADPS2 、 CDH11 、 FBXL7 、 MEOX2 、 NOS1 、 OSMR 、 PALM2 、 PDE10A 、 RBMS3 、 SULF1 、 WLS
和WTIP
。
實施例
4.
胃癌基因標誌物的有效性測定
本實施例驗證本發明的胃癌基因標誌物用於檢測胃癌的有效性。
根據實施例1的方法測定第三批60個樣品(25例胃癌和35例對照)中本發明所述的18個胃癌基因標誌物的5-hmC含量,並確定各基因標誌物的加權係數。
將各基因標誌物的標準化5-hmC含量乘以與其對應的加權係數,獲得該基因標誌物的預測因子t後,將各基因標誌物的預測因子t相加,獲得總預測因子T,然後將總預測因子T根據以下公式經過Logistic轉換獲得評分P:
若P>0.5,則該受試者樣品患有胃癌;若P<0.5,則該受試者樣品為正常。
圖3示出了根據本發明的方法區分該批樣品的結果。如圖3所示,本發明的方法能夠達到92%的靈敏度和91%的特異性。發明人進一步用本發明的方法區分第四批63個樣品(29例胃癌和37例對照),其結果表明該方法能夠達到90%的靈敏度和97%的特異性(圖4)。
這些結果表明,與現有技術相比,根據本發明的方法能夠以更高的靈敏度和特異性檢測腸癌。
根據本發明可作之不同修正及變化對於熟悉該項技術者而言均顯然不會偏離本發明的範圍與精神。雖然本發明已敘述特定的較佳具體事實,必須瞭解的是本發明不應被不當地限制於該等特定具體事實上。事實上,在實施本發明之已述模式方面,對於熟習該項技術者而言顯而易知之不同修正亦被涵蓋於下列申請專利範圍之內。
圖1:用本發明的腸癌基因標誌物區分第一批樣品的結果。 圖2:用本發明的腸癌基因標誌物區分第二批樣品的結果。 圖3:用本發明的胃癌基因標誌物區分第三批樣品的結果。 圖4:用本發明的胃癌基因標誌物區分第四批樣品的結果。
Claims (6)
- 一種檢測胃癌的基因標誌物在製備分析胃癌患者試劑盒的用途,所述基因標誌物包括以下的基因:Rho GTP酶啟動蛋白28(ARHGAP28)、BMP結合內皮調控者(BMPER)、染色體9開放讀碼框92(C9orf92)、鈣依賴分泌啟動者2(CADPS2)、鈣黏蛋白11(CDH11)、F盒和富亮氨酸重複蛋白7(FBXL7)、間質同源框2(MEOX2)、氧化一氮合成酶1(NOS1)、抑瘤素M受體(OSMR)、細胞膜調控蛋白paralemmin2(PALM2)、磷酸二酯酶10A(PDE10A)、RNA結合模體單鏈相互作用蛋白3(RBMS3)、硫酸酯酶1(SULF1)、wntless Wnt配體分泌調節者(WLS)、Wilms瘤1作用蛋白(WTIP)、鋅指蛋白518B(ZNF518B)、鋅指蛋白714(ZNF714)和Rad52模體包含1(RDM1)。
- 如請求項1所述之用途,其中RDM1、ZNF714和ZNF518B基因的5-羥甲基胞嘧啶(5-hmC)含量在胃癌患者樣品中低於正常人,其餘所述基因的5-hmC含量在胃癌患者樣品中高於正常人。
- 一種用於檢測胃癌的方法,包括以下步驟:(a)測定正常樣品和受試者樣品中如請求項1所述的基因標誌物的5-羥甲基胞嘧啶(5-hmC)含量;(b)用正常品中所述基因標誌物的5-hmC含量作為參照,將受試者樣品中對應的基因標誌物的5-hmC含量標準化;(c)通過邏輯回歸和彈性網路正則化獲得各基因標誌物的加權係數;(d)將各基因標誌物的標準化5-hmC含量乘以與其對應的加權係數,獲得該基因標誌物的預測因子t後,將各基因標誌物的預測因子t相加,獲得總預測因子T,然後將總預測因子T根據以下公式經過Logistic轉化獲得評分P:
- 如請求項3所述之方法,其中步驟(a)是測定所述基因標誌物全長或其片段上的5-hmC的含量。
- 如請求項3所述之方法,其中所述樣品是來自正常人或受試者體液中游離的DNA片段,或來源於胞器、細胞以及組織中的完整基因組DNA。
- 如請求項3所述之方法,其中所述體液是血液、尿液、汗液、痰液、糞便、腦脊液、腹水、胸水、膽汁或胰腺液。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
??201710598499.4 | 2017-01-11 | ||
CN201710598499.4A CN108300783A (zh) | 2017-01-11 | 2017-01-11 | 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201829782A TW201829782A (zh) | 2018-08-16 |
TWI653340B true TWI653340B (zh) | 2019-03-11 |
Family
ID=62839418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106146504A TWI653340B (zh) | 2017-01-11 | 2017-12-29 | Method for screening gene markers of gastric cancer, gene markers screened by the method, and uses thereof |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN108300783A (zh) |
TW (1) | TWI653340B (zh) |
WO (1) | WO2018129988A1 (zh) |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0716944A2 (pt) * | 2006-09-19 | 2013-09-17 | Novartis Ag | biomarcadores de modulaÇço alvo, eficÁcia, diagnàstico, e/ou prognàstico para inibidores de raf |
GB0700374D0 (en) * | 2007-01-09 | 2007-02-14 | Oncomethylome Sciences S A | NDRG family methylation markers |
CA2677000A1 (en) * | 2007-01-30 | 2008-08-07 | Pharmacyclics, Inc. | Methods for determining cancer resistance to histone deacetylase inhibitors |
EP2215257A4 (en) * | 2007-10-23 | 2010-12-01 | Clinical Genomics Pty Ltd | METHOD FOR DIAGNOSING TUMOR DISEASES |
ES2936256T3 (es) * | 2008-02-01 | 2023-03-15 | Massachusetts Gen Hospital | Uso de microvesículas en el diagnóstico, y pronóstico de enfermedades y afecciones médicas |
EP2549399A1 (en) * | 2011-07-19 | 2013-01-23 | Koninklijke Philips Electronics N.V. | Assessment of Wnt pathway activity using probabilistic modeling of target gene expression |
EP2836836A1 (en) * | 2012-04-13 | 2015-02-18 | Erasmus University Medical Center Rotterdam | Biomarkers for triple negative breast cancer |
EP3013975A1 (en) * | 2013-06-24 | 2016-05-04 | Mirna Therapeutics, Inc. | Biomarkers of mir-34 activity |
CN103388024B (zh) * | 2013-07-04 | 2015-06-17 | 徐州医学院 | 一种基于桥式pcr检测dna羟甲基化的方法 |
CN104293938B (zh) * | 2014-09-30 | 2017-11-03 | 天津华大基因科技有限公司 | 构建测序文库的方法及其应用 |
CN106755464A (zh) * | 2017-01-11 | 2017-05-31 | 上海易毕恩基因科技有限公司 | 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途 |
-
2017
- 2017-01-11 CN CN201710598499.4A patent/CN108300783A/zh active Pending
- 2017-12-27 WO PCT/CN2017/108420 patent/WO2018129988A1/zh active Application Filing
- 2017-12-29 TW TW106146504A patent/TWI653340B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
WO2018129988A1 (zh) | 2018-07-19 |
TW201829782A (zh) | 2018-08-16 |
CN108300783A (zh) | 2018-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI647312B (zh) | Method for screening gene markers of intestinal cancer, gene markers screened by the method, and uses thereof | |
US10718010B2 (en) | Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free DNA | |
US20230323446A1 (en) | Methods and systems for high-depth sequencing of methylated nucleic acid | |
CN104673896B (zh) | 用于检测结肠直肠癌的sdc2甲基化 | |
CN107847515B (zh) | 实体瘤甲基化标志物及其用途 | |
TWI680296B (zh) | 用於檢測胰腺癌的基因標誌物、試劑組及胰腺癌檢測方法 | |
TWI673496B (zh) | 用於檢測肺癌的基因標誌物、試劑組及肺癌檢測方法 | |
CN106460046A (zh) | 检测结直肠赘生物 | |
WO2012047899A2 (en) | Novel dna hypermethylation diagnostic biomarkers for colorectal cancer | |
TW201905206A (zh) | 用於檢測肝癌的基因標誌物及其用途 | |
WO2018228028A1 (zh) | 用于检测肝癌的基因标志物及其用途 | |
WO2019149093A1 (zh) | 一种用于检测食管癌的基因标志物及其用途和检测方法 | |
CN107868822B (zh) | 用于检测食道癌的组合物及其试剂盒和用途 | |
TWI667480B (zh) | Gene marker, reagent group and detection method for detecting benign and malignant liver tumors | |
TWI653340B (zh) | Method for screening gene markers of gastric cancer, gene markers screened by the method, and uses thereof | |
WO2005021743A1 (ja) | 核酸増幅用プライマー及びこれを用いた大腸癌の検査方法 | |
EP2978861A2 (en) | Unbiased dna methylation markers define an extensive field defect in histologically normal prostate tissues associated with prostate cancer: new biomarkers for men with prostate cancer | |
JP7232438B2 (ja) | メチル含有基修飾核酸を精製、分離または濃縮する方法 | |
CN113278697B (zh) | 一种基于外周血内基因甲基化的肺癌诊断试剂盒 | |
WO2024008040A1 (zh) | 癌症特异性甲基化标志物及其应用 | |
CN117004720A (zh) | 用于检测甲状腺癌的组合物及其用途 | |
CN116798606A (zh) | 用于检测甲状腺癌的系统 | |
KR20240046525A (ko) | 세포-유리 dna에 대한 tet-보조 피리딘 보란 시퀀싱과 관련된 조성물 및 방법 | |
CN115772564A (zh) | 用于辅助检测肺癌体细胞atm基因融合突变的甲基化生物标记物及其应用 | |
CN115927644A (zh) | 一种新型多靶点胃癌检测的标志物组合及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |