CN116042830A - 消化道恶性肿瘤诊断产品及其应用 - Google Patents
消化道恶性肿瘤诊断产品及其应用 Download PDFInfo
- Publication number
- CN116042830A CN116042830A CN202211694566.XA CN202211694566A CN116042830A CN 116042830 A CN116042830 A CN 116042830A CN 202211694566 A CN202211694566 A CN 202211694566A CN 116042830 A CN116042830 A CN 116042830A
- Authority
- CN
- China
- Prior art keywords
- region
- seq
- negative strand
- digestive tract
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000011510 cancer Diseases 0.000 title claims abstract description 176
- 210000001035 gastrointestinal tract Anatomy 0.000 title claims abstract description 148
- 239000012502 diagnostic product Substances 0.000 title description 4
- 230000011987 methylation Effects 0.000 claims abstract description 138
- 238000007069 methylation reaction Methods 0.000 claims abstract description 138
- 238000000034 method Methods 0.000 claims abstract description 85
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 36
- 238000003745 diagnosis Methods 0.000 claims abstract description 20
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 17
- 239000000523 sample Substances 0.000 claims description 261
- 238000001514 detection method Methods 0.000 claims description 232
- 206010028980 Neoplasm Diseases 0.000 claims description 107
- 238000012549 training Methods 0.000 claims description 49
- 230000036210 malignancy Effects 0.000 claims description 28
- 210000002569 neuron Anatomy 0.000 claims description 28
- 238000003753 real-time PCR Methods 0.000 claims description 28
- 230000035945 sensitivity Effects 0.000 claims description 20
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 19
- 230000003321 amplification Effects 0.000 claims description 19
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 18
- 206010017758 gastric cancer Diseases 0.000 claims description 17
- 208000014018 liver neoplasm Diseases 0.000 claims description 17
- 206010009944 Colon cancer Diseases 0.000 claims description 16
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 16
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 16
- 201000002528 pancreatic cancer Diseases 0.000 claims description 16
- 201000011549 stomach cancer Diseases 0.000 claims description 16
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 15
- 201000007270 liver cancer Diseases 0.000 claims description 14
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 14
- 208000000461 Esophageal Neoplasms Diseases 0.000 claims description 13
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 13
- 201000004101 esophageal cancer Diseases 0.000 claims description 13
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 210000003238 esophagus Anatomy 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 210000002784 stomach Anatomy 0.000 claims description 11
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 10
- 210000000496 pancreas Anatomy 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 10
- 210000004185 liver Anatomy 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000001369 bisulfite sequencing Methods 0.000 claims description 6
- 238000007855 methylation-specific PCR Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000000746 purification Methods 0.000 claims description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 5
- 229940035893 uracil Drugs 0.000 claims description 5
- 238000009007 Diagnostic Kit Methods 0.000 claims description 4
- 239000000872 buffer Substances 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000002844 melting Methods 0.000 claims description 4
- 230000008018 melting Effects 0.000 claims description 4
- 230000008520 organization Effects 0.000 claims description 4
- 238000007400 DNA extraction Methods 0.000 claims description 3
- 206010061968 Gastric neoplasm Diseases 0.000 claims description 3
- 206010019695 Hepatic neoplasm Diseases 0.000 claims description 3
- 238000007847 digital PCR Methods 0.000 claims description 3
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 3
- 238000002493 microarray Methods 0.000 claims description 3
- 208000025402 neoplasm of esophagus Diseases 0.000 claims description 3
- 238000012175 pyrosequencing Methods 0.000 claims description 3
- 108091008146 restriction endonucleases Proteins 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 abstract description 17
- 238000013399 early diagnosis Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 abstract description 6
- 239000013615 primer Substances 0.000 description 93
- 210000001519 tissue Anatomy 0.000 description 87
- 210000004369 blood Anatomy 0.000 description 33
- 239000008280 blood Substances 0.000 description 33
- 108020004414 DNA Proteins 0.000 description 22
- 238000012360 testing method Methods 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 239000013641 positive control Substances 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 101150087690 ACTB gene Proteins 0.000 description 7
- 230000007067 DNA methylation Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 230000001575 pathological effect Effects 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 238000001574 biopsy Methods 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- 238000001839 endoscopy Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 238000010791 quenching Methods 0.000 description 5
- 230000000171 quenching effect Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 3
- 230000034994 death Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 230000003211 malignant effect Effects 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 206010041823 squamous cell carcinoma Diseases 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 108091029430 CpG site Proteins 0.000 description 2
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000010100 anticoagulation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 208000010643 digestive system disease Diseases 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000003147 molecular marker Substances 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000004614 tumor growth Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 208000004232 Enteritis Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 208000003098 Ganglion Cysts Diseases 0.000 description 1
- 208000007882 Gastritis Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 206010019799 Hepatitis viral Diseases 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 206010033645 Pancreatitis Diseases 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 206010071051 Soft tissue mass Diseases 0.000 description 1
- 208000005400 Synovial Cyst Diseases 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 206010064390 Tumour invasion Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000009400 cancer invasion Effects 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 201000010989 colorectal carcinoma Diseases 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 208000021045 exocrine pancreatic carcinoma Diseases 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 208000010749 gastric carcinoma Diseases 0.000 description 1
- 208000021302 gastroesophageal reflux disease Diseases 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 210000004880 lymph fluid Anatomy 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 208000000689 peptic esophagitis Diseases 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 201000000498 stomach carcinoma Diseases 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 201000001862 viral hepatitis Diseases 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Immunology (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biotechnology (AREA)
- Oncology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Hospice & Palliative Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及消化道恶性肿瘤诊断产品及其应用。本发明将检测基因特定区域的甲基化水平的试剂用于制备消化道恶性肿瘤诊断产品,以GRCh38.p14为参考,特定区域包括Chr19:36418715‑36418374负链,Chr2:264356‑264113负链,Chr19:36605129‑36604835负链,Chr20:62929258‑62929370正链,Chr2:181457558‑181457295负链,Chr17:77373330‑77372947负链,该诊断产品适用于消化道恶性肿瘤的早期诊断和筛查,有效区分道恶性消化道肿瘤患者和非恶性肿瘤患者,且诊断和筛查的过程中无需侵入性操作,简单便捷。
Description
技术领域
本发明涉及生物医学技术领域,具体而言,涉及消化道恶性肿瘤诊断产品及其应用。
背景技术
伴随着经济的快速发展、人类生活方式的改变以及寿命的延长,恶性肿瘤成为严重威胁人类生命健康的三大杀手之一。在恶性肿瘤中,肝癌、胃癌、食管癌、结直肠癌、胰腺癌等消化道肿瘤的发病率和死亡率均居于前十位,因所述消化道肿瘤而死亡的病例占到前十位恶性肿瘤死亡病例总数的40.75%。虽然拥有如此高的发病率和死亡率,但是由于消化道恶性肿瘤起病隐匿,在发病初期通常无典型症状,大多数患者在就诊时已是肿瘤晚期甚至已经发生转移,预后较差。值得注意的是,消化道恶性肿瘤从癌前病变发展为癌的过程是漫长的,可能需要经历上十年的时间,为患者提供了珍贵的诊疗时机;且早期诊断和早期治疗可以显著提高消化道恶性肿瘤患者的5年存活率,如在Ⅰ期进行手术治疗的结直肠癌患者,其5年生存率高达90%以上。因此,对消化道肿瘤患者进行早期筛查和早期诊断,对提高其生命周期和生活质量都具有十分重要的意义。
目前临床上常用的诊断消化道肿瘤的方法为消化道内镜检查和影像学检查。内镜检查可以显示消化道腔内肿瘤的大小和形态,但是无法准确评估肿瘤侵犯程度和转移情况,此外,内镜检查为复杂的侵入性操作,会给患者带来不适感,且严重依赖医师的技能。影像学检查如计算机断层扫描(CT)、核磁共振成像(MRI)、正电子发射计算机断层显像(PET-CT)等可以显示肿瘤在消化道腔内或壁内的生长情况,也可以显示局部软组织肿块及周围组织器官的变化、肿瘤向腔外生长的情况、肿瘤侵犯周围器官及向远处转移的情况,但是因其昂贵的价格以及放射性危害等,难以用于大规模或普适性的癌症筛查。
通常情况下,不同的组织、器官具有不同的生理结构,需要进行不同的诊断来检测某一组织是否发生病变,例如需要进行逆行胰胆管造影术(ERCP)检测上消化道及胰腺是否发生病变,而需要进行肠镜检测结直肠是否发生病变。因此,在进行消化道恶性肿瘤筛查时,对不同的组织、器官需分别采用不同的筛查方法,此举不仅需要受试者付出昂贵的筛查费用、且花费大量的时间来进行不同的检查,还严重增加了医疗机构的负担。
因此,目前亟需一种无需侵入、便捷的可用于消化道恶性肿瘤早期诊断和筛查的方法。
发明内容
基于此,本申请的目的包括将检测基因特定区域的甲基化水平的试剂用于制备消化道恶性肿瘤诊断产品,该诊断产品适用于消化道恶性肿瘤的早期诊断和筛查,且诊断和筛查的过程中无需侵入性操作,简单便捷。
在本申请的第一方面,提供检测基因目标区域的甲基化水平的试剂在制备消化道恶性肿瘤诊断产品中的应用;
所述目标区域包括如下(A)至(F)所示区域:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链。
在本申请的一些实施方式中,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
在本申请的一些实施方式中,所述试剂通过如下方法中的一种或者多种实现对所述目标区域的甲基化水平的检测:甲基化特异性PCR法、亚硫酸氢盐测序法、甲基化特异性微阵列法、全基因组亚硫酸氢盐测序法、焦磷酸测序法、甲基化特异性高效液相层析法、数字PCR法、甲基化特异性高分辨率熔解曲线法、甲基化敏感性限制性内切酶法和甲基化特异性荧光定量PCR法。
在本申请的一些实施方式中,所述试剂包括特异性检测所述目标区域甲基化水平的检测引物对以及检测探针的组合。
在本申请的一些实施方式中,检测引物对以及检测探针的组合包括如下(1)至(13)组中所示的检测引物对和检测探针的组合中的一组或者多组:(1)如SEQ ID No.19和SEQ ID No.20所示的检测引物对和如SEQ ID No.21所示的检测探针;(2)如SEQ ID No.22和SEQ ID No.23所示的检测引物对和如SEQ IDNo.24所示的检测探针;(3)如SEQ ID No.25和SEQ ID No.26所示的检测引物对和如SEQ ID No.27所示的检测探针;(4)如SEQ IDNo.28和SEQ ID No.29所示的检测引物对和如SEQ ID No.30所示的检测探针;(5)如SEQ IDNo.31和SEQ ID No.32所示的检测引物对和如SEQ ID No.33所示的检测探针;(6)如SEQ IDNo.34和SEQ ID No.35所示的检测引物对和如SEQ ID No.36所示的检测探针;(7)如SEQIDNo.37和SEQ ID No.38所示的检测引物对和如SEQ ID No.39所示的检测探针;(8)如SEQID No.40和SEQ ID No.41所示的检测引物对和如SEQ ID No.42所示的检测探针;(9)如SEQID No.43和SEQ ID No.44所示的检测引物对和如SEQ ID No.45所示的检测探针;(10)如SEQ ID No.46和SEQ ID No.47所示的检测引物对和如SEQ ID No.48所示的检测探针;(11)如SEQ ID No.49和SEQ ID No.50所示的检测引物对和如SEQ ID No.51所示的检测探针;(12)如SEQ ID No.52和SEQ ID No.53所示的检测引物对和如SEQ ID No.54所示的检测探针;和,(13)如SEQ ID No.55和SEQ ID No.56所示的检测引物对和如SEQ ID No.57所示的检测探针。
在本申请的一些实施方式中,所述检测引物对以及检测探针的组合包括如下所示的组合I至组合VI:组合I包括所述(1)至(3)组所示检测引物对以及检测探针的组合中的一组或者多组;组合II包括所述(4)至(5)组所示检测引物对以及检测探针的组合中的一组或者多组;组合III包括所述(6)至(7)组所示检测引物对以及检测探针的组合中的一组或者多组;组合IV包括所述(8)组所示检测引物对以及检测探针的组合;组合V包括所述(9)至(10)组所示检测引物对以及检测探针的组合中的一组或者多组;组合VI包括所述(11)至(13)组所示检测引物对以及检测探针的组合中的一组或者多组。
在本申请的一些实施方式中,所述试剂还包含检测内参基因的检测引物对和检测探针。
在本申请的一些实施方式中,所述内参基因包含ACTB基因。
在本申请的一些实施方式中,检测所述ACTB基因的检测引物对如SEQ ID NO.58和SEQ ID NO.59所示,以及检测探针如SEQ ID NO.60所示。
在本申请的一些实施方式中,所述消化道恶性肿瘤为肝脏肿瘤、胃肿瘤、食管肿瘤、结直肠肿瘤或者胰腺肿瘤。
在本申请的一些实施方式中,检测的生物样本类型包括血液样本、细胞样本或者组织样本。
在本申请的第二方面,提供一种消化道恶性肿瘤诊断试剂盒,包括第一方面中所定义的试剂。
在本申请的一些实施方式中,所述诊断试剂盒还包括测序试剂、扩增试剂、将未甲基化的胞嘧啶碱基转化为尿嘧啶的试剂、DNA提取试剂和纯化试剂中的一种或者多种。
在本申请的一些实施方式中,所述扩增试剂包括扩增缓冲液、dNTPs、DNA聚合酶和Mg2+中的一种或者多种。
在本申请的第三方面,提供一种消化道恶性肿瘤的组织起源预测模型的构建方法,所述构建方法包括如下步骤:
获取消化道恶性肿瘤样本在目标区域的甲基化水平数据,所述消化道恶性肿瘤样本包括已确诊的肝癌样本、胃癌样本、食管癌样本、结直肠癌样本和胰腺癌样本中一个或者多种;
将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入多层感知器,构建具有映射关系的组织起源预测模型;
所述多层感知器的结构包括输入层、隐藏层和输出层,所述输入层的神经元的数量与所述目标区域的数量一致,所述输出层的神经元的数量与所述消化道恶性肿瘤样本的种类数量一致,所述隐藏层的数量大于等于一层;
所述目标区域包括如下(A)至(F)项所示区域的组合:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链。
在本申请的一些实施方式中,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,
和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
在本申请的一些实施方式中,所述消化道恶性肿瘤样本包括已确诊的肝癌样本、胃癌样本、食管癌样本、结直肠癌样本和胰腺癌样本。
在本申请的一些实施方式中,将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入多层感知器,构建组织起源预测模型,包括如下步骤:
将所述消化道恶性肿瘤样本中的一部分记作训练集样本,另一部分记作验证集样本;
将所述训练集样本在目标区域的甲基化水平数据输入所述多层感知器,构建训练集模型并获得训练集预测数据,从所述训练集预测数据中对应挑选出预测性能最优的训练模型作为待用预测模型;
将所述验证集样本在目标区域的甲基化水平数据输入所述待用预测模型进行预测性能验证,若所述验证集样本在所述待用预测模型中的预测性能与训练集样本类似、或者优于训练集样本,则确定所述待用预测模型为组织起源预测模型;
其中,所述预测性能的评价指标包括灵敏度、特异性或者灵敏度与特异性之和的平均值,所述灵敏度越高、所述特异性越高或者所述平均值越大,所述预测性能越优。
在本申请的一些实施方式中,所述甲基化水平数据包括采用甲基化特异性荧光定量PCR法检测所述目标区域得到的Ct值。
在本申请的一些实施方式中,所述甲基化特异性荧光定量PCR法采用的检测引物对和检测探针的组合如在本申请中第一方面中定义。
在本申请的一些实施方式中,所述构建方法还包括对所述甲基化水平数据进行标准化处理后再输入所述多层感知器的步骤。
在本申请的一些实施方式中,标准化处理的方法包括z-score法,z-score法的计算公式如下所示:
f(x)=(x-μ)/δ,
公式中,x为各个消化道恶性肿瘤样本的各个目标区域的所述Ct值,μ为数据x的均值,δ为数据x的标准差。
在本申请的一些实施方式中,所述组织起源预测模型中,输入层包括6个神经元,输出层包括5个神经元,隐藏层的参数包括:学习率为0.00011,隐藏层节点数为24,层数为1层。
在本申请的第四方面,提供一种消化道恶性肿瘤的组织起源的预测方法,所述预测方法包括如下步骤:
获取待测消化道恶性肿瘤样本在目标区域的甲基化水平数据;
将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入本申请第三方面提供的采用所述构建方法构建的组织起源预测模型中,预测所述待测消化道恶性肿瘤样本归属为某种组织起源的概率;
所述目标区域包括如下(A)至(F)项所示区域的组合:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链;
可选地,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,
和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
在本申请的一些实施方式中,所述甲基化水平数据包括采用甲基化特异性荧光定量PCR法检测所述目标区域得到的Ct值。
在本申请的一些实施方式中,所述甲基化特异性荧光定量PCR法采用的检测引物对和检测探针如在第一方面中定义。
在本申请的一些实施方式中,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺中的一种或者多种。
在本申请的一些实施方式中,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺。
在本申请的一些实施方式中,所述预测方法还包括对所述待测消化道恶性肿瘤样本在目标区域的甲基化水平数据进行标准化处理后再输入所述多层感知器的步骤。
在本申请的一些实施方式中,标准化处理的方法包括z-score法,z-score法的计算公式如下所示:
f(x)=(x-μ)/δ,
公式中,x为各个消化道恶性肿瘤样本的各个目标区域的所述Ct值,μ为数据x的均值,δ为数据x的标准差。
在本申请的第五方面,提供一种消化道恶性肿瘤的组织起源预测装置,包括:
数据获取模块:用于获取待测消化道恶性肿瘤样本在目标区域的甲基化水平数据;
预测模块:用于将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入本申请第三方面提供的采用所述构建方法构建的组织起源预测模型中,预测所述待测消化道恶性肿瘤样本归属为某种组织起源的概率;
输出模块:用于输出所述预测模块预测的所述待测消化道恶性肿瘤样本归属为某种组织起源的概率;
所述目标区域包括如下(A)至(F)项所示区域的组合:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链。
在本申请的一些实施方式中,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,
和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
在本申请的一些实施方式中,所述甲基化水平数据包括采用甲基化特异性荧光定量PCR法检测所述目标区域得到的Ct值。
在本申请的一些实施方式中,所述甲基化特异性荧光定量PCR法采用的检测引物对和检测探针如在本申请第一方面中定义。
在本申请的一些实施方式中,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺中的一种或者多种。
在本申请的一些实施方式中,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺。
在本申请的一些实施方式中,所述组织起源预测装置还包括:
标准化处理模块:用于对所述待测消化道恶性肿瘤样本在目标区域的甲基化水平数据进行标准化处理后再输入所述多层感知器;进一步可选地,标准化处理的方法包括z-score法,z-score法的计算公式如下所示:
f(x)=(x-μ)/δ,
公式中,x为各个消化道恶性肿瘤样本的各个目标区域的所述Ct值,μ为数据x的均值,δ为数据x的标准差。
在本申请的第六方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现在本申请第三方面或者第四方面中提供的所述方法的步骤。
基于本申请的第六方面提供的计算机可读存储介质,本申请的第七方面还相应提供一种计算机设备,包括存储器和处理器,所述存储器包括前述计算机可读存储介质,处理器用于执行该可读存储介质上存储的计算机程序以实现在第三方面或者第四方面中提供的所述方法的步骤。
相对于传统技术,本申请的有益效果包括:
本申请将检测基因特定区域的甲基化水平的试剂用于制备消化道恶性肿瘤诊断产品,该诊断产品适用于消化道恶性肿瘤的早期诊断和筛查,有效区分恶性消化道肿瘤患者和非恶性肿瘤患者,且诊断和筛查的过程中无需侵入性操作,简单便捷。并且,本申请还具有高灵敏度、高特异性的特点。
同时,基于本申请提供的基因特定区域的甲基化水平数据,本申请构建得到消化道恶性肿瘤的组织起源模型,能够预测消化道恶性肿瘤患者属于某一组织起源概率。进一步地,在构建模型的甲基化水平数据来源于已确认的特定的5种消化道恶性肿瘤的条件下,所得预测模型能够适用于5种消化道恶性肿瘤的预测,仅需受试者提供血液样本,无需进行多种检测,即可判断其是否为5种消化道恶性肿瘤患者,若为癌症患者,还可以判断其患癌的具体部位。
附图说明
为了更清楚地说明本申请实施例中的技术方案、更完整地理解本申请及其有益效果,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对本领域技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为多层感知器的示意图;
图2为消化道恶性肿瘤组织起源预测模型;
图3为消化道恶性肿瘤组织起源预测模型构建流程图;
图4为消化道恶性肿瘤组织起源预测装置结构示意图。
具体实施方式
下面结合附图、实施方式和实施例,对本发明作进一步详细的说明。应理解,这些实施方式和实施例仅用于说明本发明而不用于限制本发明的范围,提供这些实施方式和实施例的目的是使对本发明公开内容理解更加透彻全面。还应理解,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施方式和实施例,本领域技术人员可以在不违背本发明内涵的情况下作各种改动或修改,得到的等价形式同样落于本申请的保护范围。此外,在下文的描述中,给出了大量具体的细节以便提供对本发明更为充分地理解,应理解,本发明可以无需一个或多个这些细节而得以实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述实施方式和实施例的目的,不是旨在于限制本发明。
术语“多个”指两个以上;“多种”指两种以上;“以上”与数字结合表示数量时包括本数,例如“两个以上”包括两个。
本申请中涉及“多个”、“多种”、“多次”、“多组”等,如无特别限定,指在数量上大于2或等于2。例如,“一种或多种”表示一种或大于等于两种。“以上”包括本数,比如“两种以上”包括两种、三种或更多种。
本申请中,“至少一者”、“至少一种”、“一种或多种”、“一个或多个”是指可以是所列项目中的任一项,或者是其中任意两种以上的组合。“任选的”是指可以包括该特征,也可以不包括该特征。
本申请中所使用的“其组合”、“其任意组合”、“其任意组合方式”等中包括所列项目中任两个或任两个以上项目的所有合适的组合方式。
本申请中,“合适的组合方式”、“合适的方式”、“任意合适的方式”等中所述“合适”,以能够实施本申请的技术方案、解决本申请的技术问题、实现本申请预期的技术效果为准。
本申请中,“进一步”、“更进一步”、“特别”等用于描述目的,表示内容上的差异,但并不应理解为对本申请保护范围的限制。
本申请中,“第一方面”、“第二方面”、“第三方面”、“第四方面”等中,术语“第一”、“第二”、“第三”、“第四”等仅用于描述目的,不能理解为指示或暗示相对重要性或数量,也不能理解为隐含指明所指示的技术特征的重要性或数量。而且“第一”、“第二”、“第三”、“第四”等仅起到非穷举式的列举描述目的,应当理解并不构成对数量的封闭式限定。
本申请中,以开放式描述的技术特征中,包括所列举特征组成的封闭式技术方案,也包括包含所列举特征的开放式技术方案。
术语“诊断”包括辅助诊断、复发风险评估、癌变风险和癌变程度的评估、预后判断等方面。
术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指具有两个或更多个脱氧核糖核苷酸或核糖核苷酸的分子,优选多于三个,并且通常多于十个。确切的大小将取决于许多因素,而所述因素又取决于寡核苷酸的最终功能或用途。寡核苷酸可以任何方式产生,包括化学合成、DNA复制、逆转录或其组合。DNA的典型脱氧核糖核苷酸是胸腺嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。RNA的典型核糖核苷酸是尿嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。
术语“甲基化”为DNA化学修饰的一种形式,能够在不改变DNA序列的前提下,改变遗传表现。DNA甲基化是指在DNA甲基转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶第5号碳位共价结合一个甲基基团。DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。
术语“甲基化水平”指的是一段DNA序列中一个或多个CpG二核苷酸中的胞嘧啶是否发生甲基化、或发生甲基化的频率/比例/百分数,既代表定性的概念又代表定量的概念。在实际应用中,可根据实际情况采用不同的检测指标比较DNA甲基化水平。如在一些情况下,可根据样本检测的Ct值进行比较;在一些情况下,可计算样本中基因甲基化的比例,即甲基化分子数/(甲基化分子数+非甲基化分子数)×100,然后再进行比较;在一些情况下,还需要对各个指标进行统计学上的分析整合,得出最终的判定指标。
术语“引物”是指可以用在扩增方法(例如聚合酶链式反应PCR)中,基于与目标基因或其一部分区域相对应的多核苷酸序列来扩增目的序列的寡核苷酸。通常,用于扩增多核苷酸序列的PCR引物中的至少一个对于该多核苷酸序列是序列特异性的。引物的确切长度取决于很多因素,包括温度、引物来源以及所用方法等。例如,对于诊断和预后应用,根据靶序列的复杂度,寡核苷酸引物通常含有至少10、15、20、25或更多个核苷酸,但是也可以含有更少的核苷酸。在本公开内容中,术语“引物”或“引物对”是指能与目标DNA分子的双链杂交或能与目标DNA分子中位于待扩增核苷酸序列两翼的区域杂交的一对引物。
术语“甲基化特异性PCR”是目前研究甲基化最敏感的实验技术之一,能发现最低约50pg DNA的甲基化。单链DNA经亚硫酸氢盐转化后,所有未甲基化的胞嘧啶脱氨转变为尿嘧啶,而CpG位点中甲基化的胞嘧啶保持不变,因此分别设计两对针对甲基化和非甲基化序列的引物,通过PCR扩增即可将甲基化与非甲基化的DNA序列区分开来。
术语“甲基化特异性荧光定量PCR(QMSP)”是将荧光定量PCR技术和甲基化特异性PCR技术相结合的实验技术。该技术也是基于不同甲基化状态的DNA经亚硫酸氢盐转化后的序列差异来设计合适的引物对,从而将甲基化和未甲基化的序列区分开来,但是q-MSP最终的检测指标为荧光信号,因此,在q-MSP反应系统中,除加入甲基化检测引物以外,还需要加入荧光探针或者荧光染料。与传统的甲基化特异性PCR技术相比,q-MSP检测DNA甲基化水平的灵敏度和特异性更高,更适合检测癌症早期患者DNA中混合的痕量的发生异常甲基化的DNA片段,且该技术不需要凝胶电泳检测,操作更加简便。
术语“Taqman探针”是指包含5’荧光基团和3’淬灭基团的一段寡核苷酸序列。当探针与DNA上的相应位点结合时,因为荧光基团附近存在淬灭基团,探针不会发出荧光。在扩增过程中,如果探针与被扩增的链结合,DNA聚合酶(如Taq酶)的5’-3’核酸外切酶活性会消化探针,荧光基团远离淬灭基团,其能量不被吸收,即产生荧光信号。每经过一个PCR循环,荧光信号也和目的片段一样,有一个同步的指数增长的过程。
术语“多层感知器(Multilayer Perceptron,MLP)”算法是一种前馈结构的神经网络。它由三种结构组成:输入层、隐藏层和输出层。输入层接收待处理的输入信号。输出层用于输出处理后的信号,比如预测或分类的结果。在输入层和输出层之间的一层或多层是隐藏层,是执行目标任务的核心。与前馈网络类似,MLP中数据也是从输入层向输出层正向流动。MLP网络结构中的每个节点代表一个神经元,也称为感知器。
DNA甲基化是最常见的表观遗传事件之一,主要是指在DNA甲基转移酶的作用下在胞嘧啶碱基的第5位碳原子上共价连接一个甲基基团,但是不改变DNA的序列。机体内肿瘤抑制基因启动子区域的高甲基化通常发生在癌症的早期且稳定存在,因此,当实体瘤细胞通过程序性死亡、凋亡、坏死等方式从而导致其细胞内的肿瘤DNA释放入血或淋巴液时,可以通过检测例如体液等样本中某些分子标记物的甲基化状态的改变来诊断早期癌症。考虑到肿瘤标志物的检测具有取样方便、检测程序简单、便捷等优势,目前急需高灵敏度、高特异性的肿瘤标志物可用于消化道恶性肿瘤的早期诊断和筛查。
本申请提出与消化道恶性肿瘤有关的目标区域,通过对这些目标区域或者其部分区域的甲基化水平进行检测,能够准确将消化道恶性肿瘤患者和健康人区别开来。同时,基于这些目标区域的甲基化水平数据构建的组织起源预测模型,还能够对消化道恶性肿瘤的组织起源进行预测。本申请能简化消化道恶性肿瘤的检测方法,具有临床应用价值,同时也可减轻医疗机构的检测压力。
本申请的第一方面
本申请提供检测基因目标区域的甲基化水平的试剂在制备消化道恶性肿瘤诊断产品中的应用;
所述目标区域包括如下(A)至(F)所示区域:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链。
可选地,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
可选地,所述试剂通过如下方法中的一种或者多种实现对所述目标区域的甲基化水平的检测:甲基化特异性PCR法、亚硫酸氢盐测序法、甲基化特异性微阵列法、全基因组亚硫酸氢盐测序法、焦磷酸测序法、甲基化特异性高效液相层析法、数字PCR法、甲基化特异性高分辨率熔解曲线法、甲基化敏感性限制性内切酶法和甲基化特异性荧光定量PCR法。
可选地,所述试剂包括特异性检测所述目标区域甲基化水平的检测引物对以及检测探针的组合。
可选地,检测引物对以及检测探针的组合包括如下所示的检测引物对和检测探针的组合中的一组或者多组:(1)如SEQ ID No.19和SEQ ID No.20所示的检测引物对和如SEQID No.21所示的检测探针;(2)如SEQ ID No.22和SEQ ID No.23所示的检测引物对和如SEQID No.24所示的检测探针;(3)如SEQ IDNo.25和SEQ ID No.26所示的检测引物对和如SEQID No.27所示的检测探针;(4)如SEQ ID No.28和SEQ ID No.29所示的检测引物对和如SEQID No.30所示的检测探针;(5)如SEQ ID No.31和SEQ ID No.32所示的检测引物对和如SEQID No.33所示的检测探针;(6)如SEQ ID No.34和SEQ ID No.35所示的检测引物对和如SEQID No.36所示的检测探针;(7)如SEQ ID No.37和SEQ ID No.38所示的检测引物对和如SEQID No.39所示的检测探针;(8)如SEQ ID No.40和SEQ ID No.41所示的检测引物对和如SEQIDNo.42所示的检测探针;(9)如SEQ ID No.43和SEQ ID No.44所示的检测引物对和如SEQID No.45所示的检测探针;(10)如SEQ ID No.46和SEQ ID No.47所示的检测引物对和如SEQ ID No.48所示的检测探针;(11)如SEQ ID No.49和SEQ ID No.50所示的检测引物对和如SEQ ID No.51所示的检测探针;(12)如SEQ ID No.52和SEQ ID No.53所示的检测引物对和如SEQ ID No.54所示的检测探针;和,(13)如SEQ ID No.55和SEQ ID No.56所示的检测引物对和如SEQ ID No.57所示的检测探针。
进一步可选地,所述检测引物对以及检测探针的组合包括如下所示的组合I至组合VI:组合I包括所述(1)至(3)组所示检测引物对以及检测探针的组合中的一组或者多组;组合II包括所述(4)至(5)组所示检测引物对以及检测探针的组合中的一组或者多组;组合III包括所述(6)至(7)组所示检测引物对以及检测探针的组合中的一组或者多组;组合IV包括所述(8)组所示检测引物对以及检测探针的组合;组合V包括所述(9)至(10)项所示检测引物对以及检测探针的组合中的一组或者多组;组合VI包括所述(11)至(13)组所示检测引物对以及检测探针的组合中的一组或者多组。
可选地,所述试剂还包含检测内参基因的检测引物对和检测探针。
可选地,所述内参基因包含ACTB基因。
可选地,检测所述ACTB基因的检测引物对如SEQ ID NO.58和SEQ ID NO.59所示,以及检测探针如SEQ ID NO.60所示。
可选地,所述消化道恶性肿瘤为肝脏肿瘤、胃肿瘤、食管肿瘤、结直肠肿瘤或者胰腺肿瘤。可选地,检测的生物样本类型包血液样本、细胞样本或者组织样本。组织是界于细胞,及器官之间的细胞架构,由许多形态相似的细胞及细胞间质所组成。其中,包括结缔组织。血液样本包括血细胞样本、血浆样本、血清样本等。
本申请的第二方面
本申请提供一种消化道恶性肿瘤诊断试剂盒,包括第一方面中所定义的试剂。
在本申请的一些实施方式中,所述诊断试剂盒还包括测序试剂、扩增试剂、将未甲基化的胞嘧啶碱基转化为尿嘧啶的试剂、DNA提取试剂和纯化试剂中的一种或者多种。
在本申请的一些实施方式中,所述扩增试剂包括扩增缓冲液、dNTPs、DNA聚合酶和Mg2+中的一种或者多种。
本申请的第三方面
本申请提供一种消化道恶性肿瘤的组织起源预测模型的构建方法(见图3),所述构建方法包括如下步骤:
获取消化道恶性肿瘤样本在目标区域的甲基化水平数据,所述消化道恶性肿瘤样本包括已确诊的肝癌样本、胃癌样本、食管癌样本、结直肠癌样本和胰腺癌样本中一个或者多种;
将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入多层感知器,构建具有映射关系的组织起源预测模型;
所述多层感知器的结构包括输入层、隐藏层和输出层,所述输入层的神经元的数量与所述目标区域的数量一致,所述输出层的神经元的数量与所述消化道恶性肿瘤样本的种类数量一致,所述隐藏层的数量大于等于一层;
所述目标区域包括如下(A)至(F)项所示区域的组合:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链。
可选地,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,
和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
可选地,所述消化道恶性肿瘤样本包括已确诊的肝癌样本、胃癌样本、食管癌样本、结直肠癌样本和胰腺癌样本。在该情况下,将每一种消化道恶性肿瘤样本的在目标区域的甲基化水平数据输入多层感知器,构建具有映射关系的组织起源预测模型。
可选地,将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入多层感知器,构建组织起源预测模型,包括如下步骤:
将所述消化道恶性肿瘤样本中的一部分记作训练集样本,另一部分记作验证集样本;
将所述训练集样本在目标区域的甲基化水平数据输入所述多层感知器,构建训练集模型并获得训练集预测数据,从所述训练集预测数据中对应挑选出预测性能最优的训练模型作为待用预测模型;
将所述验证集样本在目标区域的甲基化水平数据输入所述待用预测模型进行预测性能验证,若所述验证集样本在所述待用预测模型中的预测性能与训练集样本类似、或者优于训练集样本,则确定所述待用预测模型为为组织起源预测模型;
其中,所述预测性能的评价指标包括灵敏度、特异性或者灵敏度与特异性之和的平均值,所述灵敏度越高、所述特异性越高或者所述平均值越大,所述预测性能越优。
可选地,所述甲基化水平数据包括采用甲基化特异性荧光定量PCR法检测所述目标区域得到的Ct值。
可选地,所述甲基化特异性荧光定量PCR法采用的检测引物对和检测探针的组合如在本申请中第一方面中定义。
可选地,所述构建方法还包括对所述甲基化水平数据进行标准化处理后再输入所述多层感知器的步骤;
可选地,标准化处理的方法包括z-score法,z-score法的计算公式如下所示:
f(x)=(x-μ)/δ,
公式中,x为各个消化道恶性肿瘤样本的各个目标区域的所述Ct值,μ为数据x的均值,δ为数据x的标准差。
可选地,所述组织起源预测模型中,输入层包括6个神经元,输出层包括5个神经元,隐藏层的参数包括:学习率为0.00011,隐藏层节点数为24,层数为1层。
本申请的第四方面
本申请提供一种消化道恶性肿瘤的组织起源的预测方法,所述预测方法包括如下步骤:
获取待测消化道恶性肿瘤样本在目标区域的甲基化水平数据;
将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入本申请第三方面提供的采用所述构建方法构建的组织起源预测模型中,预测所述待测消化道恶性肿瘤样本归属为某种组织起源的概率;
所述目标区域包括如下(A)至(F)所示区域:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链。
可选地,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
可选地,所述甲基化水平数据包括采用甲基化特异性荧光定量PCR法检测所述目标区域得到的Ct值。
可选地,所述甲基化特异性荧光定量PCR法采用的检测引物对和检测探针如在第一方面中定义。
可选地,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺中的一种或者多种。
可选地,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺。
可选地,所述预测方法还包括对所述待测消化道恶性肿瘤样本在目标区域的甲基化水平数据进行标准化处理后再输入所述多层感知器的步骤;进一步可选地,标准化处理的方法包括z-score法,z-score法的计算公式如下所示:
f(x)=(x-μ)/δ,
公式中,x为各个消化道恶性肿瘤样本的各个目标区域的所述Ct值,μ为数据x的均值,δ为数据x的标准差。
本申请的第五方面
本申请提供一种消化道恶性肿瘤的组织起源预测装置(见图4),包括:
数据获取模块:用于获取待测消化道恶性肿瘤样本在目标区域的甲基化水平数据;
预测模块:用于将所述待测消化道恶性肿瘤样本在目标区域的甲基化水平数据输入本申请第三方面提供的采用所述构建方法构建的组织起源预测模型中,预测所述待测消化道恶性肿瘤样本归属为某种组织起源的概率;
输出模块:用于输出所述预测模块预测的所述待测消化道恶性肿瘤样本归属为某种组织起源的概率;
所述目标区域包括如下(A)至(F)所示区域:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链。
可选地,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
可选地,所述甲基化水平数据包括采用甲基化特异性荧光定量PCR法检测所述目标区域得到的Ct值。
可选地,所述甲基化特异性荧光定量PCR法采用的检测引物对和检测探针如在本申请第一方面中定义。
可选地,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺中的一种或者多种。
可选地,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺。
所述组织起源预测装置还包括:
标准化处理模块:用于对所述待测消化道恶性肿瘤样本在目标区域的甲基化水平数据进行标准化处理后再输入所述多层感知器;进一步可选地,标准化处理的方法包括z-score法,z-score法的计算公式如下所示:
f(x)=(x-μ)/δ,
公式中,x为各个消化道恶性肿瘤样本的各个目标区域的所述Ct值,μ为数据x的均值,δ为数据x的标准差。
本申请的第六方面
本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现在本申请第三方面或者第四方面中提供的所述方法的步骤。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本申请的第七方面
基于上述计算机可读存储介质,本申请还相应提供一种计算机设备,包括存储器和处理器,所述存储器包括前述计算机可读存储介质,处理器用于执行该可读存储介质上存储的计算机程序以实现在第三方面或者第四方面中提供的所述方法的步骤。
下面将结合实施例对本发明的实施方案进行详细描述。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,优先参考本发明中给出的指引,还可以按照本领域的实验手册或常规条件,还可以按照制造厂商所建议的条件,或者参考本领域已知的实验方法。
下述的具体实施例中,涉及原料组分的量度参数,如无特别说明,可能存在称量精度范围内的细微偏差。涉及温度和时间参数,允许仪器测试精度或操作精度导致的可接受的偏差。
1.筛选目标区域特异性的甲基化检测引物对和检测探针
从http://asia.ensembl.org/index.html网站分别获取区域1(Chr19:36418715-36418374,负链)、区域2(Chr2:264356-264113,负链)、区域3(Chr19:36605129-36604835,负链)、区域4(Chr20:62929258-62929370,正链)、区域5(Chr2:181457558-181457295,负链)和区域6(Chr17:77373330-77372947,负链)的DNA序列,如表1中SEQ ID NO.1~6所示,然后得到完全甲基化的且经亚硫酸氢盐转化后的DNA序列,如表1中SEQ ID NO.7~12所示,还可以得到完全未甲基化的且经亚硫酸氢盐转化后的DNA序列,如表1中SEQ ID NO.13~18所示。将如SEQ ID NO.7~18所示序列的片段人工合成,并分别构建到pUC18载体上,作为荧光定量PCR的模板备用。
收集50例健康人的白细胞样本,分别提取每个样本的基因组DNA备用。
以SEQ ID NO.7~12作为模板,针对每条片段分别设计多对甲基化检测引物并人工合成。利用SYBR荧光定量PCR体系分析每对检测引物的性能,要求扩增曲线具有明显的指数增长期,且扩增效率在90%~110%的范围内。更重要的是,需分析PCR扩增的熔解曲线,以保证引物扩增的特异性,即在一个PCR扩增体系中,当同时加入甲基化的质粒模板和非甲基化的质粒模板时,要求对应的检测引物对仅扩增甲基化的质粒,而不扩增非甲基化的质粒,也没有其它非特异性扩增。保留满足上述要求的引物对,再以健康人的白细胞样本基因组DNA作为模板进行荧光定量PCR实验,进一步筛选针对目标区域无非特异性扩增的引物对。
得到满足上述所有要求的针对每个区域的甲基化检测引物对以后,对每对检测引物对设计相应的检测探针,检测探针均为TaqMan探针,探针5’端为荧光基团,探针3’端为荧光淬灭基团,要求检测引物对与检测探针之间、检测探针与目标区域之间无非特异性结合。最后在荧光定量PCR体系中验证甲基化检测引物对和检测探针联用的效果,保留具有指数扩增期的检测引物对和检测探针作为最终的检测产品。通过上述方法,最终筛选得到可检测区域1甲基化水平的3对检测引物对和检测探针,得到可检测区域2甲基化水平的2对检测引物对和检测探针,得到可检测区域3甲基化水平的2对检测引物对和检测探针,得到可检测区域4甲基化水平的1对检测引物对和检测探针,得到可检测区域5甲基化水平的2对检测引物对和检测探针,得到可检测区域6甲基化水平的3对检测引物对和检测探针,针对各个区域的检测引物对和检测探针的核苷酸序列如表2所示。针对各个区域的检测引物对和检测探针可识别的甲基化的胞嘧啶位点如表3所示。
表1、目标区域的DNA序列及经亚硫酸氢盐转化后的序列
表2、目标区域的甲基化检测引物对及检测探针
表3、甲基化引物对和探针可识别的甲基化的胞嘧啶位点
2.采用实时荧光定量甲基化PCR法检测标记物的甲基化水平
2.1样本收集
共招募805名志愿者,其中包括经病理组织活检确诊为食管鳞癌的患者145名,经病理组织活检确诊为胃癌的患者99名,经病理组织活检确诊为肝癌的患者123名,经病理组织活检确诊为胰腺癌的患者142名,经病理组织活检确诊为结直肠癌的患者94名,经内镜、影像学或其它检测诊断为消化系统良性疾病(如反流性食管炎、胃炎、病毒性肝炎、胰腺炎、肠炎等)的患者共88名,无消化系统疾病的健康人114名。
从每位志愿者体内抽取静脉抗凝血,收集的每份血液样本的体积大于等于16mL。所有血液样本的收集过程经过伦理委员会的审批,所有志愿者签署了知情同意书,所有血液样本采用匿名化处理。
2.2样本DNA的提取、转化和纯化
新鲜的抗凝血样本经离心后,吸取上层血浆层,用于提取血浆游离DNA。使用天根生化科技(北京)有限公司的磁珠法血清/血浆游离DNA(cfDNA)提取试剂盒(DP709)进行血浆cfDNA提取,具体操作按照试剂盒说明书进行。
得到cfDNA以后,采用武汉艾米森生命科技有限公司核酸转化试剂(鄂汉械备20200843号)对其进行DNA的转化,随后对转化的DNA进行纯化,用于后续实验,具体操作步骤参见试剂盒说明书。
2.3甲基化实时荧光定量PCR反应
以转化后的血浆cfDNA作为模板,分别使用表2中提供的检测引物对和检测探针进行荧光定量PCR反应来扩增每个血液样本中6个不同的目标区域。因此,对于每个血液样本,一共需要配置3个PCR反应体系,在每个PCR反应体系中,需同时加入2个目标区域特异性的甲基化检测引物对和检测探针,以及内参基因ACTB(用于评估检测样本中DNA含量和质量)的检测引物对和检测探针。在每个PCR反应体系中,2个目标区域的检测探针的5’端荧光基团分别为FAM和ROX,3’端荧光淬灭基团为BHQ1和MGB。具体地,按照表4提供的配方配置PCR扩增体系,配方中用到的DNA聚合酶及缓冲液等成分均购自Invitrogen(Cat:14966005)。本实施例中用到的扩增ACTB基因片段的上游引物序列为:5’-AAGGTGGTTGGGTGGTTGTTTTG-3’(SEQ ID NO.58),扩增ACTB基因片段的下游引物序列为:5’-AATAACACCCCCACCCTGC-3’(SEQID NO.59),与之对应的检测探针序列为:5’-VIC-GGAGTGGTTTTTGGGTTTG-BHQ1-3’SEQ IDNO.60)。此外,在检测生物样本中每一个目标区域时,需要同时设置质控实验,即需要设置阳性对照PCR管和阴性对照PCR管。对于某一目标区域,阳性对照PCR管和阴性对照PCR管的配置体系与实验测试PCR管相同,但是阳性对照PCR管的模板为103拷贝/微升的含转化后该目标区域的质粒和103拷贝/微升的含转化后ACTB基因片段的质粒等体积混合而成,阴性对照PCR管的模板为TE缓冲液。例如,若检测某一待测血液样本中区域1和区域2的甲基化水平时,此时阳性对照PCR管的模板由含SEQ ID NO.7和SEQ ID NO.8所示片段以及转化后ACTB片段的质粒等比例混合而成。当阳性对照PCR管、实验测试PCR管和阴性对照PCR管的体系配置完成后,按照表5提供的程序在荧光定量PCR仪上进行反应。
表4、qPCR反应体系
表5、qPCR反应程序
qPCR反应结束后,调整基线,并设置阈值,阈值必须位于指数扩增期内,穿越阈值与X轴平行的直线称为阈值线,阈值线与扩增曲线的交点所对应的循环数即为Ct值。分析qPCR反应的结果,要求:①阴性对照PCR管无扩增(即不起线);②阳性对照PCR管有明显的指数增长期,且阳性对照PCR管目标基因的Ct值在26~30之间;③待测血液样本的内参基因的Ct值小于等于33。若阳性对照、阴性对照和内参基因均满足上述要求,则可以分析待测血液样本的检测结果并进行结果判读,否则,当次实验无效,必须重新进行检测。
3.癌症风险判读
根据每个血液样本每个目标区域的Ct值判断该血液样本是否为癌症样本。每个目标区域Ct值的阈值如表6所示,在待测血液样本在某一目标区域的Ct值小于等于该阈值的条件下,则该血液样本在此目标区域的检测结果为甲基化阳性,反之,在待测血液样本在某一目标区域的Ct值大于该阈值的条件下,则该血液样本在此目标区域的检测结果为甲基阴性。
表6、各个目标区域的阈值
目标区域 | 阈值 | 甲基化阳性 | 甲基化阴性 |
区域1 | 48 | ≤48 | >48 |
区域2 | 43 | ≤43 | >43 |
区域3 | 48 | ≤48 | >48 |
区域4 | 48 | ≤48 | >48 |
区域5 | 48 | ≤48 | >48 |
区域6 | 48 | ≤48 | >48 |
根据目标区域的甲基化水平判断某一待测血液样本是否为癌症阳性样本的具体标准为:1)在所有6个目标区域的检测结果均为甲基化阴性的条件下,该血液样本为5种消化道癌症阴性样本;2)在所有6个目标区域中至少一个区域的检测结果为甲基化阳性的条件下,则该血液样本为消化道癌症阳性样本。
在收集的805例血液样本中,有603例经组织病理检测确诊为消化道恶性肿瘤患者的样本,有88例经内镜、影像学或其它检测诊断为消化系统良性疾病患者的样本,有114例健康人样本,利用本实施例提供的甲基化检测方法及癌症风险判读标准检测癌症患者的灵敏度和检测消化道良性病变、健康人的特异性结果如表7所示。可以看出,通过检测6个目标区域甲基化水平的方法可以有效区分消化道恶性肿瘤患者和非恶性肿瘤患者。
表7、检测目标区域的甲基化水平诊断消化道5种癌症的性能
4.多层感知器算法预测5种消化道癌症的组织起源
对第3点中514例检测结果为阳性的消化道癌症患者血液样本中各个目标区域的甲基化数据即Ct值进行标准化处理,标准化处理的目的是为了提升使用这些数据所构建的模型的收敛速度和精度。标准化处理的方法为z-score法,z-score的计算公式如下所示:
f(x)=(x-μ)/δ
公式中,x为各个血液样本中各个区域的Ct值,μ为数据x的均值,δ为数据x的标准差。
4.1样本分组
将已经标准化处理的514例样本按照6:4的比例随机分为训练集和验证集。训练集样本用于对模型进行训练,以获得模型中每个神经元的参数,这些参数代表的是神经元之间连接的权重。根据训练模型的预测性能(即灵敏度和特异性)选择最优的训练模型评估其在验证集样本中的灵敏度和特异性,若验证集样本在所述最优的训练模型中的预测性能与训练集样本类似、或优于训练集样本,则确定所述最优的训练模型为组织起源预测模型。
4.2利用多层感知器算法构建5种消化道恶性肿瘤的预测模型
多层感知器算法(Multilayer Perceptron)是一种前馈结构的人工神经网络模型,它由输入层、隐藏层和输出层3种结构组成,其结构示意图如图1所示。在多层感知器中,每一个节点代表一个神经元,同一层神经元之间无连接,相邻两层神经元之间全连接,且信息的传递具有方向性,在进行前向计算的过程中,由输入层向输出层逐层计算。多层感知器神经网络不仅含有输入层和输出层,还含有一层或多层的隐藏层,隐藏层在学习过程中能提取输入模式中的有用特征,通过不断学习使感知器模型达到要求。除了输入层节点以外,每个节点都是一个带有非线性激活函数的神经元。
多层感知器模型的训练参数主要有学习率和隐藏层神经元数量。通过调整这两个训练参数的值来对模型的性能进行改进。为了获得较优的模型,本方案通过网格搜索方法来挑选合适的学习率和隐藏层神经元数量,具体过程如下:按照表8提供的学习率和隐藏层神经元节点数量在训练集上训练模型,得到各个训练模型在训练集中的预测性能,如表8所示。进而选择预测性能最优(灵敏度和特异性之和的均值最大时)的训练模型,在验证集上验证该模型的性能,若该模型在验证集样本中的预测性能与训练集样本类似、或优于训练集样本,则确定所述最优的训练模型为组织起源预测模型,该模型对应的参数即为最优的训练参数。
表8、多层感知器模型的训练参数
从表8中可以看出,通过对320个模型进行训练,发现在模型的超参数如学习率为0.00011、隐藏层神经元节点数为24的条件下,其检测训练集样本的灵敏度(94.26%)和特异性(98.87%)的均值最高,即预测性能达到最佳,所述超参数为最优参数,此时的模型为性能最佳的预测5种消化道恶性肿瘤的训练模型。
使用上述训练模型在验证集样本中评估其预测性能。在由206例确诊的消化道恶性肿瘤患者的血液样本组成的验证集中,使用上述训练模型进行肿瘤组织起源预测的精确度和准确度如表9所示,精确度的计算方法为预测为某一癌症的样本数中病理诊断为该癌症的样本数的比例;准确度的计算方法为病理诊断为某一癌症的样本数中预测为该癌症的样本数的比例。
表9、预测消化道恶性肿瘤组织起源的精确度和准确度
由表9可以看出,本实施例构建的训练模型在验证集样本中的预测效果良好,其预测消化道恶性肿瘤组织起源的精确度和准确度均较高,具体地,该模型预测癌症患者为食管癌的精确度为82.86%,其预测癌症患者为胃癌的精确度为61.22%,其预测癌症患者为肝癌的精确度为83.67%,其预测癌症患者为胰腺癌的精确度为91.89%,其预测癌症患者为结直肠癌的精确度为86.11%;另外,其对食管癌患者进行肿瘤组织起源预测的准确度为60.42%,其对胃癌患者进行肿瘤组织起源预测的准确度为85.71%,其对肝癌患者进行肿瘤组织起源预测的准确度为95.35%,其对胰腺癌患者进行肿瘤组织起源预测的准确度为73.91%,其对结直肠癌患者进行肿瘤组织起源预测的准确度为91.18%。从以上结果可以看出,本实施例构建的肿瘤组织起源预测模型预测胃癌的精确度较低,预测食管癌的准确度较低,其原因在于:在输入的样本数据来自食管癌患者的条件下,一定量的样本会被模型预测为胃癌。考虑到在临床应用中,对于某一肿瘤患者的血液样本,无论使用该肿瘤组织起源预测模型预测其起源于食管还是起源于胃,该患者通常会进行消化道内镜检查,而消化道内镜则可以同时观察食管和胃的病变情况,即不同的癌症类型可采用相同的检测方法,不会使受试者遭受过多的医疗检查和承担额外的医疗支出,因此无需对此模型再进行矫正。
综上,当学习率为0.00011,隐藏层神经节点数为24时的训练模型在验证集样本中的预测效果良好,因而其可以作为最终的消化道恶性肿瘤组织起源预测模型。得到的最佳组织起源预测模型由3层结构构成(如图2所示),分别由6个神经元组成的输入层、24个神经元组成的隐藏层和5个神经元组成的输出层构成。其中输入层的6个神经元分别对应6个标记物区域1、区域2、区域3、区域4、区域5和区域6的输入数值(即Ct值);输出层5个神经元分别对应5种预测的消化道恶性肿瘤类型的概率,5种消化道恶性肿瘤类型为:结直肠癌(CRC)、食管鳞癌(ESCC)、胃癌(GC)、肝癌(HCC)、和胰腺癌(PAAD)。模型根据转换后的6个区域的数值进行预测,输出样本为5种癌症的概率,通常取概率最大的那个癌症类型作为未知样本被预测的类型。图2为消化道恶性肿瘤组织起源预测模型,图中M55表示区域1,M76表示区域2,M01表示区域3,M04表示区域4,M7表示区域5,M15表示区域6。
5.利用测试集样本评估癌症风险判读标准和癌症组织起源预测模型的性能
5.1测试集样本收集
共招募430名志愿者,其中,确诊为食管鳞癌的患者有72名,确诊为胃癌的患者有56名,确诊为肝癌的患者有51名,确诊为胰腺癌的患者有42名,确诊为结直肠癌的患者有66名,消化道良性疾病患者有63名,健康人80名。
从每位志愿者体内抽取静脉抗凝血,收集的每份血液样本的体积大于等于16mL。所有血液样本的收集过程经过伦理委员会的审批,所有志愿者签署了知情同意书,所有血液样本采用匿名化处理。
5.2测试集样本cfDNA的提取、转化、纯化、甲基化水平检测、甲基化数据的标准化处理同上。
5.3评估癌症风险判读标准和癌症组织起源预测模型在测试集样本中的性能
根据目标区域的甲基化水平判断测试集样本是否为癌症阳性样本的性能如表10所示。
表10、癌症风险判读标准诊断测试集样本的灵敏度和特异性
从上表可以看出,所述癌症风险判读标准在验证集和测试集中的性能是一致的,其在测试集中检测消化道恶性肿瘤样本的灵敏度为81.89%,其检测消化道良性疾病和健康人样本的总特异性为91.6%,可以实现对消化道癌症样本和非癌样本的有效区分。
进一步地,将经过标准化处理的测试集样本(参照上述第1至3点进行检测,检测结果为阳性的235例消化道癌症患者血液样本)数据导入所构建的消化道癌症组织起源预测模型中,模型根据转换后的6个标记物的数值进行预测,并输出测试样本患5种癌症的概率,从而得到最接近该样本原发部位的癌症类型。利用消化道癌症组织起源预测模型预测测试集样本癌症起源的精确度和准确度如表11所示。
表11、消化道癌症组织起源预测模型预测测试集样本的精确度和准确度
从上表可以看出,所述消化道癌症组织起源预测模型在验证集和测试集中的预测性能是一致的。其预测癌症患者为食管癌的精确度为84.78%,其预测癌症患者为胃癌的精确度为63.93%,其预测癌症患者为肝癌的精确度为95.74%,其预测癌症患者为胰腺癌的精确度为85.71%,其预测癌症患者为结直肠癌的精确度为90.57%;另外,其对食管癌患者进行肿瘤组织起源预测的准确度为67.24%,其对胃癌患者进行肿瘤组织起源预测的准确度为86.67%,其对肝癌患者进行肿瘤组织起源预测的准确度为95.74%,其对胰腺癌患者进行肿瘤组织起源预测的准确度为75%,其对结直肠癌患者进行肿瘤组织起源预测的准确度为90.57%。
上述实施例提供了一组分子标记物,该标记物包括:区域1(Chr19:36418715-36418374,负链)、区域2(Chr2:264356-264113,负链)、区域3(Chr19:36605129-36604835,负链)、区域4(Chr20:62929258-62929370,正链)、区域5(Chr2:181457558-181457295,负链)和区域6(Chr17:77373330-77372947,负链)。根据本发明提供的技术方案,通过甲基化荧光定量PCR的方法来检测血浆样本中所述分子标记物的甲基化水平;进而根据所述分子标记物的甲基化水平来区分消化道恶性肿瘤患者和非恶性肿瘤患者;此外,本发明还提供了一种预测5种消化道恶性肿瘤组织起源的方法。因此,仅需受试者提供血液样本,而无需侵入性操作,无需进行多种检测,即可判断其是否为5种消化道恶性肿瘤患者,若为癌症患者,还可以判断其患癌的具体部位。根据本发明提供的技术方案,其判断受试者患消化道恶性肿瘤的灵敏度为81.89%,其检测消化道良性疾病和健康人的特异性为91.6%。此外,基于本技术方案提供的肿瘤组织起源预测模型,其预测受试者患食管癌的准确度和精确度分别为67.24%和84.78%,其预测受试者患胃癌的准确度和精确度分别为86.67%和63.93%,其预测受试者患肝癌的准确度和精确度均为95.74%,其预测受试者患胰腺癌的准确度和精确度分别为75%和85.71%,其预测受试者患结直肠癌的准确度和精确度均为90.57%。该诊断方法简单、便捷、快速,避免了患者接受多种侵入性检查,可以减少患者的痛苦,也可以缓解目前医疗资源紧张的问题,同时又达到了诊断的目的,一举多得。
综上,利用本发明提供的技术方案,可以同时检测受试者是否患有5种消化道恶性肿瘤,并能够准确预测受试者患有哪种消化道恶性肿瘤。该方案弥补了现有消化道恶性肿瘤筛查和诊断方法的不足和空缺,且更加便利、快捷,不仅有利于提高检查效率,还可以使受试者避免接受侵入性的检查,为患者带来福音。
以上所述实施方式和实施例的各技术特征可以进行任意合适方式的组合,为使描述简洁,未对上述实施方式和实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为在本说明书记载的范围中。
以上所述实施例仅表达了本发明的几种实施方式,便于具体和详细地理解本发明的技术方案,但并不能因此而理解为对发明专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,得到的等价形式同样落于本申请的保护范围。还应当理解,本领域技术人员在本发明提供的技术方案的基础上,通过合乎逻辑的分析、推理或者有限的试验得到的技术方案,均在本发明所附权利要求的保护范围内。因此,本发明专利的保护范围应以所附权利要求的内容为准,说明书及附图可以用于解释权利要求的内容。
Claims (15)
1.检测基因目标区域的甲基化水平的试剂在制备消化道恶性肿瘤诊断产品中的应用;
所述目标区域包括如下(A)至(F)项所示区域的组合:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链。
2.根据权利要求1所述的应用,其特征在于,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,
和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
3.根据权利要求1或者2所述的应用,其特征在于,所述试剂通过如下方法中的一种或者多种实现对所述目标区域的甲基化水平的检测:甲基化特异性PCR法、亚硫酸氢盐测序法、甲基化特异性微阵列法、全基因组亚硫酸氢盐测序法、焦磷酸测序法、甲基化特异性高效液相层析法、数字PCR法、甲基化特异性高分辨率熔解曲线法、甲基化敏感性限制性内切酶法和甲基化特异性荧光定量PCR法。
4.根据权利要求3所述的应用,其特征在于,所述试剂包括特异性检测所述目标区域甲基化水平的检测引物对以及检测探针的组合;
可选地,所述试剂包括如下(1)至(13)组中所示的检测引物对和检测探针的组合中的一组或者多组:(1)如SEQ ID No.19和SEQ ID No.20所示的检测引物对和如SEQ ID No.21所示的检测探针;(2)如SEQ ID No.22和SEQ ID No.23所示的检测引物对和如SEQ IDNo.24所示的检测探针;(3)如SEQ IDNo.25和SEQ ID No.26所示的检测引物对和如SEQ IDNo.27所示的检测探针;(4)如SEQ ID No.28和SEQ ID No.29所示的检测引物对和如SEQ IDNo.30所示的检测探针;(5)如SEQ ID No.31和SEQ ID No.32所示的检测引物对和如SEQ IDNo.33所示的检测探针;(6)如SEQ ID No.34和SEQ ID No.35所示的检测引物对和如SEQ IDNo.36所示的检测探针;(7)如SEQ ID No.37和SEQ ID No.38所示的检测引物对和如SEQ IDNo.39所示的检测探针;(8)如SEQ ID No.40和SEQ ID No.41所示的检测引物对和如SEQIDNo.42所示的检测探针;(9)如SEQ ID No.43和SEQ ID No.44所示的检测引物对和如SEQID No.45所示的检测探针;(10)如SEQ ID No.46和SEQ ID No.47所示的检测引物对和如SEQ ID No.48所示的检测探针;(11)如SEQ ID No.49和SEQ ID No.50所示的检测引物对和如SEQ ID No.51所示的检测探针;(12)如SEQ ID No.52和SEQ ID No.53所示的检测引物对和如SEQ ID No.54所示的检测探针;和,(13)如SEQ ID No.55和SEQ ID No.56所示的检测引物对和如SEQ ID No.57所示的检测探针;
进一步可选地,所述检测引物对以及检测探针的组合包括如下所示的组合I至组合VI:
组合I包括所述(1)至(3)组所示检测引物对以及检测探针的组合中的一组或者多组;
组合II包括所述(4)至(5)组所示检测引物对以及检测探针的组合中的一组或者多组;
组合III包括所述(6)至(7)组所示检测引物对以及检测探针的组合中的一组或者多组;
组合IV包括所述(8)组所示检测引物对以及检测探针的组合;
组合V包括所述(9)至(10)组所示检测引物对以及检测探针的组合中的一组或者多组;
组合VI包括所述(11)至(13)组所示检测引物对以及检测探针的组合中的一组或者多组。
5.根据权利要求1、2和4任一项所述的应用,其特征在于,所述消化道恶性肿瘤为肝脏肿瘤、胃肿瘤、食管肿瘤、结直肠肿瘤或者胰腺肿瘤。
6.一种消化道恶性肿瘤诊断试剂盒,其特征在于,包括权利要求1至5中任一项所定义的试剂。
7.根据权利要求6所述的消化道恶性肿瘤诊断试剂盒,其特征在于,所述诊断试剂盒还包括测序试剂、扩增试剂、将未甲基化的胞嘧啶碱基转化为尿嘧啶的试剂、DNA提取试剂和纯化试剂中的一种或者多种;
可选地,所述扩增试剂包括扩增缓冲液、dNTPs、DNA聚合酶和Mg2+中的一种或者多种。
8.一种消化道恶性肿瘤的组织起源预测模型的构建方法,其特征在于,所述构建方法包括如下步骤:
获取消化道恶性肿瘤样本在目标区域的甲基化水平数据,所述消化道恶性肿瘤样本包括已确诊的肝癌样本、胃癌样本、食管癌样本、结直肠癌样本和胰腺癌样本中一种或者多种;
将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入多层感知器,构建具有映射关系的组织起源预测模型;
所述多层感知器的结构包括输入层、隐藏层和输出层,所述输入层的神经元的数量与所述目标区域的数量一致,所述输出层的神经元的数量与所述消化道恶性肿瘤样本的种类数量一致,所述隐藏层的数量大于等于一层;
所述目标区域包括如下(A)至(F)项所示区域的组合:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链;
可选地,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,
和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
9.根据权利要求8所述的消化道恶性肿瘤的组织起源预测模型的构建方法,其特征在于,将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入多层感知器,构建组织起源预测模型,包括如下步骤:
将所述消化道恶性肿瘤样本的一部分记作训练集样本,另一部分记作验证集样本;
将所述训练集样本在目标区域的甲基化水平数据输入所述多层感知器,构建训练集模型并获得训练集预测数据,从所述训练集预测数据中对应挑选出预测性能最优的训练模型作为待用预测模型;
将所述验证集样本在目标区域的甲基化水平数据输入所述待用预测模型进行预测性能验证,若所述验证集样本在所述待用预测模型中的预测性能与训练集样本类似、或者优于所述训练集样本,则确定所述待用预测模型为组织起源预测模型;
其中,所述预测性能的评价指标包括灵敏度、特异性或者灵敏度与特异性之和的平均值,所述灵敏度越高、所述特异性越高或者所述平均值越大,所述预测性能越优。
10.根据权利要求8或者9所述的消化道恶性肿瘤的组织起源预测模型的构建方法,其特征在于,所述消化道恶性肿瘤样本在目标区域的甲基化水平数据包括采用甲基化特异性荧光定量PCR法检测所述目标区域得到的Ct值;
可选地,所述甲基化特异性荧光定量PCR法采用的检测引物对和检测探针的组合如权利要求4中定义。
11.根据权利要求10所述的消化道恶性肿瘤的组织起源预测模型的构建方法,其特征在于,所述构建方法还包括对所述甲基化水平数据进行标准化处理后再输入所述多层感知器的步骤;
可选地,标准化处理的方法包括z-score法,z-score法的计算公式如下所示:
f(x)=(x-μ)/δ,
公式中,x为各个消化道恶性肿瘤样本的各个目标区域的所述Ct值,μ为数据x的均值,δ为数据x的标准差。
12.根据权利要求11所述的消化道恶性肿瘤的组织起源预测模型的构建方法,其特征在于,所述组织起源预测模型中,输入层包括6个神经元,输出层包括5个神经元,隐藏层的参数包括:学习率为0.00011,隐藏层节点数为24,层数为1层。
13.一种消化道恶性肿瘤的组织起源预测装置,其特征在于,包括:
数据获取模块:用于获取待测消化道恶性肿瘤样本在目标区域的甲基化水平数据;
预测模块:用于将所述消化道恶性肿瘤样本在目标区域的甲基化水平数据输入权利要求8至12任一项所述构建方法构建的组织起源预测模型中,预测所述待测消化道恶性肿瘤样本归属为某种组织起源的概率;
输出模块:用于输出所述预测模块预测的所述待测消化道恶性肿瘤样本归属为某种组织起源的概率;
可选地,所述组织起源预测装置还包括:任选的标准化处理模块:用于对所述待测消化道恶性肿瘤样本在目标区域的甲基化水平数据进行标准化处理后再输入所述多层感知器;
所述目标区域包括如下(A)至(F)项所示区域的组合:
(A)区域1或其部分区域,
(B)区域2或其部分区域,
(C)区域3或其部分区域,
(D)区域4或其部分区域,
(E)区域5或其部分区域,和,
(F)区域6或其部分区域;
以GRCh38.p14为参考,
所述区域1为Chr19:36418715-36418374,负链,
所述区域2为Chr2:264356-264113,负链,
所述区域3为Chr19:36605129-36604835,负链,
所述区域4为Chr20:62929258-62929370,正链,
所述区域5为Chr2:181457558-181457295,负链,
所述区域6为Chr17:77373330-77372947,负链;
可选地,所述目标区域满足如下条件(a)至(e)中的一个或者多个:
(a)所述区域1的部分区域包括如下定义的区域1-1、区域1-2和区域1-3中的一个或者多个:
区域1-1为Chr19:36418715-36418574,负链,
区域1-2为Chr19:36418531-36418393,负链,和,
区域1-3为Chr19:36418491-36418374,负链;
(b)所述区域2的部分区域包括如下定义的区域2-1和区域2-2中的一个或者多个:
区域2-1为Chr2:264356-264234,负链,和,
区域2-2为Chr2:264207-264113,负链;
(c)所述区域3的部分区域包括如下定义的区域3-1和区域3-2中的一个或者多个:
区域3-1为Chr19:36605129-36604988,负链,和,
区域3-2为Chr19:36604969-36604835,负链;
(d)所述区域5的部分区域包括如下定义的区域5-1和区域5-2中的一个或者多个:
区域5-1为Chr2:181457558-181457452,负链,
和,
区域5-2为Chr2:181457423-181457295,负链;
(e)所述区域6的部分区域包括如下定义的区域6-1、区域6-2和区域6-3中的一个或者多个:
区域6-1为Chr17:77373330-77373210,负链,
区域6-2为Chr17:77373186-77373039,负链,和,
区域6-3为Chr17:77373035-77372947,负链。
14.根据权利要求13所述的预测装置,其特征在于,所述甲基化水平数据包括采用甲基化特异性荧光定量PCR法检测所述目标区域得到的Ct值;
可选地,所述甲基化特异性荧光定量PCR法采用的检测引物对和检测探针如权利要求4中定义;
可选地,所述组织起源的组织源种类包括肝、胃、食管、结直肠和胰腺中的一种或者多种;
可选地,所述标准化处理的方法包括z-score法,z-score法的计算公式如下所示:
f(x)=(x-μ)/δ,
公式中,x为各个消化道恶性肿瘤样本的各个目标区域的所述Ct值,μ为数据x的均值,δ为数据x的标准差。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求8至12任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211694566.XA CN116042830A (zh) | 2022-12-28 | 2022-12-28 | 消化道恶性肿瘤诊断产品及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211694566.XA CN116042830A (zh) | 2022-12-28 | 2022-12-28 | 消化道恶性肿瘤诊断产品及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116042830A true CN116042830A (zh) | 2023-05-02 |
Family
ID=86130571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211694566.XA Pending CN116042830A (zh) | 2022-12-28 | 2022-12-28 | 消化道恶性肿瘤诊断产品及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116042830A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015153283A1 (en) * | 2014-03-31 | 2015-10-08 | Mayo Foundation For Medical Education And Research | Detecting colorectal neoplasm |
AU2016201170A1 (en) * | 2005-12-23 | 2016-03-17 | Pacific Edge Limited | Prognosis prediction for colorectal cancer |
CN105468893A (zh) * | 2014-09-26 | 2016-04-06 | 希森美康株式会社 | 辅助大肠癌的再发风险诊断的计算机系统、程序及方法 |
CN106244724A (zh) * | 2016-10-26 | 2016-12-21 | 北京鑫诺美迪基因检测技术有限公司 | 检测septin9基因甲基化的引物及试剂盒 |
CN111560434A (zh) * | 2020-05-18 | 2020-08-21 | 苏州唯善生物科技有限公司 | 消化道肿瘤标记物检测的引物探针组、试剂盒、检测方法及其应用 |
CN111676292A (zh) * | 2020-08-11 | 2020-09-18 | 圣湘生物科技股份有限公司 | 一种用于检测肝癌的组合物,试剂盒及其用途 |
CN113355414A (zh) * | 2021-06-04 | 2021-09-07 | 武汉艾米森生命科技有限公司 | 食管癌检测试剂盒及其应用 |
CN114317740A (zh) * | 2021-11-24 | 2022-04-12 | 博尔诚(北京)科技有限公司 | 用于胃癌筛查的标志物、探针组合物及其应用 |
-
2022
- 2022-12-28 CN CN202211694566.XA patent/CN116042830A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2016201170A1 (en) * | 2005-12-23 | 2016-03-17 | Pacific Edge Limited | Prognosis prediction for colorectal cancer |
WO2015153283A1 (en) * | 2014-03-31 | 2015-10-08 | Mayo Foundation For Medical Education And Research | Detecting colorectal neoplasm |
CN105468893A (zh) * | 2014-09-26 | 2016-04-06 | 希森美康株式会社 | 辅助大肠癌的再发风险诊断的计算机系统、程序及方法 |
CN106244724A (zh) * | 2016-10-26 | 2016-12-21 | 北京鑫诺美迪基因检测技术有限公司 | 检测septin9基因甲基化的引物及试剂盒 |
CN111560434A (zh) * | 2020-05-18 | 2020-08-21 | 苏州唯善生物科技有限公司 | 消化道肿瘤标记物检测的引物探针组、试剂盒、检测方法及其应用 |
CN111676292A (zh) * | 2020-08-11 | 2020-09-18 | 圣湘生物科技股份有限公司 | 一种用于检测肝癌的组合物,试剂盒及其用途 |
CN113355414A (zh) * | 2021-06-04 | 2021-09-07 | 武汉艾米森生命科技有限公司 | 食管癌检测试剂盒及其应用 |
CN114317740A (zh) * | 2021-11-24 | 2022-04-12 | 博尔诚(北京)科技有限公司 | 用于胃癌筛查的标志物、探针组合物及其应用 |
Non-Patent Citations (3)
Title |
---|
ZHOU Y等: "Expression profiles and prognostic significance of RNA N6-methyladenosine-related genes in patients with hepatocellular carcinoma:Evidence from independent datasets", 《CANER MANAG RESEARCH》, vol. 11, pages 3921 - 3931 * |
刘晖;谢诗扬;关庆洲;谢佳静;夏洁;邓旭晟;郭政;严海丹: "基于CpG位点的DNA甲基化水平的秩序关系识别结直肠癌的诊断标志", 《2018年中国肿瘤标志物学术大会暨第十二届肿瘤标志物青年科学家论坛论文集》, pages 1 * |
宋海飞; 余诗俊; 高勇: "m6A甲基化在多种消化道肿瘤中的研究进展", 《现代肿瘤医学》, vol. 28, no. 20, pages 3613 - 3616 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106893784A (zh) | 用于预测肝癌预后的lncRNA标志物 | |
Sangtani et al. | Combining copy number, methylation markers, and mutations as a panel for endometrial cancer detection via intravaginal tampon collection | |
CN109207592A (zh) | 用于结直肠癌检测的试剂盒及其应用 | |
JP2020519296A (ja) | 膀胱がん監視のためのdnaメチル化および変異分析方法 | |
CN112609015A (zh) | 一种预测结直肠癌风险的微生物标志物及其应用 | |
CN117165688A (zh) | 用于尿路上皮癌的标志物及其应用 | |
CN116804218A (zh) | 用于检测肺结节良恶性的甲基化标志物及其应用 | |
CN117248021A (zh) | 一种用于尿路上皮癌或癌前病变检测的核酸组合、试剂盒及应用 | |
CA3181473A1 (en) | Tumor detection reagent and kit | |
CN116987791A (zh) | 一组血浆标志物在甲状腺结节良恶性鉴别中的应用 | |
CN114480636B (zh) | 胆汁细菌作为肝门部胆管癌诊断及预后标志物的用途 | |
CN114107514A (zh) | 一种用于结直肠癌诊断的miRNA分子标志物及其试剂盒 | |
CN116042830A (zh) | 消化道恶性肿瘤诊断产品及其应用 | |
CN118374600B (zh) | 引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质 | |
CN118685526B (zh) | 用于诊断肺癌基因甲基化的pcr引物探针组合、试剂盒及其应用 | |
CN108118091A (zh) | 可用于检测与直肠癌相关的prmt6基因启动子区甲基化程度的试剂盒及其应用 | |
US11807908B2 (en) | Genetic markers used for identifying benign and malignant pulmonary micro-nodules and the application thereof | |
WO2023082141A1 (zh) | 用于检测肝癌的hist1h3g甲基化标志物 | |
CN113278697B (zh) | 一种基于外周血内基因甲基化的肺癌诊断试剂盒 | |
WO2023082140A1 (zh) | 一种用于诊断肝癌的核酸检测试剂盒 | |
WO2023082142A1 (zh) | 用于检测肝癌的otx1甲基化标志物 | |
CN109182520B (zh) | 一种宫颈癌及其癌前病变检测试剂盒及其应用 | |
CN118186078A (zh) | 一种新型多靶点肺癌辅助诊断的标志物组合及其应用 | |
CN118685526A (zh) | 用于诊断肺癌基因甲基化的pcr引物探针组合、试剂盒及其应用 | |
CN117431315A (zh) | 大肠癌淋巴结转移检测甲基化生物标记物及检测试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |