CN116867911A - 用于胃癌预防和早期发现的生物标志物特征 - Google Patents
用于胃癌预防和早期发现的生物标志物特征 Download PDFInfo
- Publication number
- CN116867911A CN116867911A CN202180094230.7A CN202180094230A CN116867911A CN 116867911 A CN116867911 A CN 116867911A CN 202180094230 A CN202180094230 A CN 202180094230A CN 116867911 A CN116867911 A CN 116867911A
- Authority
- CN
- China
- Prior art keywords
- gastric cancer
- biomarkers
- patient
- lep
- optionally
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000090 biomarker Substances 0.000 title claims abstract description 224
- 208000005718 Stomach Neoplasms Diseases 0.000 title claims abstract description 212
- 206010017758 gastric cancer Diseases 0.000 title claims abstract description 209
- 201000011549 stomach cancer Diseases 0.000 title claims abstract description 209
- 230000002265 prevention Effects 0.000 title description 3
- 102100032277 Serum amyloid A-1 protein Human genes 0.000 claims abstract description 173
- 238000000034 method Methods 0.000 claims abstract description 155
- 108020005196 Mitochondrial DNA Proteins 0.000 claims abstract description 136
- 241000282414 Homo sapiens Species 0.000 claims abstract description 115
- 108090001007 Interleukin-8 Proteins 0.000 claims abstract description 102
- 102000013691 Interleukin-17 Human genes 0.000 claims abstract description 96
- 108050003558 Interleukin-17 Proteins 0.000 claims abstract description 96
- 208000016644 chronic atrophic gastritis Diseases 0.000 claims abstract description 94
- 208000004300 Atrophic Gastritis Diseases 0.000 claims abstract description 93
- 208000036495 Gastritis atrophic Diseases 0.000 claims abstract description 93
- 101001027631 Homo sapiens Kinesin-like protein KIF20B Proteins 0.000 claims abstract description 93
- 101000573451 Homo sapiens Msx2-interacting protein Proteins 0.000 claims abstract description 93
- 102100037691 Kinesin-like protein KIF20B Human genes 0.000 claims abstract description 93
- 102100026285 Msx2-interacting protein Human genes 0.000 claims abstract description 93
- 102100021723 Arginase-1 Human genes 0.000 claims abstract description 91
- 101000752037 Homo sapiens Arginase-1 Proteins 0.000 claims abstract description 91
- 101000800287 Homo sapiens Tubulointerstitial nephritis antigen-like Proteins 0.000 claims abstract description 91
- 102100023471 E-selectin Human genes 0.000 claims abstract description 90
- 101000691574 Homo sapiens Junction plakoglobin Proteins 0.000 claims abstract description 90
- 101000869480 Homo sapiens Serum amyloid A-1 protein Proteins 0.000 claims abstract description 90
- 102100026153 Junction plakoglobin Human genes 0.000 claims abstract description 90
- 101000693844 Homo sapiens Insulin-like growth factor-binding protein complex acid labile subunit Proteins 0.000 claims abstract description 89
- 102100025515 Insulin-like growth factor-binding protein complex acid labile subunit Human genes 0.000 claims abstract description 89
- 102100021761 Alpha-mannosidase 2 Human genes 0.000 claims abstract description 88
- 101000615953 Homo sapiens Alpha-mannosidase 2 Proteins 0.000 claims abstract description 88
- 102100021834 3-hydroxyacyl-CoA dehydrogenase Human genes 0.000 claims abstract description 87
- 101710089435 Lipopolysaccharide-binding protein Proteins 0.000 claims abstract description 87
- 101000671649 Homo sapiens Upstream stimulatory factor 2 Proteins 0.000 claims abstract description 86
- 102100040103 Upstream stimulatory factor 2 Human genes 0.000 claims abstract description 86
- 102100032794 ATPase family AAA domain-containing protein 3B Human genes 0.000 claims abstract description 85
- 101000923358 Homo sapiens ATPase family AAA domain-containing protein 3B Proteins 0.000 claims abstract description 85
- 102100040105 Upstream stimulatory factor 1 Human genes 0.000 claims abstract description 85
- -1 F A1 Proteins 0.000 claims abstract description 84
- 101000671637 Homo sapiens Upstream stimulatory factor 1 Proteins 0.000 claims abstract description 84
- 101000998011 Homo sapiens Keratin, type I cytoskeletal 19 Proteins 0.000 claims abstract description 83
- 102100033420 Keratin, type I cytoskeletal 19 Human genes 0.000 claims abstract description 83
- 102100031673 Corneodesmosin Human genes 0.000 claims abstract description 81
- 101000777796 Homo sapiens Corneodesmosin Proteins 0.000 claims abstract description 81
- 101000614436 Homo sapiens Keratin, type I cytoskeletal 14 Proteins 0.000 claims abstract description 81
- 102100040445 Keratin, type I cytoskeletal 14 Human genes 0.000 claims abstract description 81
- 101001091582 Homo sapiens Keratinocyte proline-rich protein Proteins 0.000 claims abstract description 80
- 102100035791 Keratinocyte proline-rich protein Human genes 0.000 claims abstract description 80
- 102100023519 Cornifin-A Human genes 0.000 claims abstract description 79
- 101800000026 Dentin sialoprotein Proteins 0.000 claims abstract description 79
- 101000828732 Homo sapiens Cornifin-A Proteins 0.000 claims abstract description 79
- 101000741544 Homo sapiens Properdin Proteins 0.000 claims abstract description 79
- 102100038567 Properdin Human genes 0.000 claims abstract description 79
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 claims abstract description 78
- 101001053641 Homo sapiens Plasma serine protease inhibitor Proteins 0.000 claims abstract description 78
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 claims abstract description 78
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 claims abstract description 78
- 102100024078 Plasma serine protease inhibitor Human genes 0.000 claims abstract description 78
- 101001046936 Homo sapiens Keratin, type II cytoskeletal 2 epidermal Proteins 0.000 claims abstract description 77
- 102100022854 Keratin, type II cytoskeletal 2 epidermal Human genes 0.000 claims abstract description 77
- 101001056452 Homo sapiens Keratin, type II cytoskeletal 6A Proteins 0.000 claims abstract description 74
- 101000934774 Homo sapiens Keratin, type II cytoskeletal 6C Proteins 0.000 claims abstract description 74
- 102100025383 Keratin, type II cytoskeletal 6C Human genes 0.000 claims abstract description 74
- GOZMBJCYMQQACI-UHFFFAOYSA-N 6,7-dimethyl-3-[[methyl-[2-[methyl-[[1-[3-(trifluoromethyl)phenyl]indol-3-yl]methyl]amino]ethyl]amino]methyl]chromen-4-one;dihydrochloride Chemical compound Cl.Cl.C=1OC2=CC(C)=C(C)C=C2C(=O)C=1CN(C)CCN(C)CC(C1=CC=CC=C11)=CN1C1=CC=CC(C(F)(F)F)=C1 GOZMBJCYMQQACI-UHFFFAOYSA-N 0.000 claims abstract description 73
- 102000058242 S100A12 Human genes 0.000 claims abstract description 62
- 108700016890 S100A12 Proteins 0.000 claims abstract description 62
- 101150097337 S100A12 gene Proteins 0.000 claims abstract description 59
- 102100030621 Carboxypeptidase A4 Human genes 0.000 claims abstract description 52
- 241000590002 Helicobacter pylori Species 0.000 claims abstract description 52
- 101000772572 Homo sapiens Carboxypeptidase A4 Proteins 0.000 claims abstract description 52
- 229940037467 helicobacter pylori Drugs 0.000 claims abstract description 52
- 230000002496 gastric effect Effects 0.000 claims abstract description 44
- 230000001855 preneoplastic effect Effects 0.000 claims abstract description 39
- 108010017324 STAT3 Transcription Factor Proteins 0.000 claims abstract description 33
- 102100024040 Signal transducer and activator of transcription 3 Human genes 0.000 claims abstract description 33
- 208000006994 Precancerous Conditions Diseases 0.000 claims abstract description 25
- 239000012472 biological sample Substances 0.000 claims abstract description 25
- 210000004369 blood Anatomy 0.000 claims abstract description 25
- 239000008280 blood Substances 0.000 claims abstract description 25
- 208000015181 infectious disease Diseases 0.000 claims abstract description 19
- 238000010339 medical test Methods 0.000 claims abstract description 19
- 230000007170 pathology Effects 0.000 claims abstract description 16
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 12
- 238000000338 in vitro Methods 0.000 claims abstract description 12
- 238000012216 screening Methods 0.000 claims abstract description 9
- 101001063991 Homo sapiens Leptin Proteins 0.000 claims abstract 21
- BSFODEXXVBBYOC-UHFFFAOYSA-N 8-[4-(dimethylamino)butan-2-ylamino]quinolin-6-ol Chemical compound C1=CN=C2C(NC(CCN(C)C)C)=CC(O)=CC2=C1 BSFODEXXVBBYOC-UHFFFAOYSA-N 0.000 claims abstract 19
- 101000622123 Homo sapiens E-selectin Proteins 0.000 claims abstract 19
- 101000576802 Homo sapiens Mesothelin Proteins 0.000 claims abstract 19
- 102100025096 Mesothelin Human genes 0.000 claims abstract 19
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 claims abstract 18
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 claims abstract 18
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 claims abstract 18
- 102100038199 Desmoplakin Human genes 0.000 claims abstract 16
- 102000004890 Interleukin-8 Human genes 0.000 claims description 100
- 102100026992 Dermcidin Human genes 0.000 claims description 88
- 101000911659 Homo sapiens Dermcidin Proteins 0.000 claims description 88
- 102100022695 Histidine ammonia-lyase Human genes 0.000 claims description 82
- 101001044626 Homo sapiens Histidine ammonia-lyase Proteins 0.000 claims description 82
- 108090000623 proteins and genes Proteins 0.000 claims description 49
- 102000004169 proteins and genes Human genes 0.000 claims description 43
- 239000000523 sample Substances 0.000 claims description 40
- 239000011324 bead Substances 0.000 claims description 38
- 230000003902 lesion Effects 0.000 claims description 36
- 238000001514 detection method Methods 0.000 claims description 33
- 150000007523 nucleic acids Chemical class 0.000 claims description 30
- 239000000427 antigen Substances 0.000 claims description 29
- 108091007433 antigens Proteins 0.000 claims description 27
- 102000036639 antigens Human genes 0.000 claims description 27
- 230000035945 sensitivity Effects 0.000 claims description 27
- 108020004414 DNA Proteins 0.000 claims description 26
- 102000039446 nucleic acids Human genes 0.000 claims description 25
- 108020004707 nucleic acids Proteins 0.000 claims description 25
- 238000003753 real-time PCR Methods 0.000 claims description 23
- 238000009396 hybridization Methods 0.000 claims description 22
- 108060008682 Tumor Necrosis Factor Proteins 0.000 claims description 20
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 claims description 20
- 239000003155 DNA primer Substances 0.000 claims description 19
- 239000003153 chemical reaction reagent Substances 0.000 claims description 19
- 238000005259 measurement Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 18
- 238000002965 ELISA Methods 0.000 claims description 17
- 238000003556 assay Methods 0.000 claims description 15
- 102100029057 Coagulation factor XIII A chain Human genes 0.000 claims description 14
- 101000918352 Homo sapiens Coagulation factor XIII A chain Proteins 0.000 claims description 14
- 108010004729 Phycoerythrin Proteins 0.000 claims description 14
- 230000003862 health status Effects 0.000 claims description 14
- 101000958390 Homo sapiens Mannosyl-oligosaccharide 1,2-alpha-mannosidase IA Proteins 0.000 claims description 12
- 102100038245 Mannosyl-oligosaccharide 1,2-alpha-mannosidase IA Human genes 0.000 claims description 12
- 238000004949 mass spectrometry Methods 0.000 claims description 11
- 238000012544 monitoring process Methods 0.000 claims description 10
- 239000013615 primer Substances 0.000 claims description 10
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 9
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 9
- 239000007853 buffer solution Substances 0.000 claims description 9
- 238000011282 treatment Methods 0.000 claims description 9
- 230000036541 health Effects 0.000 claims description 8
- 101000617830 Homo sapiens Sterol O-acyltransferase 1 Proteins 0.000 claims description 6
- 102100021993 Sterol O-acyltransferase 1 Human genes 0.000 claims description 6
- 108010090804 Streptavidin Proteins 0.000 claims description 6
- 101000697584 Streptomyces lavendulae Streptothricin acetyltransferase Proteins 0.000 claims description 6
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 claims description 5
- 102000004190 Enzymes Human genes 0.000 claims description 5
- 108090000790 Enzymes Proteins 0.000 claims description 5
- 108010006785 Taq Polymerase Proteins 0.000 claims description 5
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims description 5
- 150000001412 amines Chemical class 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 5
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 5
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 5
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 5
- 230000008029 eradication Effects 0.000 claims description 5
- 239000003550 marker Substances 0.000 claims description 5
- 239000002773 nucleotide Substances 0.000 claims description 5
- 125000003729 nucleotide group Chemical group 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 206010000087 Abdominal pain upper Diseases 0.000 claims description 4
- 238000010186 staining Methods 0.000 claims description 4
- 239000004202 carbamide Substances 0.000 claims description 3
- 230000004544 DNA amplification Effects 0.000 claims description 2
- 102100030874 Leptin Human genes 0.000 claims 20
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 claims 8
- 238000004590 computer program Methods 0.000 claims 4
- 101001027128 Homo sapiens Fibronectin Proteins 0.000 claims 1
- 101001123332 Homo sapiens Proteoglycan 4 Proteins 0.000 claims 1
- 101000632056 Homo sapiens Septin-9 Proteins 0.000 claims 1
- 102100028024 Septin-9 Human genes 0.000 claims 1
- 108010092277 Leptin Proteins 0.000 description 80
- 102000016267 Leptin Human genes 0.000 description 80
- 229940039781 leptin Drugs 0.000 description 78
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 78
- XKTZWUACRZHVAN-VADRZIEHSA-N interleukin-8 Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](NC(C)=O)CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N1[C@H](CCC1)C(=O)N1[C@H](CCC1)C(=O)N[C@@H](C)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC=1C=CC(O)=CC=1)C(=O)N[C@H](CO)C(=O)N1[C@H](CCC1)C(N)=O)C1=CC=CC=C1 XKTZWUACRZHVAN-VADRZIEHSA-N 0.000 description 77
- 229940096397 interleukin-8 Drugs 0.000 description 77
- 108090000015 Mesothelin Proteins 0.000 description 75
- 102000003735 Mesothelin Human genes 0.000 description 75
- 102000014702 Haptoglobin Human genes 0.000 description 74
- 108050005077 Haptoglobin Proteins 0.000 description 74
- 108010024212 E-Selectin Proteins 0.000 description 71
- 102400001059 Dentin sialoprotein Human genes 0.000 description 63
- 235000018102 proteins Nutrition 0.000 description 40
- 102400001368 Epidermal growth factor Human genes 0.000 description 27
- 101800003838 Epidermal growth factor Proteins 0.000 description 27
- 229940116977 epidermal growth factor Drugs 0.000 description 27
- 210000002381 plasma Anatomy 0.000 description 27
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 27
- 206010028980 Neoplasm Diseases 0.000 description 20
- 230000008859 change Effects 0.000 description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 14
- 201000010099 disease Diseases 0.000 description 13
- 201000011510 cancer Diseases 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 11
- 210000000265 leukocyte Anatomy 0.000 description 11
- 239000000975 dye Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000011002 quantification Methods 0.000 description 10
- 108091093105 Nuclear DNA Proteins 0.000 description 8
- 230000003321 amplification Effects 0.000 description 8
- 210000001156 gastric mucosa Anatomy 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 102100032007 Serum amyloid A-2 protein Human genes 0.000 description 7
- 101710083332 Serum amyloid A-2 protein Proteins 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 210000002966 serum Anatomy 0.000 description 7
- 239000012491 analyte Substances 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 210000002784 stomach Anatomy 0.000 description 6
- 206010054949 Metaplasia Diseases 0.000 description 5
- 208000037976 chronic inflammation Diseases 0.000 description 5
- 230000006020 chronic inflammation Effects 0.000 description 5
- 238000002575 gastroscopy Methods 0.000 description 5
- 101150115013 DSP1 gene Proteins 0.000 description 4
- 206010058314 Dysplasia Diseases 0.000 description 4
- 238000001574 biopsy Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000001356 surgical procedure Methods 0.000 description 4
- 208000036170 B-Cell Marginal Zone Lymphoma Diseases 0.000 description 3
- 206010061850 Extranodal marginal zone B-cell lymphoma (MALT type) Diseases 0.000 description 3
- 201000003791 MALT lymphoma Diseases 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 239000000091 biomarker candidate Substances 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000002405 diagnostic procedure Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 201000006585 gastric adenocarcinoma Diseases 0.000 description 3
- 238000003018 immunoassay Methods 0.000 description 3
- 230000000968 intestinal effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000001613 neoplastic effect Effects 0.000 description 3
- 230000036470 plasma concentration Effects 0.000 description 3
- 238000002731 protein assay Methods 0.000 description 3
- 230000005180 public health Effects 0.000 description 3
- 238000001959 radiotherapy Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 102000004506 Blood Proteins Human genes 0.000 description 2
- 108010017384 Blood Proteins Proteins 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- 101100476480 Mus musculus S100a8 gene Proteins 0.000 description 2
- 230000003187 abdominal effect Effects 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 208000007502 anemia Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004820 blood count Methods 0.000 description 2
- 238000009534 blood test Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001684 chronic effect Effects 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012326 endoscopic mucosal resection Methods 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 208000021302 gastroesophageal reflux disease Diseases 0.000 description 2
- 238000002695 general anesthesia Methods 0.000 description 2
- 230000000762 glandular Effects 0.000 description 2
- 208000024348 heart neoplasm Diseases 0.000 description 2
- 238000010562 histological examination Methods 0.000 description 2
- 230000006303 immediate early viral mRNA transcription Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 230000009826 neoplastic cell growth Effects 0.000 description 2
- 238000010837 poor prognosis Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102000001493 Cyclophilins Human genes 0.000 description 1
- 108010068682 Cyclophilins Proteins 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- 101100202849 Drosophila melanogaster sel gene Proteins 0.000 description 1
- 208000007882 Gastritis Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001106322 Homo sapiens Rho GTPase-activating protein 7 Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 102100021446 Rho GTPase-activating protein 7 Human genes 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 108010046334 Urease Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000011394 anticancer treatment Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000021028 berry Nutrition 0.000 description 1
- 239000000117 blood based biomarker Substances 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 230000005773 cancer-related death Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000030315 diffuse gastric adenocarcinoma Diseases 0.000 description 1
- 208000010643 digestive system disease Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000003563 lymphoid tissue Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 201000011591 microinvasive gastric cancer Diseases 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000001921 nucleic acid quantification Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 102000013415 peroxidase activity proteins Human genes 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 238000000575 proteomic method Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 239000000107 tumor biomarker Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57407—Specifically defined cancers
- G01N33/57446—Specifically defined cancers of stomach or intestine
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57484—Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/20—ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/50—Determining the risk of developing a disease
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Hematology (AREA)
- Pathology (AREA)
- Urology & Nephrology (AREA)
- Analytical Chemistry (AREA)
- Cell Biology (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Hospice & Palliative Care (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Oncology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Bioethics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验的体外方法,其包括筛选血液或血浆的生物样本,其中确定至少两种选自以下的生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL‑8、IL‑17、TNF‑α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA,条件是所选的生物标志物不由IL‑8和mtDNA水平的关联组成。该方法可用于评估人类患者患有非萎缩性胃炎(NAG)或萎缩性胃炎/肿瘤前期(AG/P)或胃癌(GC)的风险,或用于区分这些风险或这些病况的存在。在一个具体方面,该方法可以包括检测幽门螺杆菌(Helicobacter pylori)感染的步骤作为不同的、同时的或并行的步骤。本发明还涉及一种适于实施这种方法的试剂盒或标志物集合,以及其用于确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验,或用于预测或诊断胃癌前期病况或胃癌病况的用途。
Description
技术领域
本发明涉及体外检测方法领域,该体外检测方法基于优选地从个体、特别是人类采集的生物样本中获得的血浆生物标志物的研究,并且本发明特别涉及可应用于胃癌病况或胃癌前期病况的预测或诊断过程,或可应用于易患胃癌患者的监测的方法。胃癌病况或胃癌前期病况是指胃癌或可能逐渐发展成胃癌的病况,即,根据从无症状到有症状的不同阶段,可能在正式胃癌结局之前出现的病况。本发明是在寻求胃癌早期发现的背景下进行的。因此,本发明还涉及用于实施本发明方法的试剂盒、标志物集合及其用途。使用本文所述的生物标志物可以允许确定是否应该进行进一步的临床研究,或评估风险,或最终诊断风险或疾病,并且有利于治愈需要早期诊断以避免预后不良的疾病。
背景技术
序言
胃癌(GC)仍然是一个重要的公共卫生问题,全世界每年约有100万人死于胃癌。胃癌仍然是第三大癌症相关死亡原因,也是第四大确诊癌症(1)。尽管在过去的30年中,观察到了全球胃癌的发病率下降,但由于人口增长和老龄化,到2030年新发病例数将保持在最佳常数或增加。最近报告,低收入和高收入国家中50岁以下人群(主要是男性)的新发和异常胃癌病例均有所增加(2)。这些数据预示着胃癌的发病率将不断上升,突出了这种癌症仍然是全球范围内公共卫生的一个重要挑战。胃癌主要与预后不良相关,总体的5年生存率为15%,因此突出了早期发现的重要性。胃癌是一个多步骤过程的结果,从慢性炎症的发展开始,经过肿瘤前期(肠化生和异型增生)逐渐发展成癌病变(3)。导致90%胃癌病例的主要风险因素是幽门螺杆菌(Helicobacter pylori)感染,其影响世界一半的人口。
虽然胃癌在晚期诊断出来时预后较差,但如果在早期诊断出来,它可以是一种可治愈的疾病。尽管如此,胃癌在早期通常是无症状的或仅引起非特异性症状。等到出现严重症状时,癌症往往已经进入晚期,并且可能已经发生转移。因此,仍然需要对早期胃癌生物标志物进行表征和验证,以降低与胃腺癌相关的发病率和死亡率。
重要的是,如果在早期(最好在肿瘤前期发展之前)检测到癌前病况,则可以预防胃癌(4)。已经提出了根除幽门螺杆菌(H.pylori)感染来预防胃癌。然而,由于风险降低的程度取决于肿瘤前期过程中根除的时间(5)这是不够的。目前,胃癌只能通过通常在全身麻醉下进行的胃内窥镜检查来诊断。重要的是,应该观察到,虽然这种涉及活检的技术在存在胃癌时可以做出准确的诊断,但用这种侵入性技术并不总是能够检测到肿瘤性病变,因为在肿瘤性病变的情况下,待化验的回收样本可能会从不存在病变的胃道区域提取。这种技术的侵入性也很强,需要全身麻醉。
此外,不幸的是,没有合适的筛查策略可用于大规模应用,以减轻胃癌诊断的全球负担。作为基于血液的生物标志物的非侵入性方法的开发对于诊断工具的有力贡献至关重要,不仅有助于处于胃癌风险的患者的早期发现和预防,还可以预测疾病复发/结局并监测抗癌治疗,从而提高胃癌患者的生存率。
本发明人使用了三种互补的方法,在来自处于胃癌级联的不同阶段的患者的血浆样本上鉴定了候选生物标志物:i)通过酶联免疫吸附测定(ELISA)对相关因素的血浆水平进行定量,相关因素根据其在宿主对幽门螺杆菌(H.pylori)感染、炎症和肿瘤形成的应答中的作用进行选择,ii)基于蛋白质组学分析仪ELISA的肿瘤途径相关因素(84种蛋白质)分析,以及iii)通过基于质谱(MS)的蛋白质组学对血浆蛋白进行大规模筛选。他们的数据提出了一个可以区分健康受试者和患者、特别是处于肿瘤前期和癌症阶段患者的候选生物标志物和特征的列表。这些生物标志物特征的表征为诊断测试的开发铺平了道路,该诊断测试通过简单的血液采样,不仅可以早期且容易地检测出出于胃癌风险的患者,还可以对其进行个性化的临床随访。
有趣的是,本发明人的发现可以确定生物标志物集合,当这些生物标志物一起使用时(在所谓的“特征”内),表现出强大而可靠的能力来预测不同阶段的胃癌前期病况或胃癌病况,或同时预测不同阶段的胃癌前期病况和胃癌病况(即,表现出区分患者健康状况和/或疾病阶段的能力)。胃癌前期病况或胃癌病况可以通过阶段、特别是本文所定义的AG/P和/或GC阶段进行鉴定。这种工具对于监测患者、特别是无症状患者可能特别相关。
值得注意的是,本说明书可将“胃癌病况”称为涵盖“胃癌前期病况”,因为在一些情况下,本说明书定义的胃癌前期病况的存在可能先于胃癌病况(胃癌阶段)的出现,因为胃癌前期状况可能是癌变过程的一部分,如本文详述的。
因此,本发明依赖于本文所述的实验,并提出旨在解决上述问题中的任何一个或所有问题的新方法和工具,即,提供简单、可靠且有效的生物标志物,从而能够确定人类患者是否存在使所述患者处于胃癌病况风险(这是本文讨论的胃癌发生过程的最终阶段)的病变,即,换言之,使所述患者处于发展成胃癌病况的风险或处于患有胃癌病况的风险的病变,并且最终能够以相关的准确性早期发现胃癌病况,根据具体的实施方案,包括诊断患者中是否存在胃癌前期病况或胃癌病况。本发明特别旨在允许医生确定对患者进行与所寻求的病况相关的进一步医学或临床研究的相关性。本发明的一个突出优点是可以在取自患者的样本的血液或血浆上进行。
具体实施方式
本发明涉及一种确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验的体外方法,其包括筛选先前从易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的人类患者中提取的血液或血浆的生物样本,所述方法包括以下步骤:
a.确定选自以下的至少两种生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平,条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成,任选地,确定选自以下的至少两种生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平,条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成,
b.将步骤a中确定的水平与对照进行比较,和
c.如果步骤a和步骤b中确定和比较的至少两种生物标志物的水平偏离其对照的水平,则得出结论:人类患者具有使所述患者处于胃癌病况风险的病变,和/或表明需要进一步的医学检验,特别是临床研究。
例如,在一个具体实施方式中,当测定两种生物标志物时,如果所述两种生物标志物的水平分别偏离其对照的水平,则得出结论:人类患者具有使所述患者处于胃癌病况风险的病变。
根据另一个具体实施方式,当测定三种生物标志物时,如果所述三种生物标志物中的至少两种生物标志物的水平分别偏离其对照的水平,则得出结论:人类患者具有使所述患者处于胃癌病况风险的病变。
根据一个具体实施方式,本发明涉及一种确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验的体外方法,其包括筛选先前从易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的人类患者中提取的血液或血浆的生物样本,所述方法包括以下步骤:
a.确定选自以下的至少两种生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平,条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成,
b.将步骤a中确定的水平与对照进行比较,和
c.如果步骤a和步骤b中确定和比较的至少两种生物标志物的水平偏离其对照的水平,则得出结论:人类患者具有使所述患者处于胃癌病况风险的病变,和/或表明需要进一步的医学检验,特别是临床研究。
例如,在一个具体实施方式中,当测定两种生物标志物时,如果所述两种生物标志物的水平分别偏离其对照的水平,则得出结论:人类患者具有使所述患者处于胃癌病况风险的病变。
根据另一个具体实施方式,当测定三种生物标志物时,如果所述三种生物标志物中的至少两种生物标志物的水平分别偏离其对照的水平,则得出结论:人类患者具有使所述患者处于胃癌病况风险的病变。
在本文公开的方法中测定的生物标志物的数量可以是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38或39。
根据具体的实施方式,在本文公开的方法中测定的生物标志物的数量为2至6,特别是2(条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成)、3、4、5或6。
根据一个具体实施方式,本说明书中提及的生物标志物的列表是:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平,
条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成。
在表述“条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成”中,其旨在通过使用表述“不由...组成”说明当在本发明方法的背景下仅选择两种生物标志物用于水平确定(步骤a)时,这些标志物不能是IL-8和mtDNA水平的结合(即,不存在本文所述的至少一种另外的生物标志物)。尽管在本说明书的上下文中,此类标志物IL-8和mtDNA水平可以与本文所述的一种或多种另外的生物标志物进一步组合一起使用,但本文所述的方法不包括仅将IL-8和mtDNA水平这两种生物标志物一起使用。可替代地,该表述可以写作“条件是两种选定的生物标志物不由IL-8和mtDNA水平的关联组成”。
因此,根据本申请适用的另一种替代写法,该条件可以写作“条件是所选的生物标志物不由IL-8和mtDNA水平的严格关联组成”,其中“IL-8和mtDNA水平的严格关联”旨在表示当在本文定义的方法中使用或存在于本文定义的试剂盒或标志物(或生物标志物)集合中时,这些具体列举的生物标志物必然与选自以下列表中的至少一种另外的标志物(或生物标志物)相关联:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN。
SAA1(SAA2)在本文中是指SAA1生物标志物或SAA2生物标志物或两者。这些蛋白质属于同一家族,并且具有密切的序列同源性。因此,它们可以相互替代或同时存在。因此,除非与上下文无关,否则本说明书中的表述SAA1(SAA2)在任何情况下都可以用“SAA1”或“SAA2”或“SAA1或SAA2”或“SAA1和SAA2”代替。
值得注意的是,术语“标志物”和“生物标志物”在本文中可互换使用(同义词)。
根据一个具体实施方式,如果所使用的生物标志物可以得出这样的结论,如本文在任何公开的方面(特别是关于所公开的决策阈值)中进一步描述的,本发明的体外方法反过来能够确定人类患者是否处于健康状态,即,在本上下文中,人类患者是否不具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验。这种方法包括与上述相同的步骤,其中在步骤c中,如果步骤a和步骤b中确定和比较的至少两种生物标志物的水平偏离其对照的水平,则得出结论:人类患者不具有使所述患者处于胃癌病况风险的病变,和/或不需要进一步的医学检验,特别是临床研究。
根据一个具体实施方式,本发明涉及一种确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验的体外方法,其包括筛选先前从易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的人类患者中提取的血液或血浆的生物样本,所述方法包括以下步骤:
a.确定选自以下的至少两种生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN,
b.将步骤a中确定的水平与对照进行比较,和
c.如果步骤a和步骤b中确定和比较的至少两种生物标志物的水平偏离其对照的水平,则得出结论:人类患者具有使所述患者处于胃癌病况风险的病变,和/或需要进一步的相关医学检验,特别是临床研究。
在一个更具体的实施方式中,该方法包括在步骤a中确定PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN中至少两种生物标志物的水平,其中所选的生物标志物中的一种被IL-8或mtDNA水平替代。
“使所述患者处于胃癌病况风险的病变”是指上文和本文定义的任何病变,其严重程度随作为本申请主题的胃癌癌变过程的阶段而逐渐增加。例如,病变可能早在胃癌前期阶段(相当于本文的“胃癌前期病况”)就出现。例如,非萎缩性胃炎(本文缩写为NAG)阶段的病变可以是与氧化物质的高产生相关的胃黏膜慢性炎症的那些病变。萎缩性胃炎(AG)阶段的病变可以是胃腺的丧失。肿瘤前期(P)阶段的病变可以包括获得肠细胞表型的胃上皮细胞的变化,或腺体的特定不规则结构。胃癌阶段的示例性病变将在本说明书的后面部分提供。
对于“使所述患者处于胃癌病况风险的病变”中的“处于胃癌病况风险”,其可替代地表述为“使所述患者处于发展成胃癌病况的风险或处于患有胃癌病况的风险的病变”,并且指满足步骤c中设定的条件的经化验的患者是:处于发展胃癌的风险或正处于胃癌癌变过程中的风险,后者包括严重程度不断增加的几个阶段(可以被诊断为胃癌前期病况),即使在任何阶段都可以看到病况的逆转。
根据具体实施方式,“至少两种生物标志物的水平与其各自对照的水平偏差”指相对于对照具有统计学显著性的偏差(对照可以是健康状态或另一种明确定义的状态的标准,只要按照用于确定变化的显著性、特别是统计学显著性的本领域的普遍做法,该变化被认为是显著的),如本文进一步详述的。事实上,如在本申请中所公开的,本发明人可以确定本发明的生物标志物的变化与病变的存在相关,该病变使经受检测的患者处于胃癌病况的风险和/或需要进一步的相关医学检验。因此,在一个具体方面,本发明寻求首先评估是否应该针对经化验的患者寻求与存在正在进行的胃癌癌变过程的风险相关的后续研究。
根据具体实施方式,可以指示的进一步的医学检验对应于进一步的临床研究,临床研究被定义为研究人员直接与门诊或住院的患者互动的临床研究。该定义可能包括进行进一步的体外检测,例如进行各种血液检测,例如用于检查贫血的全血细胞计数(CBC),但也超出了通过第三方获得人源材料以及研究人员与患者没有直接互动的研究。因此,“进一步的临床研究”的非限制性实例包括旨在证实或排除胃癌癌变过程存在的其他研究方法,例如光学胃镜检查、腹部计算机断层(或CT)扫描、组织学检查活检,后者可以精确诊断病变类型、癌症(如有)和/或致变过程中达到的阶段。
如果怀疑胃部病变,进一步的临床研究可能包括增加预定的光学胃镜检查的次数和/或频率,否则进行这种检查的频率会降低。
“生物标志物水平相对于对照的水平的偏差”的确定可以通过任何适合这一目的的手段进行。特别地,为了确定“偏差”,可以评估步骤a中为一种特定生物标志物确定的水平是否相对于在对照个体中测量的或作为对照值(例如从对照个体的汇总值获得的参考值)提供的参考值(即,临界值(cut-off value))有所增加或减少。这种确定的具体实例在本文的表2中示出。根据另一个实施方式,根据变化的方向和/或变化的绝对值,例如,以比率或倍数表示,并且如需要,通过与所考虑的分析病况(胃癌病况或胃癌前期病况)的已知变化方向进行比较,例如,如本文表7中所示,根据上文步骤c中设置的决策规则,可以得出关于患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验的结论。事实上,如本文所示,例如非靶向质谱实验的实验(其呈现是相对值的测量值)仍然可以提供统计学显著的信息,该信息是生物标志物水平(可以表示为比率)在疾病阶段之间相对的变化。相反,也可以使用定量(靶向)质谱测量进行测量,其提供可以相互比较的绝对值,而不是比较相对值之间的变化,如使用非靶向质谱实验所必需的,其实例在本文的实验部分中示出。只要本文定义的待测定的参数相对于绝对参考值的偏差被确定,或者使用不同疾病阶段或健康状态之间的汇总值的变化间的比较来确定,就可以实施本发明。此类变化可以表示为比率。本文的实验部分中提供了实例。
根据一个具体实施方式,上文定义的步骤a由确定至少三种生物标志物的水平组成,包括IL-8蛋白和mtDNA水平这两种生物标志物与选自以下的一种或多种生物标志物进一步组合:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE和MSLN,任选地,确定至少三种生物标志物的水平,包括IL-8蛋白和mtDNA水平这两种生物标志物与选自以下的一种或多种生物标志物进一步组合:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN。
根据具体的实施方式,步骤a可以包括确定:
-与选自以下的一种或多种生物标志物进一步组合的PGK1的水平:CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的CFP的水平:PGK1、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的IGFALS的水平:PGK1、CFP、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的KRT19的水平:PGK1、CFP、IGFALS、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的SPRR1A的水平:PGK1、CFP、IGFALS、KRT19、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的CPA4的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的CA2的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的SERPINA5的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的MAN2A1的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的KIF20B的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的SPEN的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的JUP的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的KRT6C的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的CDSN的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的KPRP的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的F13A1的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的SAA1(SAA2)的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平。值得注意的是,在本段上下文中,SAA1(SAA2)是指“SAA1”或“SAA2”——但在这种情况下,可以添加列表中缺失的另一种生物标志物,即分别为SAA1或SAA2,或者在本段的上下文中,SAA1(SAA2)可以是指“SAA1和SAA2”;
-与选自以下的一种或多种生物标志物进一步组合的LBP的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的DSP的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的KRT2的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的KRT14的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的ARG1的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的S100A12的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的ATAD3B的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的MAN1A1的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的HAL的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的DCD的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的C7的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的HP的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的LEP的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的IL-8的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE和MSLN;
-与选自以下的一种或多种生物标志物进一步组合的IL-17的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的TNF-α的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、USF1、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的USF1的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF2、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的USF2的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、SELE、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的SELE的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、MSLN和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的MSLN的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE和mtDNA水平;
-与选自以下的一种或多种生物标志物进一步组合的mtDNA的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE和MSLN;
-与选自以下的一种或多种生物标志物进一步组合的IL-8的水平和mtDNA水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、MSLN和SELE。
根据具体的实施方式,将生物标志物EGFR和STAT3添加到以上列出的一种或多种生物标志物中,条件是当一起确定IL-8的水平和mtDNA水平时,至少一种另外的生物标志物的水平也得到确定。
根据一个具体实施方式,“一种或多种”是指总共3、4、5或6种生物标志物,即,“多种”是指2、3、4、5或6种。
在一个具体方面,本发明不包括其中所选的生物标志物由IL-8和mtDNA水平的严格关联组成的实施方式。
根据具体的实施方式,所测定的生物标志物如表4、表5、表6、表7、表8、表9、表10、表11或表12和/或图9、图11、图13或图15中任一个所示的组合中所示。
根据具体的实施方式,所测定的生物标志物包括所选的生物标志物S100A12、KIF20B、ARG1、DSP1或HAL中的至少一种。S100A12已显示出与胃癌风险评估相关,并且KIF20B、ARG1、DSP1和HAL已显示出与AG/P期评估相关。当被选择时,这些标志物中的一种或多种可以与本文所述的生物标志物的任何组合相关联。
根据一个具体实施方式,本发明的方法的步骤a由确定至少两种选自以下的生物标志物的水平组成:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平,任选地,具有选自以下的至少一种另外的生物标志物:EGFR和STAT3。在具体的实施方式中,本发明的方法的步骤a由确定至少三种生物标志物的水平组成,其中至少两种生物标志物选自:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平,任选地,其中第三生物标志物选自:EGFR和STAT3。
根据一个具体实施方式,本发明的方法的步骤a由确定至少三种生物标志物的水平组成,包括选自以下的两种生物标志物:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平,以及至少一种选自以下的另外的生物标志物:EGFR和STAT3。
根据一个具体实施方式,本发明的方法的步骤a由确定至少三种选自以下的生物标志物的水平组成,PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平。
根据一个具体实施方式,本发明的方法的步骤a由确定至少两种、优选两种至六种选自以下的生物标志物的水平组成:IGFALS、KRT19、CPA4、CA2、MAN2A1、KIF20B、JUP、F13A1、LBP、KRT14、ARG1、S100A12、ATAD3B、DCD、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR和STAT3。
根据一个具体实施方式,本发明的方法的步骤a由确定至少两种、优选两种至六种选自以下的生物标志物的水平组成:IGFALS、KRT19、CA2、MAN2A1、KIF20B、JUP、LBP、ARG1、S100A12、ATAD3B、DCD、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR和STAT3,例如图13和表12所示的(通过ELISA实验确定的生物标志物)。
根据一个具体实施方式,本发明的方法的步骤a由确定至少两种、优选两种至六种选自以下的生物标志物的水平组成:IGFALS、KRT19、CA2、MAN2A1、JUP、ARG1、S100A12、HP、LEP、IL-17、TNF-α、USF2、SELE、MSLN和EGFR。
根据一个具体实施方式,使用不同疾病阶段/健康状态之间的汇总值的变化之间的对比来确定至少两种生物标志物的水平与各自相应标准的水平的偏差:例如,表7示出了不同疾病阶段/健康状况之间蛋白水平的变化,以比率表示(其可以转换为倍数变化,见本说明书)。可以看出,对于DCD蛋白,已经观察到健康患者池和肿瘤前期患者池之间的平均log2比率变化为0.76,已经发现这与2.54E-02的p值相关。这意味着,这种比率变化(变化的方向和大致量级(magnitude))被认为是显著的,以得出结论:相对于健康患者,存在DCD蛋白水平的偏差。类似地,可以看出,对于LEP蛋白,已经观察到健康患者池和肿瘤前期患者池之间的平均log2比率变化为-0.64,已经发现这与5.91E-02的p值相关。这意味着,这种比率变化(变化的方向和大致量级)被认为是显著的,以得出结论:相对于健康患者,存在LEP蛋白水平的偏差。在测定了DCD和LEP二者的蛋白水平,并且这两个参数相对于作为参考值的健康患者池的平均值在上述变化的方向和大致量级内均显示出偏差的情况下,可以说所述两种生物标志物的水平分别偏离其对照的水平,因此可以得出结论:从所观察到的变化表明存在胃癌前期的风险的意义上说,采样的患者处于胃癌病况的风险。提供该实例是为了说明可以从表7中得出的教导:可以对所有所述的生物标志物和测定条件进行这样的推理。表8还提供了在特征中鉴定的生物标志物的血浆水平的值,以预测肿瘤前期和胃癌,作为本领域技术人员的示例性参考,其可以容易地与可以从针对检测的病况被确定为健康的个体的样本中收集的标准值进行比较。
根据适用于本说明书的任何部分的一个具体实施方式,并且根据医学统计学领域中的常规实践,当P值低于0.05时(P值<0.05),P值被认为定义了统计学显著的检测,在一些情况下,如果P值低于或等于0.05,则本领域技术人员可以理解。
根据具体的实施方式,每个测定的生物标志物可以包括在决策规则中,该决策规则可以针对测定的病况或多种病况中的一种病况与AUC值相关联,如果AUC值高于0.5,则表示显著的预测能力,并且如果AUC等于1,则表示达到完美预测。根据具体的实施方式,所测定的生物标志物提供了一种检测,该检测可以被确定为针对所测定的病况与至少0.5、优选至少0.6、或至少0.65、或至少0.7、或至少0.75、或至少0.8、或至少0.85、或至少0.9、或至少0.95、特别是1的AUC值相关联。计算AUC值的方法是本领域技术人员已知的,并且在本说明书中提供了全面的指导。对于几种标志物的组合,AUC值仍然可以首先使用多类别逻辑回归模型的估计(参见实验部分的示例性、非限制性方案),然后基于估计的多类别逻辑回归模型确定决策规则(参见本说明书)进行计算。此外,剩余偏差标准(residual deviationcriterion)可以使用能够确定模型在多大程度上适合所有疾病阶段的统计数据。参考实验部分的示例性指导。
根据一个具体实施方式,特别但不一定,在本文所述的体外方法具有可根据一个或多个临界值归因于检测的特异性和灵敏度参数的情况下,本文所述的体外方法可以说是用于预测或诊断胃癌病况或胃癌前期病况。本文提供了与特异性和灵敏度参数相关的可能决策结果的实例(例如,表2中总结的单一参数或双重测量的数据,或者表4或表5中所示的双重或三重测量的ELISA结果。特异性和灵敏度可能会根据用于决策的临界值而变化,并且可以使用ROC曲线以优化的方式定义)。
“易患胃癌病况或胃癌前期病况或者易患易发展成胃癌病况的病况的人类患者”可以包括呈现出发展成胃癌的风险因素的患者,例如由于身体线索、家族病史或向医生表明可能存在或可能将出现胃癌病因的主诉。其还包括患有胃食管反流、患有慢性胃痛的患者以及幽门螺杆菌(H.pylori)血清反应阳性的受试者或幽门螺杆菌(H.pylori)血清反应阴性的受试者,这些受试者已经被预先根除了幽门螺杆菌(H.pylori)感染。该定义还包括具有易发展成胃癌病况或已宣布的胃癌病况的个体,无论他们是否正在接受治疗,都应对其进行监测。适合实施本发明方法的具体患者组是患有与胃炎相关的慢性炎症的患者组,或患有胃食管反流、患有慢性胃痛的患者组以及幽门螺杆菌(H.pylori)血清反应阳性的受试者组。如上所述,“易患胃癌病况或易患易发展成胃癌病况的病况的患者”由于感染的成功根除,在采样和/或检测时反过来也可能是幽门螺杆菌(H.pylori)阴性的。上述定义还包括先前诊断为慢性萎缩性胃炎或其他需要临床随访的胃病变的患者。然而,该定义还包括在通常与胃癌相关的任何临床线索方面完全无症状的患者,因为本发明旨在基于血液或血浆生物标志物水平的确定,容易且未警告任何临床体征地早期发现胃癌,如分子病阶段。
“胃癌病况”是指根据医疗实践常规诊断出的胃癌。其包括贲门癌(胃上部)和非贲门癌(胃中部和远端)。“胃癌”可以包括:弥漫性胃腺癌、肠胃腺癌和MALT淋巴瘤。MALT淋巴瘤(或MALToma)是一种涉及胃黏膜相关淋巴组织(MALT)的淋巴瘤。MALT淋巴瘤经常(但并非在所有情况下)与幽门螺杆菌(H.pylori)存在而引起的慢性炎症有关,或与幽门螺杆菌(H.pylori)的存在有关。胃腺癌是一种起源于胃黏膜的腺上皮的恶性上皮性肿瘤。其占胃癌的很大比例,即90%以上的诊断出的胃癌是腺癌。胃腺癌有两种类型:肠型或弥漫型,其基于组织学的区别。使用已知的分类系统将不同的阶段与胃癌相关联,例如描述患者的癌症程度的恶性肿瘤分期系统的TNM分类。使用这种类型的分类,例如可以区分零、一、二、三或四期。在零期,胃癌仅限于胃黏膜的内层,如果发现得很早,可以通过手术治疗,无需化疗或放疗。在第一期和第二期,该疾病已经渗透到胃黏膜的更深层,可以通过手术治疗,有时联合化疗和/或放疗。在第三阶段,该疾病可能已经渗透到其他附近的组织和远处的淋巴结。在第四阶段,该疾病已经扩散到附近的组织和更远的淋巴结,或者已经转移到其他器官。除非另有说明或上下文另有规定,胃癌在本说明书中通常缩写为“GC”。
肠型GC,通常但不总是由幽门螺杆菌(H.pylori)感染引起,它通过一系列的前驱病变发展起来。因此“胃癌前期病况”是指范围从对应于与氧化物质的高产生相关的胃黏膜慢性炎症的非萎缩性胃炎(本文缩写为NAG)或萎缩性胃炎(AG)到肿瘤前期(P)的事件,如Correa和Piazulo,《消化系统疾病杂志(J.Dig.Dis)》2012,13:2-9中所述。萎缩性胃炎是癌前级联的第一个可识别步骤,对应于胃腺的丧失。肿瘤前期包括进入胃癌阶段之前的肠化生(IM)和异型增生。肠化生和异型增生被认为是肿瘤前期病变。肠化生对应于获得肠细胞表型的胃上皮细胞的变化。这是一种易患恶性肿瘤的病况。异型增生也被称为具有特定不规则腺体结构的非侵入性肿瘤(non-invasive neoplasia)。
由于如上所述,幽门螺杆菌(H.pylori)感染是胃癌的主要风险因素,因此“易发展成胃癌病况的病况”包括例如患者的幽门螺杆菌(H.pylori)感染。
根据一个具体的方面,本发明更精确地寻求根据本说明书的风险的评估,特别是人类患者不得不发展成胃癌病况的风险或人类患者不得不患有胃癌病况的风险,特别是寻求影响经检测个体的胃癌前期病况的预测或诊断,就在胃癌之前,即萎缩性胃炎(AG)到肿瘤前期(P)阶段或病况,本文也称为AG/P,通过参考研究该效果的患者队列。
因此,本发明还用于评估人类患者具有萎缩性胃炎/肿瘤前期(AG/P)的风险,特别涉及一种用于预测或诊断经检测的患者的萎缩性胃炎或肿瘤前期(AG/P)病况的方法。
在一个具体的实施方式中,当结果允许时,本发明用于预测或诊断经检测的患者的萎缩性胃炎/肿瘤前期期(AG/P)病况。
在一个具体的实施方式中,当结果允许时,本发明用于评估人类患者具有非萎缩性胃炎(non-atrophic gastritis,NAG)、或萎缩性胃炎/肿瘤前期(AG/P)、或胃癌(GC)的风险,特别地,本发明涉及一种用于区分经检测的患者存在非萎缩性胃炎(NAG)、萎缩性胃炎/肿瘤前期(AG/P)、胃癌(GC)或健康状态的方法,特别是一种用于预测或诊断这些病况中的一种或另一种、特别是同时预测或诊断这些病况的一种或另一种的方法。
本文所述的方法基于对患者的生物参数的检测或监测,和/或允许提供关于这种患者的健康状况的信息。当灵敏度/敏感性值可以与所进行的检测相关联时,本发明的方法可以被定义为能够诊断所寻求的病况。
因此,本文所述的研究方法能够至少根据非统计学定义确定风险,或者确定患者中胃癌前期病况发作的可能性或存在胃癌前期病况的风险,该患者的样本根据本文所述的方法进行分析。根据一个不同的实施方式,当收集的值与相关对照值的比较能够直接得出存在或不存在胃癌前期病况的结论时,如果相关,而无需进行附加的检测或临床研究,则所述确定相当于对患者的胃癌前期病况进行预测或诊断。根据本领域的普遍做法,与这样的决策相关联的灵敏度/敏感性值与所保留的阈值的选择一致,该阈值可以根据本领域的常识进行优化,特别是通过使用ROC曲线,这将在后文讨论。
根据一个具体实施方式,本发明的方法在取自患有胃癌病况或胃癌前期病况或者患有易发展成胃癌病况的病况的人类患者的血液样本上进行。
在一个具体实施方式中,本发明基于血浆生物标志物的测量。因此,生物样本可以是血液样本、血浆样本或血清样本。
当寻找蛋白质生物标志物时,本发明有利地基于先前获自人类受试者的生物血浆样本而进行。该样本可以从如上定义的易患胃癌病况或胃癌前期病况或者易患易发展成胃癌病况的病况的个体中分离(采集、取出)。该个体之前可能已经或可能未被诊断出患有胃癌或可能导致胃癌的病变(肿瘤前期病况或胃癌前期病况),并且任选地,该个体可能已经接受过治疗,例如手术和/或化疗和/或放疗。
血浆样本是血液样本的液体部分,其携带血液中所含的细胞和蛋白质。值得注意的是,血清是不含凝血因子的血浆。根据一个相关的具体实施方式,本发明还可以在作为血清样本的样本上进行。
虽然本发明侧重于在个体血浆中发现的蛋白水平的测量,但根据一个具体实施方式,也可以测量线粒体DNA(本文缩写为“mtDNA”)水平。这可以通过检测血液中(尽管不是在不含细胞的血浆样本中)发现的白细胞的mtDNA来方便地完成。然而,由于它是在循环血液中发现的,因此所考虑的mtDNA水平也可以说是一种“血浆”生物标志物。根据一个优选的实施方式,当测量mtDNA水平时,mtDNA的水平通过检测循环血液mtDNA来确定,特别是通过检测白细胞的mtDNA来确定。
根据一个具体实施方式,从经检测的个体取出的生物样本是血液样本。根据一个更具体的实施方式,预先处理这样的血液样本以分离白细胞,从中制备和纯化总DNA。然后可以对回收的白细胞总DNA的制备物进行mtDNA水平的测量,如果需要,同时测量在含有分离的白细胞的同一样本的血浆中发现的其他血浆生物标志物。
本发明更具体地至少基于如上文步骤a中限定的测量选自以下的至少两种生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质水平,任选地,具有在本说明书中公开的任何实施方式中所述的条件。
这些标志物是蛋白质,它们可以通过酶联免疫吸附测定(ELISA)测试方便地进行测量,或者可替代地,基于从待检测个体获得的样本通过质谱法进行测量。根据另一个实施方式,它们可以根据文献中技术人员可用的指导通过Luminex实验进行测量。
这些蛋白质中的一些已经通过基于质谱(MS)的蛋白质组学对血浆蛋白质进行大规模筛选而被确定为用于本发明目的的相关靶点。在具体的实施方式中,本文表6或图11中所示的蛋白质组合是至少两种感兴趣的血浆生物标志物、特别是三种感兴趣的血浆生物标志物的组合,与使用实验部分所示的方案确定的良好预测的AUC值相关,其用于区分在经检测的个体中存在NAG或AG/P或GC阶段或病况的风险。针对所谓的“ELISA”生物标志物(包括mtDNA水平)也提供了相同的信息,如图9所示。一些生物标志物已经通过ELISA得到证实,本文概述了有前景的生物标志物——参见表8至表12。
血浆中蛋白质的水平可以使用本领域公知的方法进行测量,例如作为非限制性示例,通过酶联免疫吸附测定(ELISA)(Engvall E和Perlman P,1971,《免疫化学》(Immunochemistry),8:871-874)。本文的实验部分提供了测量血浆中蛋白质的水平的方法实例(例如,可以通过来自Duo Set RD系统或MyBioSource公司的商业ELISA测定来评估不同的所选的候选生物标志物的血浆水平。白细胞介素-8(IL-8)(参考号DY208);白细胞介素-17(IL-17)(参考号DY317);肿瘤坏死因子-α(TNF-α)(参考号DY210);间皮素(Haptoglobin)(MSLN)(参考号DY3265);E-选择素(SELE)(参考号DY724);触珠蛋白(haptoglobin)(HP)(参考号DY8465);瘦素(Leptin)(LEP)(参考号DY398)和上游刺激因子(Upstream stimulating factor)1和2(USF1(参考号MBS9342772)和USF2(参考号MBS9321077);MyBioSource))。技术人员可以容易地确定和检索用于测量样本中所需蛋白质水平的适当ELISA试剂。
Luminex测定是一种微孔板形式的基于珠的单一或多重免疫测定系统。在多重形式中,Luminex测定可以同时检测单个样本中的许多靶点,例如多达500个靶点,同时能够捕获与珠偶联的靶点的试剂可以是不同类型的(在单个测定中),即包括抗体、配体和对所需靶点具有特异性的核酸的蛋白质。可以用于Luminex测定的珠可以具有不同的光谱地址(所谓的“颜色编码”),例如通过使用不同比例的两种荧光团内部标记珠。珠也可以是磁性的或非磁性的。在Luminex测定中,将待分析的样本添加到颜色编码的、磁性或非磁性珠的混合物中,该珠预涂覆或待涂覆分析物特异性捕获剂,例如抗体。例如,如果试剂是抗体,则在抗体与感兴趣的分析物结合后,添加对感兴趣的分析物具有特异性的生物素化的检测抗体并形成抗体-抗原夹心结构。可以添加藻红蛋白(PE)偶联的链霉亲和素来结合生物素化的检测抗体。然后在基于双激光流的检测仪器上读取珠,即,一种激光对珠进行分类并确定正在检测的分析物。第二种激光确定PE衍生信号的量级,该信号与结合的分析物的量成正比。磁珠也可以用于将磁珠保持在单层中,同时两种光谱上不同的光(例如由发光二极管(LED)发射的光)照亮磁珠。一种光鉴定正在检测的分析物,第二种光确定PE衍生信号的量级。Luminex允许进行高通量实验,并且在寻找多个靶点的浓度变化时功能强大,如上所述。用于进行Luminex实验的试剂盒可以包括捕获珠,该珠与所用的捕获剂(例如捕获抗体)偶联或可以偶联。珠可以是颜色编码的珠、和/或磁性或非磁性珠、和/或羧化的珠。试剂盒可以包括胺偶联试剂盒,用于在珠被羧化的情况下将捕获剂(例如抗体)附着到珠。试剂盒可以包括作为检测(二级)抗体的生物素化的抗体、和/或藻红蛋白(PE)缀合的链霉亲和素以揭示生物素化的抗体。此类测定可以根据制造商(例如伯乐(BioRad)、赛默飞世尔科技(ThermoFischer Scientific)、Luminex或R&D Systems等)提供的说明和指导以及本领域的常识(如文献中所述)进行。
对蛋白质生物标志物“测量水平”的方式可能取决于用于测量该蛋白质生物标志物的技术。当使用ELISA测试时,可以使用本领域的普遍做法以浓度(定量值)的形式方便地给出蛋白质生物标志物的水平。当使用质谱法时,可以方便地将所测定的血浆样本中蛋白质生物标志物的水平转换为任意值,无论是代表绝对值(靶向质谱实验)还是代表能够确定相对于用于比较的组的变化的相对值(非靶向质谱实验)。具体地,为获得基于实际物理测量的“任意值”,如本文实验部分所示,可以利用由存在于硝化纤维素膜上的捕获抗体组成的阵列进行的蛋白质组学分析,所述捕获抗体与混合有生物素化的检测抗体的混合物的血浆样本一起孵育,并通过链霉亲和素-辣根过氧化物酶揭示。因此,所获得的测定样本中蛋白质存在的值可以反映为强度值,该强度值可以进一步用于信息的统计处理。与包括健康个体在内的不同个体组获得的强度值进行比较是容易实现的,并且完全在本领域技术人员的范围内。根据另一个实施方式,对蛋白质生物标志物“测量水平”可以利用定量聚合酶链式反应(q-PCR),例如通过TaqMan蛋白质测定,例如基于相同的技术,能够测量来自同时从患者中回收的血浆和白细胞的蛋白水平和mtDNA水平。TaqMan蛋白质测定通常允许使用实时PCR和抗体对样品蛋白质进行定量。
根据本发明的方法,一旦根据步骤a测量了至少两种生物标志物的水平,并且为了能够根据本说明书评估风险,特别是能够预测或诊断胃癌病况或胃癌前期病况,在步骤a中确定的获得的水平,如前所述,与对照进行“比较”。“对照”的同义词可以是所谓的“标准”值,通常是针对同一测定获得的,但针对已知在所研究病况下是健康的或具有特定测定的病况的个体或个体池(参见表7)。然而,值得注意的是,如果需要,通过考虑相关研究病况的本领域文献,技术人员可以容易地确定这种对照值,并且还可以根据精确研究的队列、患者来调整这种“对照”值,并针对其目的对其进行优化,特别是使用众所周知的ROC曲线技术。实验部分在这方面提供了进一步的指导。在本发明方法的一个具体实施方式中,对照可以是内部对照,例如当通过在一段时间内的多个点测试生物样本来监测患者的健康时。
根据一个具体实施方式,“对照”值还可以被定义为能够做出决策的“阈值”,即,被视为“正常”的值。这种阈值通常是针对被确定为健康的受试者而确定的。表2提供了实例。为健康受试者确定的正常阈值可以是在文献中找到的值,即已知代表健康状况的值,或者通过测定来自健康受试者的一个生物样本或可替代地通过测定来自几个不同受试者的生物样本而发现的值,然后将所得的正常阈值确定为所有测定的健康受试者生物样本或通过测定来自几个不同的健康受试者的生物样本池而发现的水平值的数学平均值。“健康受试者”是指没有胃部病况症状的受试者或被转诊进行胃镜检查且胃活检对应于正常表型的患者。根据一个具体实施方式,“对照”值是在健康个体(或其组,见上文)中发现的值,该健康个体已经通过本发明领域的技术人员为此目的普遍承认的标准被确定为是健康的。包含在此类定义中,对照组为幽门螺杆菌(H.pylori)血清学阴性的健康志愿者和/或未怀疑患有本发明所涉及的疾病或病况的无症状个体。相反地,并且根据另一个实施方式,用于定义值的对照组由在医学领域中根据最高已知标准被认为是健康的个体组成。
阈值的实例可以在本文的实验部分中找到,例如当IL-8、IL-17和TNF-α因子具有以ng/mL为单位的决策规则时,该决策规则具有对所做决策的灵敏度和特异性的特定值。还提供了USF1和USF2因子的实例,其中通过ROC曲线分析确定AUC值的附加定义,后者的确定是本领域技术人员已知的。图3和图4还提供了确定ROC曲线的实例。ROC曲线是真阳性率(TPR)与假阳性率(FPR)的函数关系图,该图是基于决策规则通过对实验获得的数据进行处理而获得的,该决策规则例如是“如果生物标志物数量高于(或者,根据配置,低于,或者高于或等于,或者低于或等于)x临界值,则患者将被分类为H或NAG或AG/P或GC类别中的一个(酌情选择)”。这是由所进行的多种实验所允许的,并且容易地使得技术人员能够根据决策的需要确定适当的“对照”值、“正常”值、“临界”值、“阈”值。此外,AUC参数,即“Roc曲线下面积”参数是总结决策规则的总体诊断准确性的有效方法。它采用从0到1的值,其中值0表示完全不准确的决策规则,而值1反映完全精确的决策规则。如果该值低于0.5,则意味着决策规则并不比随机决策做得更好,因此是无用的。AUC可以使用技术人员已知的规则和文献中的规则进行计算(Delacour,H.等人,La Courbe ROC(接收者操作特征(receiveroperating characteristic)):临床生物学的原理和主要应用(principes etprincipales application en biologie clinique),《临床生物学年鉴》(Annales debiologie clinique),2005年;63(2):145-54)。
由此,技术人员可以在所有情况下使用TPR和FPR之间的折衷,在相关的情况下容易地确定“最佳临界值”,即在所要求保护的发明的上下文中的对照值。
值得注意的是,技术人员还可以设想定义一个“对照”值,或者简单地分析个体中测量的生物标志物水平的变化方向,如果需要,通过考虑测量值或实验值中相对于“正常”情况(或参考组的另一个“已知”条件)变化的“倍数”数量来参考一组值(参见表7),或者简单地考虑变化方向相对于已知变化是相同还是不同。“倍数”是指变化的表达,特别是数字,其描述一个给定量从正常值到测试值的变化程度,正常值特别是“正常阈值”和被测样本的测试值。例如,正常值30和测试值60对应于2的倍数变化,或者通俗地说,增加两倍。相反,60的正常值和30的测试值对应于0.5的倍数变化,或者通俗地说,减少0.5倍,也称为减少“负”两倍(用负数表示,数字前面有一个“负”号)。因此,倍数变化对应于测试值与正常值的比率。换言之,倍数变化由确定测试值与正常值的比率而产生。
表7示出了根据几种比较方案的测定样本之间的变化概况。当与健康样本进行比较时,该表中所示的关于分析参数的变化(以log2(变化比率)表示)可以用作与“对照值”参考相同的规则,该比率/变化包含与特殊值(peculiar value)与对照值的比较所提供的信息相同的信息。可以使用公式2X将Log2值转换为相应的倍数变化值。定义几个参数的组合可以允许在第一水平上(例如)区分健康患者和患病患者,并在其他水平上细化患病患者是否属于癌变级联中特定类别的患者。表7中所示的所有点对点变化都是本发明的一部分,并且可以参考它们表示的变化方向以及它们表达的倍数/比率的量级。它们可以提供参考图表,以确定患者是否属于癌变级联中的特定群体。
根据一个具体实施方式,本发明的方法用测定的生物标志物进行,所述生物标志物是:
-PGK1和CFP蛋白水平,或
-KIF20B和SPEN蛋白水平,或
-JUP和KRT6C蛋白水平,或
-JUP和CDSN蛋白水平,或
-JUP和KPRP蛋白水平,或
-F13A1和SAA1(SAA2)蛋白水平,或
-KRT19和LBP蛋白水平,或
-DSP和KPRP蛋白水平,或
-DSP和CDSN蛋白水平,或
-KRT2和CDSN蛋白水平。
这些生物标志物已经被证明具有优异的AUC值,彼此关联,用于根据本说明书评估风险,或者预测和诊断经检测的个体中是否存在AG/P病况,如本文表6所示。
根据另一个实施方式,根据图12的考虑,本发明的方法涉及测定的生物标志物,其至少包括KIF20B和SPEN蛋白水平,单独或与至少另一种选自以下的生物标志物进一步组合:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD和C7蛋白水平,特别地,其中所测定的生物标志物至少包括KIF20B和SPEN蛋白水平,其进一步与至少另一种选自以下的蛋白质生物标志物组合:KRT19、ARG1、DSP1和HAL蛋白水平。
事实上,在所附的实验结果中,KIF20B和SPEN的组合已经显示出对AG/P或GC良好的预测。
根据一个具体实施方式,本发明的方法用测定的生物标志物进行,所述生物标志物是:
-KIF20B、SPEN和KRT19蛋白水平,或
-KIF20B、SPEN和ARG1蛋白水平,或
-KIF20B、SPEN和DSP蛋白水平,或
-KIF20B、SPEN和HAL蛋白水平,或
-KIF20B、SPEN和C7蛋白水平,或
-KIF20B、SPEN和JUP蛋白水平,或
-KIF20B、SPEN和CPA4蛋白水平,或
-KIF20B、SPEN和SPRR1A蛋白水平,或
-KIF20B、SPEN和MAN2A1蛋白水平,或
-KIF20B、SPEN和KRT14蛋白水平。
这些生物标志物已经被证明具有优异的AUC值,与至少3种生物标志物的关联相关,用于根据本说明书评估风险,特别是预测和诊断经检测的个体中是否存在AG/P病况,如本文表6中所示。此外,作为进一步的优势,它们具有最佳的剩余偏差,可同时预测分别为NAG、AG/P和GC病况的所有病理,如图11B所示。
根据另一个实施方式,根据图12的考虑,本发明涉及根据本文所述的任何实施方式的方法,其还包括确定至少一种选自以下的另一种生物标志物的水平:mtDNA水平、MSLN、HP、SELE和TNF-α蛋白水平。
这些标志物的确已经被证明与预测或诊断患者的AG/P病况相关。
对于mtDNA水平,可以通过检测循环血液mtDNA、特别是通过检测先前从患者身上获取的样本的白细胞的mtDNA来容易地确定。当mtDNA水平与另一种生物标志物蛋白水平一起测量时,两者都有利地基于从经检测的个体身上获取的独特样本进行测量,如果需要,根据是否进行DNA测量或蛋白水平测量进行不同的处理。
更准确地,关于mtDNA的确定,可以观察到“mtDNA的水平”可以:
-表示相对于标准或“正常”mtDNA水平的mtDNA的“定量”值,特别是旨在表示、特别是量化测定样本中mtDNA的量(例如mtDNA的拷贝数、特别是mtDNA的绝对拷贝数)的值,或
-表示测试的生物样本中mtDNA的相对量,特别是当确定的量相对于核DNA(nDNA)或同样存在于所述生物样本中的另一合适的参考的量进行标准化时,或者相对于与nDNA相关的标准化基因或DNA序列进行标准化时。
因此,在一个特定实施方式中,可以在不确定样本中mtDNA的“绝对”量的情况下确定mtDNA的水平,而是通过参考另一个参数评估该量来确定mtDNA的水平。
因此,为获得“mtDNA的水平”,可以使用能够从生物样本中进行核酸定量的技术。此类技术能够确定样本中存在的核酸(即本发明上下文中的mtDNA)的平均浓度(或量)。可以使用多种方法确定此类浓度(或量),包括(1)核酸的分光光度分析及其进一步定量,以及(2)使用与核酸结合并在结合时选择性发荧光的染料的荧光强度的测量进行定量,以及(3)特异性核酸扩增后的定量,例如在实时PCR技术中,其也依赖于与待检测和定量的所述核酸结合的荧光染料的检测。优选地,根据核酸分析领域的常识,可能需要预先分离待定量的mtDNA。
特别地,可以使用常规已知的方案,使用定量聚合酶链式反应(q-PCR)来确定mtDNA水平。可以使用对12sRNA线粒体基因具有特异性的引物,尽管本领域技术人员可以根据本领域文献中关于该技术的可用指导,适当地选择线粒体基因组的其他基因或序列来实施这种技术。PCR(聚合酶链式反应)是扩增DNA的常用方法。为扩增少量的DNA,需要DNA模板、至少一对特异性寡核苷酸引物、核苷酸(dATP、dCTP、dGTP、dUTP)、合适的缓冲溶液和热稳定的DNA聚合酶。通常将用荧光团标记的物质添加到热循环仪中该混合物的一种试剂中,该热循环仪包含用于在荧光团以所需波长激发后测量荧光团的荧光的传感器,从而允许测量一种或多种特定产物的生成率。实时PCR(q-PCR)通常用于检测和定量样本中的DNA,以确定这些样本中特定DNA序列的存在和/或丰度。在每个扩增循环后进行测量,从而能够实时定量扩增产物。
通过使用实时PCR仪器进行实时PCR,并且在每个循环之后,用检测器测量荧光水平。使用的染料通常仅在与通过PCR扩增的DNA结合时发荧光,并且在每个扩增循环中检测到荧光的增加,这对应于扩增产物的增加。
实时PCR可用于通过相对定量或绝对定量来定量核酸。绝对定量通过使用校准曲线与DNA标准品进行比较,给出目标DNA分子的确切数量。通过这种方法,可以确定怀疑存在胃癌前期或肿瘤的患者的mtDNA拷贝数,并将该数字与健康受试者中定义的mtDNA拷贝数进行比较。(参考文献:von Wurmb-Schwark等人,2002年,《法医学国际》(Forensic ScienceInternational),126:34-39;Fernandes等人,2014,《癌症流行病学、生物标志物与预防》(Cancer Epidemiol Biomarkers Re),,23:2430-38)。相对定量能够确定目标序列(其数量待测定)与“管家序列”之间的倍数差异。
为了定量代表mtDNA拷贝数的特异性DNA靶序列的存在,的确可以方便地表达其相对于另一种称为“标准化序列”或“管家序列”的DNA序列的相对水平,该DNA序列因其几乎恒定的表达率而被选择。管家序列通常存在于参与基本细胞存活相关功能的基因中,这通常意味着组成型基因表达。这使得能够提供表示扩增的感兴趣序列的存在与扩增的所选标准化物的存在的比率。该方法允许获得评估扩增的感兴趣序列的相对存在的值,该方法实际上知道其在测试样本中的绝对数量。
常用的标准化序列是在编码以下蛋白质的基因中发现的序列。作为非限制性列表,可以使用微管蛋白、甘油醛-3-磷酸脱氢酶、白蛋白、亲环蛋白、核糖体RNA序列。
实时PCR允许通过测量荧光在扩增过程中的任何点对所需产物进行定量。使用循环数阈值(CT)(CT;检测到感兴趣序列的荧光的PCR循环;CT值越低,靶序列越丰富)表示测量结果。为在使用标准化序列时定量靶序列的存在,可以使用标准化程序例如ΔΔCT方法,所述ΔΔCT方法用于分析相对基因表达。
根据一个更具体的实施方式,“mtDNA的水平”可以通过参考所选的标准化物基因或nDNA序列通过定量聚合酶链式反应(q-PCR)进行确定,mtDNA的水平根据公式2ΔCt计算,其中ΔCt=CtnDNA-CtmtDNA,如参考出版物Fan等人,2009年,《癌症研究与临床肿瘤学杂志》(J Cancer Res Clin Oncol),135;983-989和/或Chatre和Richetti,2013,《细胞科学杂志(J of Cell Science)》,126:914-926中所述。通过该计算方法,可以使用mtDNA和nDNA的平均CT的ΔCT(ΔCT=CtnDNA-CtmtDNA)作为2ΔCt来计算mtDNA的水平。用于扩增的引物可以由本领域技术人员根据该技术领域的常识进行选择,如特别在上述参考出版物中指出的。
用于确定mtDNA水平的方案实例可以包括以下步骤:
-制备生物样本以提供获取核酸、特别是细胞的线粒体核酸的途径;
-将制备的样本与靶向mtDNA的寡核苷酸引物接触;
-执行扩增循环,
-同时运行标准化物nDNA的扩增,
-定量检测mtDNA和标准化物nDNA。
-通过参考所选的标准化物nDNA序列确定mtDNA的水平,mtDNA的水平根据公式2ΔCt计算,其中ΔCt=CtnDNA-CtmtDNA。
关于mtDNA测量(特别是来自白细胞的mtDNA测量)的进一步细节可在本文的实验部分中获得,并且综合要素也可以在WO 2015/049372中找到,其通过引用并入本文。
如本文实验部分所示,在实验条件下,mtDNA水平增加至6.3以上,可以预测AG/P患者,其灵敏度为66.6%,特异性为65%(AUC值为0.7089)。
如本文实验部分所示,TNF-α蛋白水平对于“不健康的”决策规则很有意义,升高的TNF-α的浓度对于评估测定样本是否来自不健康的患者非常重要,其具有非常高的灵敏度和特异性(AUC值为0.7954)。
如本文实验部分所示,MSLN蛋白水平对于两种决策规则很有意义,特别是MSLN的最高浓度对于鉴定AG/P患者(AUC值为0.7433)非常重要。
如本文实验部分所示,HP蛋白水平对于GC患者(AUC值为0.6622)的鉴定很有意义。
如本文实验部分所示,SELE蛋白水平对于“不健康的”决策规则很有意义,升高的SELE浓度对于评估所测定样本是否来自不健康患者非常重要,最佳AUC值为0.7565。
如本文实验部分所示,HP血浆蛋白水平是令人感兴趣的,因为在胃癌样本中可以发现HP血浆蛋白的浓度增加了1.7倍。
根据一个具体实施方式,本发明的方法用于根据本说明书评估风险,特别是预测或诊断经测试的患者的非萎缩性胃炎(NAG)病况。
根据一个具体实施方式,本发明的方法用于根据本说明书评估风险,特别是预测或诊断经测试的患者的萎缩性胃炎/肿瘤前期(AG/P)病况。根据该实施方式,本发明的方法用于评估人类患者患有萎缩性胃炎/肿瘤前期(AG/P)的风险,特别地,该方法用于预测或诊断经测试的患者的萎缩性胃炎/肿瘤前期(AG/P)病况。
根据一个更具体的实施方式,当寻求萎缩性胃炎/肿瘤前期(AG/P)的评估时,本发明方法的步骤a由确定选自以下的至少两种、优选两种至六种生物标志物的水平组成:IGFALS、KRT19、CA2、MAN2A1、KIF20B、JUP、LBP、S100A12、ATAD3B、DCD、HP、LEP、IL-8、IL-17、USF1、USF2、SELE、MSLN和EGFR,特别地,步骤a由确定IGFALS、KRT19、HP、LEP、MSLN和EGFR的水平组成。
所选的生物标志物可以是2、3、4、5或6种。
根据寻求评估萎缩性胃炎/肿瘤前期(AG/P)并且使用2至6种生物标志物的实施方式,在这些具体实施方式中,包括表10中公开的任何一种组合中所述的生物标志物的选择,该表列出了基于所获得的最佳AUC值选择的用于预测AG/P的2至6种生物标志物的最佳组合。对于AG/P,一旦根据所述的相应特征使用4种生物标志物,AUC为0.82,灵敏度为92%。
根据寻求评估萎缩性胃炎/肿瘤前期(AG/P)并且使用6种生物标志物的更具体的实施方式,在这些具体实施方式中,包括表9公开的任何一种组合中所述的生物标志物的选择,该表列出了用于预测AG/P的6种生物标志物的最佳组合:所有这些组合均对应于AUC≥0.8,灵敏度为90%至96%,特异性为71%至79%。
根据可以与本文所述的任何其他实施方式组合的具体实施方式,特别是寻求评估萎缩性胃炎/肿瘤前期(AG/P)的上述实施方式,本发明的用于评估人类患者具有萎缩性胃炎/肿瘤前期(AG/P)的风险的方法的灵敏度至少为80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,和/或特异性至少为80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,特别地,灵敏度和特异性各自至少为80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
根据一个具体实施方式,本发明的方法用于根据本说明评估风险,特别是预测或诊断经检测的患者的胃癌(GC)病况。
根据一个寻求评估胃癌(GC)病况的更具体的实施方式,本发明方法的步骤a由确定选自以下的至少两种、优选两种至六种生物标志物的水平组成:IGFALS、KRT19、CA2、MAN2A1、KIF20B、JUP、LBP、ARG1、S100A12、ATAD3B、DCD、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、MSLN、EGFR和STAT3,特别地,步骤a由确定ARG1、LEP、IL-17、TNF-α、SELE和MSLN的水平组成。
所选的生物标志物可以是2、3、4、5或6种。
根据寻求评估胃癌(GC)病况并且使用2至6种生物标志物的实施方式,在这些具体实施方式中,包括表10公开的任何一种组合中所述的生物标志物的选择,该表列出了基于所获得的最佳AUC值选择的用于预测GC(癌症病变)的2至6种生物标志物的最佳组合。对于GC,6种生物标志物可以提高灵敏度,而仅使用一种蛋白质(即IL-17)的特异性就已经很好(95%)。
根据寻求评估胃癌(GC)病况并且使用6种生物标志物的更具体的实施方式,在这些具体实施方式中,包括表11公开的任何一种组合中所述的生物标志物的选择,该表列出了用于预测GC的6种生物标志物的最佳组合:所有这些组合均对应于AUC≥0.9,灵敏度为87%至94%,特异性为71%至79%。
根据可以与本文所述的任何其他实施方式组合的具体实施方式,特别是寻求评估胃癌(GC)病况的上述实施方式,本发明的用于评估人类患者具有萎缩性胃炎/肿瘤前期(AG/P)的风险的方法的灵敏度至少为75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,和/或特异性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,特别地,灵敏度和特异性各自至少为90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
当寻求评估萎缩性胃炎/肿瘤前期(AG/P)或胃癌(GC)病况时,或者一般而言,灵敏度和特异性随生物标志物的选择而变化,并且可以通过本领域的常规实践容易地确定,本文提供了进一步的指导。计算AUC值的方法是本领域技术人员已知的,并且在本文中如上所述。类似地,特异性和灵敏度可能根据用于决策的临界值而变化,并且因此可以根据用于决策的所述临界值来选择,可以使用ROC曲线以优化的方式来定义,如在本文中上文所述并在本文的实验部分中进行的。因此,技术人员可以容易地调整所使用的生物标志物,以达到所需的合适的灵敏度和特异性水平。
根据其他实施方式,当寻求评估胃癌(GC)病况时,生物标志物是以下的生物标志物或选自以下的至少一种生物标志物:CA2、KIF20B、ARG1、DCD、LEP、IL-17、TNF-α和MSLN已被确定为有前景的(表3),因此可以包含在用于此目的的特征中。
根据其他实施方式,当寻求评估萎缩性胃炎/肿瘤前期(AG/P)时,生物标志物是以下的生物标志物或选自以下的至少一种生物标志物:IGFALS、KRT19、CA2、MAN2A1、LBP、LEP、SELE、MSLN和EGFR已被确定为有前景的(表3),因此可以包含在用于此目的的特征中。
根据一个具体实施方式,本发明的方法用于评估人类患者患有非萎缩性胃炎(NAG)或萎缩性胃炎/肿瘤前期(AG/P)或胃癌(GC)的风险。
根据一个具体实施方式,本发明的方法用于根据本说明书评估风险,特别是预测或诊断经检测的患者的非萎缩性胃炎(NAG)病况或萎缩性胃炎/肿瘤前期(AG/P)病况。
根据一个具体实施方式,本发明的方法用于根据本说明书评估风险,特别是预测或诊断经检测的患者的非萎缩性胃炎(NAG)病况或胃癌(GC)病况。
根据一个具体实施方式,本发明的方法用于根据本说明书评估风险,特别是预测或诊断经检测的患者的萎缩性胃炎/肿瘤前期(AG/P)病况或胃癌(GC)病况。
根据实施方式,当寻求评估萎缩性胃炎/肿瘤前期(AG/P)或胃癌(GC)病况时,生物标志物是以下的生物标志物或选自以下的至少一种生物标志物:CA2、LEP和MSLN已被确定对这两种病况都有前景(表3),因此可以包含在用于此目的的特征中,包括在区分这些病况的上下文中。
根据一个具体实施方式,本发明的方法用于根据本说明书评估风险,特别是预测或诊断经检测的患者的非萎缩性胃炎(NAG)病况或萎缩性胃炎/肿瘤前期(AG/P)病症或胃癌(GC)病况,即允许区分这些病况。这些不同临床情况之间的差异可以根据观察到的值相对于“正常”情况的变化,即变化的方向(增加或上升)和程度(倍数)来确定。
根据一个具体实施方式,并且根据图12的考虑,本发明的方法还包括确定至少一种选自以下的另一种蛋白质生物标志物的水平:LEP和S100A12蛋白水平,和/或IL-17蛋白水平,和/或LEP、S100A12和IL-17蛋白水平。
LEP和S100A12蛋白水平的确已显示出与预测或诊断患者的胃癌病况相关。因此,根据本文公开的所有可能的组合,添加到特征中的此类生物标志物可以作为对其样本被测定的个体是否可能具有胃癌的进一步检查。
相反,IL-17蛋白水平已显示出与检测健康的个体相关,因此排除胃癌病况或胃癌前期病况(参见表4)。因此,根据本文公开的所有可能的组合,添加到特征中的此类生物标志物可以作为对其样本被测定的个体是否健康的进一步检查。
此类测量可以有助于证实或否定利用根据本发明的生物标志物的特征获得的结果。
根据一个方面,还公开了一种方法,其包括一系列步骤:
i)执行本文公开的方法,其中所测定的生物标志物包括单独地或与本文所述的至少另一种生物标志物进一步组合的至少KIF20B和SPEN蛋白水平,特别地,其中所测定的生物标志物包括与选自以下的至少另一种(或多种)蛋白质生物标志物进一步组合的KIF20B和SPEN蛋白水平:KRT19、ARG1、DSP1和HAL蛋白水平和/或mtDNA、MSLN、HP、SEL和TNF-α蛋白水平;这些标志物与评估经检测的患者存在AG/P阶段(见图12)的风险相关,和
ii)执行本文公开的方法,其中所测定的生物标志物是IL-17,以证实或复核经检测的患者是否确实被认为是健康的(参见图12),和
iii)执行本文公开的方法,其中所测定的生物标志物至少包括LEP或S100A12蛋白水平;这些标志物与评估经检测的患者患胃癌的风险相关(见图12)。这种测量可用于证实或复核经检测的患者是否确实被认为具有胃癌的风险,
其中特别地,步骤ii)和iii)可以按顺序进行,或者其中仅进行那些步骤中的一个,或者其中仅进行步骤i)或ii)或iii)中的一个。
根据一个实施方式,本发明的方法用于根据本说明书评估风险,特别是预测或诊断经检测的患者的非萎缩性胃炎(NAG),或萎缩性胃炎/肿瘤前期(AG/P)胃癌病况,或胃癌(GC),特别是用于区分经检测的患者的非萎缩性胃炎(NAG)、萎缩性胃炎/肿瘤前期(AG/P)胃癌病况、胃癌(GC)或健康状况。
根据一个具体实施方式,本发明的方法用于监测或诊断易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的患者的健康状况,或者具有使所述患者处于胃癌病况风险的病变的人类患者的健康状况,其中,如果本文讨论的步骤b中的比较集合(与“对照”的比较)和/或权利要求1的步骤c中观察到的偏差显示出演变,则随着时间推移至少重复一次该方法,以得出关于经检测的患者的健康状态的结论,特别是用于监测或诊断被诊断患有胃癌(任选地,接受胃癌治疗)的患者的健康状态。
根据一个实施方式,根据需要重复该方法,即,只要需要监测可能正在接受或未接受其病况治疗的患者的健康状况的演变,便重复该方法。
本发明的方法用于根据本说明书评估风险,特别是预测或诊断胃癌病况或胃癌前期病况,即,用于在可能时进行诊断(在特定的特异性和灵敏度值内,其可以由本文所述的技术人员根据公知常识容易地确定),或用于在需要时结合其他线索预测/预示风险。事实上,根据检测结果,可能建议对个体进行进一步检查,以更好地评估临床情况。
因此,本发明的方法能够确定个体的生物学参数的状态,并且在可能的情况下,统计地确定其生物样本被检测的个体可能存在患胃癌病况或胃癌前期病况的风险。特别地,存在胃癌前期病况,尤其是AG/P病况,具有经检测的个体中存在胃癌发生的风险。因此,可能需要进行进一步的临床研究。根据一个特定实施方式,预测或诊断需要进行进一步的临床研究,如本文所述。
根据一个特定实施方式,得出可能需要或要求进行进一步临床研究的结论的事实,其对应于关于已从其身上取出经检测的生物样本的患者的健康状况的结论。
因此,“关于健康状况的结论”和/或“进行进一步的临床研究”还包括将所述患者纳入更密切的治疗监测程序中,即建议所述患者参与或直接被纳入包括随时间推移定期监测他/她的病况或健康状态的治疗随访,以及任选地,有关其健康状况的进一步临床研究。确切地说,任何关于经检测的个体易患胃部病变的确定也表明需要进行进一步的临床研究。为早期检测胃部癌变风险的存在,即在例如与AG/P病况(或者可替代地,AG/P阶段)相对应的阶段检测胃部病变的存在风险是相关的公共卫生目标,如本文详述。
“进一步临床研究”的非限制性实例包括旨在证实或排除胃部癌变过程存在的其他研究方法,例如光学胃镜检查、腹部计算机断层(或CT)扫描、用于组织学检查的活检、各种血液检测,例如检查贫血的全血细胞计数(CBC)。
如果怀疑胃部病变,“关于健康状况的结论”和/或“进行进一步的临床研究”可以包括增加预定的光学胃镜检查的次数和/或频率,否则进行这种检查的频率会降低。
如果怀疑胃部病变,并且可能在进一步的临床研究后,也可能在可能的情况下通过手术切除怀疑已进入胃部癌变过程的区域。在某些情况下,可以通过内窥镜检查进行切除术(胃肠内镜黏膜切除术(EMR)是一种从消化道内壁切除早期癌症和癌前病变的手术)。
图16描绘了基于分别通过SIG-AGP和SIG-GC特征(图15中所述)检测肿瘤前期和胃癌病变的诊断测试的可能使用程序/方案——参见本文图16的图例。可以看出,本发明的诊断测试可以在所提出程序的不同级别上使用,并且可以重复。因此,本发明的方法可以用于初始诊断方案和/或随访方案中,如该图所述。
在一个具体实施方式中,本发明的方法还包括检测幽门螺杆菌(Helicobacterpylori)感染的步骤,作为不同的、同时的或并行的步骤,特别是通过检测对幽门螺杆菌(Helicobacter pylori)感染特异性的抗原,或通过涉及DNA扩增和随后检测所述DNA的测定,或者检测从经检测的患者身上取出的生物样本中特异性幽门螺杆菌(H.pylori)IgA和IgG抗体的存在,或通过对经检测的患者进行的13C尿素呼气试验。
在这种情况下,幽门螺杆菌(H.pylori)的检测可以在相关的情况下,通过进行对幽门螺杆菌(H.pylori)感染特异性的抗原检测步骤,在从患者身上取出的生物样本的一部分(等分试样)上进行,特别是在血浆样本或血液样本的血清部分(只要相关)上进行。幽门螺杆菌(H.pylori)感染者具有易于检测到的特异性IgA和IgG抗体。此外,寻找CagA抗原的存在也可以证实幽门螺杆菌(H.pylori)的存在。另一种检测幽门螺杆菌(H.pylori)的方法是13C尿素呼气试验,一种广泛应用于人类医学的高灵敏度非侵入性试验(Graham等人,1987年,《柳叶刀》(Lancet),1:1174-1177)。该呼吸试验可以间接测量幽门螺杆菌(H.pylori)相关的脲酶活性。也可以通过表明存在幽门螺杆菌(H.pylori)抗原的免疫测定法,或者通过扩增幽门螺杆菌(H.pylori)DNA、特别是通过使用幽门螺杆菌(H.pylori)基因序列的特异性引物(本领域技术人员可在文献中获得)的聚合酶链式反应(PCR),以及检测扩增的DNA,在粪便中检测幽门螺杆菌(H.pylori)的存在。
当同时寻求mtDNA水平和幽门螺杆菌(H.pylori)检测时,从经检测的个体获得的生物样本可以是血液样本,其一方面可以被制备以纯化血液样本的细胞部分,特别是含有待测定mtDNA的单核细胞或白细胞,其另一方面可以被制备以采集能够检测幽门螺杆菌(H.pylori)感染的血清。
在一个具体实施方式中,经检测的生物样本,特别是血浆样本,获自被诊断患有胃癌并正在接受或未接受该病况治疗的患者,和/或患有正在发展的、接受治疗或未接受治疗的幽门螺杆菌(Helicobacter pylori)感染的患者,和/或具有通过或未通过先前或正在进行的治疗根除的幽门螺杆菌(Helicobacter pylori)感染病史的患者,和/或患有胃痛和/或具有胃癌家族史的个体。
如本说明书中详述的,并且根据可用于本文所述的所有实施方式的具体实施方式,血浆生物标志物的水平通过酶联免疫吸附测定(ELISA)检测、或质谱法、或定量聚合酶链式反应(q-PCR)、或Luminex测定进行确定,并且在进行时,通过定量聚合酶链式反应(q-PCR)确定mtDNA的水平。
本发明的另一个目的是,当考虑蛋白水平或抗原检测时,提供适于实施本文定义的方法的试剂盒,或用于实施本文定义的方法的试剂盒,所述试剂盒包含:
-至少两种具有不同抗原特异性的抗体,其中每种抗体对选自以下的蛋白质具有特异性:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白或几种具有不同抗原特异性的抗体的组合:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白,以及任选地,至少一种对幽门螺杆菌(H.pylori)抗原特异性的抗体,例如CagA抗原,以及任选地,一种或多种以下试剂,
-二级抗体,例如生物素化的抗体,或揭示上述特异性抗体与其靶点之间的复合物的试剂,
-任选地,缓冲溶液,
-任选地,珠例如颜色编码的珠,和/或磁性或非磁性的珠,和/或羧化的珠,任选地,具有用于将抗体附着至珠的胺偶联试剂盒,
-任选地,藻红蛋白(PE)缀合的链霉亲和素以揭示生物素化的抗体,
-任选地,酶标板,和
-任选地,提供使用说明和用于解释结果的预期值的通知。
本发明的另一个目的是,当考虑核酸检测时,提供适于实施本文定义的方法的试剂盒,或用于实施本文定义的方法的试剂盒,所述试剂盒包含:
-至少一对特异性寡核苷酸引物或核酸分子,其对与mtDNA杂交具有特异性和/或
-至少两对特异性寡核苷酸引物或核酸分子,其对与DNA区域杂交具有特异性,DNA区域分别编码PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白中的两种或更多种,以及任选地,至少一对特异性寡核苷酸引物或对与幽门螺杆菌(H.pylori)核酸序列杂交具有特异性的核酸分子,以及任选地,一种或多种以下试剂,
-核苷酸(例如dATP、dCTP、dGTP、dUTP),
-DNA聚合酶,特别是热稳定的DNA聚合酶,例如Taq DNA聚合酶,
-至少一种用于染色核酸的染料,特别是可在实时PCR仪器中检测到的染料,
-任选地,缓冲溶液,
-任选地,引物与其靶点杂交所必需的试剂,
-可选地,参比染料,和
-提供使用说明和用于解释结果的预期值的通知。
本发明的另一个目的是,当考虑蛋白水平、抗原和核酸检测的组合时,根据其所有可能的组合,适于实施本文定义的方法的试剂盒,或用于实施本文定义的方法的试剂盒,所述试剂盒包含:
-至少两种具有不同抗原特异性的抗体,其中每种抗体对选自以下的蛋白质具有特异性:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白,或对PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白具有不同抗原特异性的几种抗体的组合,以及任选地,至少一种对幽门螺杆菌(H.pylori)抗原特异性的抗体,例如CagA抗原,以及任选地,一种或多种以下试剂,
-二级抗体,例如生物素化的抗体,或揭示上述特异性抗体与其靶点之间的复合物的试剂,
-任选地,缓冲溶液,
-任选地,珠例如颜色编码的珠,和/或磁性或非磁性的珠,和/或羧化的珠,任选地,具有用于将抗体附着至珠的胺偶联试剂盒,
-任选地,藻红蛋白(PE)缀合的链霉亲和素以揭示生物素化的抗体,
-任选地,酶标板,和
-任选地,提供使用说明和用于解释结果的预期值的通知,和
-至少一对特异性寡核苷酸引物,其对与mtDNA杂交具有特异性,和/或
-至少两对特异性寡核苷酸引物,其对与DNA区域杂交具有特异性,DNA区域分别编码PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白中的两种或更多种,以及任选地,至少一对对与幽门螺杆菌(H.pylori)核酸序列杂交具有特异性的特异性寡核苷酸引物,以及任选地,一种或多种以下试剂,任选地,至少一对特异性寡核苷酸引物或对与幽门螺杆菌(H.pylori)核酸序列杂交具有特异性的核酸分子,以及任选地,一种或多种以下试剂,
-核苷酸(例如dATP、dCTP、dGTP、dUTP),
-DNA聚合酶,特别是热稳定的DNA聚合酶,例如Taq DNA聚合酶,
-至少一种用于染色核酸的染料,特别是可在实时PCT仪器中检测到的染料,
-任选地,至少一种缓冲溶液,
-任选地,引物与其靶点杂交所必需的试剂,
-任选地,参比染料(reference dye)。
本发明的另一个目的实际上是提供一种适于实施本文定义的本发明方法的试剂盒,其包含上述试剂盒中提及的一些试剂的组合或所有试剂,即试剂盒,其包括用于通过酶免疫测定(ELISA)检测蛋白质或进行所谓的TaqMan蛋白质测定(基于qPCR)的全部或部分试剂,和/或允许定量这些蛋白质的特异性抗体,还包括必要的阳性和阴性对照,以在相关的情况下进行测定,并且任选地,至少一种对幽门螺杆菌(H.pylori)抗原特异性的标志物,以及在必须测量核酸(用于mtDNA水平或幽门螺杆菌(H.pylori)DNA或RNA存在的确定)的情况下,允许从血液样本中分离白细胞和血浆的管和/或手段,以及从白细胞中分离DNA以及进行mtDNA检测和定量所需的试剂,包括对相关mtDNA和nDNA基因或相关幽门螺杆菌(H.pylori)基因或RNA具有特异性的引物对,还包括qPCR反应所需的Taq DNA聚合酶、脱氧核苷酸混合物、缓冲液和染料,或者根据另一个实施方式,用于进行Luminex测定的所有作用剂和/或试剂。
本发明的另一个目的是标志物集合(set),其包含至少两种对选自以下的蛋白质具有特异性的抗体或由其组成:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白,以及任选地,至少一对对与mtDNA杂交具有特异性的特异性寡核苷酸引物或核酸分子,或标志物集合,其包含至少两对对与DNA区域杂交具有特异性的特异性寡核苷酸引物或由其组成,所述DNA区域分别编码PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质中的两种或更多种,以及任选地,至少一对对与mtDNA杂交具有特异性的特异性寡核苷酸引物,适合于实施本文任何实施方式中定义的方法,或用于实施本文任何实施方式中定义的方法。
本发明还涉及根据本发明的试剂盒或本文定义的标志物集合的用途,用于确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步相关医学检验,或用于评估人类患者不得不发展成胃癌病况的风险或人类患者不得不患有胃癌病况的风险,特别是用于预测或诊断胃癌前期病况或胃癌病况,通过筛选先前从易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的人类患者身上取出的血液或血浆的生物样本,特别是通过测量从易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的人类患者身上取出的生物血液或血浆样本中至少两种本文任何实施方式中定义的标志物的水平。
在一个具体的实施方式中,本发明涉及本文定义的试剂盒或标志物集合用于预测或诊断胃癌病况或胃癌前期病况的用途,通过筛选先前从易患胃癌病况的病况或胃癌前期病况或易患易发展成胃癌病况的病况的人类患者身上取出的血液或血浆的生物样本,特别是通过测量从易患胃癌病况的病况或胃癌前期病况或易患易发展成胃癌病况的病况的人类患者身上取出的生物血液或血浆样本中本文任何实施方式中定义的至少两种标志物的水平。
根据本公开,根据本发明的试剂盒或本文定义的标志物集合的用途是研究本文详述的参数,和/或监测经检测的个体中的所述参数,作为任何进一步研究之前的中间生物学参数。
本发明还涉及本文公开的任何方面中所述的作用剂、成分或试剂的用途,特别是在描述适于实施本发明的试剂盒的情况下,用于制造适于或旨在实施本文所述的本发明方法的试剂盒。可以有利地提供用于实施本发明方法的使用说明或指导和/或为获得合适的试剂盒的使用说明或指导。
根据另一个方面,应当理解,本文任何实施方式中所述的本发明方法可以至少部分地由计算机实施。特别地,本文任何实施方式中所述的本发明方法的步骤b和c可以由计算机实施,与本文任何实施方式中所述的至少两种生物标志物的水平相对应的数据被提供给计算机作为输出。根据另一个具体实施方式,计算机还可以驱动在步骤a中待采集数据的体外收集,即,采集至少两种选自以下的生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平,条件是根据本文所述的生物标志物水平的任何实施方式,通过计算机和水平测量装置之间的适当接口手段,所选的生物标志物不由IL-8和mtDNA水平的关联组成。
符合计算机可以实现本文任何实施方式中所述的本发明方法的步骤b和步骤c的可能性,本发明还涉及一种由计算机执行的用于研究人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验的方法,该方法包括以下步骤:
a.接收选自以下的至少两种生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平,条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成,或接收其测定在本文所述的任何实施方式中定义的至少两种生物标志物的任何水平,特别是在通过用于测量此类水平的体外方法或适用于测量此类水平的装置来测量至少两种生物标志物的水平的情况下,和
b.通过将步骤a中确定的水平与对照进行比较来处理所述水平,和
c.通过预定的决策规则、特别是与所确定的与所研究的生物标志物相关联的灵敏度和/或特异性相关联的决策规则来确定(特别是如果在步骤b中比较的至少两种生物标志物的水平偏离其对照)步骤a中接收的水平是否会使测量其的人类患者(特别是通过用于测量步骤a中定义的水平的体外方法)具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验、特别是临床研究。
步骤c的确定可以根据本公开中公开的任何规则、根据已被选择用于实施的生物标志物来进行。例如,本文的表2提供了感兴趣的决策规则的示例性列表。决策规则也可以来自灵敏度和特异性值确定的临界值,该灵敏度和特异性值被确定对于待进行的检测是可接受的。根据与灵敏度、特异性和AUC值相关联的生物标志物列表的所有示例,可以依赖本说明书。技术人员可以基于本公开中所述的任何数据容易地实现由嵌入所讨论的步骤c的计算机执行的方法。应当理解,本文讨论的由计算机执行的方法可以在体外方法的上下文中本文所述的任何实施方式中实现,所述体外方法确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验,特别是如权利要求或本说明书的任何实施方式中所定义的。
本发明还涉及一种数据处理设备,其包括用于执行由上述计算机执行的方法的装置,特别是所述方法的步骤b和/或步骤c,或者包括适于(或被配置成)执行所述方法的处理器,特别是适于(或被配置成)执行所述方法的步骤b和/或步骤c的处理器。
根据一个具体实施方式,这种数据处理装置包括:
-输入接口,用于接收由上述计算机执行的方法的步骤a中定义的至少两种生物标志物(或本说明书中所述的生物标志物的任何组合)的水平。
-存储器,用于至少存储计算机程序的指令,所述指令包括当所述程序由计算机或处理器执行时,使计算机执行由上述计算机执行的方法的指令,任选地,用于存储控制数据和决策规则的存储器,
-处理器,其访问存储器以读取前述指令并执行由上述计算机执行的方法,
-输出接口,至少确定由上述计算机执行的方法的步骤a中定义的至少两种生物标志物(或本说明书中所述的生物标志物的任何组合)的水平是否使测量其的人类患者具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验,特别是临床研究。
本发明还涉及一种包括指令的计算机程序(或计算机产品),当该程序由计算机或处理器执行时,所述指令使计算机执行由上述计算机执行的方法。
本发明还涉及一种计算机可读介质,特别是一种计算机可读非瞬态记录介质,其上存储有上述计算机程序(或计算机产品),特别是用于在计算机程序(或计算机产品)由计算机或处理器执行时实施由上述计算机执行的方法。
本发明是一种非侵入性检测的基础,该检测特别地在先前从个体(可能是患者)获得的生物样本上进行的。非侵入性检测意味着本发明的方法特别是体外方法。所述方法的实施不需要医生在场。根据本发明,提出了几种生物标志物用于早期发现胃癌发生,特别是早期发现涉及胃癌发生过程或在胃癌发生过程基础上(例如,在AG/P阶段或本文所述的病况中)的胃病变的存在。本发明可能特别适用于预防目的,而且:1/用于检测正在接受或未接受胃癌治疗的个体的胃癌发生过程的进展,和/或2/监测从肿瘤前期病况到肿瘤病况的转变,和/或3/作为治愈后的随访,以筛查疾病的复发。为此,本发明的方法简单地依赖于对患者的生理参数的检测和/或监测。
本发明的方法可以用于接受治疗(例如化疗和/或放疗)的患者,作为治疗功效、疾病阶段和疾病发展的指标。
本文所用的术语“包含(comprising)”与“包括(including)”或“含有(containing)”同义,是开放式的,并且不排除附加的、未引用的元素、成分或方法步骤,而术语“由……组成(consisting of)”是封闭术语,其排除未明确引用的任何附加元素、步骤或成分。
术语“基本上由......组成(essentially consisting of)”是部分开放式术语,其不排除附加的、未引用的元素、步骤或成分,只要这些附加的元素、步骤或成分不会对申请的基本和新颖特性产生实质性影响。
因此,术语“包含(comprising)”(或“包含(comprise(s)”)包括术语“由...组成(consisting of)”(“由...组成(consist(s)of)”),以及术语“基本上由...组成(essentially consisting of)”(“基本上由...组成(essentially consist(s)of)”)。因此,在本申请中,术语“包含(comprising)”(或“包含(comprise(s)”)更具体地表示包括术语“由...组成(consisting of)”(“由...组成(consist(s)of)”),以及术语“基本上由...组成(essentially consisting of)”(“基本上由...组成(essentially consist(s)of)”)。
为了帮助本申请的读者,本说明书被分成不同的段落或部分。这些分隔不应被视为将一个段落或部分的实质内容与另一个段落或部分的实质内容分开。相反,本说明书包括了可以想到的各个部分、段落和句子的所有组合。
本文引用的所有参考文献的每一个相关公开内容均通过引用具体并入。
当阅读实施例和附图时,本发明的上述特征和其他特征将是显而易见的,这些实施例和附图说明了本发明人进行的实验,以补充本说明书中给出的特征和定义。以下实施例作为说明而提供。然而,这些实施例对于所述发明而言并非限制性的。
附图说明
图1.在队列的所有样本上测量的候选生物标志物的血浆水平,A)通过qPCR对从循环白细胞中分离的DNA测量的mtDNA;使用商业ELISA测定法测量的C)IL-8,E)TNF-α,G)IL-17,I)USF1和K)USF2,如方法部分所述。根据确定的临界值,不同患者组(H、NAG、AG/P、GC)中候选生物标志物血浆水平的分布:B)mtDNA,D)IL-8,F)TNF-α,H)IL-17,J)USF1,L)USF2。
图2.在队列的所有样本上测量的候选生物标志物的血浆水平,使用商业ELISA测定法测量的A)LEP,C)HP,E)SELE,G)MSLN,如方法部分所述。根据确定的临界值,不同患者组(H、NAG、AG/P、GC)中候选生物标志物血浆水平的分布:B)LEP,D)HP,F)SELE,H)MSLN。
图3.通过ROC曲线分析(真阳性率(TPR)与假阳性率(FPR)的函数关系)和AUC值确定的候选生物标志物的诊断准确性。使用决策规则“如果生物标志物数量高于(或者,根据配置,低于、或者高于或等于、或者低于或等于)x,则患者是H或NAG或AG/P或GC”获得ROC曲线,其中x是临界值。最佳临界值和AUC标准显示在每个图表的左上角。使用TPR和FPR之间的折衷确定最佳临界值(cut off value)。
图3的对应表格如下所示:
H | NAG | AG/P | GC | ||
MtDNA | AUC | 0.3618 | 0.4956 | 0.7089 | 0.5382 |
最佳临界值 | 6.55 | 4.76 | 6.24 | 4.6 | |
IL-8 | AUC | 0.2308 | 0.4771 | 0.4237 | 0.7744 |
最佳临界值 | 4 | 16.0493 | 35.3086 | 29.3827 | |
IL-17 | AUC | 0 | 0.7513 | 0.7189 | 0.6675 |
最佳临界值 | Inf | 78 | 89.1428 | 50.2 | |
TNF-α | AUC | 0.2045 | 0.6487 | 0.5776 | 0.6763 |
最佳临界值 | 191.6 | 112.11 | 101.03 | 85.64 | |
USF1 | AUC | 0.3706 | 0.4279 | 0.4338 | 0.6761 |
最佳临界值 | 119.23 | 171.5384 | 173.0769 | 96.15 | |
USF2 | AUC | 0.3704 | 0.5498 | 0.6089 | 0.5319 |
最佳临界值 | 55 | 15.96 | 36.1538 | 40.19 | |
SELE | AUC | 0.2434 | 0.5483 | 0.578 | 0.6341 |
最佳临界值 | 11.44 | 9.05 | 9.705 | 10.206 | |
MSLN | AUC | 0.287 | 0.5775 | 0.7433 | 0.5252 |
最佳临界值 | 13.42 | 8.4 | 10.83 | 9.95 | |
HP | AUC | 0.3771 | 0.4256 | 0.4687 | 0.6622 |
最佳临界值 | 0.91 | 1.05 | 1.05 | 1.23 | |
LEP | AUC | 0.566 | 0.6426 | 0.8865 | 0.1898 |
最佳临界值 | 4.2699 | 5.94 | 7.08 | 1.8479 |
图4.通过ROC曲线分析(真阳性率(TPR)与假阳性率(FPR)的函数关系)和AUC值确定的候选生物标志物的诊断准确性。使用决策规则“如果生物标志物数量低于(或者,根据配置,高于、或者高于或等于、或者低于或等于)x,则患者是H或NAG或AG/P或GC”获得ROC曲线,其中x是临界值。最佳临界值和AUC标准显示在每个图表的左上角。使用TPR和FPR之间的折衷确定最佳临界值。
图4的对应表格如下所示:
H | NAG | AG/P | GC | ||
MtDNA | AUC | 0.6381 | 0.5043 | 0.291 | 0.4617 |
最佳临界值 | 4.57 | 6.05 | 10.23 | 6.67 | |
IL-8 | AUC | 0.7691 | 0.5228 | 0.5762 | 0.2255 |
最佳临界值 | 17.7777 | 26 | 10.4 | 82.2222 | |
IL-17 | AUC | 1 | 0.2486 | 0.281 | 0.3324 |
最佳临界值 | 41.18 | 89.1428 | 64 | 78 | |
TNF-α | AUC | 0.7954 | 0.3512 | 0.4223 | 0.3236 |
最佳临界值 | 73.85 | 130.26 | 121.05 | 146.3 | |
USF1 | AUC | 0.6293 | 0.572 | 0.5661 | 0.3228 |
最佳临界值 | 96.15 | 82.3076 | 100 | 171.5384 | |
USF2 | AUC | 0.6295 | 0.4501 | 0.391 | 0.468 |
最佳临界值 | 14.42 | 38.0769 | 49.81 | 29.23 | |
SELE | AUC | 0.7565 | 0.4516 | 0.4219 | 0.3658 |
最佳临界值 | 7.1 | 10.51 | 10.323 | 9.64 | |
MSLN | AUC | 0.7129 | 0.4224 | 0.2586 | 0.4747 |
最佳临界值 | 8.33 | 11.01 | 20.21 | 8.7 | |
HP | AUC | 0.6228 | 0.5743 | 0.5312 | 0.3377 |
最佳临界值 | 1.08 | 1.1299 | 1.1 | 0.89 | |
LEP | AUC | 0.4339 | 0.3573 | 0.1134 | 0.801 |
最佳临界值 | 5.94 | 2.3514 | 18.04 | 4.1 |
图5.蛋白质组学分析仪阵列(字符串分析:https://string-db.org/)鉴定的候选生物标志物与其相关细胞功能之间的功能关联网络。已知交互:来自精选数据库实验确定(-------);预测交互:共表达(……),其他:文本挖掘
图6.相关矩阵、层次聚类以及PLS-DA和稀疏PLS-DA分析。A)成对相关矩阵表示使用在这些样本中测量的所有完整的强度值对计算的每对样本之间的皮尔逊(Pearson)相关系数。B)根据方法部分所示进行的层次聚类分析。C)偏最小二乘判别分析(PLS-DA)用于研究四个患者组(H、NAG、AG/P、GC)之间的蛋白质组学差异。PLS-DA图显示了健康患者和其他病理之间的良好区分。D)稀疏PLS-DA方法选择一组85种潜在生物标志物,可以清楚地区分H受试者和GC患者,但无法区分NAG和AG/P患者。
图7.显示MS鉴定的最相关的候选生物标志物与其平均强度水平的偏差的热图。对于大多数因素,主要观察到NAG和AG/P的共同特征,并且与其他组相比,GC具有独特的特征。本图包含彩色信息:彩色数据已在申请时提交给当局,可以信赖。
图8.通过ELISA测定法测量的候选生物标志物的分析和预测。A)健康(H)、非萎缩性胃炎(NAG)、肿瘤前期(AG/P)和胃癌(GC)各组患者的两个变量的所有组合的AUC值的重新划分。B)一种候选生物标志物出现在模型中的次数,给出2个变量的最佳AUC标准。
图9.模型的剩余偏差以测量其同时预测所有病理的能力。2种生物标志物的10种最佳组合,突出了IL-17和LEP组合预测H和患者的能力(上半部分)。3种生物标志物的10种最佳组合,示出了TNF-α、IL-17和LEP组合将H与患者(主要是GC)区分(上半部分)。
图9中所示的2种生物标志物和3种生物标志物的相应的10种最佳组合如下:
2种生物标志物的10种最佳组合(就剩余偏差而言)(上半部分)
1)IL-17和LEP:151.23
2)TNF-a和IL-17:154.25
3)IL-17和USF2:162.58
4)Sex和IL-17:176.26
5)IL-17和MSLN:190.51
6)MtDNA和IL-17:191.22
7)Hp状况和IL-17:191.22
8)IL-17和USF1:196.64
9)IL-8和IL-17:198.49
10)IL-17和HP:198.81
3种生物标志物的10种最佳组合(就剩余偏差而言)(下半部分)
1)TNF-a、IL-17和LEP:124.88
2)IL-17、USF2和LEP:135.12
3)MtDNA、IL-17和LEP:135.28
4)IL-17、HP和LEP:139.20
5)Sex、TNF-a和IL-17:140.53
6)TNF-a、IL-17和USF2:141.95
7)Sex、IL-17和USF2:142.34
8)IL-17、MSLN和LEP:142.98
9)TNF-a、IL-17和MSLN:143.40
10)MtDNA、TNF-a和IL-17:143.54
值得注意的是,本图和上图中提到的“性别(Sex)”和“Hp状况”是指在进行的实验过程中,根据本文提供的定义,还测试了患者的性别或Hp状况(即已知患者对幽门螺杆菌(Helicobacter pylori)感染呈阳性)是否会对每个疾病阶段的每次检测产生影响。
图10.模型估计的结果。A)非萎缩性胃炎(NAG)、肿瘤前期(AG/P)和胃癌(GC)组的2和3个变量的AUC标准的分布。B)候选生物标志物出现在模型中的次数,给出最佳AUC标准。
图11.模型的剩余偏差以测量其同时预测所有病理的能力。2种生物标志物的10种最佳组合,突出了KIF20B与ARG1或CPA4组合预测GC的能力(上半部分)。3种生物标志物的10种最佳组合,示出了对具有以下组合的所有组的完美分类:KRT19、KIF20B和SPEN(下半部分)。
图11中所示的2种生物标志物和3种生物标志物的相应的10种最佳组合如下:
2种生物标志物的10种最佳组合(就剩余偏差而言)(上半部分)
1)ARG1和KIF20B:21.86
2)KIF20B和CPA4:21.95
3)DSP和KIF20B:25.06
4)SPRR1A和S100A12:25.17
5)S100A12和CPA4:25.36
6)MAN1A1和SPRR1A:25.55
7)ARG1和S100A12:25.61
8)S100A12和MAN2A1:25.87
9)KRT19和S100A12:25.95
10)CFP和CDSN:26.04
3种生物标志物的10种最佳组合(就剩余偏差而言)(下半部分)
1)KRT19、KIF20B和SPEN:0.47
2)ARG1、KIF20B和SPEN:2.37
3)DSP、KIF20B和SPEN:2.38
4)HAL、KIF20B和SPEN:3.50
5)C7、KIF20B和SPEN:5.09
6)JUP、KIF20B和SPEN:5.79
7)KIF20B、SPEN和CPA4:6.01
8)SPRR1A、KIF20B和SPEN:6.24
9)MAN2A1、KIF20B和SPEN:6.68
10)KRT14、KIF20B和SPEN:8.49
图12.提供最完美预测的生物标志物特征以鉴定胃癌过程的不同阶段。如图所示,IL-17可以区分健康人类和患者。在患者中,KIF20B、SPEN与KRT19、ARG1、DSP1或Hal的组合可以很好地预测肿瘤前期(AG/P)。根据肿瘤前期预测观察到的相应AUC值,斜体字也是待考虑的候选。此外,LEP和S100A12与胃癌的良好预测相关。
图13.通过ELISA证实的候选生物标志物的血浆水平。代表首先通过MS、蛋白质组学分析仪鉴定并通过商业ELISA证实或通过ELISA直接测量的候选生物标志物的血浆水平的小提琴图。对队列的所有样本进行定量。使用曼-惠特尼(Mann-Whitney)检验的统计分析,显著性p<0.05。本图包括生物标志物EGFR和STAT3的ELISA结果。
图14.候选生物标志物之间存在的功能网络的字符串(STRING)图示。在已证实的22种蛋白质中,第14种和第2种在功能上联结。此外,一些蛋白质是物理复合物的一部分,例如:STAT3-EGFR-LEP-IL-8;MSLN-LBP和USF1-USF2。https://string-db.org。
图15.预测A.胃癌前期(SIG-AGP)和B.胃癌(IG-GC)的最佳生物标志物特征。AUC随着SIG-AGP和SIG-GC特征长度的增加而增加。其与SIG-GC的Sens和SIG-AGP的Spec的增加有关。
图16:使用基于分别通过SIG-AGP和SIG-GC特征检测肿瘤前期和胃癌病变的诊断测试的方案。可以提出三种不同的使用级别:1)筛查处于胃癌风险的患者;2)随访肿瘤前期的存在,以尽早检测胃癌的发展;3)胃癌患者手术后和化疗期间/之后的随访,以防止癌症复发。该图的图例如下:1.针对例如本文所述的SIG-AGP或SIG-GC特征或本文所述的标志物的任何其他组合测试从患者或患者组中提取的生物样本,例如血液或血浆样本,2.如果1的测试结果为阴性,则无需采取进一步行动,3.如果1的测试对AG/P风险呈阳性(SIG-AGP阳性),则进一步进行5,4.如果1的测试对GC风险呈阳性(SIG-GC阳性),则进一步进行5,5.进一步的临床研究,例如,对患者进行内窥镜检查,并从中提取化验样本,6.如果步骤5通过5的进一步临床研究得出结论,存在肿瘤前期或具有肿瘤前期风险,则进一步进行8作为患者随访程序,7.如果步骤5通过5的进一步临床研究得出结论,存在胃癌或具有胃癌风险,则进一步进行9,8.针对例如本文所述的SIG-AGP或SIG-GC特征或本文所述的标志物的任何其他组合新/进一步测试从随访的患者中提取的生物样本,例如血液或血浆样本。该新/进一步测试可以是从本图的步骤1开始的新一轮测试的开始,9.根据医生掌握的数据,对随访的患者进行进一步的医疗行为,如治疗和/或手术,10.针对例如本文所述的SIG-AGP或SIG-GC特征或本文所述的标志物的任何其他组合新/进一步测试从随访的患者中提取的生物样本,例如血液或血浆样本。该新/进一步测试构成了患者随访程序,并且可以是从本图的步骤1开始的新一轮测试的开始。
实施例
方法论
研究群体
所研究的队列如表1所示。该队列包括在巴斯德研究院(Institut Pasteur)临床研究和生物医学研究支持部门(ICAReB)招募的48名健康(H)无症状志愿者。使用商业酶联免疫吸附测定法(ELISA)(Serion ELISA Classic)证实了每个H样本的幽门螺杆菌(H.pylori)血清学阴性。该队列包括26名非萎缩性胃炎(NAG)患者、38名萎缩性胃炎/肿瘤前期(AG/P)患者和68名胃癌(GC)患者。NAG和AG/P患者是在D.Lamarque教授领导的肝胃肠病学服务机构(AP-HP,A.Paré医院,布洛涅-比扬古)中诊断出来的。GC患者是在J.Taieb教授领导的肝胃肠病学和消化肿瘤学服务机构(A-HP,HEGP,巴黎)中诊断出来的。所有患者均为成年人,未接受抗癌治疗,至少在前两周未接受抗生素、铋化合物、质子泵抑制剂和非甾体抗炎药治疗。诊断基于内窥镜检查和胃活检的组织病理学分析。所有患者均被告知并要求签署知情同意书。该研究得到了巴斯德研究院(Institut Pasteur)转化研究中心的批准(参考方案:2013-29)。
表1:研究群体的特征
临床样本采集和组织学分析
每名患者采集10ml血液并分离胃组织标本。在胃内窥镜检查期间采集胃窦和胃体的胃活检。将活检浸泡在福尔马林中,并进行苏木精-伊红(H&E)染色,用于组织学分析和胃部病变的诊断。通过吉姆萨(Giemsa)染色和血清学证实了幽门螺杆菌(H.pylori)的存在。来自ICAReB平台的健康志愿者的血液样本的幽门螺杆菌(H.pylori)阴性状态在被纳入队列之前通过血清学进行验证。
循环线粒体DNA(mtDNA)和定量
从每位患者身上采集外周血(10ml),并通过pancoll梯度在管上分离白细胞。使用Qiamp DNA试剂盒(Qiagen)从分离的白细胞中制备DNA,并在-80℃下冷冻直至进行mtDNA定量检测。同时,分离血浆部分并在-20℃下冷冻直至使用。使用12S核糖体RNA基因和核编码18S核糖体RNA基因作为内源参考,使用如前所述(6)的StepOneTM Plus实时PCR系统和FastStart Universal SYBR Green Master(Applied Biosystems),通过定量聚合酶链式反应(q-PCR)在从循环白细胞分离的DNA上测量MtDNA水平。使用nDNA和mtDNA的平均Ct的delta Ct(ΔCt)(ΔCt=CtnDNA-CtmtDNA)作为2ΔCt计算相对mtDNA水平,如已报告的(7)。
不同候选生物标志物的血浆水平的定量
使用Duo Set RD系统的商业ELISA测定法评估不同的所选候选生物标志物的血浆水平。白细胞介素-8(IL-8)(参考号DY208);白细胞介素-17(IL-17)(参考号DY317);肿瘤坏死因子-α(TNF-α)(参考号DY210);间皮素(MSLN)(参考号DY3265);E-选择素(SELE)(参考号DY724);触珠蛋白(HP)(参考号DY8465);瘦素(LEP)(参考号DY398)和上游刺激因子1和2(USF1(参考号MBS9342772)和USF2(参考号MBS9321077);My Bio Source))。
分别使用Human XL肿瘤学阵列(参考号ARY029;R&D systems)通过蛋白质组学分析仪分析来筛选与肿瘤学途径相关的因子的血浆水平。该阵列包括捕获硝酸纤维膜上存在的选定抗体,所述抗体与混合有生物素化的检测抗体的混合物的血浆样本一起孵育,并根据供应商建议通过链霉亲和素-辣根过氧化物酶揭示。对于每种途径,分析NAG、AG/P和GC以及健康(H)受试者的每组患者的2个样本代表。
通过基于质谱的蛋白质组学(MS)大规模筛选候选血浆生物标志物
血浆样本
在这项初步研究中,考虑了四组n=10的样本,包括H、NAG、AG/P和GC患者。每组的代表性血浆样本均从AP-HP医院的同一队列中选取,用于所有项目。
MARS Hu-14免疫耗竭(immunodepletion)
按照制造商的方案,使用MARS Hu-14(5188-6560–Agilent(安捷伦))耗竭血浆样本。简言之,用缓冲液A稀释300μg总蛋白质,并在0.22μm下过滤。将每个样本装入旋转柱,并以100g/1分钟/RT离心。孵育5分钟后,用2轮400μL缓冲液A以100g/2.5分钟/RT的离心洗脱未耗竭的蛋白质。将3份滤液合并,并进一步用TCA 40%(体积:体积)沉淀过夜。用丙酮洗涤样本2次,并在溶液酶解之前风干。
溶液消化
用100μL的8M尿素/100mM NH4HCO3变性缓冲液重悬耗竭的样本,并用5mM TCEP(646547-西格玛(Sigma),美国密苏里州圣路易斯)还原15分钟,然后用20mM碘乙酰胺(I114-Sigma,美国密苏里州圣路易斯)在黑暗中烷基化30分钟。将蛋白质用0.5μg rLys-C(V1671-普洛麦格(Promega),美国威斯康星州麦迪逊)消化3小时/37℃,然后稀释9次,随后用0.5μg测序级修饰胰蛋白酶(V5111-Promega,美国威斯康星州麦迪逊)过夜/37℃消化。用4%甲酸(FA)终止消化,并使用反相C18 Stage-Tips方法(8)对肽进行脱盐。将肽用80%乙腈(ACN)/0.1% FA洗脱。最后,将样本在真空离心机中干燥,并用2% ACN/0.1% FA重悬。对于所有样本,按照Biognosys的建议掺入iRT肽。
谱库的肽分级分离
由40个血浆样本组成的“池(pool)”样本专用于获得用于数据独立采集(DIA)方法的谱库。“池”样本已经用先前的方案耗竭和消化,并用聚苯乙烯二乙烯基苯反相磺酸盐(SDB-RPS)Stage-Tips方法进行肽分级分离,如(8)(9)中所述。简言之,将3个SDB-RPSEmpore圆盘堆叠在P200尖端上,并按如下方式进行7次连续洗脱:洗脱1(60mM甲酸铵(AmF)/20% ACN/0.5% FA)、洗脱2(80mM AmF/30% ACN/0.5% FA)、洗脱3(95mM AmF/40% ACN/0.5% FA)、洗脱4(110mM AmF/50% ACN/0.5% FA)、洗脱5(130mM AmF/60% ACN/0.5%FA)、洗脱6(150mM AmF/70% ACN/0.5%Fa)和洗脱7(80% ACN/5%氢氧化铵)。在注射之前,将所有级分干燥并用2%ACN/0.1% FA重悬。对于所有级分,按照Biognosys的建议掺入iRT肽。
质谱分析
-谱库的数据依赖采集(DDA):使用集成柱烘箱(PRSO-V1-Sonation GmbH,德国比伯拉赫)将纳米色谱系统(Proxeon EASY-nLC 1200-Thermo Fisher Scientific,美国马萨诸塞州沃尔瑟姆)在线耦合到Q ExactiveTM HF质谱仪(Thermo Fisher Scientific)。对于每个样本,在100%溶剂A(H2O,0.1% FA)中进行平衡步骤后,将1μg的肽注射到44cm自制C18柱(1.9μm颗粒,孔径,ReproSil Pur Basic C18-Dr.Maisch GmbH(迈可),德国阿默布赫市恩特林根)上。在132分钟内,以250nL/分钟的流速,用2%至7%溶剂B(80% ACN、0.1% FA)5分钟,7%至23%溶剂B 70分钟,23%至45%溶剂B 30分钟,45%至90%溶剂B 5分钟的多步梯度洗脱肽,柱温度设置为60℃。使用Xcalibur软件,使用依赖数据的前10方法,以60000的分辨率进行调查扫描(300-1700m/z),以15000的分辨率进行MS/MS扫描(固定的第一质量100m/z)来获取质谱。调查扫描和MS/MS扫描的AGC目标和最大注射时间分别设置为3.0E+06,100ms和1.0E+05,45ms。对于HCD碎裂,隔离窗口设置为1.6m/z,归一化碰撞能量固定为28。使用2.0E+03的最小AGC目标来实现4.4E+04的强度阈值。未分配的前体离子电荷态以及1、7、8和>8电荷态被拒绝,并且肽匹配被禁用。启用排除同位素,并且动态排除所选的离子45秒。
-血浆样本的数据独立采集(DIA):使用在线耦合到Q ExactiveTM HF质谱仪的相同纳米色谱系统,使用XCalibur软件以数据独立采集模式获取质谱。对于每个样本,在100%溶剂A(H2O,0.1% FA)中进行平衡步骤后,将1μg的肽注射到50cm自制C18柱(1.9μm颗粒,孔径,ReproSil Pur Basic C18-Dr.Maisch GmbH,德国阿默布赫市恩特林根)上。使用与谱库相同的多步梯度洗脱肽。每个循环构建如下:一次分辨率为60000的全MS扫描(扫描范围为349m/z至1214m/z),AGC设置为3.0E+06,最大注射时间设置为60ms。所有MS1之后是36个25m/z的隔离窗口,覆盖MS1范围。AGC目标为2.0E+05,具有自动最大注射时间,NCE设置为28。所有采集均以正模式和剖面模式完成。
蛋白质鉴定和定量的数据处理
-谱库的构建:使用MaxQuant软件1.5.0.30版(10)使用Andromeda搜索引擎(11)分析原始数据。根据人类SwissProt数据库(20203个条目,2018年12月4日)搜索MS/MS谱。设置可变修饰(甲硫氨酸氧化和N末端乙酰化)和固定修饰(半胱氨酸脲甲基化)用于搜索,并选择具有最多两个缺失裂解的胰蛋白酶进行搜索。最小肽长度设置为7个氨基酸,肽和蛋白质鉴定的错误发现率(FDR)设置为0.01。对于MS/MS匹配容差,主要搜索肽容差设置为4.5ppm和20ppm。第二种肽能够鉴定共裂解事件。
-DIA法的数据分析:使用Spectronaut X(v.13.2.190705.43655Biognosys AG)分析DIA实验。采用MS1和MS2水平的动态质量容差。XIC RT提取窗口设置为动态,校正系数为1。校准模式设置为自动,并启用非线性iRT校准和精确iRT。诱饵是使用变异方法和动态限制生成的。使用核密度估计器进行P值估计。在没有蛋白质型过滤器的情况下启用干扰校正。主要分组根据蛋白质组ID,次要分组根据剥离序列。主要组数量是平均肽数量。启用前N主要组,最少为1,最多为3。次要组数量是平均前体数量。启用前N次要组,最少为1,最多为3。数量MSLevel为MS2,数量类型为面积。Q值用于数据过滤。使用Q值稀疏的行选择和局部归一化策略启用了交叉运行归一化。默认标记类型为无标记,无分析策略,并且未启用统一肽峰。蛋白质推断工作流程设置为自动。
质谱蛋白质组学数据将经由PRIDE合作伙伴存储库(12)存入ProteomeXchange联盟。
统计分析
对于每组患者,首先使用曼-惠特尼(Mann-Whitney)检验对每种候选生物标志物的血浆水平进行统计分析。如果P<0.05,则认为结果具有显著性。
-假阳性率(FPR)、真阳性率(TPR)、ROC曲线和曲线下面积(AUC)的确定
对于潜在的生物标志物或生物标志物的组合,可以推导出一个决策规则来预测疾病的阶段(健康、胃炎、肿瘤前期或癌症)。因此,通过以下公式从该决策规则中推导出假阳性率(FPR)和真阳性率(TPR):
FPR=N/W
TPR=M/C
其中N=做出错误预测决策的患者数量(例如:被预测患有癌症的非癌症患者数量);W=实际未检查决策的患者数量(例如:非癌症患者数量);M=做出正确预测决策的患者数量(例如:被预测患有癌症的癌症患者数量);C=实际检查决策的患者数量(例如:癌症患者数量)。
当使用单个潜在的生物标志物时,可以使用该潜在生物标志物浓度的阈值来预测疾病的阶段。因此,针对阈值的每个值计算FPR和TPR(表2)。通过改变阈值的值,确定接收者操作特征(ROC)曲线,其中x轴为FPR,y轴为TPR(图3和图4)。ROC曲线下面积是AUC标准。如果AUC=0.5,则生物标志物无法比随机选择患者(无论选择的阈值如何)表现得更好,因此决策规则没有预测能力。因此,如果AUC>0.5,则决策规则优于随机选择(至少对于一个选择的阈值)。AUC越接近1,决策规则越好(理想决策规则的AUC=1)。同样,对于潜在生物标志物的组合,估计诊断模型来预测疾病的每个阶段,从而估计FPR和TPR,进而也得出AUC值(表4)。
有关ROC曲线的示例文献:Delacour,H.等人,La Courbe ROC(接收者操作特征(receiver operating characteristic)):临床生物学的原理和主要应用,《临床生物学年鉴》(principes et principales applications en biologie clinique,Annales debiologie clinique),2005年;63(2):145-54。
-多元数据分析和潜在生物标志物的选择
相关矩阵和层次聚类。已进行成对相关分析和层次聚类,以突出血浆样本之间的相似性。相关矩阵表示每对样本之间的皮尔逊(Pearson)相关系数,该系数是使用这些样本中测量的所有完整的强度值对计算得出的。层次聚类分析是使用Ward方法通过多尺度自举重采样(1000次自举重复)和得益于R package pvcluster的pvcluster函数的基于相关性的距离测量进行的,在强度的log2变换后,使用R package imp4p的impul.slsa函数对缺失值进行插补,并在条件内部使用样本中值居中法进行归一化。
偏最小二乘法判别分析(PLS-DA)和稀疏PLS-DA。PLS-DA用于研究四个患者组(H、NAG、AG/P、GC)之间的蛋白质组学差异。使用mixOmics R package来使用PLS-DA和稀疏PLS-DA。
-使用2种或3种潜在生物标志物组合的预测和诊断测试
为鉴定两种或三种潜在生物标志物的组合,从而可以根据测量的强度(质谱分析)或数量(ELISA数据)预测患者组,使用了以下用于k种生物标志物组合的多类别逻辑回归模型:
其中:
·k是模型中使用的生物标志物的数量。
·vi是对于生物标志物i测量的相对强度值。其对应于在胃炎、肿瘤前期或癌症样本中测量的浓度或强度除以在健康患者中测量的该蛋白质的浓度或强度值的平均值。
该模型的估计已使用剩余偏差标准进行了评估,该标准是一种拟合优度统计量,用于评估模型与观察到的疾病阶段的拟合程度(表4)。一旦估计了模型的参数ai、bi和ci,可以使用以下数学公式计算患者受到疾病每个阶段影响的概率:
其中
这四种概率中最高的概率决定了患者最可能的状况。将该预测状态与患者的实际状态进行比较,以确定疾病每个阶段的AUC标准(表4)。因此,所估计的模型可以用于诊断患者的疾病状态。
结果
-根据其在癌变过程中的已知作用选择的候选生物标志物
·MtDNA
在不同类型的肿瘤中都报告了mtDNA突变和mtDNA含量的变化。在先前对墨西哥患者队列进行的一项研究中,报告了胃癌患者的循环白细胞中的mtDNA水平较高(mtDNA>20),其临界值为8.23(OR:3.93),将GC样本与H样本区分开来(6)。这些数据与对摩洛哥患者队列进行的mtDNA定量相似(ACIP 10-2015-Collaboration F.Maachi,摩洛哥巴斯德研究院)。在本研究中,与H受试者相比,NAG、AG/P和GC癌症患者中平均mtDNA水平分别高出1.25(P=0.04)倍;1.8(P=0.0006)倍和1.3(P=0.003)倍(图1A)。根据mtDNA值对样本分布的分析表明,89%的AG/P样本中观察到mtDNA>5,而健康组中这一比例为32%。更准确地,mtDNA>6.3可以预测肿瘤前期(AG/P)患者,灵敏度为66.6%,特异性为65%(表2)。mtDNA数据的接收者操作特征(ROC)曲线报告AG/P样本的曲线下面积(AUC)值为0.7089(图3)。
·炎症因子、IL-8、IL-17和TNF-α
胃癌是一种炎症驱动的疾病。尽管炎症介质如IL-8、IL-17和TNF-α水平的变化对于胃癌前期/肿瘤(AG/P)存在不是特异的,但它们的变化可以帮助鉴定胃部恶性过程开始或正在进行的患者。在先前对墨西哥队列的研究中,IL-8的高血浆水平与mtDNA的测量相结合可以改进胃癌患者的检测(6)。如方法论部分所示,通过商业ELISA测定法对当前AP-HP队列的所有样本评估IL-8、IL-17和TNF-α的血浆水平。如图1C所报告,平均IL-8值随着胃部病变的阶段而增加,并且与H样本相比,NAG、AG/P和GC样本的平均IL-8值分别高出2倍(P=0.0098)、1.6倍和3倍(P<0.0001)。重要的是,94%的H样本显示IL-8≤40ng/ml,而GC患者中的这一比例仅为39%。此外,在33%的AG/P样本和61%的GC样本中观察到IL-8>40ng/ml(图1D)。根据“不健康的”决策规则计算的临界值表明,IL-8>17.7pg/ml对应于不健康的样本,灵敏度为73.2%,特异性为72.3%(表2)。此外,IL-8>29.4pg/ml可以预测胃癌(GC)患者,灵敏度和特异性分别为74.6%和72.9%(表2)。
有趣的是,IL-17可以明确区分H受试者和患有NAG、AG/P或GC病变的患者。100%的NAG、AG/P和GC样本显示IL-17血浆水平>20pg/ml。相比之下,在100%的H样本中观察到IL-17≤20pg/ml(图1G和1H)。更准确地,根据“不健康的”决策规则计算临界值表明IL-17>41pg/ml对应于不健康的样本,灵敏度和特异性均为100%(表2)。ROC曲线分析也表明IL-17的良好生物标志物特性,NAG、AG/P和GC样本的AUC值分别为0.75、0.72和0.67,使用决策规则“如果生物标志物数量高于(或,取决于配置,低于,或者高于或等于、或者低于或等于)x,则患者是H或NAG或AG/P或GC”,其中x是临界值(图3)。使用决策规则“如果生物标志物数量低于(或,取决于配置,高于,或者高于或等于、或者低于或等于)x,则患者是H或NAG或AG/P或GC”,观察到健康(H)样本的AUC为1(图4)。
TNF-α的遗传多态性先前被认为与胃癌风险增加有关(13)。与健康受试者相比,NAG、AG/P和GC样本中TNF-α血浆水平的测量显示出1.6倍、1.4倍和1.6倍的较高值。与IL-17类似,在100%的NAG样本、87%的AG/P样本和93%的GC样本中观察到TNF-α>80pg/ml,而H受试者中这一比例为26%(图1E和1F)。更准确地,根据“不健康的”决策规则计算的临界值表明TNF-α>74pg/ml对应于不健康(H)样本,灵敏度和特异性分别为98.8%和72.3%(表2)。因此,使用决策规则“如果生物标志物数量低于(或,取决于配置,高于,或者高于或等于,或者低于或等于)x,则患者是H或NAG或AG/P或GC”获得的AUC值为0.7954,其中x是临界值。(图4)。
·上游刺激因子USF1和USF2
USF1和USF2是多效性转录因子,其参与调节与重要细胞功能(如免疫应答、细胞增殖和维持基因组稳定性)相关的几个基因(14)。这些因子先前已被提议作为肿瘤抑制因子(15)。我们团队最近的一项团队研究报告称,GC患者胃活检中USF1的耗竭与不良预后相关(16)。因此,USF1可能是鉴定处于胃癌风险患者的潜在候选生物标志物。
在本研究中,GC患者的USF1血浆水平是H受试者的3.6倍(P=0.0002),其中分别有36%和0%的GC和H样本USF1>300pg/ml(图1I和1J)。在这种情况下,根据决策规则“如果生物标志物数量高于(或,根据配置,低于,或者高于或等于,或者低于或等于)x临界值,则患者是H或NAG或AG/P或GC”,由ROC曲线分析确定的AUC值为0.774(图3)。通过测量USF2获得的数据并未显示样本之间血浆水平的显著差异。然而,分别有89%、76%和77%的NAG、AG/P和GC样本显示USF2>10pg/ml,而健康个体中这一比例仅为51%(图1K和1L)。
·触珠蛋白
在血浆中,触珠蛋白(HP)与游离血红蛋白结合。据非小细胞肺癌报告,高血清HP水平与肿瘤进展和预后不良相关(17)。血清HP也被提议作为预测结肠直肠癌(CRC)肝转移的新型分子生物标志物(18)。最近,血清HP的异常糖基化与胃癌相关(19)。在本研究中,与H相比,GC样本中的平均HP血浆水平较高(1.7倍;P=0.0006)(图2C),44%的GC患者的HP水平>1.5g/l,而H受试者中的这一比例为7%(图2D)。
-通过蛋白质组学分析仪分析鉴定的候选生物标志物。
还通过蛋白质组学分析仪分析搜索了候选生物标志物,包括基于膜的抗体阵列,其允许平行确定所选的Human XL肿瘤学途径蛋白(84种癌症相关蛋白)的相对水平,如方法论部分所述。根据与H相比其在AG/P和GC样本中的血浆水平的显著变化,从肿瘤学途径阵列中选出瘦素(LEP)、E-选择素(SELE)和间皮素(MSLN)三种候选。然后,使用方法论部分中所示的特定商业ELISA测定法对队列中的所有样本进行定量。
·瘦素
LEP由于其作为消化肽激素的作用而成为特别感兴趣的候选。LEP是炎症细胞因子的诱导剂。在多种恶性肿瘤(包括胃肠道恶性肿瘤)中报告了LEP的失调。在CRC中,其表达从正常粘膜到伴有高度异型增生的腺癌逐渐增加(20)。高瘦素血清水平与胃肠化生和胃癌风险的增加相关(21,22)。在本研究中,AG/P样本中的平均LEP血浆水平比H和GC样本高3倍(P<0.0001)。此外,85%的AG/P样本显示LEP水平>6ng/ml,而H组中仅有7%(图2A和2B)。LEP是鉴定肿瘤前期患者样本的良好候选,ROC曲线也证明了这一点,该曲线确定AG/P的AUC值为0.705(图3)。临界值的计算表明,LEP>7.1ng/ml对应于肿瘤前期(AG/P)患者,其灵敏度为75%,特异性为86.2%(表2)。此外,LEP<4.1ng/ml导致预测胃癌患者,灵敏度为82.3%,特异性为72.3%。此外,LEP<2ng/ml的较低值(如果不是H)对应于GC样本,其灵敏度为100%,特异性为94.9%(表2)。
·E-选择素/CD62E
选择素是糖蛋白。E-选择素(SELE)在NFκB介导的转录调控下在内皮细胞上表达。它的表达对于控制炎症期间白细胞的聚集至关重要。一旦到达NAG阶段,SELE血浆水平便会升高(与健康组相比,P<0.0001)(图2E),其中85%、78%和84%的NAG、AG/P和GC样本的SELE水平>8ng/ml,而24%的健康样本SELE水平>8ng/ml(图2F)。临界值的计算表明,SELE>7.1ng/ml对应于不健康的样本,其灵敏度为89.3%,特异性为76.3%(表2)。如图3所示,通过ROC曲线分析,GC样本的最佳AUC值为0.7565,使用决策规则“如果生物标志物数量高于(或者,根据配置,低于,或者高于或等于,或低于或等于)x,则患者是H或NAG或AG/P或GC”,其中x是临界值。
·间皮素
间皮素(MSLN)可能参与细胞粘附。先前已报告MSLN在多种人类肿瘤中过表达(23)。在我们的研究中,AG/P样本中的平均MSLN血浆水平高出2倍(与H组相比,P<0.0001)(图2G),90%的样本MSLN>10ng/ml,而H组中这一比例为28%。ROC曲线分析还表明,MSLN可以被视为有价值的候选生物标志物,其AUC为0.7433,用于鉴定AG/P患者(图3)。如果MSNL>8.3ng/ml,则样本不属于健康组,并且MSLN>10.8ng/ml导致预测AG/P患者,其灵敏度为84.2%,特异性为63.1%(表2)。
表2:具有相应临界值的主要感兴趣的决策规则的列表,用于预测通过ELISA分析的候选的“不健康”和肿瘤前期(AG/P)或胃癌(GC)患者。
如图5所报告,对所有这些选定的候选生物标志物的相关功能的分析显示了与炎症反应相关的SELE、HP、IL-8(CXCL-8)、IL-17和TNF-α之间的联系。作为LEP,它们先前已被建议作为胰腺炎诊断和预后评估的生物标志物(24)。还与HP、SELE和TNF-α相关的LEP与USF1和USF2等信号转导有关。有趣的是,MSLN已被提及作为卵巢癌的蛋白质生物标志物,如LEP、HP、IL-8(CXCL-8)、IL-17和TNF-α(25)。
-通过基于质谱的蛋白质组学(MS)大规模筛选血浆蛋白鉴定的候选生物标志物
为获得更大的候选生物标志物组,并定义特征图谱,以尽可能改进对处于胃癌风险患者的早期发现,在巴斯德研究所利用UTechS MSBio平台开发了一项试点高通量蛋白质组学研究。本研究包括同样的四组H、NAG、AG/P和GC,每组10个代表性样本。血浆样本制备和MS分析按照方法论部分所述进行。
经过血浆耗竭、谱库数据分析和DIA获取后,不同组之间的比较导致总共鉴定出224种差异丰富的蛋白质。当将NAG、AG/P和GC组的样本与H样本进行比较时,分别有114、88和136种蛋白质显示出显著的变化,其中一些蛋白质在比较中普遍存在差异。根据相关矩阵和层次聚类分析(参见方法论部分),癌症(或健康)患者的定量血浆蛋白质组之间通常具有良好的相关性,而与受其他病理影响的患者相关性较小(图6A和图6B)。肿瘤前期(AG/P)和NAG患者的定量血浆蛋白质组在整体上具有良好的相关性,而与GC患者和H受试者的相关性较小。使用偏最小二乘判别分析(PLS-DA)研究四组样本(H、NAG、AG/P、GC)之间的蛋白质组学差异。PLS-DA图显示了H受试者和其他病理之间的良好区分(图6C)。然而,PLS-DA图未能清楚地区分NAG、AG/P和GC,表明这三种病理的血浆蛋白质组是封闭的,但与H个体不同。
为选择负责区分各组的蛋白质子集,使用了稀疏PLS-DA。该方法选择了一组49种无缺失值的潜在生物标志物,其可以清楚地区分健康个体和癌症患者,但无法区分肿瘤前期(AG/P)患者和胃炎患者(NAG)(图6D),如图7中报告的热图所示,该热图显示其中一些候选与其平均强度水平的偏差。在最相关的候选中,其中5种可以预测AG/P患者:IGFBP3、IGFALS、KIF20B、DCD、MAN2A1,6种可以预测GC患者:ATAD3B、DCD、S100A12、TFRC、IGHG1、CSTA,如表3所列。
表3:通过ELISA或蛋白质组学分析鉴定的候选蛋白质生物标志物列表。在潜在的候选中,4种通过蛋白质组阵列(Prot-array)鉴定并通过ELISA证实,29种通过质谱(prot-MS)鉴定,其中12种已通过ELISA证实,4种根据其已知的致癌作用先前选择并通过ELISA检测。重要的是,LEP已通过3种方法证实,IL-17、SELE、MSLN和HP已通过2种方法证实。粗体:根据AUC和剩余偏差评估,具有检测NAG、AG/P和/或GC的最佳预测特性的候选生物标志物。用“x”标记:用于表征不同候选生物标志物的方法。粗体:在ELISA中验证、并在通过质谱鉴定的蛋白质的3种生物标志物的10种最佳组合中发现的候选生物标志物(IL-17和LEP)(表6)。¥根据人类蛋白质图谱(https://www.proteinatlas.org/humanproteome/pathology)与癌症相关的血浆蛋白。
-使用2种和3种潜在生物标志物组合的预测和诊断测试。
·通过ELISA和蛋白质组学分析仪鉴定的候选
对通过ELISA和蛋白质组学分析仪阵列鉴定的候选进行了相同的分析。两种候选生物标志物组合的推导出的ROC曲线和每种病理特异性的AUC如图8A所报告。如上所述,对于每种病理,可以评估蛋白质在模型中出现的次数,给出最佳AUC标准(图8B)以及模型的剩余偏差(图9A和9B)。对于这些候选,似乎很难完美预测胃炎、肿瘤前期或癌症,因为没有2种或3种标志物的组合使得AUC=1。然而,LEP和mtDNA的组合可预测肿瘤前期(AUC=0.761)以及与IL-17相关的LEP可预测癌症(AUC=0.8705)。此外,如表4中报告,与HP、USF2、SELE、IL-8或USF1相关的LEP可以预测肿瘤前期(0.61≤AUC≤0.70),与mtDNA、SELE、IL-8或USF1相关的LEP可以预测胃癌(0.74≤AUC≤0.78),以及IL-17与mtDNA组合(AUC=0.76)或与TNF-α组合(AUC=0.75)可以预测胃癌。考虑到三种候选生物标志物的组合,LEP总是出现在预测肿瘤前期的5种组合中,其中5种组合中有4种组合与mtDNA相关(0.69≤AUC≤0.73)。预测胃癌的三种生物标志物的八种最佳组合的AUC值更好,为0.84至0.87。所有这些都存在IL-17和LEP。它们与mtDNA、HP、SELE、MSLN、IL-8、USF1或USF2相关(表5)。
3种生物标志物的组合 | NAG | AG/P | GC |
IL-17、USF2、SELE | 0.72 | ||
IL-17、USF2、HP | 0.67 | ||
LEP、MSLN、HP | 0.73 | ||
LEP、IL-17、mtDNA | 0.72 | 0.87 | |
LEP、SELE、mtDNA | 0.71 | ||
LEP、IL-8、mtDNA | 0.71 | ||
LEP、MSLN、mtDNA | 0.69 | ||
IL-17、LEP、HP | 0.87 | ||
IL-17、LEP、SELE | 0.87 | ||
IL-17、LEP、MSLN | 0.86 | ||
IL-17、LEP、IL-8 | 0.86 | ||
IL-17、LEP、USF1 | 0.86 | ||
IL-17、LEP、TNF-α | 0.86 | ||
IL-17、LEP、USF2 | 0.84 |
表5:通过ELISA鉴定的3种生物标志物的组合列表,以及预测NAG、AG/P和GC患者的最佳相应AUC值。
·通过质谱分析鉴定的候选。
已经使用表3中列出的MS分析鉴定的候选中的2或3种生物标志物的组合来估计多类别逻辑回归模型。使用两种方法评估模型估计的结果。第一种方法是使用估计的模型根据生物标志物的组合来预测病理,并减少对每种病理具有特异性的ROC曲线和AUC标准(图10A)。接着,对于每种病理,可以评估蛋白质在模型中出现的次数,从而给出最佳AUC标准(图10B)。第二种方法是计算模型的剩余偏差,其对应于估计的建模误差,并且可以测量模型同时预测所有病理的能力(图11A和11B)。
根据我们的结果,仅使用两种生物标志物似乎很难完美预测肿瘤前期和胃炎(对于这些病理学,没有生物标志物的组合达到AUC=1),而使用两种生物标志物的30种组合可以完美预测患有癌症的患者(图10B),包括KRT14、CFP、ARG1、SA10012、ATAD3B、KIF20B、SPEN、SERPINA5、DSP、CPA4、KRT19、JUP、KRT2、CDSN、MAN1A1、MAN2A1、SPRR1A、HAL、DCD,如表6中所报告。重要的是,在用两个变量检测到的30种组合中,S100A12是最常被选择来预测胃癌的候选。此外,可以使用包括PGK1、CFP、IGFALS、KRT19、CPA4、CA2、SERPINA5、MAN2A1(0.8≤AUC≤0.85)在内的两种生物标志物的十种组合预测胃炎(NAG)患者,并且PGK1、CFP、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1、LBP、DSP中的两种生物标志物的十种组合(表6)可以预测肿瘤前期患者(AG/P)。当使用三种生物标志物时,可以完美预测所有病理。非常有趣的是,三种生物标志物的组合给出了最低的剩余偏差:KRT19、KIF20B和SPEN;ARG1、KIF20B和SPEN;DSP、KIF20B和SPEN,其可以完美预测NAG、AG/P和GC的所有病理(AUC=1)。KRT19、KIF20B和SPEN作为癌症生物标志物具有特殊的相关性。角蛋白19(KRT19)在不同类型的癌症中发挥重要作用,并作为预测标志物(26)(27)。驱动蛋白家族成员20B(KIF20B)由于其对细胞增殖和凋亡的影响,可能会促进癌症的发展。它的高表达与晚期肿瘤阶段和不良预后相关,例如在肝细胞癌中(28)。此外,Msx2相互作用蛋白(SPEN)被认为是一种新型肿瘤抑制因子并调节Notch通路(29)。如表3所示,KIF20B和SPEN属于癌症相关血浆蛋白(如JUP、SERPINA5和F13A1)。
表6:用于预测NAG、AG/P和GC患者的2种和3种生物标志物的组合以及相应的AUC值的列表。
表7:通过基于质谱的蛋白质组学鉴定的生物标志物的变化概况,以log2比率表示,比较它们在健康和NAG、AG/P和GC之间或胃癌癌变级联的两个不同阶段之间的差异表达。底部的斜体数字对应于P值。如果相关的p值>0.05,则两组之间的差异(例如给定候选生物标志物的癌症组与健康组之间的差异)将被视为统计学显著的。
-通过ELISA证实MS数据
已经进行进一步的研究,以证实通过MS分析鉴定的候选生物标志物预测肿瘤前期(AG/P)或GC的能力。本文列出的蛋白质中至少11种蛋白质的血浆水平通过ELISA在队列的所有样本上进行定量,如表3所示,其中还提到了蛋白质名称。
如图13所报告,观察到与H组相比,AG/P组和GC组的ARG1、JUP、MAN2A1、LBP和IGFALS(也包括先前测量的LEP)的血浆水平存在显著差异。与H和GC相比,AG/P中的DCD血浆水平显著较低。此外,ATAD3B、HP和CA2水平在GC和H样本之间显示出显著差异(图13)。ROC分析得出用于预测肿瘤前期(AG/P)的AUC>0.6:LEP(AUC=0.685)、ARG1(AUC=0.63)和HP(AUC=0.629),以及用于预测胃癌的AUC>0.7:ARG1(AUC=0.712)(表3)。
在这些候选中,ARG1是尿素循环的关键元素,其催化精氨酸转化为鸟氨酸和尿素,进一步代谢为脯氨酸和聚酰胺,驱动胶原蛋白合成和生物能途径。它还参与对癌症的免疫应答的调节,并且在胃癌的肿瘤微环境中报告了更高的水平(30)。在我们的研究中,ARG1能够预测AG/P,灵敏度(Sens)为72%,特异性(Spec)为54%,而在预测GC的情况下,Sens为49%,Spec为93%。
根据字符串分析(图14),功能连接用JUP表示,其也称为γ-连环蛋白。JUP作为桥粒和紧密连接参与细胞间连接。其与细胞骨架重排有关。它的损失与GC恶性肿瘤和不良预后密切相关(31)。此处,观察到NAG、AG/P和GC样本中JUP血浆水平的总体增加,但预测GC的AUC仅为0.5,具有低Sens(27%)和Spec(73%)。
功能上连接到JUP(图14)的HP结合游离血红蛋白。最近,血清HP的异常糖基化与胃癌相关(9)。在本研究中,44%的GC患者观察到HP>1.5g/l,而H受试者的这一比例为7%。然而,预测GC的AUC仅为0.567,Spec为69%,Sens为44%。
LBP在功能上与LEP连接(图14)。LBP是一种与多种细菌LPS结合的糖蛋白,其在先天免疫应答中发挥作用。我们观察到从NAG到GC阶段,LBP血浆水平显著增加(图13)。LBP显示用于预测AG/P和GC的AUC分别为0.5和0.562。值得注意的是,在100%的H样本中,LBP≤250ng/ml,而在73%的AG/P和79%的GC样本中,LBP>250ng/ml。
DCD可被裂解成具有不同功能的几种肽。其最著名的作用是作为抗菌宿主防御蛋白。在多种癌症(包括胃癌)中报告了DCD表达失调(32)。对于DCD预测AG/P和GC确定的AUC值分别为0.597和0.581,Sens:88%;对于AG/P的Spec为31%,Sens为22%;对于GC的Spec为94%。
ATAD3B在干细胞的线粒体网络组织中发挥作用,并已显示出在癌细胞中重新表达(33)。与健康样本相比,GC样本中的ATAD3B血浆水平较高(图13),GC的AUC为0.583。
CA2在质子耦联肽吸收过程中有助于十二指肠上绒毛上皮的pH调节。在胃肠道间质瘤中已经报告了CA2的过表达(34)。观察到与H受试者相比,GC患者血浆中CA2的水平较高(图13),但AUC仅为0.583。
另外两种被定量的候选生物标志物是MAN2A1和IGFALS。MAN2A1参与聚糖的生物合成,GC患者血清中已报告了不同类型的聚糖(35)。MAN2A1与AG/P和GC的AUC≤0.5相关。最后一种,IGFALS是一种结合胰岛素生长因子(IGF)的血清蛋白。IGFALS先前已被建议作为肝癌恶性进展的标志物(36)。与MAN2A1一样,IGFALS与预测AG/P和GC的0.5的AUC相关。
除这些候选之外,还将易与有效生物标志物相对应的因子纳入组,因为它们在炎症和癌症中的已知作用,如上文提到的IL-8、TNF-α、USF1和USF2。表3中还列出了STAT3和EGFR,它们是通过ELISA对队列的所有样本进行测量的这些其他候选中的两种。
SATA3是一种关键的转录因子,与细胞对白细胞介素、LEP和其他生长因子的应答相关(图14)。重要的是,STAT3先前已被报告在GC中上调(37)。STAT3磷酸化参与LEP信号通路,并导致LEP抗性,这是肥胖的主要风险因素(38)。此处,观察到GC患者的STAT3血浆水平较高(图13)。所有H样本和89%的NAG样本显示STAT3水平≤250ng/ml,而在大多数(59%)GC样本中,STAT3>5ng/ml,AUC值为0.672。(Sens 62.8%;Spec 71.6%)。
第二种是EGFR,其在细胞增殖和肿瘤发展中起着至关重要的作用。它在27%至64%的胃部肿瘤中过表达,并被认为是GC患者较差结果的指标(39)。与AG/P相比,GC样本中观察到更高的EGFR水平(图13),AG/P和GC的AUC分别仅为0.5和0.472。
-使用2至6种候选生物标志物的组合的预测和诊断测试
目前的数据以及有关生物标志物发现的文献都认为,生物标志物组的组合而非单一候选对于改进癌症患者的早期发现的重要性。事实上,根据我们的结果,使用单一生物标志物似乎很难完美预测肿瘤前期和/或癌症,因为对于预测GC的单一候选:IL-17和IL-18的最佳AUC值分别为0.731(Sens 50.5%,Spec 95.6%)和0.725(Sens 63%,Spec 82%)。对于肿瘤前期,LEP给出最佳AUC值:0.685(Sens 94.2%,Spec 42.8%)。为改进对肿瘤前期或癌症病变存在的检测,已使用多达6种候选生物标志物的组合对多类别逻辑回归模型进行了估计,这些候选生物标志物的血浆水平已通过ELISA对队列的所有样本进行了测量。
基于这些数据,使用两种方法评估了模型估计的结果。第一种方法是使用估计的模型根据生物标志物的组合预测病理,并推导出对每种病理具有特异性的ROC曲线和AUC值。接着,对于每种病理,可以评估蛋白质在模型中出现的次数,给出最佳AUC标准。第二种方法是计算模型的剩余偏差,其对应于估计的建模误差,并且可以测量模型同时预测所有病理的能力。
使用这些模型,能够根据AUC、Sens和Spec值鉴定两个最佳特征,以预测胃癌前期的存在(SIG-AGP)和癌症病变(SIG-GC),包括多达6种生物标志物。
所谓的“SIG-AGP”特征对应于MSLN、HP、LEP、KRT19、IGFALS、EGFR的组合,AUC值为0.852,Sens为91.4%,Spec为79%,以预测肿瘤前期(图15A)。
所谓的“SIG-GC”特征包括IL-17、ARG1、LEP、MSLN、TNF-α、SELE,AUC值为0.928、Sens为92.9%,Spec为92.7%,以预测胃癌(图15B)。
LEP和MSLN均存在于两者中。表8报告了每种生物标志物血浆水平的中值、最小值和最大值。
重要的是,这两个特征的预测特性随着生物标志物数量的增加而增加。对于两者,AUC从1种蛋白质增加到6种蛋白质,SIG-AG/P的Spec和SIG-GC的Sens也增加。关于SIG-AGP,使用LEP作为单一生物标志物已观察到Sens为94%,但Spec仅为42.8%。同样,在SIG-GC的情况下,使用单一生物标志物IL-17获得最高Spec(95.6%)。
为完整起见,表9报告了预测AG/P的6种生物标志物的最佳组合列表。这些组合对应于AUC≥0.8,灵敏度为90%至96%,特异性为71%至79%。
此外,如表10所报告,5种生物标志物的组合:MSNL、LEP、KRT19、MAN2A1、IGFALS可以预测肿瘤前期,其Sens高于SIG-AGP(94.1%),Spec为73.7%。
此外,为预测GC,还观察到TNF-α、IL-17、MSLN、LEP、KIF20B、ARG1的组合的优异得分(AUC:0.928;Sens 93%,Spec 92.7%),与SIG-GC相比,SELE被KIF20B替代。值得注意的是,仅使用单一生物标志物IL-17就已经获得了GC的最佳Spec(95.6%),但AUC和Sens较低(0.731和50.6%)。
为完整起见,表11报告了预测GC的6种生物标志物的最佳组合列表。这些组合对应于AUC≥0.9,灵敏度为87%至94%,特异性为88%至94%。
除了组成SIG-AGP或SIG-GC的10种生物标志物之外,9种附加的候选标志物,即CA2、MAN2A1、ATAD3B、S100A12、USF2、JUP、CPA4、KRT14和F13A1也很有前景,因为它们也存在于4至6种生物标志物的组合中,给出预测肿瘤前期或GC的10个最佳AUC,无论是考虑CA2、MAN2A1、ATAD3B、S100A12、USF2、JUP的ELISA数据,还是CPA4、KRT14和F13A1的质谱数据。下表12对此进行了汇总。
表12:有前景纳入特征的候选汇总。
结论
总之,分析使得选出表3中所示的一组40种候选生物标志物,可以预测患者是否患有胃炎、胃癌前期或癌症病变。有些候选比其他候选给出更好的预测结果。重要的是,ELISA分析的数据表明,在第一水平IL-17可以很好地区分健康受试者和患者。在患者组中,最引人注目的结果表明,结合到IL-17的LEP可以以高置信水平预测GC,并且与HP或MSLN相关联的LEP可以检测肿瘤前期(AG/P)。重要的是,LEP已通过本研究中开发的三种方法进行了验证,IL-17、SELE、MSLN和HP已通过其中两种方法进行了验证。
此外,根据所进行的基于MS的分析,KIF20B和SPEN的组合可以很好地预测AG/P或GC。他们与KRT19和S100A12的组合似乎可以完美预测GC,如图12中汇总的。这些有前景的分析使得能够提出基于生物标志物组合的数学模型,以预测胃部病变的存在,从而非限制性地且在具体实施方式中导致第一生物标志物特征检测胃癌前期和癌症病变的存在,包括IL-17、LEP、HP、MSLN、KIF20B、SPEN、KRT19和S100A12。KIF20B、SPEN、KRT19和S100A12已通过MS蛋白质组学研究进行鉴定,该研究包括每组10个样本,通过ELISA测定法对该队列的所有血浆样本进行进一步的研究将有助于证实其作为生物标志物的准确性,如表6中列出的与KIF20B和SPEN组合的其他潜在候选。
根据另一个方面,在最初通过MS鉴定的蛋白质中,通过ELISA测量的其中12种蛋白质的血浆水平证实了MS数据,从而将它们视为检测胃癌级联的不同阶段的胃部病变的潜在生物标志物。除了10种先前选择的候选蛋白质之外,这12种蛋白质也通过ELISA进行了定量,导致定义了6种生物标志物的最佳组合,在具体的实施方式中,其对应于两个特征SIG-AGP和SIG-GC,以分别预测肿瘤前期和胃癌病变的存在。需要强调的是,SIG-AGP和SIG-GC中包含的10种候选中的大多数(包括MSLN、HP、KRT19、TNF-α、IL-17、LEP、ARG1、KIF20B)均证实了最初采集的数据。SIG-GC的预测得分非常好。在SIG-AGP的情况下,AUC、Sens和Spec比SIG-GC获得的结果稍低,但仍然非常好。观察到的SIG-AGP的最低Spec(79%)可能是由于这组样本的异质性,这组样本包括萎缩性胃炎(AG)、肠化生(IM)和异型增生(D)。在这组患者中,可以发现所有不同的病变关联,AG、AG+IM、AG+IM+D。由于IM转变为D的时间很短,正好在癌症病变发生之前,因此对这些病变的良好预测非常重要。这些肿瘤前病变也是最难通过内窥镜检查鉴定的。
总之,根据这个方面,使用三种不同的方法鉴定并证实了两个生物标志物特征SIG-AGP和SIG-GC。这些特征构成了基于简单的血液采样预测胃癌前期和癌症病变存在的重要工具,并为未来开发诊断性非侵入性检测以改进胃癌患者的检测/预防铺平了道路。如图16所示,该检测不仅可以用于首次筛查,如果结果呈阳性,还可用于推动患者进行进一步的临床研究,如内窥镜检查,而且还可以用于随访先前检测患有肿瘤前期的患者,以及跟踪接受抗癌治疗的患者的复发/缓解。
观点
生物标志物特征的表征允许预测NAG、AG/P和GC病变的存在,为未来开发用于早期发现和预防处于胃癌发展风险的个体的非侵入性预测/诊断工具铺平了道路。根据一个具体实施方式,该诊断测试可以基于根据一个具体实施方式对血浆样本进行的ELISA测定,结合构成生物标志物特征的不同因素的测量,从而预测胃癌前期和癌症病变的存在。根据另一个实施方式,可以使用例如Luminex测定的技术来进行这种诊断测试。构成该特征的每个因子的血浆水平的伴随测量及其与相应的预定临界值的比较将表明是否存在肿瘤前期或癌症病变。这种基于简单血液采样的重要工具将能够对处于胃癌风险的患者进行首次筛查,从而推动他们进行进一步的临床研究。此外,该诊断工具对于预测疾病复发/结局以及监测患者的个性化治疗和随访也非常有帮助。
参考文献
1.Bray F、Ferlay J、Soerjomataram I等人,2018年全球癌症统计数据:GLOBOCAN对全球185个国家36种癌症的发病率和死亡率进行估计,《CA:临床医师癌症杂志》2018年;68:394-424(Bray F,Ferlay J,Soerjomataram I et al.Global cancer statistics2018:GLOBOCAN estimates of incidence and mortality worldwide for 36cancers in185countries.CA:a cancer journal for clinicians.2018;68:394-424)。
2.Arnold M、Young Park J、Camargo MC等人,胃癌正在成为一种罕见疾病吗?到2035年的预测发病率趋势的全球评估,《胃肠》2020年;69:823-829(Arnold M,Young ParkJ,Camargo MC et al.Is gastric cancer becoming a rare disease?Aglobalassessment of predicted incidence trends to 2035.Gut.2020;69:823-829)。
3.Correa P.,人类胃癌发生:一个多步骤和多因素的过程,第一届美国癌症协会癌症流行病学和预防奖讲座,《癌症研究》1992年;52:6735-40(Correa P.Human gastriccarcinogenesis:a multistep and multifactorial process.First American CancerSociety Award Lecture on Cancer Epidemiology and Prevention.Cancer Res.1992;52:6735-40)。
4.Rugge M、Genta RM、DiMario F等人,胃癌作为可预防的疾病,《临床胃肠病学和肝病学》:美国胃肠病学会的官方临床实践杂志,2017年;15:1833-43(Rugge M,Genta RM,Di Mario F et al.Gastric Cancer as Preventable Disease.Clin Gast Hep:theofficial clinical practice journal of the American GastroenterologicalAssociation.2017;15:1833-43)。
5.Ford AC、Forman D、Hunt RH等人,幽门螺杆菌根除治疗预防健康无症状感染者患胃癌:随机对照试验的系统评价和荟萃分析,《英国医学杂志》(临床研究编辑)2014年;348:g3174(Ford AC,Forman D,Hunt RH et al.Helicobacter pylori eradicationtherapy to prevent gastric cancer in healthy asymptomatic infectedindividuals:systematic review and meta-analysis of randomised controlledtrials.BMJ(Clinical research ed).2014;348:g3174)。
6.Fernandes J、Michel V、Camorlinga-Ponce M等人,循环线粒体DNA水平,一种用于早期发现胃癌的非侵入性生物标志物,《癌症流行病学、生物标记与预防》2014年;23:2430-8(Fernandes J,Michel V,Camorlinga-Ponce M et al.Circulatingmitochondrial DNA level,a noninvasive biomarker for the early detection ofgastric cancer.Cancer Epidemiol Biomarkers Prev.2014;23:2430-8)。
7.Fan AX、Radpour R、Haghighi MM等人,乳腺癌患者配对的正常和癌性乳腺组织样本中的线粒体DNA含量,《癌症研究与临床肿瘤学杂志》2009年;135:983-9(Fan AX,Radpour R,Haghighi MM et al.Mitochondrial DNAcontent in paired normal andcancerous breast tissue samples from patients with breast cancer.J Cancer ResClin Oncol.2009;135:983-9)。
8.Rappsilber J、Mann M、Ishihama Y,使用StageTips对蛋白质组学肽进行微纯化、富集、预分级和存储的方案,《自然协议》2007年;2:1896-906(Rappsilber J,Mann M,Ishihama Y.Protocol for micro-purification,enrichment,pre-fractionation andstorage of peptides for proteomics using StageTips.Nature Prot.2007;2:1896-906)。
9.Kulak NA、Pichler G、Paron I等人,应用于真核细胞的拷贝数估计的最小封装蛋白质组学样本处理,《自然-方法》2014年;11:319-24(Kulak NA,Pichler G,Paron I etal.Minimal,encapsulated proteomic-sample processing applied to copy-numberestimation in eukaryotic cells.Nature Meth.2014;11:319-24)。
10.Cox J、Mann M.,MaxQuant能够实现高肽鉴定率、个性化p.p.b.范围质量准确度和全蛋白质组蛋白质定量,《自然-生物技术》2008年;26:1367-72(Cox J,MannM.MaxQuant enables high peptide identification rates,individualized p.p.b.-range mass accuracies and proteome-wide protein quantification.NatureBiotech.2008;26:1367-72)。
11.Cox J、Neuhauser N、Michalski A等人,Andromeda:集成到MaxQuant环境中的肽搜索引擎,《蛋白质组学研究杂志》2011;10:1794-805(Cox J,Neuhauser N,Michalski Aet al.Andromeda:a peptide search engine integrated into the MaxQuantenvironment.J Prot Res.2011;10(:1794-805)。
12.Perez-Riverol Y、Csordas A、Bai J等人,2019年PRIDE数据库及相关工具和资源:改进对量化数据的支持,《核酸研究》2019年;47:D442-d50(Perez-Riverol Y,Csordas A,Bai J et al.The PRIDE database and related tools and resources in2019:improving support for quantification data.Nucleic Acids Res.2019;47:D442-d50)。
13.Gorouhi F、Islami F、Bahrami H等人,肿瘤坏死因子A多态性和胃癌风险:荟萃分析,《英国癌症杂志》2008年;98:1443-51(Gorouhi F,Islami F,Bahrami H etal.Tumour-necrosis factor-A polymorphisms and gastric cancer risk:a meta-analysis.Br J Cancer.2008;98:1443-51)。
14.Corre S、MD Galibert,上游刺激因子:高度通用的胁迫应答转录因子,《色素细胞与黑色素瘤研究》2005年;18:337-48(Corre S,MD Galibert.Upstream stimulatingfactors:highly versatile stress-responsive transcription factors.Pigment CellRes 2005;18:337-48)。
15.Chen N、Szentirmay MN、Pawar SA等人,转录因子Usf2在前列腺癌发生中的肿瘤抑制功能,《癌基因》2006年;25:579-87(Chen N,Szentirmay MN,Pawar SA etal.Tumor-suppression function of transcription factor Usf2 in prostatecarcinogenesis.Oncogene.2006;25:579-87)。
16.Costa L、Corre S、Michel V等人,USF1缺陷在幽门螺杆菌感染期间驱动p53降解并加速胃癌发生,《胃肠》2019(Costa L,Corre S,Michel V etal.USF1 defect drivesp53 degradation during Helicobacter pyloriinfection and accelerates gastriccarcinogenesis.Gut.2019)。
17.Lu J、Wang Y、Yan M等人,高血清触珠蛋白水平与肿瘤进展相关,并预测非小细胞肺癌的不良预后,《肿瘤靶点》2016年;7:41758-66(Lu J,Wang Y,Yan M et al.Highserum haptoglobin level is associated with tumor progression and predictspoor prognosis in non-small cell lung cancer.Oncotarget.2016;7:41758-66)。
18.Sun L、Hu S、Yu L等人,血清触珠蛋白作为预测结直肠癌肝转移的新型分子生物标志物,《国际癌症杂志》2016年;138:2724-31(Sun L,Hu S,Yu L et al.Serumhaptoglobin as a novel molecular biomarker predicting colorectal cancerhepatic metastasis.Int J Cancer.2016;138:2724-31)。
19.Jeong S、Oh MJ、Kim U等人,血清触珠蛋白糖基化作为胃癌的标志物:临床医生综述,《蛋白质组学专家评论》2020年,17:109-117(Jeong S,Oh MJ,Kim U etal.Glycosylation of serum haptoglobin as a marker for gastric cancer:anoverview for clinicians.Exp.Rev Prot.2020.17:109-117)。
20.Endo H、Hosono K、Uchiyama T等人,在小鼠结肠癌发生过程中,瘦素在肿瘤发生后的阶段充当结直肠肿瘤的生长因子,《胃肠》2011年;60:1363-71(Endo H,Hosono K,Uchiyama T et al.Leptin acts as a growth factor for colorectal tumours atstages subsequent to tumour initiation in murine coloncarcinogenesis.Gut.2011;60:1363-71)。
21.Capelle LG、de Vries AC、Haringsma J等人,血清瘦素水平作为胃癌高危患者的标志物,《幽门螺杆菌》2009年,14:596-604(Capelle LG,de Vries AC,Haringsma Jet al.Serum levels of leptin as marker for patients at high risk of gastriccancer.Helicobacter.2009.14:596-604)。
22.Tas F、Karabulut S、Erturk K等人,胃癌患者血清瘦素水平的临床意义,《欧洲细胞因子网络》2018年,29:52-58(Tas F,Karabulut S,Erturk Ket al.Clinicalsignificancer of serum leptin levels in patients with gastric cancer.EurCytokines Netw.2018.29:52-58)。
23.Ho M、Bera TK、Willingham MC等人,人类肺癌中的间皮素表达,《临床癌症研究》2007年;13:1571-5(Ho M,Bera TK,Willingham MC et al.Mesothelin expression inhuman lung cancer.Clin Cancer Res.2007;13:1571-5)。
24.Meher S、Mishra TS、Sasmal PK等人,生物标志物在急性胰腺炎诊断和预后评估中的作用,《生物标志物杂志》2015年,2015:519534(Meher S,Mishra TS,Sasmal PK etal.Role of biomarkers in diagnosis and prognostic evaluation of acute pancreatitis.J.Biomarkers.2015.2015:519534)。
25.Nolen BM、Lokshin AE,卵巢癌的蛋白质生物标志物:森林和树木,《未来肿瘤学》2012年,8:55-71(Nolen BM,Lokshin AE.Protein biomarkers of ovarian cancer:the forest and the trees.Future Oncol.2012.8:55-71)。
26.Cen D、Chen J、Li Z等人,细胞角蛋白19表达在胰腺神经内分泌肿瘤中的预后意义:荟萃分析,《公共科学图书馆-综合》2017年;12:e0187588(Cen D,Chen J,Li Z etal.Prognostic significance of cytokeratin 19expression in pancreaticneuroendocrine tumor:A meta-analysis.PLoS One.2017;12:e0187588)。
27.Takano M、Shimada K、Fujii T等人,角蛋白19作为人肝细胞癌通过侵袭和血管生成进展的关键分子,《BMC癌症》2016年;16:903(Takano M,Shimada K,Fujii T etal.Keratin 19as a key molecule in progression of human hepatocellularcarcinomas through invasion and angiogenesis.BMC Cancer.2016;16:903)。
28.Liu X、Li Y、Zhang X等人,驱动蛋白家族成员20B的抑制通过阻断胞质分裂使肝细胞癌细胞对微管靶向剂敏感,《癌症科学》2018年;109:3450-60(Liu X,Li Y,Zhang Xet al.Inhibition of kinesin family member20B sensitizes hepatocellularcarcinoma cell to microtubule-targeting agents by blocking cytokinesis.CancerSci.2018;109:3450-60)。
29.Legare S、Cavallone L、Mamo A等人,雌激素受体辅因子SPEN在激素依赖性乳腺癌中充当肿瘤抑制因子和药物反应性候选生物标志物,《癌症研究》2015年;75:4351-63(Legare S,Cavallone L,Mamo A et al.The Estrogen Receptor Cofactor SPENFunctions as a Tumor Suppressor and Candidate Biomarker of DrugResponsiveness in Hormone-Dependent Breast Cancers.Cancer Res.2015;75:4351-63)。
30.Jang TJ、Kim AS、Kim KM.,与前驱病变和非肿瘤组织相比,癌间质中精氨酸酶1阳性细胞的数量增加,《病理学研究与实践》2018年,214:1179-1184(Jang TJ,Kim AS,KimKM.Increased number of arginase-1positive cells in the stroma of carcinomascompared to precursor lesions and nonneoplastic tissues.Pathology-Researchand Practice.2018.214:1 179-1184)。
31.Chen Y、Yang L、Qin Y等人,差异分布的JUP对胃癌恶性程度的影响,《前沿研究杂志》2021年,28:195-208(Chen Y,Yang L,Qin Y et al.Effects of differentialdistributed-JUP on the malignancy of gastric cancer.J.Adv.Res.2021.28:195-208)。
32.Stewart GD、Skipworth RJ、Ross JA等人,癌症中的dermcidin基因:在恶病质、致癌作用和肿瘤细胞存活中的作用,《临床营养和代谢护理的当前观点》2008年,11:208-13(Stewart GD,Skipworth RJ,Ross JA et al.The dermcidin gene in cancer:role in cachexia,carcinogenesis and tumour cell survival.Curr Opin Clin NutrMetab Care.2008.11:208-13)。
33.Merle N、Féraud O、Gilquin B等人,ATAD3B是一种人类胚胎干细胞特异性线粒体蛋白,在癌细胞中重新表达,对于普遍存在的ATAD3A起显性阴性作用,《线粒体》2012年,12:441-448(Merle N,Feraud O,Gilquin B et al.ATAD3B is a human embryonicstem cell specific mitochondrial protein,re-expressed in cancer cells,thatfunctions as dominant negative for the ubiquitousATAD3A.Mitochondrion.2012.12:441-448)。
34.Parkkila S、Lasota J、Fletcher JA等人,碳酸酐酶II:一种胃肠道间质瘤的新型生物标志物,《现代病理学》2010年,23:743-750(Parkkila S,Lasota J,Fletcher JAet al.Carbonic anhydrase II.A novel biomarker for gastrointestinal stromaltumors.Modern Pathology.2010.23:743-750)。
35.Ozcan S、Bark DA、Ruhak Lr等人,胃癌的血清聚糖特征,《癌症预防研究》2014年,7:226-235(Ozcan S,Bark DA,Ruhak Lr et al.Serum glycan signatures ofgastric cancer.Cancer Prev Res.2014.7:226-235)。
36.Marquardt JU、Seo D、Andersen JB等人,人类肝癌的序列转录组分析表明恶性特征的晚期获得,《肝脏病学杂志》2014年,60:346-353(Marquardt JU,Seo D,AndersenJB et al.Sequential transcriptome analysis of human liver cancer indicateslate stage acquisition of malignant traits.JHepatol.2014.60:346-353)。
37.Ashrafizadeh M、Zarrabi A、Orouei S等人,胃癌中的Stat3通路:信号传导、治疗靶向和未来前景,《生物学-巴塞尔》2020年,9:126(Ashrafizadeh M,Zarrabi A,Orouei S et al.Stat3 pathways in gastric cancer:signaling,therapeutictargeting and future prospects.Biology(Basel).2020.9:126)。
38.Liu H、Du T、Yang G.,中枢瘦素抵抗中的STAT3磷酸化,《营养与新陈代谢》2021年,18:39(Liu H,Du T,Yang G.STAT3 phosphorylation in central leptinresistance.Nutrition and Metabolism.2021.18:39)。
39.Lieto E、Ferraracio F、Orditura M等人,血管内皮生长因子(VEGF)和表皮生长因子(EGFR)的表达是胃癌患者预后较差的独立指标,2008年,《肿瘤外科年鉴》15:69-79(Lieto E,Ferraraccio F,Orditura M et al.Expression of vascular endothelialgrowth factor(VEGF)and epidermal growth factor(EGFR)is an indicator ofindependent prognosis of worse outcome in gastric cancer patients.2008.AnnSurg Oncol.15:69-79)。
Claims (27)
1.一种确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验的体外方法,其包括筛选先前从易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的人类患者中取出的血液或血浆的生物样本,所述方法包括以下步骤:
a.确定选自以下的至少两种生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平,条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成,任选地,确定选自以下的至少两种生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平,条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成,
b.将步骤a中确定的水平与对照进行比较,和
c.如果步骤a和步骤b中确定和比较的至少两种生物标志物的水平偏离其对照的水平,则得出结论:人类患者具有使所述患者处于胃癌病况风险的病变,和/或需要进一步的相关医学检验,特别是临床研究。
2.根据权利要求1所述的方法,其中步骤a由确定至少三种生物标志物的水平组成,所述至少三种生物标志物包括IL-8蛋白和mtDNA水平这两种生物标志物与选自以下的一种或多种生物标志物的进一步组合:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE和MSLN,任选地包括IL-8蛋白和mtDNA水平这两种生物标志物与选自以下的一种或多种生物标志物的进一步组合:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN。
3.根据权利要求1或2中任一项所述的方法,其中步骤a由确定至少三种生物标志物的水平组成,所述至少三种生物标志物包括选自以下的两种生物标志物:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN和mtDNA水平,以及至少一种选自EGFR和STAT3的另外的生物标志物。
4.根据权利要求1至3中任一项所述的方法,其中步骤a由确定选自以下的至少三种生物标志物的水平组成:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平。
5.根据权利要求1或2中任一项所述的方法,其中步骤a由确定选自以下的至少两种、优选两种至六种生物标志物的水平组成:IGFALS、KRT19、CPA4、CA2、MAN2A1、KIF20B、JUP、F13A1、LBP、KRT14、ARG1、S100A12、ATAD3B、DCD、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR和STAT3。
6.根据权利要求1至5中任一项所述的方法,其用于评估人类患者具有非萎缩性胃炎(NAG)或萎缩性胃炎/肿瘤前期(AG/P)或胃癌(GC)的风险。
7.根据权利要求1至6中中任一项所述的方法,其用于评估人类患者具有萎缩性胃炎/肿瘤前期(AG/P)的风险,其特别是一种用于预测或诊断经检测的患者的萎缩性胃炎/肿瘤前期(AG/P)病况的方法。
8.根据权利要求7所述的方法,其中步骤a由确定选自以下的至少两种、优选两种至六种生物标志物的水平组成:IGFALS、KRT19、CA2、MAN2A1、KIF20B、JUP、LBP、S100A12、ATAD3B、DCD、HP、LEP、IL-8、IL-17、USF1、USF2、SELE、MSLN和EGFR,特别是由确定IGFALS、KRT19、HP、LEP、MSLN和EGFR的水平组成。
9.根据权利要求7或8中任一项所述的方法,其用于评估人类患者具有萎缩性胃炎/肿瘤前期(AG/P)的风险,其中灵敏度至少为80%和/或特异性至少为80%,特别是灵敏度和特异性各自至少为80%。
10.根据权利要求1至6中任一项所述的方法,其用于评估人类患者具有胃癌(GC)的风险,其特别是一种用于预测或诊断经检测的患者的胃癌(GC)病况的方法。
11.根据权利要求10所述的方法,其中步骤a由确定选自以下的至少两种、优选两种至六种生物标志物的水平组成:IGFALS、KRT19、CA2、MAN2A1、KIF20B、JUP、LBP、ARG1、S100A12、ATAD3B、DCD、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、MSLN、EGFR和STAT3,特别是由确定ARG1、LEP、IL-17、TNF-α、SELE和MSLN的水平组成。
12.根据权利要求10或11中任一项所述的方法,其用于评估人类患者具有胃癌(GC)的风险,其中灵敏度至少为75%和/或特异性至少为90%,特别是灵敏度和特异性各自至少为90%。
13.根据权利要求1至12中任一项所述的方法,其用于区分经检测的患者是否存在非萎缩性胃炎(NAG)、萎缩性胃炎/肿瘤前期(AG/P)、胃癌(GC)或健康状况,其特别是一种用于预测或诊断这些病况中的一种的方法。
14.根据权利要求1至13中任一项所述的方法,其用于监测或诊断易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的患者的健康状况,或者具有使所述患者处于胃癌病况风险的病变的人类患者的健康状况,其中如果权利要求1的步骤b中设置的比较和/或权利要求1的步骤c中观察到的偏差显示出发展,则随时间推移重复所述方法至少一次,以得出关于经检测的患者的健康状况的结论,所述方法特别是用于监测或诊断被诊断患有胃癌并且任选地接受胃癌治疗的患者的健康状况。
15.根据权利要求1至14中任一项所述的方法,其包括检测幽门螺杆菌(Helicobacterpylori)感染的步骤作为不同的、同时的或并行的步骤,其特别是通过检测对幽门螺杆菌(H.pylori)感染具有特异性的抗原,或者通过涉及DNA扩增和随后检测所述DNA或检测先前从经测试的患者中取出的生物样本中特异性幽门螺杆菌(H.pylori)IgA和IgG抗体的存在的测定,或者通过对经检测的患者进行的13C尿素呼气试验。
16.根据权利要求1至15中任一项所述的方法,其中所述血液样本来自被诊断患有胃癌癌变的患者,并且任选地,所述患者正在接受这种病况的治疗,和/或所述血液样本来自具有正在发展的、接受治疗或未接受治疗的幽门螺杆菌(Helicobacter pylori)感染的患者,和/或具有根除或未根除的幽门螺杆菌(Helicobacter pylori)感染病史的患者,和/或具有胃痛和/或胃癌家族史的个体。
17.根据权利要求1至16中任一项所述的方法,其中所述血浆生物标志物的水平通过酶联免疫吸附测定(ELISA)检测、或质谱法、或定量聚合酶链式反应(q-PCR)、或路明克斯(Luminex)测定来确定,并且在进行时,通过定量聚合酶链式反应(q-PCR)来确定mtDNA的水平。
18.一种适于实施权利要求1至17中任一项所限定的方法的试剂盒,其包含:
-至少两种具有不同抗原特异性的抗体,其中每种抗体对选自以下的蛋白质具有特异性:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质,或对PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质具有不同抗原特异性的几种抗体的组合,以及任选地,至少一种对幽门螺杆菌(H.pylori)抗原具有特异性的抗体,例如CagA抗原,以及任选地,一种或多种以下试剂,
-二级抗体,例如生物素化的抗体,或揭示上述单个或复数个特异性抗体与其靶点之间的复合物的试剂,
-任选地,珠例如颜色编码的珠,和/或磁性或非磁性的珠,和/或羧化的珠,任选地,具有一种用于将抗体附着至珠的胺偶联试剂盒,
-任选地,藻红蛋白(PE)缀合的链霉亲和素以揭示生物素化的抗体,
-任选地,缓冲溶液,
-任选地,酶标板,和
-任选地,提供使用说明和用于解释结果的预期值的通知。
19.一种适于实施权利要求1至17中任一项所限定的方法的试剂盒,其包含:
-至少一对特异性寡核苷酸引物,其对与mtDNA杂交具有特异性,和/或
-至少两对特异性寡核苷酸引物,其对与DNA区域杂交具有特异性,所述DNA区域分别编码PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质中的两种或更多种,以及任选地,对与幽门螺杆菌(H.pylori)核酸序列杂交具有特异性的至少一对特异性寡核苷酸引物或核酸分子,以及任选地,一种或多种以下试剂,
-核苷酸(例如dATP、dCTP、dGTP、dUTP),
-DNA聚合酶,特别是热稳定的DNA聚合酶,例如Taq DNA聚合酶,
-至少一种用于染色核酸的染料,特别是可在实时PCT设备中检测到的染料,
-任选地,缓冲溶液,
-任选地,引物与其靶点杂交所必需的试剂,
-任选地,参比染料,和
-提供使用说明和用于解释结果的预期值的通知。
20.一种适于实施权利要求1至17中任一项所限定的方法的试剂盒,其包含:
-至少两种具有不同抗原特异性的抗体,其中每种抗体对选自以下的蛋白质具有特异性:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质,或对PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3、MSLN蛋白质具有不同抗原特异性的几种抗体的组合,以及任选地,至少一种对幽门螺杆菌(H.pylori)抗原具有特异性的抗体,例如CagA抗原,以及任选地,一种或多种以下试剂,
-二级抗体,例如生物素化的抗体,或揭示上述特异性抗体与其靶点之间的复合物的试剂,
-任选地,珠例如颜色编码的珠,和/或磁性或非磁性的珠,和/或羧化的珠,任选地,具有一种用于将抗体附着至珠的胺偶联试剂盒,
-任选地,藻红蛋白(PE)缀合的链霉亲和素以揭示生物素化的抗体,
-任选地,缓冲溶液,
-任选地,酶标板,和
-任选地,提供使用说明和用于解释结果的预期值的通知,和
-至少一对特异性寡核苷酸引物,其对与mtDNA杂交具有特异性,和/或
-至少两对对与DNA区域杂交具有特异性的特异性寡核苷酸引物,所述DNA区域分别编码PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质中的两种或更多种,以及任选地,对与幽门螺杆菌(H.pylori)核酸序列杂交具有特异性的至少一对特异性寡核苷酸引物或核酸分子,以及任选地,一种或多种以下试剂,
-核苷酸(例如dATP、dCTP、dGTP、dUTP),
-DNA聚合酶,特别是热稳定的DNA聚合酶,例如Taq DNA聚合酶,
-至少一种用于染色核酸的染料,特别是可在实时PCT设备中检测到的染料,
-任选地,至少一种缓冲溶液,
-任选地,引物与其靶点杂交所必需的试剂,
-任选地,参比染料。
21.一种包含至少两种对选自以下的蛋白质具有特异性的抗体或由至少两种对选自以下的蛋白质具有特异性的抗体组成的标志物集合:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质,以及任选地,对与mtDNA杂交具有特异性的至少一对特异性寡核苷酸引物或核酸分子,或者一种包含至少两对对与DNA区域杂交具有特异性的特异性寡核苷酸引物的标志物集合,所述DNA区域分别编码PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、EGFR、STAT3和MSLN蛋白质中的两种或更多种,以及任选地,对与mtDNA杂交具有特异性的至少一对特异性寡核苷酸引物或核酸分子,其适于实施权利要求1至17中任一项所限定的方法。
22.根据权利要求18至21中任一项所述的试剂盒或标志物集合用于确定人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验,或者用于预测或诊断胃癌前期病况或胃癌病况的用途,所述预测或诊断通过筛选先前从易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的人类患者中取出的血液或血浆的生物样本,特别是通过测量从易患易发展成胃癌病况的病况或易患胃癌前期病况或易患胃癌病况的人类患者中取出的生物血液或血浆样本中权利要求18至21中任一项所限定的至少两种标志物的水平。
23.一种由计算机执行用于研究人类患者是否具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验的方法,所述方法包括以下步骤:
a.接收至少两种选自以下的生物标志物的水平:PGK1、CFP、IGFALS、KRT19、SPRR1A、CPA4、CA2、SERPINA5、MAN2A1、KIF20B、SPEN、JUP、KRT6C、CDSN、KPRP、F13A1、SAA1(SAA2)、LBP、DSP、KRT2、KRT14、ARG1、S100A12、ATAD3B、MAN1A1、HAL、DCD、C7、HP、LEP、IL-8、IL-17、TNF-α、USF1、USF2、SELE、MSLN、EGFR、STAT3和mtDNA水平,条件是所选的生物标志物不由IL-8和mtDNA水平的关联组成,或者接收其确定在权利要求1至11中任一项中限定的至少两种生物标志物的任何水平,特别是在所述至少两种生物标志物的水平通过用于测量该水平的体外方法或适于测量该水平的装置测量的情况下,和
b.通过将步骤a中确定的水平与对照进行比较来处理所述水平,和
c.通过预定的决策规则、特别是与所确定的与研究的生物标志物相关联的灵敏度和/或特异性相关联的决策规则来确定步骤a中接收的水平是否会使测量其的人类患者具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验、特别是临床研究,特别是在步骤b中比较的至少两种生物标志物的水平偏离其对照的情况下,所述测量特别是通过用于测量步骤a中限定的水平的体外方法。
24.一种数据处理设备,其包括用于执行根据权利要求23所述的方法的机构,特别是执行根据权利要求23所述的方法的步骤b和/或步骤c的机构,或者包括适于/被配置成执行根据权利要求23所述的方法的处理器,特别是适于/被配置成执行根据权利要求23所述的方法的步骤b和/或步骤c的处理器。
25.根据权利要求24所述的数据处理设备,其包括:
-输入接口,其用于接收在权利要求23的步骤a中限定的至少两种生物标志物的水平,
-存储器,其用于至少存储计算机程序的指令,所述指令包括当程序由计算机或处理器执行时,使所述计算机执行根据权利要求23所述的方法的指令,任选地,用于存储控制数据和决策规则的存储器,
-处理器,其访问所述存储器以读取前述指令并执行根据权利要求23所述的方法,
-输出接口,其至少确定权利要求23的步骤a中限定的至少两种生物标志物的水平是否使测量其的人类患者具有使所述患者处于胃癌病况风险的病变和/或需要进一步的相关医学检验,特别是临床研究。
26.一种计算机程序,其包括指令,当所述程序由计算机或处理器执行时,所述指令使得所述计算机执行根据权利要求23所述的方法。
27.一种计算机可读介质,特别是一种计算机可读的非瞬态记录介质,其上存储有根据权利要求26所述的计算机程序,特别是当所述计算机程序由计算机或处理器执行时,其实施根据权利要求23所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20306649.3 | 2020-12-21 | ||
EP20306649 | 2020-12-21 | ||
PCT/EP2021/087155 WO2022136472A1 (en) | 2020-12-21 | 2021-12-21 | Biomarkers signature(s) for the prevention and early detection of gastric cancer |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116867911A true CN116867911A (zh) | 2023-10-10 |
Family
ID=74184396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180094230.7A Pending CN116867911A (zh) | 2020-12-21 | 2021-12-21 | 用于胃癌预防和早期发现的生物标志物特征 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240053343A1 (zh) |
EP (1) | EP4263872A1 (zh) |
JP (1) | JP2024502253A (zh) |
KR (1) | KR20230124671A (zh) |
CN (1) | CN116867911A (zh) |
CA (1) | CA3202252A1 (zh) |
WO (1) | WO2022136472A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118483437A (zh) * | 2024-07-15 | 2024-08-13 | 济南市中心医院 | 区分普通高血压与难治性高血压的生物标志物及其应用 |
CN118645252A (zh) * | 2024-08-16 | 2024-09-13 | 杭州和壹基因科技有限公司 | 基于深度学习的疾病风险评估方法及系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023183481A1 (en) * | 2022-03-23 | 2023-09-28 | Serum Detect, Inc. | Biomarker signatures indicative of early stages of cancer |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2857520A1 (en) | 2013-10-03 | 2015-04-08 | Institut Pasteur | Method for in vitro investigating mitochondrial dna levels in a biological sample, kits and uses thereof |
CN105572354B (zh) * | 2014-10-17 | 2018-02-02 | 广州瑞博奥生物科技有限公司 | 一种检测早期胃癌的抗体芯片试剂盒 |
-
2021
- 2021-12-21 CN CN202180094230.7A patent/CN116867911A/zh active Pending
- 2021-12-21 JP JP2023537677A patent/JP2024502253A/ja active Pending
- 2021-12-21 EP EP21844281.2A patent/EP4263872A1/en active Pending
- 2021-12-21 WO PCT/EP2021/087155 patent/WO2022136472A1/en active Application Filing
- 2021-12-21 US US18/258,271 patent/US20240053343A1/en active Pending
- 2021-12-21 KR KR1020237024923A patent/KR20230124671A/ko unknown
- 2021-12-21 CA CA3202252A patent/CA3202252A1/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118483437A (zh) * | 2024-07-15 | 2024-08-13 | 济南市中心医院 | 区分普通高血压与难治性高血压的生物标志物及其应用 |
CN118483437B (zh) * | 2024-07-15 | 2024-10-18 | 济南市中心医院 | 区分普通高血压与难治性高血压的生物标志物及其应用 |
CN118645252A (zh) * | 2024-08-16 | 2024-09-13 | 杭州和壹基因科技有限公司 | 基于深度学习的疾病风险评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2024502253A (ja) | 2024-01-18 |
CA3202252A1 (en) | 2022-06-30 |
EP4263872A1 (en) | 2023-10-25 |
KR20230124671A (ko) | 2023-08-25 |
US20240053343A1 (en) | 2024-02-15 |
WO2022136472A1 (en) | 2022-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200370127A1 (en) | Biomarkers in Peripheral Blood Mononuclear Cells for Diagnosing or Detecting Lung Cancers | |
US12060617B2 (en) | Marker genes for prostate cancer classification | |
CN116867911A (zh) | 用于胃癌预防和早期发现的生物标志物特征 | |
US20200249235A1 (en) | Methods for diagnosing pancreatic cancer | |
KR20080098055A (ko) | 암 검출을 위한 소변 유전자 발현 비율 | |
Di Meo et al. | Searching for prognostic biomarkers for small renal masses in the urinary proteome | |
GB2551415A (en) | Protein biomarker panels for detecting colorectal cancer and advanced adenoma | |
Montero-Calle et al. | Multiplexed biosensing diagnostic platforms detecting autoantibodies to tumor-associated antigens from exosomes released by CRC cells and tissue samples showed high diagnostic ability for colorectal cancer | |
JP5422785B2 (ja) | 質量分析法を利用した複数癌腫の血液検出のための方法および生物マーカー | |
JP2023508701A (ja) | 結腸直腸癌又は腺腫を検出するためのバイオマーカー及びその方法 | |
CN110229899B (zh) | 用于结直肠癌早期诊断或预后预测的血浆标记物组合 | |
He et al. | Serum soluble CD14 is a potential prognostic indicator of recurrence of human breast invasive ductal carcinoma with Her2-enriched subtype | |
WO2021030460A1 (en) | Proteogenomic methods for diagnosing cancer | |
Chen et al. | Identification of biomarkers to improve diagnostic sensitivity of sporadic colorectal cancer in patients with low preoperative serum carcinoembryonic antigen by clinical proteomic analysis | |
Kim et al. | For physicians managing voiding dysfunction, improving the detection rate of early prostate cancer and discrimination from benign prostatic hyperplasia, in a molecular biomarker aspects | |
Bregeon et al. | MALDI-ToF mass spectrometry for the rapid diagnosis of cancerous lung nodules | |
WO2017219093A1 (en) | Screening methods | |
JP5429725B1 (ja) | 前立腺癌の進行度の評価方法、前立腺癌の検出方法、および検査キット | |
Dang et al. | tRNA‐derived fragments are promising biomarkers for screening of early colorectal cancer | |
US20140256586A1 (en) | Methods and compositions for diagnosis of colorectal cancer | |
EP3736345A1 (en) | Genomic predictors of aggressive micropapillary bladder cancer | |
Hammoud et al. | Diagnosis of esophageal adenocarcinoma by serum proteomic pattern | |
KR101967100B1 (ko) | 대장암의 림프절 전이를 진단하기 위한 miRNA 분별자 및 이를 이용한 대장암에서 림프절 전이 진단 방법 | |
de Abreu et al. | 23P Unraveling predictive transcriptomic signatures of anti-EGFR therapy response in RAS/BRAF wild-type metastatic colorectal cancer | |
AU2022325178A1 (en) | Method of detecting adenoma |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |