CN117789993A - 基于舌苔代谢物的胃癌预测模型的建立和应用 - Google Patents
基于舌苔代谢物的胃癌预测模型的建立和应用 Download PDFInfo
- Publication number
- CN117789993A CN117789993A CN202410211261.1A CN202410211261A CN117789993A CN 117789993 A CN117789993 A CN 117789993A CN 202410211261 A CN202410211261 A CN 202410211261A CN 117789993 A CN117789993 A CN 117789993A
- Authority
- CN
- China
- Prior art keywords
- acid
- metabolite
- tongue fur
- gastric cancer
- tongue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000005718 Stomach Neoplasms Diseases 0.000 title claims abstract description 153
- 206010017758 gastric cancer Diseases 0.000 title claims abstract description 153
- 201000011549 stomach cancer Diseases 0.000 title claims abstract description 153
- 239000002207 metabolite Substances 0.000 claims abstract description 74
- 239000011248 coating agent Substances 0.000 claims abstract description 69
- 238000000576 coating method Methods 0.000 claims abstract description 69
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 239000000523 sample Substances 0.000 claims description 85
- WHBMMWSBFZVSSR-UHFFFAOYSA-N 3-hydroxybutyric acid Chemical compound CC(O)CC(O)=O WHBMMWSBFZVSSR-UHFFFAOYSA-N 0.000 claims description 40
- IAVREABSGIHHMO-UHFFFAOYSA-N 3-hydroxybenzaldehyde Chemical compound OC1=CC=CC(C=O)=C1 IAVREABSGIHHMO-UHFFFAOYSA-N 0.000 claims description 34
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims description 33
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 claims description 32
- FJKROLUGYXJWQN-UHFFFAOYSA-N 4-hydroxybenzoic acid Chemical compound OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 claims description 32
- -1 cholesteryl ketone Chemical class 0.000 claims description 31
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 claims description 29
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 claims description 29
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 28
- AXVZFRBSCNEKPQ-UHFFFAOYSA-N N-methyltyramine Chemical compound CNCCC1=CC=C(O)C=C1 AXVZFRBSCNEKPQ-UHFFFAOYSA-N 0.000 claims description 24
- MNLRQHMNZILYPY-MDMHTWEWSA-N N-acetyl-alpha-D-muramic acid Chemical compound OC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)O[C@H](O)[C@@H]1NC(C)=O MNLRQHMNZILYPY-MDMHTWEWSA-N 0.000 claims description 23
- QZZRQURPSRWTLG-UXCAXZQLSA-N 6beta-hydroxy-17beta-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3C[C@@H](O)C2=C1 QZZRQURPSRWTLG-UXCAXZQLSA-N 0.000 claims description 20
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 claims description 18
- WXNXCEHXYPACJF-ZETCQYMHSA-N N-acetyl-L-leucine Chemical compound CC(C)C[C@@H](C(O)=O)NC(C)=O WXNXCEHXYPACJF-ZETCQYMHSA-N 0.000 claims description 18
- UFAHZIUFPNSHSL-UHFFFAOYSA-N O-propanoylcarnitine Chemical compound CCC(=O)OC(CC([O-])=O)C[N+](C)(C)C UFAHZIUFPNSHSL-UHFFFAOYSA-N 0.000 claims description 18
- 229960000669 acetylleucine Drugs 0.000 claims description 18
- 229930182834 17alpha-Estradiol Natural products 0.000 claims description 17
- VOXZDWNPVJITMN-SFFUCWETSA-N 17α-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-SFFUCWETSA-N 0.000 claims description 17
- 229960000511 lactulose Drugs 0.000 claims description 17
- PFCRQPBOOFTZGQ-UHFFFAOYSA-N lactulose keto form Natural products OCC(=O)C(O)C(C(O)CO)OC1OC(CO)C(O)C(O)C1O PFCRQPBOOFTZGQ-UHFFFAOYSA-N 0.000 claims description 17
- XGTCGDUVXWLURC-FZNBEQTOSA-N (5Z,7E,9E,14Z,17Z)-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/CCC\C=C\C=C\C=C/CCCC(O)=O XGTCGDUVXWLURC-FZNBEQTOSA-N 0.000 claims description 16
- 229940090248 4-hydroxybenzoic acid Drugs 0.000 claims description 16
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 claims description 16
- SXKNCCSPZDCRFD-UHFFFAOYSA-N betaine aldehyde Chemical compound C[N+](C)(C)CC=O SXKNCCSPZDCRFD-UHFFFAOYSA-N 0.000 claims description 16
- JYGXADMDTFJGBT-VWUMJDOOSA-N hydrocortisone Chemical compound O=C1CC[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 JYGXADMDTFJGBT-VWUMJDOOSA-N 0.000 claims description 16
- 229940055726 pantothenic acid Drugs 0.000 claims description 16
- 235000019161 pantothenic acid Nutrition 0.000 claims description 16
- 239000011713 pantothenic acid Substances 0.000 claims description 16
- DTUQWGWMVIHBKE-UHFFFAOYSA-N phenylacetaldehyde Chemical compound O=CCC1=CC=CC=C1 DTUQWGWMVIHBKE-UHFFFAOYSA-N 0.000 claims description 16
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 15
- 239000004473 Threonine Substances 0.000 claims description 15
- JCQLYHFGKNRPGE-FCVZTGTOSA-N lactulose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 JCQLYHFGKNRPGE-FCVZTGTOSA-N 0.000 claims description 15
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 14
- 229940031098 ethanolamine Drugs 0.000 claims description 14
- 238000011282 treatment Methods 0.000 claims description 14
- 239000000203 mixture Substances 0.000 claims description 13
- UZTFMUBKZQVKLK-UHFFFAOYSA-N 4-acetamidobutanoic acid Chemical compound CC(=O)NCCCC(O)=O UZTFMUBKZQVKLK-UHFFFAOYSA-N 0.000 claims description 12
- QGXBDMJGAMFCBF-HLUDHZFRSA-N 5α-Androsterone Chemical compound C1[C@H](O)CC[C@]2(C)[C@H]3CC[C@](C)(C(CC4)=O)[C@@H]4[C@@H]3CC[C@H]21 QGXBDMJGAMFCBF-HLUDHZFRSA-N 0.000 claims description 12
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 claims description 12
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 claims description 12
- QGXBDMJGAMFCBF-UHFFFAOYSA-N Etiocholanolone Natural products C1C(O)CCC2(C)C3CCC(C)(C(CC4)=O)C4C3CCC21 QGXBDMJGAMFCBF-UHFFFAOYSA-N 0.000 claims description 12
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 12
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 12
- 229930195725 Mannitol Natural products 0.000 claims description 12
- 229930006000 Sucrose Natural products 0.000 claims description 12
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 12
- 229940061641 androsterone Drugs 0.000 claims description 12
- 239000000594 mannitol Substances 0.000 claims description 12
- 235000010355 mannitol Nutrition 0.000 claims description 12
- 239000005720 sucrose Substances 0.000 claims description 12
- LKDRXBCSQODPBY-AMVSKUEXSA-N L-(-)-Sorbose Chemical compound OCC1(O)OC[C@H](O)[C@@H](O)[C@@H]1O LKDRXBCSQODPBY-AMVSKUEXSA-N 0.000 claims description 11
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 claims description 11
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 claims description 11
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 claims description 11
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 claims description 11
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 claims description 11
- LGRFSURHDFAFJT-UHFFFAOYSA-N Phthalic anhydride Natural products C1=CC=C2C(=O)OC(=O)C2=C1 LGRFSURHDFAFJT-UHFFFAOYSA-N 0.000 claims description 11
- JHIWVOJDXOSYLW-UHFFFAOYSA-N butyl 2,2-difluorocyclopropane-1-carboxylate Chemical compound CCCCOC(=O)C1CC1(F)F JHIWVOJDXOSYLW-UHFFFAOYSA-N 0.000 claims description 11
- 229960002173 citrulline Drugs 0.000 claims description 11
- 235000013477 citrulline Nutrition 0.000 claims description 11
- 229960003104 ornithine Drugs 0.000 claims description 11
- DEFJQIDDEAULHB-QWWZWVQMSA-N D-alanyl-D-alanine Chemical compound C[C@@H]([NH3+])C(=O)N[C@H](C)C([O-])=O DEFJQIDDEAULHB-QWWZWVQMSA-N 0.000 claims description 10
- DEFJQIDDEAULHB-UHFFFAOYSA-N N-D-alanyl-D-alanine Natural products CC(N)C(=O)NC(C)C(O)=O DEFJQIDDEAULHB-UHFFFAOYSA-N 0.000 claims description 10
- 108010056243 alanylalanine Proteins 0.000 claims description 10
- QWCKQJZIFLGMSD-UHFFFAOYSA-N alpha-aminobutyric acid Chemical compound CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 claims description 10
- QQHJDPROMQRDLA-UHFFFAOYSA-N hexadecanedioic acid Chemical class OC(=O)CCCCCCCCCCCCCCC(O)=O QQHJDPROMQRDLA-UHFFFAOYSA-N 0.000 claims description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 10
- QZIGLSSUDXBTLJ-ZBRFXRBCSA-N 17beta-estradiol 3-sulfate Chemical compound OS(=O)(=O)OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 QZIGLSSUDXBTLJ-ZBRFXRBCSA-N 0.000 claims description 9
- MBIQENSCDNJOIY-UHFFFAOYSA-N 2-hydroxy-2-methylbutyric acid Chemical compound CCC(C)(O)C(O)=O MBIQENSCDNJOIY-UHFFFAOYSA-N 0.000 claims description 8
- LSBDFXRDZJMBSC-UHFFFAOYSA-N 2-phenylacetamide Chemical compound NC(=O)CC1=CC=CC=C1 LSBDFXRDZJMBSC-UHFFFAOYSA-N 0.000 claims description 8
- XHFURSFUHFDPTB-UHFFFAOYSA-N 3-Dimethylallyl-4-hydroxybenzaldehyde Chemical compound CC(C)=CCC1=CC(C=O)=CC=C1O XHFURSFUHFDPTB-UHFFFAOYSA-N 0.000 claims description 8
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 claims description 8
- KXDAEFPNCMNJSK-UHFFFAOYSA-N Benzamide Chemical compound NC(=O)C1=CC=CC=C1 KXDAEFPNCMNJSK-UHFFFAOYSA-N 0.000 claims description 8
- MDSUKZSLOATHMH-UHFFFAOYSA-N Leucyl-Valine Chemical compound CC(C)CC(N)C(=O)NC(C(C)C)C(O)=O MDSUKZSLOATHMH-UHFFFAOYSA-N 0.000 claims description 8
- RFMMMVDNIPUKGG-YFKPBYRVSA-N N-acetyl-L-glutamic acid Chemical compound CC(=O)N[C@H](C(O)=O)CCC(O)=O RFMMMVDNIPUKGG-YFKPBYRVSA-N 0.000 claims description 8
- DCICDMMXFIELDF-UHFFFAOYSA-N N-isobutyrylglycine Chemical compound CC(C)C(=O)NCC(O)=O DCICDMMXFIELDF-UHFFFAOYSA-N 0.000 claims description 8
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 claims description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 8
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 8
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 claims description 8
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 claims description 8
- CBOQJANXLMLOSS-UHFFFAOYSA-N ethyl vanillin Chemical compound CCOC1=CC(C=O)=CC=C1O CBOQJANXLMLOSS-UHFFFAOYSA-N 0.000 claims description 8
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 claims description 8
- HHLFWLYXYJOTON-UHFFFAOYSA-N glyoxylic acid Chemical compound OC(=O)C=O HHLFWLYXYJOTON-UHFFFAOYSA-N 0.000 claims description 8
- 229960000890 hydrocortisone Drugs 0.000 claims description 8
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 claims description 8
- 239000011259 mixed solution Substances 0.000 claims description 8
- 229940100595 phenylacetaldehyde Drugs 0.000 claims description 8
- DIJBBUIOWGGQOP-QGVNFLHTSA-N pregnenolone sulfate Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 DIJBBUIOWGGQOP-QGVNFLHTSA-N 0.000 claims description 8
- KIDHWZJUCRJVML-UHFFFAOYSA-N putrescine Chemical compound NCCCCN KIDHWZJUCRJVML-UHFFFAOYSA-N 0.000 claims description 8
- DUYSYHSSBDVJSM-KRWOKUGFSA-N sphingosine 1-phosphate Chemical compound CCCCCCCCCCCCC\C=C\[C@@H](O)[C@@H](N)COP(O)(O)=O DUYSYHSSBDVJSM-KRWOKUGFSA-N 0.000 claims description 7
- WBYWAXJHAXSJNI-VOTSOKGWSA-M .beta-Phenylacrylic acid Natural products [O-]C(=O)\C=C\C1=CC=CC=C1 WBYWAXJHAXSJNI-VOTSOKGWSA-M 0.000 claims description 6
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 claims description 6
- 229930016911 cinnamic acid Natural products 0.000 claims description 6
- 235000013985 cinnamic acid Nutrition 0.000 claims description 6
- 229930182470 glycoside Natural products 0.000 claims description 6
- SUMDYPCJJOFFON-UHFFFAOYSA-N isethionic acid Chemical compound OCCS(O)(=O)=O SUMDYPCJJOFFON-UHFFFAOYSA-N 0.000 claims description 6
- WBYWAXJHAXSJNI-UHFFFAOYSA-N methyl p-hydroxycinnamate Natural products OC(=O)C=CC1=CC=CC=C1 WBYWAXJHAXSJNI-UHFFFAOYSA-N 0.000 claims description 6
- 239000002244 precipitate Substances 0.000 claims description 6
- ZMJGSOSNSPKHNH-UHFFFAOYSA-N pyridoxamine 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(CN)=C1O ZMJGSOSNSPKHNH-UHFFFAOYSA-N 0.000 claims description 6
- 238000009210 therapy by ultrasound Methods 0.000 claims description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 6
- RUDATBOHQWOJDD-UHFFFAOYSA-N (3beta,5beta,7alpha)-3,7-Dihydroxycholan-24-oic acid Natural products OC1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)CC2 RUDATBOHQWOJDD-UHFFFAOYSA-N 0.000 claims description 5
- DBPWSSGDRRHUNT-UHFFFAOYSA-N 17alpha-hydroxy progesterone Natural products C1CC2=CC(=O)CCC2(C)C2C1C1CCC(C(=O)C)(O)C1(C)CC2 DBPWSSGDRRHUNT-UHFFFAOYSA-N 0.000 claims description 5
- NGSWKAQJJWESNS-ZZXKWVIFSA-M 4-Hydroxycinnamate Natural products OC1=CC=C(\C=C\C([O-])=O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-M 0.000 claims description 5
- YBGZDTIWKVFICR-JLHYYAGUSA-N Octyl 4-methoxycinnamic acid Chemical compound CCCCC(CC)COC(=O)\C=C\C1=CC=C(OC)C=C1 YBGZDTIWKVFICR-JLHYYAGUSA-N 0.000 claims description 5
- 229950000801 hydroxyprogesterone caproate Drugs 0.000 claims description 5
- 229960001679 octinoxate Drugs 0.000 claims description 5
- 239000006228 supernatant Substances 0.000 claims description 5
- NGSWKAQJJWESNS-ZZXKWVIFSA-N trans-4-coumaric acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-N 0.000 claims description 5
- RUDATBOHQWOJDD-UZVSRGJWSA-N ursodeoxycholic acid Chemical compound C([C@H]1C[C@@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)CC1 RUDATBOHQWOJDD-UZVSRGJWSA-N 0.000 claims description 5
- 229960001661 ursodiol Drugs 0.000 claims description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 4
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 claims description 4
- UCTWMZQNUQWSLP-VIFPVBQESA-N (R)-adrenaline Chemical compound CNC[C@H](O)C1=CC=C(O)C(O)=C1 UCTWMZQNUQWSLP-VIFPVBQESA-N 0.000 claims description 4
- 229930182837 (R)-adrenaline Natural products 0.000 claims description 4
- ADFXKUOMJKEIND-UHFFFAOYSA-N 1,3-dicyclohexylurea Chemical compound C1CCCCC1NC(=O)NC1CCCCC1 ADFXKUOMJKEIND-UHFFFAOYSA-N 0.000 claims description 4
- MSFSPUZXLOGKHJ-PGYHGBPZSA-N 2-amino-3-O-[(R)-1-carboxyethyl]-2-deoxy-D-glucopyranose Chemical compound OC(=O)[C@@H](C)O[C@@H]1[C@@H](N)C(O)O[C@H](CO)[C@H]1O MSFSPUZXLOGKHJ-PGYHGBPZSA-N 0.000 claims description 4
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 claims description 4
- HBDWQSHEVMSFGY-SCQFTWEKSA-N 4-hydroxy-L-glutamic acid Chemical compound OC(=O)[C@@H](N)CC(O)C(O)=O HBDWQSHEVMSFGY-SCQFTWEKSA-N 0.000 claims description 4
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 claims description 4
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 claims description 4
- 229930024421 Adenine Natural products 0.000 claims description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 4
- 239000005711 Benzoic acid Substances 0.000 claims description 4
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 claims description 4
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 claims description 4
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 claims description 4
- QXKAIJAYHKCRRA-BXXZVTAOSA-N D-ribonic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)C(O)=O QXKAIJAYHKCRRA-BXXZVTAOSA-N 0.000 claims description 4
- 239000008777 Glycerylphosphorylcholine Substances 0.000 claims description 4
- RQNSKRXMANOPQY-UHFFFAOYSA-N L-L-gamma-Glutamylmethionine Natural products CSCCC(C(O)=O)NC(=O)CCC(N)C(O)=O RQNSKRXMANOPQY-UHFFFAOYSA-N 0.000 claims description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 4
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 claims description 4
- DEGCDQUOHKYOQM-WDSKDSINSA-N N(5)-(L-1-carboxyethyl)-L-ornithine Chemical compound [O-]C(=O)[C@H](C)[NH2+]CCC[C@H]([NH3+])C([O-])=O DEGCDQUOHKYOQM-WDSKDSINSA-N 0.000 claims description 4
- DTERQYGMUDWYAZ-ZETCQYMHSA-N N(6)-acetyl-L-lysine Chemical compound CC(=O)NCCCC[C@H]([NH3+])C([O-])=O DTERQYGMUDWYAZ-ZETCQYMHSA-N 0.000 claims description 4
- PYUSHNKNPOHWEZ-YFKPBYRVSA-N N-formyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC=O PYUSHNKNPOHWEZ-YFKPBYRVSA-N 0.000 claims description 4
- SAVLIIGUQOSOEP-UHFFFAOYSA-N N-octanoylglycine Chemical compound CCCCCCCC(=O)NCC(O)=O SAVLIIGUQOSOEP-UHFFFAOYSA-N 0.000 claims description 4
- 239000005642 Oleic acid Substances 0.000 claims description 4
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 claims description 4
- 239000005700 Putrescine Substances 0.000 claims description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 4
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 claims description 4
- INOFNEWQYCGESC-UHFFFAOYSA-N acetic acid;chromen-2-one Chemical compound CC(O)=O.C1=CC=C2OC(=O)C=CC2=C1 INOFNEWQYCGESC-UHFFFAOYSA-N 0.000 claims description 4
- 229960000643 adenine Drugs 0.000 claims description 4
- 229910000147 aluminium phosphate Inorganic materials 0.000 claims description 4
- 235000003704 aspartic acid Nutrition 0.000 claims description 4
- 235000010233 benzoic acid Nutrition 0.000 claims description 4
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 claims description 4
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 4
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 claims description 4
- SUHOQUVVVLNYQR-MRVPVSSYSA-N choline alfoscerate Chemical compound C[N+](C)(C)CCOP([O-])(=O)OC[C@H](O)CO SUHOQUVVVLNYQR-MRVPVSSYSA-N 0.000 claims description 4
- 229940109239 creatinine Drugs 0.000 claims description 4
- 150000002148 esters Chemical class 0.000 claims description 4
- FJAZVHYPASAQKM-JBAURARKSA-N estrone 3-O-(beta-D-glucuronide) Chemical compound C([C@@H]1[C@@H](C2=CC=3)CC[C@]4([C@H]1CCC4=O)C)CC2=CC=3O[C@@H]1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O FJAZVHYPASAQKM-JBAURARKSA-N 0.000 claims description 4
- 229960003692 gamma aminobutyric acid Drugs 0.000 claims description 4
- JBFYFLXEJFQWMU-WDSKDSINSA-N gamma-Glu-Gln Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@H](C(O)=O)CCC(N)=O JBFYFLXEJFQWMU-WDSKDSINSA-N 0.000 claims description 4
- RQNSKRXMANOPQY-BQBZGAKWSA-N gamma-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CC[C@H](N)C(O)=O RQNSKRXMANOPQY-BQBZGAKWSA-N 0.000 claims description 4
- JZNLEPLZUABCSQ-ZETCQYMHSA-N gamma-glutamyl-gamma-aminobutyraldehyde zwitterion Chemical compound OC(=O)[C@@H](N)CCC(=O)NCCCC=O JZNLEPLZUABCSQ-ZETCQYMHSA-N 0.000 claims description 4
- 108010002568 gamma-glutamylglutamine Proteins 0.000 claims description 4
- 229960004956 glycerylphosphorylcholine Drugs 0.000 claims description 4
- 239000003617 indole-3-acetic acid Substances 0.000 claims description 4
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 claims description 4
- 229930182817 methionine Natural products 0.000 claims description 4
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 claims description 4
- FZUGPQWGEGAKET-UHFFFAOYSA-N parbenate Chemical compound CCOC(=O)C1=CC=C(N(C)C)C=C1 FZUGPQWGEGAKET-UHFFFAOYSA-N 0.000 claims description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N phosphoric acid Substances OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 claims description 4
- 229960004838 phosphoric acid Drugs 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 229960002898 threonine Drugs 0.000 claims description 4
- 229940104230 thymidine Drugs 0.000 claims description 4
- 229940035893 uracil Drugs 0.000 claims description 4
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 4
- 229940045145 uridine Drugs 0.000 claims description 4
- 239000004474 valine Substances 0.000 claims description 4
- 239000004475 Arginine Substances 0.000 claims description 3
- LJCWONGJFPCTTL-SSDOTTSWSA-N D-4-hydroxyphenylglycine Chemical compound [O-]C(=O)[C@H]([NH3+])C1=CC=C(O)C=C1 LJCWONGJFPCTTL-SSDOTTSWSA-N 0.000 claims description 3
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 claims description 3
- 125000000030 D-alanine group Chemical group [H]N([H])[C@](C([H])([H])[H])(C(=O)[*])[H] 0.000 claims description 3
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 claims description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 3
- 229940000635 beta-alanine Drugs 0.000 claims description 3
- 229940045996 isethionic acid Drugs 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000012488 sample solution Substances 0.000 claims description 3
- 229940113082 thymine Drugs 0.000 claims description 3
- OLLPXZHNCXACMM-CMDGGOBGSA-N Propyl cinnamate Chemical compound CCCOC(=O)\C=C\C1=CC=CC=C1 OLLPXZHNCXACMM-CMDGGOBGSA-N 0.000 claims description 2
- 238000001035 drying Methods 0.000 claims description 2
- 150000002576 ketones Chemical class 0.000 claims description 2
- 239000001572 propyl (E)-3-phenylprop-2-enoate Substances 0.000 claims description 2
- DOMWKUIIPQCAJU-LJHIYBGHSA-N Hydroxyprogesterone caproate Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@@](C(C)=O)(OC(=O)CCCCC)[C@@]1(C)CC2 DOMWKUIIPQCAJU-LJHIYBGHSA-N 0.000 claims 2
- DSLZVSRJTYRBFB-UHFFFAOYSA-N Galactaric acid Natural products OC(=O)C(O)C(O)C(O)C(O)C(O)=O DSLZVSRJTYRBFB-UHFFFAOYSA-N 0.000 claims 1
- 239000002253 acid Substances 0.000 claims 1
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 claims 1
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 claims 1
- YHHSONZFOIEMCP-UHFFFAOYSA-O phosphocholine Chemical compound C[N+](C)(C)CCOP(O)(O)=O YHHSONZFOIEMCP-UHFFFAOYSA-O 0.000 claims 1
- 239000000600 sorbitol Substances 0.000 claims 1
- 238000013103 analytical ultracentrifugation Methods 0.000 description 29
- 238000010200 validation analysis Methods 0.000 description 26
- 238000012549 training Methods 0.000 description 19
- 239000000090 biomarker Substances 0.000 description 12
- 230000001105 regulatory effect Effects 0.000 description 12
- 210000002381 plasma Anatomy 0.000 description 10
- 102000012406 Carcinoembryonic Antigen Human genes 0.000 description 9
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 description 9
- 206010028980 Neoplasm Diseases 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 238000000513 principal component analysis Methods 0.000 description 7
- DBPWSSGDRRHUNT-CEGNMAFCSA-N 17α-hydroxyprogesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@@](C(=O)C)(O)[C@@]1(C)CC2 DBPWSSGDRRHUNT-CEGNMAFCSA-N 0.000 description 6
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical group CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- QADHLRWLCPCEKT-UHFFFAOYSA-N Androstenediol Natural products C1C(O)CCC2(C)C3CCC(C)(C(CC4)O)C4C3CC=C21 QADHLRWLCPCEKT-UHFFFAOYSA-N 0.000 description 6
- SRBFZHDQGSBBOR-STGXQOJASA-N alpha-D-lyxopyranose Chemical compound O[C@@H]1CO[C@H](O)[C@@H](O)[C@H]1O SRBFZHDQGSBBOR-STGXQOJASA-N 0.000 description 6
- QADHLRWLCPCEKT-LOVVWNRFSA-N androst-5-ene-3beta,17beta-diol Chemical compound C1[C@@H](O)CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CC=C21 QADHLRWLCPCEKT-LOVVWNRFSA-N 0.000 description 6
- 229950009148 androstenediol Drugs 0.000 description 6
- 238000002347 injection Methods 0.000 description 6
- 239000007924 injection Substances 0.000 description 6
- 150000002500 ions Chemical class 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 5
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 150000001720 carbohydrates Chemical class 0.000 description 5
- 235000014633 carbohydrates Nutrition 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 5
- IPCSVZSSVZVIGE-SAQPIRCFSA-N 2,2,3,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15,16,16,16-hentriacontadeuteriohexadecanoic acid Chemical compound [2H]C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C([2H])([2H])C(O)=O IPCSVZSSVZVIGE-SAQPIRCFSA-N 0.000 description 4
- 241000590002 Helicobacter pylori Species 0.000 description 4
- 208000007107 Stomach Ulcer Diseases 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 230000002496 gastric effect Effects 0.000 description 4
- 201000005917 gastric ulcer Diseases 0.000 description 4
- 229940037467 helicobacter pylori Drugs 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 208000023984 stomach polyp Diseases 0.000 description 4
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 3
- RPXHXZNGZBHSMJ-UHFFFAOYSA-N 2-azaniumylethyl (2-hydroxy-3-tetradecanoyloxypropyl) phosphate Chemical compound CCCCCCCCCCCCCC(=O)OCC(O)COP(O)(=O)OCCN RPXHXZNGZBHSMJ-UHFFFAOYSA-N 0.000 description 3
- FFEARJCKVFRZRR-OSIBIXDNSA-N L-methionine-d3 Chemical compound [2H]C([2H])([2H])SCC[C@H](N)C(O)=O FFEARJCKVFRZRR-OSIBIXDNSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- ADZLWSMFHHHOBV-BYPYZUCNSA-N N-formyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC=O ADZLWSMFHHHOBV-BYPYZUCNSA-N 0.000 description 3
- 241000218657 Picea Species 0.000 description 3
- KRNYOVHEKOBTEF-YUMQZZPRSA-N Val-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O KRNYOVHEKOBTEF-YUMQZZPRSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 238000002575 gastroscopy Methods 0.000 description 3
- 150000002338 glycosides Chemical class 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 229950004354 phosphorylcholine Drugs 0.000 description 3
- PYJNAPOPMIJKJZ-UHFFFAOYSA-N phosphorylcholine chloride Chemical compound [Cl-].C[N+](C)(C)CCOP(O)(O)=O PYJNAPOPMIJKJZ-UHFFFAOYSA-N 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 229960002920 sorbitol Drugs 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 238000004885 tandem mass spectrometry Methods 0.000 description 3
- 108010021889 valylvaline Proteins 0.000 description 3
- JCQLYHFGKNRPGE-WJONTELPSA-N (2s,3r,4s,5r,6r)-2-[(2r,3s,4s,5s)-4,5-dihydroxy-2,5-bis(hydroxymethyl)oxolan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound OC[C@H]1O[C@@](O)(CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 JCQLYHFGKNRPGE-WJONTELPSA-N 0.000 description 2
- 229940024606 amino acid Drugs 0.000 description 2
- 235000001014 amino acid Nutrition 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001066 destructive effect Effects 0.000 description 2
- 230000035622 drinking Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000013062 quality control Sample Substances 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000000391 smoking effect Effects 0.000 description 2
- QKRMFCXDTFLKKT-UHFFFAOYSA-N 2-hydroxyethanesulfonic acid Chemical compound OCCS(O)(=O)=O.OCCS(O)(=O)=O QKRMFCXDTFLKKT-UHFFFAOYSA-N 0.000 description 1
- QGXBDMJGAMFCBF-BNSUEQOYSA-N 3alpha-hydroxy-5beta-androstan-17-one Chemical compound C1[C@H](O)CC[C@]2(C)[C@H]3CC[C@](C)(C(CC4)=O)[C@@H]4[C@@H]3CC[C@@H]21 QGXBDMJGAMFCBF-BNSUEQOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 208000005189 Embolism Diseases 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- 230000007412 host metabolism Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000037427 ion transport Effects 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000010208 microarray analysis Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- LISFMEBWQUVKPJ-UHFFFAOYSA-N quinolin-2-ol Chemical compound C1=CC=C2NC(=O)C=CC2=C1 LISFMEBWQUVKPJ-UHFFFAOYSA-N 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 1
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 1
- 229940054967 vanquish Drugs 0.000 description 1
- 206010055031 vascular neoplasm Diseases 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及胃癌预测技术领域,公开了基于舌苔代谢物的胃癌预测模型的建立和应用。步骤S1:采集舌苔代谢物作为样本;步骤S2:对样本进行分析,获得舌苔代谢物样本数据集;舌苔代谢物样本数据集包括M个舌苔代谢物样本数据子集,每个舌苔代谢物样本数据子集包含舌苔代谢物中各组分的丰度数据;步骤S3:数据前处理,针对舌苔代谢物样本数据集进行前处理,得到最终舌苔代谢物样本数据集;步骤S4:将最终舌苔代谢物样本数据集输入胃癌预测模型,得到最终胃癌患病概率。采集舌苔代谢物对人体无损,受试者接受度好,预测准确度高。根据预测精度要求灵活选择采集舌苔代谢物各组分的组合,提升预测模型的便捷性、易用性。
Description
技术领域
本发明涉及胃癌预测技术领域,尤其涉及基于舌苔代谢物的胃癌预测模型的建立和应用。
背景技术
胃癌是全球范围内最常见的恶性肿瘤之一,严重危害人类健康。由于胃癌缺乏早期的显著症状,其在诊断时往往处于晚期,导致死亡率很高。胃癌早期筛查依赖于胃镜的检查,而胃镜检查依赖于仪器和专业医师,同时面临患者依从性较差的问题,严重限制胃癌的诊断,尤其是限制胃癌早期的筛查。因此开发非侵入性的新型胃癌筛查工具至关重要。
代谢组学是一种强有力的生物标志物挖掘工具,以代谢物作为代表,是所有小分子化合物的集合,可以表征生理或疾病新陈代谢动态系统的最下游阶段,其优势在于能够提供关于生物体内部代谢状态的全面信息,从而揭示疾病发展的微妙变化。癌症对宿主的新陈代谢产生广泛的影响,肿瘤细胞代谢重编程促进其增殖和改变肿瘤免疫微环境,同时某些代谢物直接促进癌症的进展和发生。
因此,亟需一种基于舌苔代谢物的胃癌预测模型,用于提升胃癌预测的准确率。
发明内容
为了解决上述技术问题,本发明提供了基于舌苔代谢物的胃癌预测模型的建立方法,以提升胃癌预测的准确率,包括如下步骤:
步骤S1:采集舌苔代谢物作为样本;
步骤S2:对所述样本进行分析,获得舌苔代谢物样本数据集,所述舌苔代谢物样本数据集包括M个舌苔代谢物样本数据子集,每个舌苔代谢物样本数据子集包含舌苔代谢物中各组分的丰度数据,舌苔代谢物的组分包括:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺;
步骤S3:数据前处理,针对所述舌苔代谢物样本数据集进行前处理,得到最终舌苔代谢物样本数据集;
步骤S4:将所述最终舌苔代谢物样本数据集输入胃癌预测模型,得到最终胃癌患病概率。
优选地,所述舌苔代谢物的组分还包括:本胆烷醇酮、3-羟基苯甲醛、3-羟基丁酸、6β-羟基-17β-雌二醇、N-乙酰胞壁酸。
优选地,所述舌苔代谢物的组分还可以是:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺、N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮、泛酸、甜菜碱醛、3 -羟基苯甲醛、3-羟基丁酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、N-乙酰胞壁酸。
优选地,所述舌苔代谢物的组分还包括:N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮、苏氨酸亮氨酸、D-丙氨酰-D-丙氨酸、蔗糖、邻苯二甲酸酐、N-甲基酪胺、丁酸、泛酸、甜菜碱醛、甘露醇、3-羟基苯甲醛、3-羟基丁酸、4-乙酰氨丁酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、普糖、N-乙酰胞壁酸、山梨糖。
优选地,所述舌苔代谢物的组分还可以是:N-乙酰-亮氨酸、N-乙酰-D-半乳糖胺[M+H-H2O]+、丙酰肉碱、本胆烷醇酮、17α-雌二醇、N-乙酰-D-半乳糖胺、左旋肾上腺素、‘丙基肉桂酸酯;3-二甲基烯丙基-4-羟基苯甲醛’、17α-羟基孕酮、乳果糖、苏氨酸亮氨酸、精氨酸-丙氨酸、皮质醇、D-丙氨酰、D-丙氨酸、雄酮、蔗糖、2-羟基-2-甲基丁酸、邻苯二甲酸酐、N-甲基酪胺、雌二醇-17β 3-硫酸酯、丙氨酰-亮氨酸、亮氨酰-缬氨酸、4-氨基-4-脱氧鸟苷、胸腺嘧啶、β-羟基苯乙醛、苯乙醛、β-丙氨酸、对羟基肉桂醇糖苷、泛酸、甜菜碱醛、甘露醇、β-羟基苯甲醛、蛋氨酸、熊去氧胆酸、β-羟基丁酸、异丁酰甘氨酸、4-乙酰氨丁酸、正十六烷二酸二酸盐;十六烷二酸盐、精氨酸、鸟氨酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、来普糖、N-乙酰胞壁酸、山梨糖。
优选地,所述舌苔代谢物的组分还包括:N-乙酰-D-半乳糖胺[M+H-H2O]+(N-Acetyl-D-galactosamine [M+H-H2O]+)、本胆烷醇酮(Etiocholanone)、N-乙酰半糖胺、左旋间羟肾上腺素、‘丙基肉桂酸酯;3-二甲基烯丙基-4-羟基苯甲醛’、17α-羟基孕酮、苏氨酸亮氨酸(Threonylleucine)、瓜氨酸、N-乙酰胞壁酸、胞壁酸、‘精氨酸-丙氨酸’、 甲基亮氨酸酯、皮质醇、乙基-4-二甲基氨基苯甲酸酯(Ethyl-4-dimethylaminobenzoate)、D-丙氨酰-D-丙氨酸、雄甾酮(Androsterone)、云杉苷、蔗糖、2-羟基-2-甲基丁酸、邻苯二甲酸酐、N-甲基酪胺、17β-雌二醇-3-硫酸酯(Estradiol-17beta 3-sulfate)、丙氨酰-亮氨酸、腺嘌呤、缬氨酸-缬氨酸(Valylvaline)、γ-谷氨酰-γ-氨基丁醛、亮氨酰-缬氨酸、‘4-氨基-4-脱氧鸟苷;胸苷’、 3β-羟基孕-5-烯-20-酮硫酸酯(3beta-Hydroxypregn-5-en-20-onesulfate)、正丁酸、雌酮葡糖苷酸、辛基甲氧肉桂酸酯、γ-谷氨酰谷氨酰胺、N-辛酰甘氨酸、苯甲酰胺、苯乙醛、N-ε-乙酰赖氨酸、香豆酰基鸟氨酸、1,3-二环己基脲、N5-(L-1-羧乙基)-L-鸟氨酸、2-氨基丁酸、尿嘧啶、4-羟肉桂醇4-D-葡萄糖苷、‘安沙明;香豆素醋酸盐’、磷酸胆碱(LPE 14:0)、泛酸、甜菜碱醛、甘露醇、肌酐、腐胺、丙烯酰胺、鞘氨醇1-磷酸酯(Sphingosine 1-phosphate)、吲哚乙酸、2-苯乙酰胺、3-乙氧基-4-羟基苯甲醛、3-羟基苯甲醛、γ-谷氨酰基蛋氨酸、甲酰甲硫氨酸、磷酸吡哆胺、苯、天冬氨酸、苯甲酸、4-羟基-L-谷氨酸、羟乙基磺酸(isethionic acid)、D-核糖酸、丝氨酸、3-羟基丁酸、甘油磷酰胆碱、L-羟基赖氨酸、4-羟基苯基甘氨酸、4-羟基粘液酸、雄甾二醇(Androstenediol)、异丁酰甘氨酸、4-乙酰胺基丁酸、乙醛酸、N-乙酰-L-谷氨酸 5-磷酸、尿苷、鸟氨酸、十六烷二酸、油酸、瓜氨酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、琥珀酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、4-氨基丁酸、N-甲酰基-L-谷氨酸、来普糖(LYXOSE)、N-乙酰半乳糖胺、N-乙酰胞壁酸、山梨糖、D-山梨糖醇。
优选地,所述步骤S3中,针对所述舌苔代谢物样本数据集进行前处理,得到最终舌苔代谢物样本数据集,包括:
确定所述每个舌苔代谢物样本数据子集的缺失值个数;
剔除所述缺失值个数超过缺失值阈值的舌苔代谢物样本数据子集,得到符合缺失值要求的舌苔代谢物样本数据子集;
对符合缺失值要求的舌苔代谢物样本数据子集进行插补,得到插补后的舌苔代谢物样本数据集;
针对插补后的舌苔代谢物样本数据集进行归一化处理,获得最终舌苔代谢物样本数据集。
优选地,所述步骤S1中采集舌苔代谢物包括:
将采集的舌苔代谢物溶于水和甲醇的混合溶液中,所述水和甲醇的混合溶液体积比为1:3,采集的舌苔代谢物、水和甲醇的混合溶液以及内标共计700 μL,进行涡旋处理30秒,涡旋处理后于 4℃下超声处理10 min,在-20 ℃下静置2 h;
静置结束后,在13500 rpm的转速下离心处理10 min,取450 μL上清液,将所述上清液在25 ℃下挥发干燥,得到沉淀物;
在所述沉淀物中加入2 %浓度的甲醇100 μL进行复溶,再涡旋处理30 s,涡旋处理完毕后超声处理10 min,获得舌苔代谢物样品溶液。
本发明还提供上述任一种建立方法建立的基于舌苔代谢物的胃癌预测模型在胃癌预测中的应用。
本发明实施例具有以下技术效果:
1.本发明提供了基于舌苔代谢物的胃癌预测模型的建立方法,采集舌苔代谢物,获取样本数据集,使用该样本数据集对胃癌进行预测,对人体无损,相比其他有损检测,提升患者体验感和接受度。
2.本发明选择舌苔代谢物组分中的N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺进行胃癌预测,进一步提升了预测准确率。
3.本发明中输入胃癌预测模型的样本数据,还可以根据预测精度要求灵活选择,精度要求高时选择较多组分的组合作为样本数据,精度要求较低时选择较少组分的组合作为样本数据,提升预测模型的便捷性、易用性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明提供的基于舌苔代谢物的胃癌预测模型的建立方法的流程图;
图2是本发明实施例中将内标L-甲硫氨酸-甲基-d3加标到单个样品中峰面积的相对标准偏差展示图;
图3是本发明实施例中将内标棕榈酸-d31加标到单个样品中峰面积的相对标准偏差展示图;
图4是本发明实施例中质控样品(混合样本)在正极模式下的PCA图;
图5是本发明实施例中质控样品(混合样本)在负极模式下的PCA图;
图6是本发明实施例中舌苔样本的混合样本的正极代表性TIC图;
图7是本发明实施例中舌苔样本的混合样本的负极代表性TIC图;
图8是本发明实施例使用训练集中5种舌苔代谢物组分的组合得到的胃癌预测结果的AUCs值展示图;
图9是本发明实施例使用内部验证集中5种舌苔代谢物组分的组合得到的胃癌预测结果的AUCs值展示图;
图10是本发明实施例使用外部验证集中5种舌苔代谢物组分的组合得到的胃癌预测结果的AUCs值展示图;
图11是本发明实施例中使用训练集中四种常见血浆生物标志物及其组合得到的胃癌预测结果的AUCs值展示图;
图12是本发明实施例中使用内部验证集中四种常见血浆生物标志物及其组合得到的胃癌预测结果的AUCs值展示图;
图13是本发明实施例中使用外部验证集中四种常见血浆生物标志物及其组合得到的胃癌预测结果的AUCs值展示图;
图14是本发明实施例中使用内部验证集通过舌苔图像胃癌预测模型得到第二胃癌患病概率的AUCs值展示图;
图15是本发明实施例中使用外部验证集通过舌苔图像胃癌预测模型得到第二胃癌患病概率的AUCs值展示图;
图16是本发明实施例中使用内部验证集通过多模态胃癌预测模型得到最终胃癌患病概率的AUCs值展示图;
图17是本发明实施例中使用外部验证集通过多模态胃癌预测模型得到最终胃癌患病概率的AUCs值展示图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行清楚、完整的描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
本发明提供了基于舌苔代谢物的胃癌预测模型的建立方法,由图1可知,该建立方法包括如下步骤:
步骤S1:采集舌苔代谢物作为样本;
参与者队列:
选取8个中心的1648名参与者,其中胃癌患者(GC)613名,正常受试者(non-GC)1035名,覆盖中国多个地区。回顾了所有参与者的医疗记录。在胃镜检查前收集了基线临床病理数据,包括年龄、性别、体重指数、吸烟史、饮酒史和家族史等。同时还收集了一些外周血肿瘤标志物的信息,包括癌胚抗原(CEA)、糖类抗原724(CA724)、甲胎蛋白(AFP)和糖类抗原199(CA199)。蛋白质生物标志物的分析根据临床指导进行(CA724: 编号11776258,Cobas; AFP: 编号3P36/07P90, Alinity; CEA: 编号00937450, Simens; CA199: 编号10491244, Simens)。
具体来说,训练集以及内部测试集的胃癌患者来自3个中心的样本,训练集以及内部测试集的非胃癌患者来自5个中心的样本;而独立外部验证数据集的胃癌患者来自一个中心,独立外部验证数据集的非胃癌患者来自三个中心。
在训练集上训练模型,在内部测试集上评估模型,一旦找到的最佳的参数,就在外部验证集上最后测试。
对于胃癌患者,纳入标准包括:(1)经病理检查确认的胃癌患者且接受过D2淋巴结清扫术,(2)术前有舌苔样本及舌象采集的患者,(3)术前未接受过任何肿瘤治疗的患者,(4)有完整临床数据和随访的患者。排除标准包括:(1)术前没有舌苔样本及舌象采集的患者,(2)术前接受过任何肿瘤治疗的患者,(3)医疗记录不完整或失去随访的患者。医疗记录中还检索了病理类型、肿瘤大小、肿瘤位置、分化程度、神经侵犯和血管肿瘤栓塞情况。根据美国癌症联合委员会第八版TNM分期系统,也检索了pN分期、pM分期和pTNM分期。
对于非胃癌参与者,舌苔样本及舌象采集是在常规体检期间收集的。根据体检结果回顾和咨询病史,可以确认所有参与者的健康状况。非胃癌参与者的排除标准包括:(1)有癌症相关治疗史的参与者,(2)内窥镜前没有舌苔样本采集的参与者。
收集舌苔代谢物:
舌苔代谢物的采集时间是在所有胃癌(GC)参与者的胃手术当天早晨以及非胃癌(NGC)参与者的胃镜检查当天早晨,在空腹超过8小时的情况下进行,这样排除了饮食对舌苔的影响。在采集舌苔样本之前,参与者用无菌水漱口三次。所有舌象都是使用同一台舌象采集仪器(型号:d-CleverTongue,杭州迪英加科技有限公司,中国杭州)在相同的光源、环境和采集软件下收集的。舌头从根部到尖端被专业操作员同时滚动舌拭子刮取30次(每个拭子滚动5次,共6个拭子)。拭子立即放入冷冻管中,然后样本被转移到-80°C的冰箱中。
对采集的舌苔代谢物进行前处理,所述前处理包括:
将采集的舌苔代谢物溶于水和甲醇的混合溶液中,所述水和甲醇的混合溶液体积比为1:3,采集的舌苔代谢物、水和甲醇的混合溶液以及内标共计700 μL,进行涡旋处理30秒,涡旋处理后于 4℃下超声处理10 min,在-20 ℃下静置2 h。
静置结束后,在13500 rpm的转速下离心处理10 min,取450 μL上清液,将所述上清液在25 ℃下挥发干燥,得到沉淀物。
在所述沉淀物中加入2 %浓度的甲醇100 μL进行复溶,再涡旋处理30 s,涡旋处理完毕后超声处理10 min,取上清液作为舌苔代谢物样品溶液。
进样量为10 μL。样本混合方案:每个中心随机选取12%样本作为样本进行混合,前处理步骤同样本处理方案。内标配置方法:L-甲硫氨酸-甲基-d3:称取7 mg;配成1 mg/mL;取160 μL加入到50ml;浓度为3.2 μg/mL;棕榈酸-d31:1 mg/mL;称取3 mg;配成1 mg/mL;取50μL加入到50ml,浓度为1 μg/mL。
色谱及质谱方法:
数据采集使用了配备Orbitrap Exploris 120的Vanquish UHPLC系统(赛默飞世尔科技,美国)进行。原始数据通过Xcalibur软件获取。液相色谱分离在一个Waters UPLCHSS T3柱上进行(1.8 µm;150 mm长度×2.1 mm内径),柱温维持在40°C。正离子模式检测时,流动相A为含0.1%甲酸的水(LC-MS/MS级,赛默飞),流动相B为乙腈(LC-MS/MS级,赛默飞);负离子模式检测时,流动相A为6.5 mM碳酸氢铵(Sigma),流动相B为乙腈;流速为0.3mL/min。梯度程序设置如下:0-1分钟,2% B;1-4.5分钟,2-60% B;4.5-7分钟,60% B;7-8分钟,60-100% B;8-11.4分钟,100% B;11.4-11.5分钟,100-2% B;14分钟,2%。注射体积为10µL。在数据采集期间,所有样本均随机分析。质控样品通过汇集所有受试样本等体积份额制备,并在每10个样本进样后插入一次。
在LC−MS数据采集过程中,将两种内标L-甲硫氨酸-甲基-d3和棕榈酸-d31加标到单个样品中,以监测重现性,由图2和图3可知,两种内标的峰面积的相对标准偏差(RSD)计算值分别为2.2%和2.7%。进行主成分分析(PCA)以评估样品的重现性。在正极和负极模式下,质控样品(混合样本)在PCA图中紧密聚集,参见图4和图5可知,这些结果表明数据具有出色的重现性和良好的数据质量。
数据采集在全扫描模式和dd-MS2扫描模式下进行。离子源参数设置如下:正离子模式的喷射电压为3500 V,负离子模式为2500V;鞘气为50 arb;辅助气体为10 arb;离子传输管温度为300°C。全MS扫描模式的分辨率设为60,000,正离子模式的AGC目标设为1e6。最大注射时间设为100毫秒。质量范围设为60-900 Da。对于dd-MS2扫描模式,MS分辨率设为15,000,AGC目标设为标准。最大注射时间设为自动。碰撞能量设为SNCE 20-40-60%。所有的样本分成8个批次进行制备和进样,样本第一次制样时统一制备,分别插入每个批次样本中进行进样。
本发明提供的基于舌苔代谢物的胃癌预测模型的建立方法,采集舌苔代谢物,获取样本数据集,使用该样本数据集对胃癌进行预测,对人体无损,相比其他有损检测,提升患者体验感和接受度。
步骤S2:对所述样本进行分析,获得舌苔代谢物样本数据集,所述舌苔代谢物样本数据集包括M个舌苔代谢物样本数据子集,每个舌苔代谢物样本数据子集包含舌苔代谢物中各组分的丰度数据,舌苔代谢物的组分包括:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺;
本发明选择舌苔代谢物组分中的N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺进行胃癌预测,提升了胃癌预测的准确率。
优选地,所述舌苔代谢物的组分还包括:本胆烷醇酮(Etiocholanone)、3-羟基苯甲醛、3-羟基丁酸、6β-羟基-17β-雌二醇、N-乙酰胞壁酸。
优选地,所述舌苔代谢物的组分:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺、N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮(Etiocholanolone)、泛酸、甜菜碱醛、3 -羟基苯甲醛、3-羟基丁酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、N-乙酰胞壁酸。
优选地,所述舌苔代谢物的组分还包括:N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮、苏氨酸亮氨酸、D-丙氨酰-D-丙氨酸、蔗糖、邻苯二甲酸酐、N-甲基酪胺、丁酸、泛酸、甜菜碱醛、甘露醇、3-羟基苯甲醛、3-羟基丁酸、4-乙酰氨丁酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、普糖、N-乙酰胞壁酸、山梨糖。
优选地,所述舌苔代谢物的组分还可以是:N-乙酰-亮氨酸、N-乙酰-D-半乳糖胺[M+H-H2O]+、丙酰肉碱、本胆烷醇酮(Etiocholanolone)、17α-雌二醇、N-乙酰-D-半乳糖胺、左旋肾上腺素、‘丙基肉桂酸酯;3-二甲基烯丙基-4-羟基苯甲醛’、17α-羟基孕酮、乳果糖、苏氨酸亮氨酸、精氨酸-丙氨酸、皮质醇、D-丙氨酰、D-丙氨酸、雄酮、蔗糖、2-羟基-2-甲基丁酸、邻苯二甲酸酐、N-甲基酪胺、雌二醇-17β 3-硫酸酯、丙氨酰-亮氨酸、亮氨酰-缬氨酸、4-氨基-4-脱氧鸟苷、胸腺嘧啶、β-羟基苯乙醛、苯乙醛、β-丙氨酸、对羟基肉桂醇糖苷、泛酸、甜菜碱醛、甘露醇、β-羟基苯甲醛、蛋氨酸、熊去氧胆酸、β-羟基丁酸、异丁酰甘氨酸、4-乙酰氨丁酸、正十六烷二酸二酸盐;十六烷二酸盐、精氨酸、鸟氨酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、来普糖、N-乙酰胞壁酸、山梨糖。
优选地,所述舌苔代谢物的组分还包括:N-乙酰-D-半乳糖胺[M+H-H2O]+(N-Acetyl-D-galactosamine [M+H-H2O]+)、本胆烷醇酮(Etiocholanone)、N-乙酰半糖胺、左旋间羟肾上腺素、‘丙基肉桂酸酯;3-二甲基烯丙基-4-羟基苯甲醛’、17α-羟基孕酮、苏氨酸亮氨酸(Threonylleucine)、瓜氨酸、N-乙酰胞壁酸、胞壁酸、‘精氨酸-丙氨酸’、 甲基亮氨酸酯、皮质醇、乙基-4-二甲基氨基苯甲酸酯(Ethyl-4-dimethylaminobenzoate)、D-丙氨酰-D-丙氨酸、雄甾酮(Androsterone)、云杉苷、蔗糖、2-羟基-2-甲基丁酸、邻苯二甲酸酐、N-甲基酪胺、17β-雌二醇-3-硫酸酯(Estradiol-17beta 3-sulfate)、丙氨酰-亮氨酸、腺嘌呤、缬氨酸-缬氨酸(Valylvaline)、γ-谷氨酰-γ-氨基丁醛、亮氨酰-缬氨酸、‘4-氨基-4-脱氧鸟苷;胸苷’、 3β-羟基孕-5-烯-20-酮硫酸酯(3beta-Hydroxypregn-5-en-20-onesulfate)、正丁酸、雌酮葡糖苷酸、辛基甲氧肉桂酸酯、γ-谷氨酰谷氨酰胺、N-辛酰甘氨酸、苯甲酰胺、苯乙醛、N-ε-乙酰赖氨酸、香豆酰基鸟氨酸、1,3-二环己基脲、N5-(L-1-羧乙基)-L-鸟氨酸、2-氨基丁酸、尿嘧啶、4-羟肉桂醇4-D-葡萄糖苷、‘安沙明;香豆素醋酸盐’、磷酸胆碱(LPE 14:0)、泛酸、甜菜碱醛、甘露醇、肌酐、腐胺、丙烯酰胺、鞘氨醇1-磷酸酯(Sphingosine 1-phosphate)、吲哚乙酸、2-苯乙酰胺、3-乙氧基-4-羟基苯甲醛、3-羟基苯甲醛、γ-谷氨酰基蛋氨酸、甲酰甲硫氨酸、磷酸吡哆胺(Pyridoxamine phosphate)、苯、天冬氨酸、苯甲酸、4-羟基-L-谷氨酸、羟乙基磺酸(isethionic acid)、D-核糖酸、丝氨酸、3-羟基丁酸、甘油磷酰胆碱、L-羟基赖氨酸、4-羟基苯基甘氨酸、4-羟基粘液酸(4-Hydroxymyxol)、雄甾二醇(Androstenediol)、异丁酰甘氨酸、4-乙酰胺基丁酸、乙醛酸、N-乙酰-L-谷氨酸 5-磷酸、尿苷、鸟氨酸、十六烷二酸、油酸、瓜氨酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、琥珀酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、4-氨基丁酸、N-甲酰基-L-谷氨酸、来普糖(LYXOSE)、N-乙酰半乳糖胺、N-乙酰胞壁酸、山梨糖、D-山梨糖醇。
本发明中输入胃癌预测模型的样本数据,还可以根据预测精度要求灵活选择,精度要求高时选择较多组分的组合作为样本数据,精度要求较低时选择较少组分的组合作为样本数据,提升预测模型的便捷性、易用性。
步骤S3:数据前处理,针对所述舌苔代谢物样本数据集进行前处理,得到最终舌苔代谢物样本数据集;
优选地,所述步骤S3中,针对所述舌苔代谢物样本数据集进行前处理,得到最终舌苔代谢物样本数据集,包括:
确定所述每个舌苔代谢物样本数据子集的缺失值个数;
剔除所述缺失值个数超过缺失值阈值的舌苔代谢物样本数据子集,得到符合缺失值要求的舌苔代谢物样本数据子集;
对符合缺失值要求的舌苔代谢物样本数据子集进行插补,得到插补后的舌苔代谢物样本数据集;
针对插补后的舌苔代谢物样本数据集进行归一化处理,获得最终舌苔代谢物样本数据集。
具体的,使用ProteoWizard(版本 3.0.20360)将原始MS数据(.raw)文件转换为mzXML格式,使用R包“XCMS”(3.12版)用于峰检测、保留时间校正和峰比对。XCMS处理参数设置如下:峰检测的质量精度 = 10 ppm;峰值宽度=(5,30);信号噪声阈值 = 6;最小分数 =0.5。去除了样品中缺失值超过70%的特征。缺失值使用“impute”包内的k-nearestneighbor classification(KNN)算法进行插补。生成的峰值表使用“MetNormalizer12”R包进行处理,并进行归一化处理。样品中RSD小于30%的代谢峰用于后续分析。使用MetDNA2.0、MS-DIAL(5.1.230912)以及MetEx15进行代谢物的鉴定,主要根据代谢物的保留时间,1级质谱以及MS/MS 相似性来进行代谢物注释。
步骤S4:将所述最终舌苔代谢物样本数据集输入胃癌预测模型,得到最终胃癌患病概率。
实施例一
本实施例中总共纳入包括8个中心的1648名参与者,其中胃癌患者(GC)613名,正常受试者(non-GC)1035名,所有胃癌患者均经病理检查确认,所有非胃癌参与者均经医学检查结果和病史咨询确认。具体来说,训练集和内部验证集包括来自5个中心的1224名参与者(包括469名胃癌患者和755名非胃癌参与者),而来自另外三个独立中心的424名参与者(包括144名胃癌患者和280名非胃癌参与者)被定义为独立外部验证数据集。如表1和表2所示,在训练集、内部验证集和外部验证集数据集中,胃癌患者和非胃癌参与者之间在年龄、性别、BMI,吸烟史和饮酒史方面没有显著差异。
表 1. 胃癌(GC)和非胃癌(NGC)参与者在训练集和内部验证集中的临床信息
其中,CA,碳水化合物抗原;CEA,癌胚抗原;GC,胃癌;GU,胃溃疡;GP,胃息肉;HP,幽门螺旋杆菌;NGC,非胃癌。
表 2. 胃癌(GC)和非胃癌(NGC)参与者在独立的外部验证集中的临床信息
其中,CA,碳水化合物抗原;CEA,癌胚抗原;GC,胃癌;GU,胃溃疡;GP,胃息肉;HP,幽门螺旋杆菌;NGC,非胃癌。
胃癌患者和非胃癌受试者舌苔代谢物特征:
使用基于高分辨质谱Orbitrap Exploris™ 120的非靶向代谢组学的方法对所有的舌苔样本进行LC-MS分析,舌苔样本的混合样本的正极和负极的TIC图如图6和图7所示。经过质谱数据的预处理,代谢组学数据中,在正极检测模式下,提取到了46954个特征,在负极检测模式下,提取到了16578个特征。由于所有的样本是在8个批次的情况下进行检测的,所以使用“MetNormalizer12”R包对得到的峰表进行了基于样本的校准,校准完成后在两个尺度对校准的结果进行了判断;1)对加入到所有样本中的同位素内标进行了峰面积的定量,正极使用的同位素内标是L-Methionine-(methyl-d3),RSD为2.7%;负极使用的同位素内标是Palmitic acid d31,RSD为2.2%,如图2和图3所示;内标的RSD值小于20%,说明在样本的前处理以及分析过程中的稳定性良好,前处理和仪器分析过程较为稳定。2)对所有样本进行了PCA的分析,结果如图4和图5所示,正极和负极的所有样本均良好的聚集在一起,说明样本分析过程中仪器状态稳定,基于样本的校准方法可行,结果可靠。按照样本中RSD值小于30%的特征进行了取舍,保留了12713个正极的特征和3162个负极的特征,进行后续的分析。
按照胃癌组和非胃癌组的变化大于1.5或者小于0.67,并且p值(校准后)小于0.05进行了火山图的绘制,结果如图8所示,在正极找到了876个上调的特征和1185个下调的特征,在负极找到了233个上调的特征和448个下调的特征。对所有具有显著性差异(p<0.05)的特征进行了注释,使用了3个开源的工具,包括MetDNA 2.0(http://metdna.zhulab.cn/ )、MS-DIAL(5.1.230912)以及MetEx,同时注释到的化合物经过HMDB、METLIN以及MassBank等在线数据库的检索验证,在正极注释到了147个具有显著差异的代谢物,在负极注释到了125个具有显著差异的代谢物,分别分属于氨基酸、脂质、碳水化合物、羧酸、核苷酸和其他,关注到了合并正极和负极注释到的代谢物,总共有60个氨基酸类的代谢物上调,46个脂质类代谢物上调,34个其他类代谢物上调,10个羧酸类代谢物上调,13个核苷酸类代谢物上调。基于kernel principal component analysis (KPCA)的方法,使用鉴定到的272种代谢物进行区分,胃癌组和非胃癌组在主成分1和主成分2上均可有效分离,P值为0.039和3.78×1074,表明胃癌组和非胃癌舌苔代谢组存在较大的差异。使用显著性微阵列分析(Significance Analysis of Microarrays, SAM)的方法对272个差异代谢物进行了分析,N-乙酰-亮氨酸、丙酰肉碱、本胆烷醇酮等物质在GC组中上调最为显著,熊去氧胆酸、D-丙氨酰-D-丙氨酸和3-3-羟基苯甲醛等物质在GC组中下调最为显著。进一步的,使用热图分别展示了正极和负极调控最为显著的前50个代谢物。
基于舌苔代谢物的胃癌预测模型的建立:
对所有鉴定出来的272个代谢物进行了基于机器学习的数学分析,主要的机器学习算法为随机森林(Random forest),以确定基于舌苔代谢组建立的胃癌诊断模型的价值。设置了训练集(Training Set),包含608名非胃癌受试者以及390名胃癌患者;内部验证集(Validation Set),包含147名非胃癌受试者以及79名胃癌患者;以及外部验证集(TestSet)包含280名非胃癌受试者以及144名胃癌患者;已确认模型的泛化能力。
具体来说,设置了5种舌苔代谢物组分的组合,即选择分类性能最好的5个、10个、15个、25个以及100个舌苔代谢物组分的组合进行胃癌患者和非胃癌受试者的区分,结果如图8-图10所示。在训练集中取得了令人满意的结果,5个舌苔代谢物组分的组合时曲线下面积(AUCs)值为0.966-0.994,舌苔代谢物组分纳入的越多,其AUCs的面积越大。其中由5个舌苔代谢物组分的组合的置信区间为0.956-0.975,由100个舌苔代谢物组分的组合的置信区间为0.990-0.997,表明具有极高的可信度。内部验证集5个舌苔代谢物组分的组合的曲线下面积(AUCs)值为0.900-0.957,同样具有良好的分类性能的独立外部验证集的AUCs值为0.850-0.921。上述结果表明的训练集、内部验证集以及外部验证集的AUCs值均在0.850以上,这表明基于舌苔代谢组的分类工具在胃癌诊断中表现出色。
5个舌苔代谢物组分的组合,包含的舌苔代谢物组分有N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺。
10个舌苔代谢物组分的组合,包含的舌苔代谢物组分有:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺、本胆烷醇酮、3-羟基苯甲醛、3-羟基丁酸、6β-羟基-17β-雌二醇、N-乙酰胞壁酸。
15个舌苔代谢物组分的组合,包含的舌苔代谢物组分有:N-乙酰-亮氨酸、丙酰肉碱、乳果糖、乙醇胺、3-羟基苯甲醛、3-羟基丁酸、6β-羟基-17β-雌二醇、N-乙酰胞壁酸、N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮、17α-雌二醇、泛酸、甜菜碱醛、5Z,7E,9E,14Z,17Z-二十碳五烯酸、4-羟基苯甲酸。
25个舌苔代谢物组分的组合,包含的舌苔代谢物组分有:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺、N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮、苏氨酸亮氨酸、D-丙氨酰-D-丙氨酸、蔗糖、邻苯二甲酸酐、N-甲基酪胺、丁酸、泛酸、甜菜碱醛、甘露醇、3-羟基苯甲醛、3-羟基丁酸、4-乙酰氨丁酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、来普糖、N-乙酰胞壁酸、山梨糖。
50个舌苔代谢物组分的组合,包含的舌苔代谢物组分有:N-乙酰-亮氨酸、N-乙酰-D-半乳糖胺[M+H-H2O]+、丙酰肉碱、本胆烷醇酮、17α-雌二醇、N-乙酰-D-半乳糖胺、左旋肾上腺素、丙基肉桂酸酯、3-二甲基烯丙基-4-羟基苯甲醛、17α-羟基孕酮、乳果糖、苏氨酸亮氨酸、瓜氨酸(Citrulline)、乙醇胺、精氨酸-丙氨酸、皮质醇、D-丙氨酰-D-丙氨酸、雄甾酮(Androsterone)、蔗糖、2-羟基-2-甲基丁酸、邻苯二甲酸酐、N-甲基酪胺、17β-雌二醇-3-硫酸酯(Estradiol-17beta 3-sulfate)、丙氨酰-亮氨酸、亮氨酰-缬氨酸、4-氨基-4-脱氧基 喹啉酮、胸苷、3β-羟基孕-5-烯-20-酮硫酸酯、丁酸、辛基甲氧基肉桂酸酯、苯乙醛、2-氨基丁酸、4-羟基肉桂醇4-D-葡萄糖苷、泛酸、甜菜碱醛、甘露醇、3-羟基苯甲醛、蛋氨酸、熊去氧胆酸、3-羟基丁酸、异丁酰甘氨酸、4-乙酰氨丁酸、十六烷二酸盐、瓜氨酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、来普糖、N-乙酰胞壁酸、山梨糖。
100个舌苔代谢物组分的组合,包含的舌苔代谢物组分有:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺、N-乙酰-D-半乳糖胺[M+H-H2O]+(N-Acetyl-D-galactosamine [M+H-H2O]+)、本胆烷醇酮(Etiocholanone)、N-乙酰半糖胺、左旋间羟肾上腺素、‘丙基肉桂酸酯;3-二甲基烯丙基-4-羟基苯甲醛’、17α-羟基孕酮、苏氨酸亮氨酸(Threonylleucine)、瓜氨酸、N-乙酰胞壁酸、胞壁酸、‘精氨酸-丙氨酸’、 甲基亮氨酸酯、皮质醇、乙基-4-二甲基氨基苯甲酸酯(Ethyl-4-dimethylaminobenzoate)、D-丙氨酰-D-丙氨酸、雄甾酮(Androsterone)、云杉苷、蔗糖、2-羟基-2-甲基丁酸、邻苯二甲酸酐、N-甲基酪胺、17β-雌二醇-3-硫酸酯(Estradiol-17beta 3-sulfate)、丙氨酰-亮氨酸、腺嘌呤、缬氨酸-缬氨酸(Valylvaline)、γ-谷氨酰-γ-氨基丁醛、亮氨酰-缬氨酸、‘4-氨基-4-脱氧鸟苷;胸苷’、 3β-羟基孕-5-烯-20-酮硫酸酯(3beta-Hydroxypregn-5-en-20-one sulfate)、正丁酸、雌酮葡糖苷酸、辛基甲氧肉桂酸酯、γ-谷氨酰谷氨酰胺、N-辛酰甘氨酸、苯甲酰胺、苯乙醛、N-ε-乙酰赖氨酸、香豆酰基鸟氨酸、1,3-二环己基脲、N5-(L-1-羧乙基)-L-鸟氨酸、2-氨基丁酸、尿嘧啶、4-羟肉桂醇4-D-葡萄糖苷、‘安沙明;香豆素醋酸盐’、磷酸胆碱(LPE14:0)、泛酸、甜菜碱醛、甘露醇、肌酐、腐胺、丙烯酰胺、鞘氨醇1-磷酸酯(Sphingosine 1-phosphate)、吲哚乙酸、2-苯乙酰胺、3-乙氧基-4-羟基苯甲醛、3-羟基苯甲醛、γ-谷氨酰基蛋氨酸、甲酰甲硫氨酸、磷酸吡哆胺(Pyridoxamine phosphate)、苯、天冬氨酸、苯甲酸、4-羟基-L-谷氨酸、羟乙基磺酸(isethionic acid)、D-核糖酸、丝氨酸、3-羟基丁酸、甘油磷酰胆碱、L-羟基赖氨酸、4-羟基苯基甘氨酸、4-羟基粘液酸(4-Hydroxymyxol)、雄甾二醇(Androstenediol)、异丁酰甘氨酸、4-乙酰胺基丁酸、乙醛酸、N-乙酰-L-谷氨酸 5-磷酸、尿苷、鸟氨酸、十六烷二酸、油酸、瓜氨酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、琥珀酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、4-氨基丁酸、N-甲酰基-L-谷氨酸、来普糖(LYXOSE)、N-乙酰半乳糖胺、N-乙酰胞壁酸、山梨糖、D-山梨糖醇。
选择15个舌苔代谢物组分的组合作为后续靶向验证的目标代谢物。所有15个舌苔代谢物组分的组合在胃癌和非胃癌组中均具有显著性差异(p<0.05),15个舌苔代谢物组分的组合在训练集、内部验证集以及外部验证集的AUCs值为0.884-0.983,表明胃癌患者和非胃癌受试者具有良好的区分度。
与目前临床上应用的四种常见血浆生物标志物及其组合(CEA/CA724/AFP以及CA199)进行了对比,结果如图11-图13所示。CEA(WNL:0-5 ng/mL)在训练集中的AUCs为0.660,置信区间为0.627-0.693;CA724(WNL:0-6.9 U/mL)在训练集中的AUCs为0.756;AFP(WNL:0-8.1 ng/mL)在训练集中的AUCs为0.744;CA199(WNL:0-37 U/mL)在训练集中的AUCs为0.804;四种血浆生物标志物组合的AUCs在训练集为0.879。进一步的,在内部验证集中,四种血浆生物标志物的AUCs在0.511-0.699之间,四种血浆生物标志物组合的AUCs为0.720;在外部验证集中,四种血浆生物标志物的AUCs在0.558-0.704之间,四种血浆生物标志物组合的AUCs为0.766。上述结果表明的5个代谢物组合在训练集、内部验证集以及外部验证集中表现出来胃癌的诊断能力都显著强于现有临床上的血浆生物标志物。
实施例二
本发明还提供上述任一种建立方法建立的基于舌苔代谢物的胃癌预测模型在胃癌预测中的应用。
实施例三
本发明还提供一种基于舌苔代谢物和舌象图像的多模态胃癌预测模型,用于胃癌的预测。
多模态胃癌预测模型是在舌苔代谢物的胃癌预测模型基础上,结合已有的舌苔图像胃癌预测模型,构建的多模态融合的胃癌预测模型。
示例性的,把15个舌苔代谢物组分的组合输入舌苔代谢物的胃癌预测模型,获得第一胃癌患病概率;将舌象图像输入舌苔图像胃癌预测模型,获得第二胃癌患病概率;将第一胃癌患病概率和第二胃癌患病概率分别赋予相应的权重,得到最终胃癌患病概率,试验结果如图14和图15所示。采用舌苔图像胃癌预测模型对胃癌患者和非胃癌受试者进行诊断,结果表明,在内部验证集中舌苔图像胃癌预测模型得到的第二胃癌患病概率的AUCs为0.889,在外部验证集中舌苔图像胃癌预测模型得到的第二胃癌患病概率的AUCs为0.816,略低于舌苔代谢物的胃癌预测模型。进一步的,在舌苔代谢物的胃癌预测模型基础上,结合已有的舌苔图像胃癌预测模型,构建的多模态融合的胃癌预测模型,试验结果如图16和图17所示:使用内部验证集通过多模态胃癌预测模型得到最终胃癌患病概率的AUCs值为0.927,置信区间为0.887-0.955;使用外部验证集通过多模态胃癌预测模型得到最终胃癌患病概率的AUCs值为0.909,置信区间为0.881-0.935。上述结果表明,基于舌苔代谢物和舌象图像的多模态胃癌预测模型明显优于单个模型,可实现诊断性能的进一步提升。
需要说明的是,本发明所用术语仅为了描述特定实施例,而非限制本申请范围。如本发明说明书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案。
Claims (9)
1.基于舌苔代谢物的胃癌预测模型的建立方法,其特征在于:包括如下步骤:
步骤S1:采集舌苔代谢物作为样本;
步骤S2:对所述样本进行分析,获得舌苔代谢物样本数据集;
所述舌苔代谢物样本数据集包括M个舌苔代谢物样本数据子集,每个舌苔代谢物样本数据子集包含舌苔代谢物中各组分的丰度数据,舌苔代谢物的组分包括:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺;
步骤S3:数据前处理,针对所述舌苔代谢物样本数据集进行前处理,得到最终舌苔代谢物样本数据集;
步骤S4:将所述最终舌苔代谢物样本数据集输入胃癌预测模型,得到最终胃癌患病概率。
2.根据权利要求1所述的基于舌苔代谢物的胃癌预测模型的建立方法,其特征在于:所述舌苔代谢物的组分包括还包括:本胆烷醇酮、3-羟基苯甲醛、3-羟基丁酸、6β-羟基-17β-雌二醇、N-乙酰胞壁酸。
3.根据权利要求1所述的基于舌苔代谢物的胃癌预测模型的建立方法,其特征在于:所述舌苔代谢物的组分还可以是:N-乙酰-亮氨酸、丙酰肉碱、17α-雌二醇、乳果糖、乙醇胺、N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮、泛酸、甜菜碱醛、3 -羟基苯甲醛、3-羟基丁酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、N-乙酰胞壁酸。
4.根据权利要求1所述的基于舌苔代谢物的胃癌预测模型的建立方法,其特征在于:所述舌苔代谢物的组分还包括:N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮、苏氨酸亮氨酸、D-丙氨酰-D-丙氨酸、蔗糖、邻苯二甲酸酐、N-甲基酪胺、丁酸、泛酸、甜菜碱醛、甘露醇、3-羟基苯甲醛、3-羟基丁酸、4-乙酰氨丁酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、普糖、N-乙酰胞壁酸、山梨糖。
5.根据权利要求1所述的基于舌苔代谢物的胃癌预测模型的建立方法,其特征在于:所述舌苔代谢物的组分还可以是:N-乙酰-亮氨酸、N-乙酰-D-半乳糖胺[M+H-H2O]+、丙酰肉碱、本胆烷醇酮、17α-雌二醇、N-乙酰-D-半乳糖胺、左旋肾上腺素、‘丙基肉桂酸酯;3-二甲基烯丙基-4-羟基苯甲醛’、17α-羟基孕酮、乳果糖、苏氨酸亮氨酸、精氨酸-丙氨酸、皮质醇、D-丙氨酰、D-丙氨酸、雄酮、蔗糖、2-羟基-2-甲基丁酸、邻苯二甲酸酐、N-甲基酪胺、雌二醇-17β 3-硫酸酯、丙氨酰-亮氨酸、亮氨酰-缬氨酸、4-氨基-4-脱氧鸟苷、胸腺嘧啶、β-羟基苯乙醛、苯乙醛、β-丙氨酸、对羟基肉桂醇糖苷、泛酸、甜菜碱醛、甘露醇、β-羟基苯甲醛、蛋氨酸、熊去氧胆酸、β-羟基丁酸、异丁酰甘氨酸、4-乙酰氨丁酸、正十六烷二酸二酸盐;十六烷二酸盐、精氨酸、鸟氨酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、来普糖、N-乙酰胞壁酸、山梨糖。
6.根据权利要求1所述的基于舌苔代谢物的胃癌预测模型的建立方法,其特征在于:所述舌苔代谢物的组分还包括:N-乙酰-D-半乳糖胺[M+H-H2O]+、本胆烷醇酮、N-乙酰半糖胺、左旋间羟肾上腺素、‘丙基肉桂酸酯;3-二甲基烯丙基-4-羟基苯甲醛’、17α-羟基孕酮、苏氨酸亮氨酸、瓜氨酸、N-乙酰胞壁酸、胞壁酸、‘精氨酸-丙氨酸’、 甲基亮氨酸酯、皮质醇、乙基-4-二甲基氨基苯甲酸酯、D-丙氨酰-D-丙氨酸、雄甾酮、云杉苷、蔗糖、2-羟基-2-甲基丁酸、邻苯二甲酸酐、N-甲基酪胺、17β-雌二醇-3-硫酸酯、丙氨酰-亮氨酸、腺嘌呤、缬氨酸-缬氨酸、γ-谷氨酰-γ-氨基丁醛、亮氨酰-缬氨酸、‘4-氨基-4-脱氧鸟苷;胸苷’、 3β-羟基孕-5-烯-20-酮硫酸酯、正丁酸、雌酮葡糖苷酸、辛基甲氧肉桂酸酯、γ-谷氨酰谷氨酰胺、N-辛酰甘氨酸、苯甲酰胺、苯乙醛、N-ε-乙酰赖氨酸、香豆酰基鸟氨酸、1,3-二环己基脲、N5-(L-1-羧乙基)-L-鸟氨酸、2-氨基丁酸、尿嘧啶、4-羟肉桂醇4-D-葡萄糖苷、‘安沙明;香豆素醋酸盐’、磷酸胆碱、泛酸、甜菜碱醛、甘露醇、肌酐、腐胺、丙烯酰胺、鞘氨醇1-磷酸酯、吲哚乙酸、2-苯乙酰胺、3-乙氧基-4-羟基苯甲醛、3-羟基苯甲醛、γ-谷氨酰基蛋氨酸、甲酰甲硫氨酸、磷酸吡哆胺、苯、天冬氨酸、苯甲酸、4-羟基-L-谷氨酸、羟乙基磺酸、D-核糖酸、丝氨酸、3-羟基丁酸、甘油磷酰胆碱、L-羟基赖氨酸、4-羟基苯基甘氨酸、4-羟基粘液酸、雄甾二醇、异丁酰甘氨酸、4-乙酰胺基丁酸、乙醛酸、N-乙酰-L-谷氨酸 5-磷酸、尿苷、鸟氨酸、十六烷二酸、油酸、瓜氨酸、5Z,7E,9E,14Z,17Z-二十碳五烯酸、琥珀酸、6β-羟基-17β-雌二醇、4-羟基苯甲酸、4-氨基丁酸、N-甲酰基-L-谷氨酸、来普糖、N-乙酰半乳糖胺、N-乙酰胞壁酸、山梨糖、D-山梨糖醇。
7.根据权利要求1所述的基于舌苔代谢物的胃癌预测模型的建立方法,其特征在于:所述步骤S3中,针对所述舌苔代谢物样本数据集进行前处理,得到最终舌苔代谢物样本数据集,包括:
确定所述每个舌苔代谢物样本数据子集的缺失值个数;
剔除所述缺失值个数超过缺失值阈值的舌苔代谢物样本数据子集,得到符合缺失值要求的舌苔代谢物样本数据子集;
对符合缺失值要求的舌苔代谢物样本数据子集进行插补,得到插补后的舌苔代谢物样本数据集;
针对插补后的舌苔代谢物样本数据集进行归一化处理,获得最终舌苔代谢物样本数据集。
8.根据权利要求1所述的基于舌苔代谢物的胃癌预测模型的建立方法,其特征在于:所述步骤S1中采集舌苔代谢物包括:
将采集的舌苔代谢物溶于水和甲醇的混合溶液中,所述水和甲醇的混合溶液,采集的舌苔代谢物、水和甲醇的混合溶液以及内标,进行涡旋处理,涡旋处理后超声处理,静置;
静置后,离心处理,取上清液,将所述上清液在常温下挥发干燥,得到沉淀物;
在所述沉淀物中加入甲醇进行复溶,再涡旋处理,涡旋处理完毕后超声处理,获得舌苔代谢物样品溶液。
9.如权利要求1-8任一项建立的基于舌苔代谢物的胃癌预测模型在胃癌预测中的应用。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410131519 | 2024-01-31 | ||
CN2024101315197 | 2024-01-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117789993A true CN117789993A (zh) | 2024-03-29 |
CN117789993B CN117789993B (zh) | 2024-06-11 |
Family
ID=90391382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410211261.1A Active CN117789993B (zh) | 2024-01-31 | 2024-02-27 | 基于舌苔代谢物的胃癌预测模型的建立和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117789993B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112216393A (zh) * | 2020-10-09 | 2021-01-12 | 郑州大学第一附属医院 | 口腔扁平苔藓诊断模型的构建方法、标志物及其应用 |
CN113030357A (zh) * | 2019-12-24 | 2021-06-25 | 四川大学 | 一种口腔鳞癌诊断模型及其构建方法 |
CA3173672A1 (en) * | 2020-03-27 | 2021-09-30 | Viome Life Sciences, Inc. | Diagnostic for oral cancer |
CN114965801A (zh) * | 2022-05-13 | 2022-08-30 | 上海交通大学医学院附属第九人民医院 | 代谢标志物在口腔癌诊断试剂盒制备中的应用 |
CN115083600A (zh) * | 2022-07-22 | 2022-09-20 | 浙江省肿瘤医院 | 基于舌苔微生物的肿瘤预测系统、方法及其应用 |
CN117686712A (zh) * | 2023-11-24 | 2024-03-12 | 浙江省肿瘤医院 | 一种基于舌苔微生物蛋白筛查胃癌的方法 |
-
2024
- 2024-02-27 CN CN202410211261.1A patent/CN117789993B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113030357A (zh) * | 2019-12-24 | 2021-06-25 | 四川大学 | 一种口腔鳞癌诊断模型及其构建方法 |
CA3173672A1 (en) * | 2020-03-27 | 2021-09-30 | Viome Life Sciences, Inc. | Diagnostic for oral cancer |
CN112216393A (zh) * | 2020-10-09 | 2021-01-12 | 郑州大学第一附属医院 | 口腔扁平苔藓诊断模型的构建方法、标志物及其应用 |
CN114965801A (zh) * | 2022-05-13 | 2022-08-30 | 上海交通大学医学院附属第九人民医院 | 代谢标志物在口腔癌诊断试剂盒制备中的应用 |
CN115083600A (zh) * | 2022-07-22 | 2022-09-20 | 浙江省肿瘤医院 | 基于舌苔微生物的肿瘤预测系统、方法及其应用 |
CN116936074A (zh) * | 2022-07-22 | 2023-10-24 | 浙江省肿瘤医院 | 基于舌苔微生物的肿瘤预测系统的应用 |
CN117292814A (zh) * | 2022-07-22 | 2023-12-26 | 浙江省肿瘤医院 | 基于舌苔微生物的肿瘤预测方法 |
CN117686712A (zh) * | 2023-11-24 | 2024-03-12 | 浙江省肿瘤医院 | 一种基于舌苔微生物蛋白筛查胃癌的方法 |
Non-Patent Citations (2)
Title |
---|
沈睿;李美凤;彭宇恒;滕钰浩;钱峻;董伟;詹瑧;张军峰;: "胃癌患者脾胃虚弱证形成与舌苔菌群相关性研究", 南京中医药大学学报, no. 02 * |
程向东等: "IN-depth metaproteomics analysis of tongue coating for gastric cancer", 《MICROBIOME》, 8 January 2024 (2024-01-08) * |
Also Published As
Publication number | Publication date |
---|---|
CN117789993B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109884302B (zh) | 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用 | |
Vitório et al. | Metabolic landscape of oral squamous cell carcinoma | |
Nobakht M. Gh et al. | The metabolomics of airway diseases, including COPD, asthma and cystic fibrosis | |
EP2427773B1 (en) | Method of diagnosing asphyxia | |
CN108414660B (zh) | 一组与肺癌早期诊断相关的血浆代谢小分子标志物的应用 | |
JP2022058852A (ja) | 取得方法、算出方法、胃癌評価装置、算出装置、胃癌評価プログラム、算出プログラムおよび胃癌評価システム | |
Kim et al. | Metabolomic screening and star pattern recognition by urinary amino acid profile analysis from bladder cancer patients | |
WO2022073502A1 (zh) | 生物标志物在制备肺癌检测试剂中的用途和方法 | |
JP2014038114A (ja) | 肺癌の評価方法 | |
CN111710372B (zh) | 一种呼出气检测装置及其呼出气标志物的建立方法 | |
WO2017028312A1 (en) | Biomarkers for coronary heart disease | |
CN115932277A (zh) | 一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用 | |
CN112183616B (zh) | 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法 | |
JP7337018B2 (ja) | 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム | |
CN114924073B (zh) | 结直肠进展期肿瘤诊断标志物组合及其应用 | |
Cao et al. | Database-assisted global metabolomics profiling of pleural effusion induced by tuberculosis and malignancy | |
CN117789993B (zh) | 基于舌苔代谢物的胃癌预测模型的建立和应用 | |
CN113567585A (zh) | 一种基于外周血的食管鳞癌筛查标志物及试剂盒 | |
CN113871008A (zh) | 一种用于肺癌早期诊断的预测模型及其相关产品和应用 | |
CN107543873B (zh) | 一种基于冠心病心阳虚证的代谢标记物的鉴定方法 | |
CN117517532B (zh) | 基于代谢组学和人工智能技术的肺腺癌早期诊断标志物及其应用 | |
CN109444277B (zh) | 代谢标志物在制备胶质瘤诊断试剂盒方面的应用 | |
CN118033023A (zh) | 肺癌生物标志物及其用途 | |
CN117929567A (zh) | 一种泛肿瘤和癌胚循环代谢物标志物及其应用 | |
CN116448910A (zh) | 脂质物用于制备癌症诊断试剂盒的方法及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |