CN116482155A - 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 - Google Patents
基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 Download PDFInfo
- Publication number
- CN116482155A CN116482155A CN202310328875.3A CN202310328875A CN116482155A CN 116482155 A CN116482155 A CN 116482155A CN 202310328875 A CN202310328875 A CN 202310328875A CN 116482155 A CN116482155 A CN 116482155A
- Authority
- CN
- China
- Prior art keywords
- hong kong
- oyster
- value
- model
- metabolite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 43
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 43
- 241001207609 Crassostrea hongkongensis Species 0.000 title claims abstract description 31
- 238000003745 diagnosis Methods 0.000 title claims abstract description 22
- 239000003550 marker Substances 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000012216 screening Methods 0.000 title claims abstract description 15
- 241000237502 Ostreidae Species 0.000 claims abstract description 25
- 235000020636 oyster Nutrition 0.000 claims abstract description 25
- 238000005516 engineering process Methods 0.000 claims abstract description 9
- 238000005481 NMR spectroscopy Methods 0.000 claims abstract description 6
- 230000004060 metabolic process Effects 0.000 claims abstract description 4
- 239000002207 metabolite Substances 0.000 claims description 42
- 238000004458 analytical method Methods 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 12
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 210000000514 hepatopancreas Anatomy 0.000 claims description 10
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 6
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 claims description 6
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 claims description 6
- 229920002527 Glycogen Polymers 0.000 claims description 6
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 6
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 6
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 claims description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 6
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 6
- 239000004472 Lysine Substances 0.000 claims description 6
- BAWFJGJZGIEFAR-NNYOXOHSSA-N NAD zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-N 0.000 claims description 6
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims description 6
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 6
- 229960001230 asparagine Drugs 0.000 claims description 6
- 235000009582 asparagine Nutrition 0.000 claims description 6
- 235000003704 aspartic acid Nutrition 0.000 claims description 6
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 6
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 6
- 235000020958 biotin Nutrition 0.000 claims description 6
- 229960002685 biotin Drugs 0.000 claims description 6
- 239000011616 biotin Substances 0.000 claims description 6
- 229940096919 glycogen Drugs 0.000 claims description 6
- 229960000310 isoleucine Drugs 0.000 claims description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 6
- 235000014705 isoleucine Nutrition 0.000 claims description 6
- 235000018977 lysine Nutrition 0.000 claims description 6
- 229950006238 nadide Drugs 0.000 claims description 6
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 claims description 6
- 235000019260 propionic acid Nutrition 0.000 claims description 6
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000012417 linear regression Methods 0.000 claims description 4
- 238000007477 logistic regression Methods 0.000 claims description 4
- 230000002503 metabolic effect Effects 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims description 3
- 238000013145 classification model Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000010239 partial least squares discriminant analysis Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 210000004185 liver Anatomy 0.000 claims description 2
- 210000000496 pancreas Anatomy 0.000 claims description 2
- 235000015170 shellfish Nutrition 0.000 abstract description 6
- 208000031295 Animal disease Diseases 0.000 abstract description 2
- 238000010276 construction Methods 0.000 abstract description 2
- 238000007405 data analysis Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 230000035945 sensitivity Effects 0.000 abstract description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000006386 neutralization reaction Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000007728 cost analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229940088592 immunologic factor Drugs 0.000 description 1
- 239000000367 immunologic factor Substances 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000004923 pancreatic tissue Anatomy 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N24/00—Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects
- G01N24/08—Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects by using nuclear magnetic resonance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/80—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
- Y02A40/81—Aquaculture, e.g. of fish
Landscapes
- Physics & Mathematics (AREA)
- High Energy & Nuclear Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及水产动物疾病诊断技术领域,公开了基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法。所述诊断标志物包含10种肝胰腺组织代谢标志物的组合。本发明采用基于核磁共振的代谢组学技术以及人工智能数据分析技术得到适合于香港牡蛎病害诊断的诊断标志物及诊断模型。本发明诊断标志物筛选方法可操作性强,模型构建方法简单,所得诊断模型效果良好,灵敏度高,特异性好,适合于香港牡蛎的发病诊断。本发明实现了香港牡蛎发病的快速诊断,为其他贝类病害的诊断提供了方法,具有很好的使用和推广价值。
Description
技术领域
本发明属于水产动物疾病诊断技术领域,涉及基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法。
背景技术
香港牡蛎(Crassostrea hongkongensis),俗称“白蚝”、“大蚝”,其个体大、品质优、味道美,是两广、海南等南方产区最重要的经济贝类品种。除经济效益外,牡蛎养殖还具有重要的生态效益。作为滤食性贝类,牡蛎可以有效净化海洋环境,高效固定海洋中的碳,被称为“可移出的碳汇”,是“碳中和”目标实现的重要支撑,具有巨大的生态开发潜力。因此,着力促进我省香港牡蛎产业发展对于保障粮食安全、提供优质蛋白供给、海洋环境资源养护、应对气候危机、实现“碳中和”目标都具有非常重要的经济和生态效益。
然而每年清明前后,成年香港牡蛎都会爆发的大规模死亡事件。同其他贝类一样,香港牡蛎缺乏适应性免疫系统,且主要养殖于开放性水体,难以通过药物投放或水质调节等措施控制病害的发生,这严重制约了香港牡蛎的健康发展。因此,加强病害发生的预警预防,有效规避病害发生,是香港牡蛎养殖业目前急需解决的关键技术,而确定香港牡蛎的发病症状是病害预警预报体系的基础。
由于香港牡蛎属于双壳类生物,其外壳非常坚硬,不容易观察到内部的情况。当牡蛎发病时,外壳并没有明显的反应。例如,外壳颜色、形状和质地看起来可能与健康的牡蛎没有太大差别。此外,即使我们能够打开牡蛎的外壳,里面的病变症状也可能无法看到。这是因为一些病原体会在牡蛎体内潜伏,导致症状不易察觉。因此,通过监测香港牡蛎的生理生化指标,我们可以更准确地评估其健康状况,及时发现可能存在的疾病。目前贝类的生理生化指标研究大多集中在部分免疫因子和抗氧化分子等,难以实现病害的早发现和早处理。
近年来,以代谢组学和人工智能技术为基础的诊断方法,已应用于疾病的早筛早诊。基于核磁共振的代谢组学具有极高可重复性和定量特性,特异性高,能够对代谢物同时完成定性和定量分析,且检测价格低廉,特别适合大样品量的低成本分析。但目前没有以代谢组学为基础的香港牡蛎病害诊断技术。
发明内容
为了克服现有技术的不足,本发明的目的在于提供基于代谢组学的香港牡蛎病害诊断标志物。
本发明的目的通过以下技术方案实现:
香港牡蛎病害诊断标志物组合,所述标志物组合为糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
本发明还提供组合A在作为香港牡蛎病害诊断标志物的应用,所述组合A为糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
本发明还提供一种基于代谢组学筛选香港牡蛎病害诊断标志物的方法,包括以下步骤:
S1、收集不同时间不同地点大规模死亡时期和正常时期的香港牡蛎肝胰腺样品作为分析样品;
S2、采用核磁共振技术对每个分析样本进行代谢组学分析,得到各肝胰腺样本的原始代谢指纹图谱;
S3、使用R包Rnmr1D对发病的肝胰腺样本和健康肝胰腺样本的原始代谢指纹图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行代谢物峰标识、峰面积积分及绝对定量,用于进一步的机器学习;
S4、使用R包tidymodels中9种机器学习算法,学习S3的二维矩阵数据,随机将上述发病及健康对照肝胰腺样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代几十次,通过统计比较最终不同模型在测试集上的准确率、F值、Kappa值、Precision值、Recall值及ROC_AUC值等的平均值,通过得到性能最优的模型;
S5、根据上述得到的最优模型,利用Python包ShapRFECV、Shap_hypertune、BorutaShap进行特征筛选,分别得到差异代谢物组合,选择三种算法的交集差异代谢物作为组合;
S6、分别将上述筛选出的差异代谢物组合的数据集,用S4的9种机器学习算法进行学习,其中数据集的3/4作为训练集,1/4作为测试集,并随机循环迭代几十次,通过统计比较不同代谢物组合在不同模型测试集上的准确率、F值、Kappa值、Recall值及ROC_AUC值等的平均值,最终得出相对最优代谢物组合;
S7、通过比较最优代谢物组合的不同模型性能,发现基于SVM建立的模型性能最优;通过混淆矩阵,可以明确发病与健康香港牡蛎的代谢组数据能够有效分类;
S8、将筛选出的代谢物进行差异分析和相关性评估;
S9、最终基于最优代谢物组合的数据集,使用机器学习SVM构建分类模型,得到牡蛎病害诊断模型。
优选的,上述方法中,S4所述9种机器算法包括:决策树、支持向量机、极致梯度提升树、神经网络、随机森林、多元线性回归、最小绝对收缩与选择算子、逻辑回归、正交偏最小二乘判别分析。
与现有技术相比,本发明具有以下有益效果:
本发明公开了基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法,所述诊断标志物包含10种肝胰腺组织代谢标志物的组合。本发明通过核磁共振技术对发病香港牡蛎肝胰腺组织进行代谢组学分析,通过人工智能数据分析技术发现发病香港牡蛎与健康香港牡蛎之间的差异代谢物,并验证了在香港牡蛎病害诊断中的诊断能力,实现了对香港牡蛎发病表型症状的数字化,为香港牡蛎病害预警系统的建立打下基础。
本发明诊断标志物筛选方法可操作性强,模型构建方法简单,所得诊断模型效果良好,灵敏度高,特异性好,适合于香港牡蛎的发病诊断。本发明实现了香港牡蛎发病的快速诊断,为其他贝类病害的诊断提供了方法,具有很好的使用和推广价值。
附图说明
图1是使用全部代谢物作为输入数据集的测试集全部评价指标柱状图;
图2为使用10个代谢物作为输入数据集的测试集全部评价指标柱状图;
图3为使用10个代谢物作为输入数据集的混淆矩阵;
图4为10个代谢物的相关性分析图;
图5为10个代谢物的差异分析图。
具体实施方式
为更好地说明本发明的目的、技术方案和优点,下面将结合具体附图和实施例对本发明作进一步说明。实施例中,所使用的实验方法如无特殊说明,均为常规方法,所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1病害诊断标志物的筛选
1、收集不同时间不同地点大规模死亡时期和正常时期的香港牡蛎肝胰腺样品作为分析样品;
2、采用核磁共振技术对每个分析样本进行代谢组学分析,得到各肝胰腺样本的原始代谢指纹图谱;
3、使用R包Rnmr1D对发病的肝胰腺样本和健康肝胰腺样本的原始代谢指纹图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行代谢物峰标识、峰面积积分及绝对定量,用于进一步的机器学习;
4、使用R包tidymodels中9种机器学习算法,包括:决策树(Decision Tree,DT)、支持向量机(Support Vecor Machine,SVM)、极致梯度提升树(extreme gradient boosting,XGBoost)、神经网络(Multilayer Perceptron,MLP)、随机森林(Random Forest,RF)、多元线性回归(Multiple linear regression,MLR)、最小绝对收缩与选择算子(Leastabsolute shrinkage and selection operator,LASSO)、逻辑回归(LogisticRegression,LOG)、正交偏最小二乘判别分析(Orthogonal Partial Least SquaresDiscriminationAnalysis,OPLS-DA),学习步骤3的二维矩阵数据,随机将上述发病及健康对照肝胰腺样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代40次,通过统计比较最终不同模型在测试集上的准确率、F值、Kappa值、Precision值、Recall值及ROC_AUC值等的平均值(图1),通过比较发现基于XGBoost建立的模型性能最优,可有效对发病与健康香港牡蛎的代谢组数据进行分类;
5、根据上述得到的XGBoost模型,利用Python包ShapRFECV、Shap_hypertune、BorutaShap等进行特征筛选,分别得到了16、19和24个差异代谢物组合,同时发现三种算法的交集为10个差异代谢物组合。
6、分别将上述筛选出的16、19和24个代谢物组合的数据集,用上述的9种机器学习算法进行学习,其中数据集的3/4作为训练集,1/4作为测试集,并随机循环迭代40次,通过统计比较不同代谢物组合在不同模型测试集上的准确率、F值、Kappa值、Recall值及ROC_AUC值等的平均值,最终得出相对最优代谢物组合数量为10,10个代谢物分别是糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
7、同时,通过比较10个代谢物组合的不同模型性能(图2),发现基于SVM建立的模型性能最优,准确度和ROC曲线下面积AUC值的平均值均在0.9以上;通过混淆矩阵,可以明确发病与健康香港牡蛎的代谢组数据能够有效分类(图3)。
8、将筛选出的代谢物进行差异分析和相关性评估。如图4所示,10个代谢物的浓度在发病牡蛎和健康牡蛎之间存在显著差异。相关性分析(图5)显示10个代谢物之间的相关性系数很低,说明所筛选的标志物间重复信息越低,那么代谢物组合就越趋向简单,包含的信息面就越多。
9、最终基于10个代谢物组合的数据集,使用机器学习SVM构建分类模型,得到牡蛎病害诊断模型。此后通过检测牡蛎肝胰腺中糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖和烟酰胺腺嘌呤二核苷酸这10个代谢物的浓度,再输进牡蛎病害诊断模型中就能得出此牡蛎是否处于发病状态。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (4)
1.香港牡蛎病害诊断标志物组合,其特征在于,所述标志物组合为糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
2.组合A在作为香港牡蛎病害诊断标志物的应用,其特征在于,所述组合A为糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
3.一种基于代谢组学筛选香港牡蛎病害诊断标志物的方法,其特征在于,包括以下步骤:
S1、收集不同时间不同地点大规模死亡时期和正常时期的香港牡蛎肝胰腺样品作为分析样品;
S2、采用核磁共振技术对每个分析样本进行代谢组学分析,得到各肝胰腺样本的原始代谢指纹图谱;
S3、使用R包Rnmr1D对发病的肝胰腺样本和健康肝胰腺样本的原始代谢指纹图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行代谢物峰标识、峰面积积分及绝对定量,用于进一步的机器学习;
S4、使用R包tidymodels中9种机器学习算法,学习S3的二维矩阵数据,随机将上述发病及健康对照肝胰腺样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代几十次,通过统计比较最终不同模型在测试集上的准确率、F值、Kappa值、Precision值、Recall值及ROC_AUC值等的平均值,通过得到性能最优的模型;
S5、根据上述得到的最优模型,利用Python包ShapRFECV、Shap_hypertune、BorutaShap进行特征筛选,分别得到差异代谢物组合,选择三种算法的交集差异代谢物作为组合;
S6、分别将上述筛选出的差异代谢物组合的数据集,用S4的9种机器学习算法进行学习,其中数据集的3/4作为训练集,1/4作为测试集,并随机循环迭代几十次,通过统计比较不同代谢物组合在不同模型测试集上的准确率、F值、Kappa值、Recall值及ROC_AUC值等的平均值,最终得出相对最优代谢物组合;
S7、通过比较最优代谢物组合的不同模型性能,发现基于SVM建立的模型性能最优;通过混淆矩阵,可以明确发病与健康香港牡蛎的代谢组数据能够有效分类;
S8、将筛选出的代谢物进行差异分析和相关性评估;
S9、最终基于最优代谢物组合的数据集,使用机器学习SVM构建分类模型,得到牡蛎病害诊断模型。
4.根据权利要求3所述的筛选方法,其特征在于,S4所述9种机器算法包括:决策树、支持向量机、极致梯度提升树、神经网络、随机森林、多元线性回归、最小绝对收缩与选择算子、逻辑回归、正交偏最小二乘判别分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310328875.3A CN116482155A (zh) | 2023-03-30 | 2023-03-30 | 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310328875.3A CN116482155A (zh) | 2023-03-30 | 2023-03-30 | 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116482155A true CN116482155A (zh) | 2023-07-25 |
Family
ID=87218606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310328875.3A Pending CN116482155A (zh) | 2023-03-30 | 2023-03-30 | 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116482155A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117352064A (zh) * | 2023-12-05 | 2024-01-05 | 成都泰莱生物科技有限公司 | 一种肺癌代谢标志物组合及其筛选方法和应用 |
-
2023
- 2023-03-30 CN CN202310328875.3A patent/CN116482155A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117352064A (zh) * | 2023-12-05 | 2024-01-05 | 成都泰莱生物科技有限公司 | 一种肺癌代谢标志物组合及其筛选方法和应用 |
CN117352064B (zh) * | 2023-12-05 | 2024-02-09 | 成都泰莱生物科技有限公司 | 一种肺癌代谢标志物组合及其筛选方法和应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Evaluation of fish feeding intensity in aquaculture using a convolutional neural network and machine vision | |
Chen et al. | Detection of rice plant diseases based on deep transfer learning | |
Park et al. | Classification and morphological analysis of vector mosquitoes using deep convolutional neural networks | |
CN109543679A (zh) | 一种基于深度卷积神经网络的死鱼识别方法及预警系统 | |
CN112016392B (zh) | 一种基于高光谱图像的大豆虫害程度的小样本检测方法 | |
Leow et al. | Automated identification of copepods using digital image processing and artificial neural network | |
Li et al. | A deep learning method for recognizing elevated mature strawberries | |
CN116482155A (zh) | 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 | |
Fang et al. | Identification of apple leaf diseases based on convolutional neural network | |
Hasan et al. | Fish diseases detection using convolutional neural network (CNN) | |
Xiao et al. | Citrus greening disease recognition algorithm based on classification network using TRL-GAN | |
Suzuki et al. | Deep learning predicts rapid over-softening and shelf life in persimmon fruits | |
Vishnoi et al. | Crop disease classification through image processing and machine learning techniques using leaf images | |
Wang et al. | Research on identification of corn disease occurrence degree based on improved ResNeXt network | |
Avanzato et al. | Dairy Cow Behavior Recognition Using Computer Vision Techniques and CNN Networks | |
Roy et al. | Disease Detection in Paddy Crop using Machine Learning Techniques | |
Zhang et al. | Lightweight Multi-scale Convolutional Neural Network for Rice Leaf Disease Recognition. | |
Yang et al. | Research and design of a machine vision-based silk cocoon quality inspection system | |
Shukla et al. | A New Approach for Leaf Disease Detection using Multilayered Convolutional Neural Network | |
CN113786185A (zh) | 一种基于卷积神经网络的静态脑网络特征提取方法和系统 | |
Kumar et al. | Double Channel CNN Based Tomato Plant Leaf Disease Detection | |
Dong et al. | Dragon fruit disease image segmentation based on FCM algorithm and two-dimensional OTSU algorithm | |
Meena et al. | Plant Diseases Detection Using Deep Learning | |
Concepcion II et al. | BivalveNet: A hybrid deep neural network for common cockle (Cerastoderma edule) geographical traceability based on shell image analysis | |
Varma et al. | Transfer Learning-based Optimal Feature Selection with DLCNN for Shrimp Recognition and Classification. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |