CN116482155A - 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 - Google Patents

基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 Download PDF

Info

Publication number
CN116482155A
CN116482155A CN202310328875.3A CN202310328875A CN116482155A CN 116482155 A CN116482155 A CN 116482155A CN 202310328875 A CN202310328875 A CN 202310328875A CN 116482155 A CN116482155 A CN 116482155A
Authority
CN
China
Prior art keywords
hong kong
oyster
value
model
metabolite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310328875.3A
Other languages
English (en)
Inventor
卢洁
姚托
叶灵通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Sea Fisheries Research Institute Chinese Academy Fishery Sciences
Original Assignee
South China Sea Fisheries Research Institute Chinese Academy Fishery Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Sea Fisheries Research Institute Chinese Academy Fishery Sciences filed Critical South China Sea Fisheries Research Institute Chinese Academy Fishery Sciences
Priority to CN202310328875.3A priority Critical patent/CN116482155A/zh
Publication of CN116482155A publication Critical patent/CN116482155A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N24/00Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects
    • G01N24/08Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects by using nuclear magnetic resonance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Landscapes

  • Physics & Mathematics (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及水产动物疾病诊断技术领域,公开了基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法。所述诊断标志物包含10种肝胰腺组织代谢标志物的组合。本发明采用基于核磁共振的代谢组学技术以及人工智能数据分析技术得到适合于香港牡蛎病害诊断的诊断标志物及诊断模型。本发明诊断标志物筛选方法可操作性强,模型构建方法简单,所得诊断模型效果良好,灵敏度高,特异性好,适合于香港牡蛎的发病诊断。本发明实现了香港牡蛎发病的快速诊断,为其他贝类病害的诊断提供了方法,具有很好的使用和推广价值。

Description

基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法
技术领域
本发明属于水产动物疾病诊断技术领域,涉及基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法。
背景技术
香港牡蛎(Crassostrea hongkongensis),俗称“白蚝”、“大蚝”,其个体大、品质优、味道美,是两广、海南等南方产区最重要的经济贝类品种。除经济效益外,牡蛎养殖还具有重要的生态效益。作为滤食性贝类,牡蛎可以有效净化海洋环境,高效固定海洋中的碳,被称为“可移出的碳汇”,是“碳中和”目标实现的重要支撑,具有巨大的生态开发潜力。因此,着力促进我省香港牡蛎产业发展对于保障粮食安全、提供优质蛋白供给、海洋环境资源养护、应对气候危机、实现“碳中和”目标都具有非常重要的经济和生态效益。
然而每年清明前后,成年香港牡蛎都会爆发的大规模死亡事件。同其他贝类一样,香港牡蛎缺乏适应性免疫系统,且主要养殖于开放性水体,难以通过药物投放或水质调节等措施控制病害的发生,这严重制约了香港牡蛎的健康发展。因此,加强病害发生的预警预防,有效规避病害发生,是香港牡蛎养殖业目前急需解决的关键技术,而确定香港牡蛎的发病症状是病害预警预报体系的基础。
由于香港牡蛎属于双壳类生物,其外壳非常坚硬,不容易观察到内部的情况。当牡蛎发病时,外壳并没有明显的反应。例如,外壳颜色、形状和质地看起来可能与健康的牡蛎没有太大差别。此外,即使我们能够打开牡蛎的外壳,里面的病变症状也可能无法看到。这是因为一些病原体会在牡蛎体内潜伏,导致症状不易察觉。因此,通过监测香港牡蛎的生理生化指标,我们可以更准确地评估其健康状况,及时发现可能存在的疾病。目前贝类的生理生化指标研究大多集中在部分免疫因子和抗氧化分子等,难以实现病害的早发现和早处理。
近年来,以代谢组学和人工智能技术为基础的诊断方法,已应用于疾病的早筛早诊。基于核磁共振的代谢组学具有极高可重复性和定量特性,特异性高,能够对代谢物同时完成定性和定量分析,且检测价格低廉,特别适合大样品量的低成本分析。但目前没有以代谢组学为基础的香港牡蛎病害诊断技术。
发明内容
为了克服现有技术的不足,本发明的目的在于提供基于代谢组学的香港牡蛎病害诊断标志物。
本发明的目的通过以下技术方案实现:
香港牡蛎病害诊断标志物组合,所述标志物组合为糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
本发明还提供组合A在作为香港牡蛎病害诊断标志物的应用,所述组合A为糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
本发明还提供一种基于代谢组学筛选香港牡蛎病害诊断标志物的方法,包括以下步骤:
S1、收集不同时间不同地点大规模死亡时期和正常时期的香港牡蛎肝胰腺样品作为分析样品;
S2、采用核磁共振技术对每个分析样本进行代谢组学分析,得到各肝胰腺样本的原始代谢指纹图谱;
S3、使用R包Rnmr1D对发病的肝胰腺样本和健康肝胰腺样本的原始代谢指纹图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行代谢物峰标识、峰面积积分及绝对定量,用于进一步的机器学习;
S4、使用R包tidymodels中9种机器学习算法,学习S3的二维矩阵数据,随机将上述发病及健康对照肝胰腺样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代几十次,通过统计比较最终不同模型在测试集上的准确率、F值、Kappa值、Precision值、Recall值及ROC_AUC值等的平均值,通过得到性能最优的模型;
S5、根据上述得到的最优模型,利用Python包ShapRFECV、Shap_hypertune、BorutaShap进行特征筛选,分别得到差异代谢物组合,选择三种算法的交集差异代谢物作为组合;
S6、分别将上述筛选出的差异代谢物组合的数据集,用S4的9种机器学习算法进行学习,其中数据集的3/4作为训练集,1/4作为测试集,并随机循环迭代几十次,通过统计比较不同代谢物组合在不同模型测试集上的准确率、F值、Kappa值、Recall值及ROC_AUC值等的平均值,最终得出相对最优代谢物组合;
S7、通过比较最优代谢物组合的不同模型性能,发现基于SVM建立的模型性能最优;通过混淆矩阵,可以明确发病与健康香港牡蛎的代谢组数据能够有效分类;
S8、将筛选出的代谢物进行差异分析和相关性评估;
S9、最终基于最优代谢物组合的数据集,使用机器学习SVM构建分类模型,得到牡蛎病害诊断模型。
优选的,上述方法中,S4所述9种机器算法包括:决策树、支持向量机、极致梯度提升树、神经网络、随机森林、多元线性回归、最小绝对收缩与选择算子、逻辑回归、正交偏最小二乘判别分析。
与现有技术相比,本发明具有以下有益效果:
本发明公开了基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法,所述诊断标志物包含10种肝胰腺组织代谢标志物的组合。本发明通过核磁共振技术对发病香港牡蛎肝胰腺组织进行代谢组学分析,通过人工智能数据分析技术发现发病香港牡蛎与健康香港牡蛎之间的差异代谢物,并验证了在香港牡蛎病害诊断中的诊断能力,实现了对香港牡蛎发病表型症状的数字化,为香港牡蛎病害预警系统的建立打下基础。
本发明诊断标志物筛选方法可操作性强,模型构建方法简单,所得诊断模型效果良好,灵敏度高,特异性好,适合于香港牡蛎的发病诊断。本发明实现了香港牡蛎发病的快速诊断,为其他贝类病害的诊断提供了方法,具有很好的使用和推广价值。
附图说明
图1是使用全部代谢物作为输入数据集的测试集全部评价指标柱状图;
图2为使用10个代谢物作为输入数据集的测试集全部评价指标柱状图;
图3为使用10个代谢物作为输入数据集的混淆矩阵;
图4为10个代谢物的相关性分析图;
图5为10个代谢物的差异分析图。
具体实施方式
为更好地说明本发明的目的、技术方案和优点,下面将结合具体附图和实施例对本发明作进一步说明。实施例中,所使用的实验方法如无特殊说明,均为常规方法,所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1病害诊断标志物的筛选
1、收集不同时间不同地点大规模死亡时期和正常时期的香港牡蛎肝胰腺样品作为分析样品;
2、采用核磁共振技术对每个分析样本进行代谢组学分析,得到各肝胰腺样本的原始代谢指纹图谱;
3、使用R包Rnmr1D对发病的肝胰腺样本和健康肝胰腺样本的原始代谢指纹图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行代谢物峰标识、峰面积积分及绝对定量,用于进一步的机器学习;
4、使用R包tidymodels中9种机器学习算法,包括:决策树(Decision Tree,DT)、支持向量机(Support Vecor Machine,SVM)、极致梯度提升树(extreme gradient boosting,XGBoost)、神经网络(Multilayer Perceptron,MLP)、随机森林(Random Forest,RF)、多元线性回归(Multiple linear regression,MLR)、最小绝对收缩与选择算子(Leastabsolute shrinkage and selection operator,LASSO)、逻辑回归(LogisticRegression,LOG)、正交偏最小二乘判别分析(Orthogonal Partial Least SquaresDiscriminationAnalysis,OPLS-DA),学习步骤3的二维矩阵数据,随机将上述发病及健康对照肝胰腺样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代40次,通过统计比较最终不同模型在测试集上的准确率、F值、Kappa值、Precision值、Recall值及ROC_AUC值等的平均值(图1),通过比较发现基于XGBoost建立的模型性能最优,可有效对发病与健康香港牡蛎的代谢组数据进行分类;
5、根据上述得到的XGBoost模型,利用Python包ShapRFECV、Shap_hypertune、BorutaShap等进行特征筛选,分别得到了16、19和24个差异代谢物组合,同时发现三种算法的交集为10个差异代谢物组合。
6、分别将上述筛选出的16、19和24个代谢物组合的数据集,用上述的9种机器学习算法进行学习,其中数据集的3/4作为训练集,1/4作为测试集,并随机循环迭代40次,通过统计比较不同代谢物组合在不同模型测试集上的准确率、F值、Kappa值、Recall值及ROC_AUC值等的平均值,最终得出相对最优代谢物组合数量为10,10个代谢物分别是糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
7、同时,通过比较10个代谢物组合的不同模型性能(图2),发现基于SVM建立的模型性能最优,准确度和ROC曲线下面积AUC值的平均值均在0.9以上;通过混淆矩阵,可以明确发病与健康香港牡蛎的代谢组数据能够有效分类(图3)。
8、将筛选出的代谢物进行差异分析和相关性评估。如图4所示,10个代谢物的浓度在发病牡蛎和健康牡蛎之间存在显著差异。相关性分析(图5)显示10个代谢物之间的相关性系数很低,说明所筛选的标志物间重复信息越低,那么代谢物组合就越趋向简单,包含的信息面就越多。
9、最终基于10个代谢物组合的数据集,使用机器学习SVM构建分类模型,得到牡蛎病害诊断模型。此后通过检测牡蛎肝胰腺中糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖和烟酰胺腺嘌呤二核苷酸这10个代谢物的浓度,再输进牡蛎病害诊断模型中就能得出此牡蛎是否处于发病状态。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (4)

1.香港牡蛎病害诊断标志物组合,其特征在于,所述标志物组合为糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
2.组合A在作为香港牡蛎病害诊断标志物的应用,其特征在于,所述组合A为糖原、丙酸、天冬氨酸、赖氨酸、阿拉伯糖、异亮氨酸、生物素、天冬酰胺、岩藻糖、烟酰胺腺嘌呤二核苷酸。
3.一种基于代谢组学筛选香港牡蛎病害诊断标志物的方法,其特征在于,包括以下步骤:
S1、收集不同时间不同地点大规模死亡时期和正常时期的香港牡蛎肝胰腺样品作为分析样品;
S2、采用核磁共振技术对每个分析样本进行代谢组学分析,得到各肝胰腺样本的原始代谢指纹图谱;
S3、使用R包Rnmr1D对发病的肝胰腺样本和健康肝胰腺样本的原始代谢指纹图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行代谢物峰标识、峰面积积分及绝对定量,用于进一步的机器学习;
S4、使用R包tidymodels中9种机器学习算法,学习S3的二维矩阵数据,随机将上述发病及健康对照肝胰腺样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代几十次,通过统计比较最终不同模型在测试集上的准确率、F值、Kappa值、Precision值、Recall值及ROC_AUC值等的平均值,通过得到性能最优的模型;
S5、根据上述得到的最优模型,利用Python包ShapRFECV、Shap_hypertune、BorutaShap进行特征筛选,分别得到差异代谢物组合,选择三种算法的交集差异代谢物作为组合;
S6、分别将上述筛选出的差异代谢物组合的数据集,用S4的9种机器学习算法进行学习,其中数据集的3/4作为训练集,1/4作为测试集,并随机循环迭代几十次,通过统计比较不同代谢物组合在不同模型测试集上的准确率、F值、Kappa值、Recall值及ROC_AUC值等的平均值,最终得出相对最优代谢物组合;
S7、通过比较最优代谢物组合的不同模型性能,发现基于SVM建立的模型性能最优;通过混淆矩阵,可以明确发病与健康香港牡蛎的代谢组数据能够有效分类;
S8、将筛选出的代谢物进行差异分析和相关性评估;
S9、最终基于最优代谢物组合的数据集,使用机器学习SVM构建分类模型,得到牡蛎病害诊断模型。
4.根据权利要求3所述的筛选方法,其特征在于,S4所述9种机器算法包括:决策树、支持向量机、极致梯度提升树、神经网络、随机森林、多元线性回归、最小绝对收缩与选择算子、逻辑回归、正交偏最小二乘判别分析。
CN202310328875.3A 2023-03-30 2023-03-30 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法 Pending CN116482155A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310328875.3A CN116482155A (zh) 2023-03-30 2023-03-30 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310328875.3A CN116482155A (zh) 2023-03-30 2023-03-30 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法

Publications (1)

Publication Number Publication Date
CN116482155A true CN116482155A (zh) 2023-07-25

Family

ID=87218606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310328875.3A Pending CN116482155A (zh) 2023-03-30 2023-03-30 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法

Country Status (1)

Country Link
CN (1) CN116482155A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117352064A (zh) * 2023-12-05 2024-01-05 成都泰莱生物科技有限公司 一种肺癌代谢标志物组合及其筛选方法和应用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117352064A (zh) * 2023-12-05 2024-01-05 成都泰莱生物科技有限公司 一种肺癌代谢标志物组合及其筛选方法和应用
CN117352064B (zh) * 2023-12-05 2024-02-09 成都泰莱生物科技有限公司 一种肺癌代谢标志物组合及其筛选方法和应用

Similar Documents

Publication Publication Date Title
Zhou et al. Evaluation of fish feeding intensity in aquaculture using a convolutional neural network and machine vision
Chen et al. Detection of rice plant diseases based on deep transfer learning
Park et al. Classification and morphological analysis of vector mosquitoes using deep convolutional neural networks
CN109543679A (zh) 一种基于深度卷积神经网络的死鱼识别方法及预警系统
CN112016392B (zh) 一种基于高光谱图像的大豆虫害程度的小样本检测方法
Leow et al. Automated identification of copepods using digital image processing and artificial neural network
Li et al. A deep learning method for recognizing elevated mature strawberries
CN116482155A (zh) 基于代谢组学的香港牡蛎病害诊断标志物及其筛选方法
Fang et al. Identification of apple leaf diseases based on convolutional neural network
Hasan et al. Fish diseases detection using convolutional neural network (CNN)
Xiao et al. Citrus greening disease recognition algorithm based on classification network using TRL-GAN
Suzuki et al. Deep learning predicts rapid over-softening and shelf life in persimmon fruits
Vishnoi et al. Crop disease classification through image processing and machine learning techniques using leaf images
Wang et al. Research on identification of corn disease occurrence degree based on improved ResNeXt network
Avanzato et al. Dairy Cow Behavior Recognition Using Computer Vision Techniques and CNN Networks
Roy et al. Disease Detection in Paddy Crop using Machine Learning Techniques
Zhang et al. Lightweight Multi-scale Convolutional Neural Network for Rice Leaf Disease Recognition.
Yang et al. Research and design of a machine vision-based silk cocoon quality inspection system
Shukla et al. A New Approach for Leaf Disease Detection using Multilayered Convolutional Neural Network
CN113786185A (zh) 一种基于卷积神经网络的静态脑网络特征提取方法和系统
Kumar et al. Double Channel CNN Based Tomato Plant Leaf Disease Detection
Dong et al. Dragon fruit disease image segmentation based on FCM algorithm and two-dimensional OTSU algorithm
Meena et al. Plant Diseases Detection Using Deep Learning
Concepcion II et al. BivalveNet: A hybrid deep neural network for common cockle (Cerastoderma edule) geographical traceability based on shell image analysis
Varma et al. Transfer Learning-based Optimal Feature Selection with DLCNN for Shrimp Recognition and Classification.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination