CN114334003B - 基于单分子测序的发酵金鲳深度学习质量判别方法及系统 - Google Patents

基于单分子测序的发酵金鲳深度学习质量判别方法及系统 Download PDF

Info

Publication number
CN114334003B
CN114334003B CN202111578375.2A CN202111578375A CN114334003B CN 114334003 B CN114334003 B CN 114334003B CN 202111578375 A CN202111578375 A CN 202111578375A CN 114334003 B CN114334003 B CN 114334003B
Authority
CN
China
Prior art keywords
golden pomfret
fermented golden
sample
neural network
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111578375.2A
Other languages
English (en)
Other versions
CN114334003A (zh
Inventor
王悦齐
吴燕燕
陈茜
相欢
李春生
赵永强
陈胜军
杨少玲
蔡秋杏
李来好
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beibu Gulf University
South China Sea Fisheries Research Institute Chinese Academy Fishery Sciences
Original Assignee
Beibu Gulf University
South China Sea Fisheries Research Institute Chinese Academy Fishery Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beibu Gulf University, South China Sea Fisheries Research Institute Chinese Academy Fishery Sciences filed Critical Beibu Gulf University
Priority to CN202111578375.2A priority Critical patent/CN114334003B/zh
Publication of CN114334003A publication Critical patent/CN114334003A/zh
Application granted granted Critical
Publication of CN114334003B publication Critical patent/CN114334003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了基于单分子测序的发酵金鲳深度学习质量判别方法及系统,涉及发酵水产食品快速分析检测领域,通过制备不同品质等级的传统发酵金鲳粉末状样品;提取样品的宏基因组DNA,并检验片段完整度、纯度及浓度;通过获取发酵金鲳样品的物种丰度数据,并作为神经网络模型的训练样本数据,对神经网络模型进行训练,并使用训练好的神经网络模型,对不同传统发酵金鲳的品质等级进行判别;本发明解决了标准化程度低和产品品质不稳定等问题,利用单分子实时测序获得样品的微生物群落结构组成,并结合机器学习判断传统发酵金鲳的品质质量等级,具有准确性高的特点,有利于传统发酵金鲳的品质监测和工业化生产。

Description

基于单分子测序的发酵金鲳深度学习质量判别方法及系统
技术领域
本申请涉及发酵水产食品快速分析检测领域,具体而言,涉及基于单分子测序的发酵金鲳深度学习质量判别方法及系统。
背景技术
传统发酵金鲳是一种传统的固态自然发酵鱼制品,是沿海地区特色的发酵鱼制品。据统计,2019年我国发酵鱼制品产量达152万吨,约占水产品加工总量(2171万吨)的7.01%,约占海水加工产品(1776万吨)的8.57%。传统发酵金鲳具有营养丰富和风味独特等主要优势,深受消费者的青睐,但由于传统发酵鱼生产体系缺乏系统的理论支持,自动化生产水平低。因此,实现传统发酵金鲳靶向工艺调控和品质监测是水产品加工行业迫切需要解决的关键问题之一。
由于发酵体系中微生物与代谢产物之间复杂的物质和能力交换,发酵金鲳的内部营养成分存在明显差异。目前,发酵金鲳品质的鉴定主要依赖色泽、气味和硬度等人工经验式感官判别,存在主观性强、标准化程度低和产品品质不稳定等问题。在固态自然发酵体系中,传统发酵金鲳的品质与不同微生物区系在发酵过程中复杂的生物学相互作用密切相关。单分子实时测序技术具读长长,通量高,物种注释准的优点,能够准确有效地分析微生物群落结构。深度学习是机器学习的一个分支,利用神经网络算法建立相应的模型,使机器具有学习分析能力并实现智能测判。单分子实时测序技术和机器学习结合能高效地对发酵金鲳的品质进行判别,目前尚未见利用单分子实时测序技术和机器学习技术对发酵金鲳的质量等级进行判别的报道。
发明内容
为了解决上述问题,本发明的目的是通过单分子实时测序对传统发酵金鲳的微生物群落结构进行分析,并基于发酵金鲳的微生物菌群组成及丰度,利用神经网络算法的机器学习技术对传统发酵金鲳的品质进行判别。该方法能够高效、准确对传统发酵金鲳的品质进行测判,满足现代水产食品快速检测和分析的要求。
为了实现上述技术目的,本申请提供了基于单分子测序的发酵金鲳深度学习质量判别方法,包括以下步骤:
制备不同品质等级的传统发酵金鲳粉末状样品,传统发酵金鲳粉末状样品用于单分子实时测序进行微生物群落结构分析;
提取传统发酵金鲳粉末状样品的宏基因组DNA,并检验片段完整度、纯度及浓度;
基于宏基因组DNA,获取发酵金鲳样品的物种丰度数据,作为神经网络模型的训练样本数据;
通过训练样本数据,对神经网络模型进行训练,并使用训练好的神经网络模型,对不同传统发酵金鲳的品质等级进行判别,其中,神经网络模型采用tansig作为隐藏层传递函数,采用purelin函数作为输出层传递函数,采用梯度下降法进行训练。
优选地,在制备不同品质等级的传统发酵金鲳检测样品的过程中,将若干传统发酵金鲳去皮去骨后,每条鱼从起点开始向尾部方向依次以中线和上表层为基点制取2cm×2cm×1cm的待测块状样品;
将待测块状样品,采用液氮冷却后研磨5-8s,每个样品重复研磨3次,制得传统发酵金鲳粉末状样品。
优选地,在提取宏基因组DNA的过程中,采用Omniscripy RT kit提取宏基因组DNA,通过单分子实时测序对不同样品的DNA进行测序,通过对CCS序列进行过滤、聚类,并进行物种注释和丰度分析,获取物种丰度数据。
优选地,在获取物种丰度数据的过程中,还包括以下步骤:
PCR扩增程序为:95℃预变性2min;98℃变性10s,55℃退火30s,72℃延伸90s,共循环30次;72℃终端延伸2min;
CCS序列识别:根据minPasses≥5,minPredictedAccuracy≥0.9识别初始CCS序列。
优选地,在对CCS序列进行过滤的过程中,通过识别barcode序列,识别不同样品的初始CCS序列,并去除嵌合体,得到高质量的CCS序列。
优选地,在对CCS序列进行聚类的过程中,基于CCS序列,在相似性97%的水平上对序列进行聚类,获取特征序列,其中,以所有序列数的0.005%作为阈值过滤OTUs;
以SILVA为参考数据库,使用朴素贝叶斯分类器结合比对的方法,对特征序列进行分类学注释,得到每个特征对应的物种分类信息,并在各个水平统计各样品群落组成,利用QIME软件获得不同分类水平的物种丰度表,其中,各个水平包括门、纲、目、科、属。
优选地,在对神经网络模型进行训练的过程中,利用mapminmax函数将训练样本数据归一化到[0,1]之间,其计算公式为:
y=(ymax-ymin)×(x-xmin)/(xmax-xmin)+ymin
其中,y为归一化之后的值,xmax为样本数据的最大值,xmin为样本数据的最小值。
优选地,在对神经网络模型进行训练的过程中,tansig函数的表达式为:
Figure BDA0003426145260000041
purelin函数的表达式为y=x。
优选地,在对神经网络模型进行训练的过程中,基于梯度下降法对网络权值和阈值进行调整,其中,
隐含层到输出层的权值:wjk=wjk+ηHjek
输入层到隐含层的权值:
Figure BDA0003426145260000042
隐含层到输出层的阈值:bk=bk+ηek
输入层到输出层的阈值:
Figure BDA0003426145260000043
其中:wij为输出层到隐藏层的权值,wjk为隐藏层到输出层的权值,bk为隐含层到输出层的阈值,aj为输入层到隐含层的阈值,η为学习速率,Hj为隐含层输出。
基于单分子测序的发酵金鲳深度学习质量判别系统,包括:
数据采集模块,用于通过制备不同品质等级的传统发酵金鲳粉末状样品,传统发酵金鲳粉末状样品用于单分子实时测序进行微生物群落结构分析;提取传统发酵金鲳粉末状样品的宏基因组DNA,并检验片段完整度、纯度及浓度;
样本构建模块,用于基于宏基因组DNA,获取发酵金鲳样品的物种丰度数据,作为神经网络模型的训练样本数据;
数据识别模块,用于通过训练样本数据,对神经网络模型进行训练,并使用训练好的神经网络模型,对不同传统发酵金鲳的品质等级进行判别,其中,神经网络模型采用tansig作为隐藏层传递函数,采用purelin函数作为输出层传递函数,采用梯度下降法进行训练。
本发明公开了以下技术效果:
本发明的方法突破了人工经验式判断发酵阶段存在的主观性强,标准化程度低和产品品质不稳定等问题,利用单分子实时测序获得样品的微生物群落结构组成,并结合机器学习判断传统发酵金鲳的品质等级,具有准确性高的特点,有利于传统发酵金鲳的品质监测和工业化生产。
神经网络具有极强的信息处理能力,具有强大的容错性和适应性,能够自动排除干扰因素并抽取有效数据特征,以获得准确结果。利用神经网络对传统发酵金鲳微生物丰度数据判断传统发酵金鲳的品质质量,对保证传统发酵金鲳品质稳定性有重要的指导意义。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1传统发酵金鲳质量判别神经网络原理图;
图2不同等级的传统发酵金鲳的微生物丰度图;
图3传统发酵金鲳质量判别神经网络模型拟合图。
具体实施方式
下为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1-3所示,本申请提供了基于单分子测序的发酵金鲳深度学习质量判别方法,包括以下步骤:
制备不同品质等级的传统发酵金鲳粉末状样品,传统发酵金鲳粉末状样品用于单分子实时测序进行微生物群落结构分析;
提取传统发酵金鲳粉末状样品的宏基因组DNA,并检验片段完整度、纯度及浓度;
基于宏基因组DNA,获取发酵金鲳样品的物种丰度数据,作为神经网络模型的训练样本数据;
通过训练样本数据,对神经网络模型进行训练,并使用训练好的神经网络模型,对不同传统发酵金鲳的品质等级进行判别,其中,神经网络模型采用tansig作为隐藏层传递函数,采用purelin函数作为输出层传递函数,采用梯度下降法进行训练。
进一步优选地,在制备不同品质等级的传统发酵金鲳检测样品的过程中,将若干传统发酵金鲳去皮去骨后,每条鱼从起点开始向尾部方向依次以中线和上表层为基点制取2cm×2cm×1cm的待测块状样品;
将待测块状样品,采用液氮冷却后研磨5-8s,每个样品重复研磨3次,制得传统发酵金鲳粉末状样品。
进一步优选地,在提取宏基因组DNA的过程中,采用Omniscripy RT kit提取宏基因组DNA,通过单分子实时测序对不同样品的DNA进行测序,通过对CCS序列进行过滤、聚类,并进行物种注释和丰度分析,获取物种丰度数据。
进一步优选地,在获取物种丰度数据的过程中,还包括以下步骤:
PCR扩增程序为:95℃预变性2min;98℃变性10s,55℃退火30s,72℃延伸90s,共循环30次;72℃终端延伸2min;
CCS序列识别:根据minPasses≥5,minPredictedAccuracy≥0.9识别初始CCS序列。
进一步优选地,在对CCS序列进行过滤的过程中,通过识别barcode序列,识别不同样品的初始CCS序列,并去除嵌合体,得到高质量的CCS序列。
进一步优选地,在对CCS序列进行聚类的过程中,基于CCS序列,在相似性97%的水平上对序列进行聚类,获取特征序列,其中,以所有序列数的0.005%作为阈值过滤OTUs;
以SILVA为参考数据库,使用朴素贝叶斯分类器结合比对的方法,对特征序列进行分类学注释,得到每个特征对应的物种分类信息,并在各个水平统计各样品群落组成,利用QIME软件获得不同分类水平的物种丰度表,其中,各个水平包括门、纲、目、科、属。
进一步优选地,在对神经网络模型进行训练的过程中,利用mapminmax函数将训练样本数据归一化到[0,1]之间,其计算公式为:
y=(ymax-ymin)×(x-xmin)/(xmax-xmin)+ymin
其中,y为归一化之后的值,xmax为样本数据的最大值,xmin为样本数据的最小值。
进一步优选地,在对神经网络模型进行训练的过程中,tansig函数的表达式为:
Figure BDA0003426145260000081
purelin函数的表达式为y=x。
优选地,在对神经网络模型进行训练的过程中,基于梯度下降法对网络权值和阈值进行调整,其中,
隐含层到输出层的权值:wjk=wjk+ηHjek
输入层到隐含层的权值:
Figure BDA0003426145260000082
隐含层到输出层的阈值:bk=bk+ηek
输入层到输出层的阈值:
Figure BDA0003426145260000083
其中:wij为输出层到隐藏层的权值,wjk为隐藏层到输出层的权值,bk为隐含层到输出层的阈值,aj为输入层到隐含层的阈值,η为学习速率,Hj为隐含层输出。
基于单分子测序的发酵金鲳深度学习质量判别系统,包括:
数据采集模块,用于通过制备不同品质等级的传统发酵金鲳粉末状样品,传统发酵金鲳粉末状样品用于单分子实时测序进行微生物群落结构分析;提取传统发酵金鲳粉末状样品的宏基因组DNA,并检验片段完整度、纯度及浓度;
样本构建模块,用于基于宏基因组DNA,获取发酵金鲳样品的物种丰度数据,作为神经网络模型的训练样本数据;
数据识别模块,用于通过训练样本数据,对神经网络模型进行训练,并使用训练好的神经网络模型,对不同传统发酵金鲳的品质等级进行判别,其中,神经网络模型采用tansig作为隐藏层传递函数,采用purelin函数作为输出层传递函数,采用梯度下降法进行训练。
实施例1:本发明公开了基于单分子测序的发酵金鲳深度学习质量判别方法,包括如下步骤:
(1)制备不同品质等级的传统发酵金鲳检测样品,若干传统发酵金鲳去皮去骨后,每条鱼从起点开始向尾部方向依次以中线和上表层为基点制取2cm×2cm×1cm(长×宽×厚)的待测块状样品;上述的块状样品采用液氮冷却后研磨5-8s,每个样品重复研磨3次,制得传统发酵金鲳粉末状样品;
(2)采用DNA提取试剂盒对步骤(1)中不同品质等级传统发酵金鲳样品提取宏基因组DNA,采用单分子实时测序对不同样品的DNA进行测序,通过对CCS(Circular ConsensusSequencing)序列进行过滤、聚类,并进行物种注释和丰度分析,揭示样品中微生物的群落结构。
(3)将不同品质等级的发酵金鲳样品的物种丰度数据,作为训练样本数据。利用mapminmax函数将训练样本数据归一化到[0,1]之间,其计算公式为:y=(ymax-ymin)*(x-xmin)/(xmax-xmin)+ymin。其中,y为归一化之后的值,xmax为样本数据的最大值,xmin为样本数据的最小值。
(4)确定神经网络层数,各层节点数,隐含层神经元个数、训练次数、学习速率及训练目标最小误差等。使用tansig为隐藏层传递函数,purelin函数作为输出层传递函数,采用梯度下降法进行训练,建立神经网络模型。
(5)初始化所述神经网络的权值与阈值在[-1,1]之间。利用步骤(3)中归一化后的训练样本数据对步骤(4)所述神经网络模型进行训练,当训练误差小于训练目标最小误差,并符合预设精度要求时,停止对所述神经网络进行训练,以得到训练好的神经网络。
(6)利用训练好的神经网络对不同传统发酵金鲳的品质进行判别。
实施例2:
1、本发明提出的方法应用于传统发酵金鲳品质判别,本实施例中所用的金鲳购于阳江市宏凯渔风有限公司,品质等级分别为A、B、C、D和E等级的样品各10条,共计50条,根据发明专利中步骤(1)中的方法将传统发酵金鲳进行预处理,每条鱼从起点开始向尾部方向依次切取5块2cm宽的鱼块,小心切除每一个鱼块上表层的和中线部位的鱼肉,然后以中线和上表层为基点制取1cm×1cm×1cm(长×宽×厚)的待测样品,随后将块状的传统发酵金鲳样品置于液氮环境中进行冷却,随后用研磨机进行研磨5-8s,每个样品重复研磨3次,制得传统发酵金鲳粉末状样品,获得的样品用于单分子实时测序进行微生物群落结构分析。
(2)采用Omniscripy RT kit对步骤(1)中不同品质等级传统发酵金鲳样品提取宏基因组DNA,随后检测DNA的片段完整度、纯度及浓度。PCR扩增程序为:95℃预变性2min;98℃变性10s,55℃退火30s,72℃延伸90s,共循环30次;72℃终端延伸2min。各样品产物纯化后,用PacBio SMRT测序平台构建文库。使用SMRT Link v8.0软件,按照minPasses≥5,minPredictedAccuracy≥0.9识别CCS序列。使用lima v1.7.0通过识别barcode序列识别不同样品的CCS序列并去除嵌合体,得到高质量的CCS序列。使用Usearch软件(version10.0)在相似性97%的水平上对序列进行聚类,以所有序列数的0.005%作为阈值过滤OTUs。以SILVA为参考数据库使用朴素贝叶斯分类器结合比对的方法对特征序列进行分类学注释,可得到每个特征对应的物种分类信息,进而在各个水平(门、纲、目、科、属)统计各样品群落组成,利用QIME软件获得不同分类水平的物种丰度表。
(3)将不同品质等级的发酵金鲳样品的物种丰度数据,作为训练样本数据。利用mapminmax函数将训练样本数据归一化到[0,1]之间,其计算公式为:y=(ymax-ymin)×(x-xmin)/(xmax-xmin)+ymin。其中,y为归一化之后的值,xmax为样本数据的最大值,xmin为样本数据的最小值。
(4)确定神经网络层数,各层节点数,隐含层神经元个数、训练次数、学习速率及训练目标最小误差等。使用tansig为隐藏层传递函数,purelin函数作为输出层传递函数,采用梯度下降法进行训练,建立神经网络模型。其中,tansig函数表达式为:
Figure BDA0003426145260000121
而purelin函数表达式为:
y=x;
初始化所述神经网络的权值阈值在[-1,1]之间。基于梯度下降法对网络权值和阈值进行调整:
隐含层到输出层的权值:
wjk=wjk+ηHjek
输入层到隐含层的权值:
Figure BDA0003426145260000122
隐含层到输出层的阈值:
bk=bk+ηek
输入层到输出层的阈值:
Figure BDA0003426145260000123
其中:wij为输出层到隐藏层的权值,wjk为隐藏层到输出层的权值,bk为隐含层到输出层的阈值,aj为输入层到隐含层的阈值,η为学习速率,Hj为隐含层输出。
利用步骤(3)中归一化后的样本数据对步骤(4)所述神经网络模型进行训练,当训练误差小于训练目标最小误差,并符合预设精度要求时,停止对所述神经网络进行训练,以得到训练好的神经网络。不同品质等级的传统发酵金鲳各有10组数据,每个品质等级将70%的数据即7组数据,五个品质等级共35组数据作为样本训练数据,20%的数据,每个品质等级2组,共10组数据作为样本验证数据,剩余的5%的数据,每个品质等级1组,共5组数据作为样本的测试数据。
(6)利用训练好的神经网络对不同传统发酵金鲳的品质等级进行判别。
综上,本技术突破发酵水产食品经验式鉴别发酵程度的限制,能够从微生物角度科学分析发酵阶段,为实现传统发酵金鲳靶向工艺调控和品质监测提供技术支撑。

Claims (6)

1.基于单分子测序的发酵金鲳深度学习质量判别方法,其特征在于,包括以下步骤:
制备不同品质等级的传统发酵金鲳粉末状样品,所述传统发酵金鲳粉末状样品用于单分子实时测序进行微生物群落结构分析;
提取所述传统发酵金鲳粉末状样品的宏基因组DNA,并检验片段完整度、纯度及浓度;在提取所述宏基因组DNA的过程中,采用Omniscripy RT kit提取所述宏基因组DNA,通过单分子实时测序对不同样品的DNA进行测序,通过对CCS序列进行过滤、聚类,并进行物种注释和丰度分析,获取物种丰度数据;
基于所述宏基因组DNA,获取发酵金鲳样品的物种丰度数据,作为神经网络模型的训练样本数据;
通过所述训练样本数据,对所述神经网络模型进行训练,并使用训练好的所述神经网络模型,对不同传统发酵金鲳的品质等级进行判别,其中,所述神经网络模型采用tansig作为隐藏层传递函数,采用purelin函数作为输出层传递函数,采用梯度下降法进行训练;在对所述神经网络模型进行训练的过程中,利用mapminmax函数将所述训练样本数据归一化到[0,1]之间,其计算公式为:
y=(ymax-ymin)×(x-xmin)/(xmax-xmin)+ymin
其中,y为归一化之后的值,xmax为样本数据的最大值,xmin为样本数据的最小值;
tansig函数的表达式为:
Figure FDA0003967744000000011
所述purelin函数的表达式为y=x;
在对所述神经网络模型进行训练的过程中,基于所述梯度下降法对网络权值和阈值进行调整,其中,
隐含层到输出层的权值:wjk=wjk+ηHjek
输入层到隐含层的权值:
Figure FDA0003967744000000021
隐含层到输出层的阈值:bk=bk+ηek
输入层到输出层的阈值:
Figure FDA0003967744000000022
其中:wij为输出层到隐藏层的权值,wjk为隐藏层到输出层的权值,bk为隐含层到输出层的阈值,aj为输入层到隐含层的阈值,η为学习速率,Hj为隐含层输出。
2.根据权利要求1所述基于单分子测序的发酵金鲳深度学习质量判别方法,其特征在于:
在制备不同品质等级的传统发酵金鲳检测样品的过程中,将若干传统发酵金鲳去皮去骨后,每条鱼从起点开始向尾部方向依次以中线和上表层为基点制取2cm×2cm×1cm的待测块状样品;
将所述待测块状样品,采用液氮冷却后研磨5-8s,每个样品重复研磨3次,制得所述传统发酵金鲳粉末状样品。
3.根据权利要求1所述基于单分子测序的发酵金鲳深度学习质量判别方法,其特征在于:
在获取所述物种丰度数据的过程中,还包括以下步骤:
PCR扩增程序为:95℃预变性2min;98℃变性10s,55℃退火30s,72℃延伸90s,共循环30次;72℃终端延伸2min;
CCS序列识别:根据minPasses≥5,minPredictedAccuracy≥0.9识别初始CCS序列。
4.根据权利要求3所述基于单分子测序的发酵金鲳深度学习质量判别方法,其特征在于:
在对CCS序列进行过滤的过程中,通过识别barcode序列,识别不同样品的所述初始CCS序列,并去除嵌合体,得到高质量的所述CCS序列。
5.根据权利要求4所述基于单分子测序的发酵金鲳深度学习质量判别方法,其特征在于:
在对CCS序列进行聚类的过程中,基于所述CCS序列,在相似性97%的水平上对序列进行聚类,获取特征序列,其中,以所有序列数的0.005%作为阈值过滤OTUs;
以SILVA为参考数据库,使用朴素贝叶斯分类器结合比对的方法,对所述特征序列进行分类学注释,得到每个特征对应的物种分类信息,并在各个水平统计各样品群落组成,利用QIME软件获得不同分类水平的物种丰度表,其中,所述各个水平包括门、纲、目、科、属。
6.基于单分子测序的发酵金鲳深度学习质量判别系统,其特征在于,包括:
数据采集模块,用于通过制备不同品质等级的传统发酵金鲳粉末状样品,所述传统发酵金鲳粉末状样品用于单分子实时测序进行微生物群落结构分析;提取所述传统发酵金鲳粉末状样品的宏基因组DNA,并检验片段完整度、纯度及浓度;
样本构建模块,用于基于所述宏基因组DNA,获取发酵金鲳样品的物种丰度数据,作为神经网络模型的训练样本数据;
数据识别模块,用于通过所述训练样本数据,对所述神经网络模型进行训练,并使用训练好的所述神经网络模型,对不同传统发酵金鲳的品质等级进行判别,其中,所述神经网络模型采用tansig作为隐藏层传递函数,采用purelin函数作为输出层传递函数,采用梯度下降法进行训练。
CN202111578375.2A 2021-12-22 2021-12-22 基于单分子测序的发酵金鲳深度学习质量判别方法及系统 Active CN114334003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111578375.2A CN114334003B (zh) 2021-12-22 2021-12-22 基于单分子测序的发酵金鲳深度学习质量判别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111578375.2A CN114334003B (zh) 2021-12-22 2021-12-22 基于单分子测序的发酵金鲳深度学习质量判别方法及系统

Publications (2)

Publication Number Publication Date
CN114334003A CN114334003A (zh) 2022-04-12
CN114334003B true CN114334003B (zh) 2023-03-17

Family

ID=81055251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111578375.2A Active CN114334003B (zh) 2021-12-22 2021-12-22 基于单分子测序的发酵金鲳深度学习质量判别方法及系统

Country Status (1)

Country Link
CN (1) CN114334003B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107709576A (zh) * 2015-04-13 2018-02-16 优比欧迈公司 用于神经系统健康问题的微生物组来源的诊断和治疗的方法及系统
CN109557148A (zh) * 2018-11-15 2019-04-02 四川理工学院 一种快速检测微生物群落的系统及方法
CN113744807A (zh) * 2021-11-03 2021-12-03 微岩医学科技(北京)有限公司 一种基于宏基因组学的病原微生物检测方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101793886A (zh) * 2010-03-24 2010-08-04 北京林业大学 一种基于bp神经网络预测发酵酸乳感官评定方法
CN104517035B (zh) * 2014-12-22 2017-10-27 中国舰船研究设计中心 一种平面阵列天线有源散射方向图预测方法
CN106434914A (zh) * 2016-09-26 2017-02-22 海南大学 一种胡椒脱皮过程中关键微生物功能基因组的检测方法
CN108448979B (zh) * 2018-03-27 2021-10-22 北京工业大学 一种基于磁编码器误差神经网络补偿的永磁同步电机系统
CN108841942B (zh) * 2018-06-04 2021-12-07 常州市环境监测中心 一种pm2.5细菌群落组成来源快速分析及风险评估方法
CN109112225A (zh) * 2018-08-30 2019-01-01 海南大学 一种诺丽自然发酵过程中关键微生物甄别及筛选的方法
CN109949863B (zh) * 2019-02-18 2023-05-26 贵州茅台酒股份有限公司 一种基于随机森林模型鉴别大曲质量的方法
CN112251503A (zh) * 2020-03-17 2021-01-22 南京大学 一种基于16S rDNA全长高通量测序检测根际细菌群落的方法
CN111816258B (zh) * 2020-07-20 2023-10-31 杭州谷禾信息技术有限公司 人体菌群16S rDNA高通量测序物种精确鉴定的优化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107709576A (zh) * 2015-04-13 2018-02-16 优比欧迈公司 用于神经系统健康问题的微生物组来源的诊断和治疗的方法及系统
CN109557148A (zh) * 2018-11-15 2019-04-02 四川理工学院 一种快速检测微生物群落的系统及方法
CN113744807A (zh) * 2021-11-03 2021-12-03 微岩医学科技(北京)有限公司 一种基于宏基因组学的病原微生物检测方法及装置

Also Published As

Publication number Publication date
CN114334003A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
De Roy et al. Flow cytometry for fast microbial community fingerprinting
CN109949863B (zh) 一种基于随机森林模型鉴别大曲质量的方法
CN108256292A (zh) 一种拷贝数变异检测装置
CN114627125A (zh) 一种基于光学手段的不锈钢压片机表面质量评估方法
CN101216416A (zh) 产微囊藻毒素蓝藻的实时荧光定量pcr检测方法
CN114334003B (zh) 基于单分子测序的发酵金鲳深度学习质量判别方法及系统
CN106434959A (zh) 一种食品及饲料中鸡源成分快速检测试剂盒及其应用
CN112233722B (zh) 品种鉴定的方法、其预测模型的构建方法和装置
CN113403400A (zh) 一种基于环境dna宏条形码技术的底栖动物完整性评价方法
CN116590381A (zh) 一种筛选再生水补水影响河道生物多样性的关键水质因子的方法
CN116426652A (zh) 一种基于pcr反应的白羽鸽选育方法及所用引物和试剂盒
CN107400723A (zh) 种子植物物种的鉴定方法和用途
CN114921572B (zh) 一种用于鉴别泰和乌鸡品种的snp分子标记及其应用
CN1858251A (zh) 家禽品种ssr指纹技术鉴定方法
CN1858252A (zh) 利用ssr指纹技术监测家禽品种资源保种效果的方法
CN114925759A (zh) 一种以太坊钓鱼行为账户的特征分析方法
CN114565221A (zh) 水生态系统环境质量综合评价方法
CN101705297B (zh) 一种基于微卫星指纹图谱的湖羊和无角陶塞特羊鉴别方法
CN114107541A (zh) 一种筛选黄绿卷毛菇总可溶性氨基酸含量指标的dna条形码
CN109609662B (zh) 同步检测鉴定禽类、鱼类、反刍类三大类成分的多重液相基因芯片的核酸和方法及试剂盒
Jugovic et al. Wing pattern morphology of three closely related Melitaea (Lepidoptera, Nymphalidae) species reveals highly inaccurate external morphology-based species identification
CN112730410A (zh) 一种光谱法快速分辨海鲜的方法
CN113470752A (zh) 一种基于纳米孔测序仪的细菌测序数据鉴定方法
CN117116351B (zh) 基于机器学习算法的物种鉴定模型的构建方法、物种鉴定方法和物种鉴定系统
CN110452990A (zh) 用于选择母鸡产蛋后期产蛋率的snp分子标记及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant