CN116612820B - 基于数据分析的乳制品生产智能管理平台 - Google Patents

基于数据分析的乳制品生产智能管理平台 Download PDF

Info

Publication number
CN116612820B
CN116612820B CN202310889208.2A CN202310889208A CN116612820B CN 116612820 B CN116612820 B CN 116612820B CN 202310889208 A CN202310889208 A CN 202310889208A CN 116612820 B CN116612820 B CN 116612820B
Authority
CN
China
Prior art keywords
dairy product
sample
otu
data
microbial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310889208.2A
Other languages
English (en)
Other versions
CN116612820A (zh
Inventor
张兵
冯宗玲
霍芳
赵蕾
郭璐
马力
唐世云
付石军
莫玲
何斌
魏敏
赵舰
杨建刚
宋义艳
孟庆云
刘吉冰
刘书琪
吴莹
王建猛
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Binzhou Dianshi Gold Technology Transfer And Achievement Transformation Service Center
Shandong Anyuxian Food Co ltd
Shandong Jizhi Bioengineering Co ltd
Shandong Binzhou Animal Science & Veterinary Medicine Academy
Original Assignee
Binzhou Dianshi Gold Technology Transfer And Achievement Transformation Service Center
Shandong Anyuxian Food Co ltd
Shandong Jizhi Bioengineering Co ltd
Shandong Binzhou Animal Science & Veterinary Medicine Academy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Binzhou Dianshi Gold Technology Transfer And Achievement Transformation Service Center, Shandong Anyuxian Food Co ltd, Shandong Jizhi Bioengineering Co ltd, Shandong Binzhou Animal Science & Veterinary Medicine Academy filed Critical Binzhou Dianshi Gold Technology Transfer And Achievement Transformation Service Center
Priority to CN202310889208.2A priority Critical patent/CN116612820B/zh
Publication of CN116612820A publication Critical patent/CN116612820A/zh
Application granted granted Critical
Publication of CN116612820B publication Critical patent/CN116612820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Manufacturing & Machinery (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于乳制品生产管理技术领域,具体涉及基于数据分析的乳制品生产智能管理平台。所述平台包括:样本间隔采样组、环境数据监测系统和数据分析系统;所述样本间隔采样组包括多个相同的采样单元;所述采样单元分别设置于乳制品生产流程中的不同观测节点,对经过该观测节点的乳制品中间产物进行采样,以获得微生物16SrRNA基因序列数据;所述观测节点通过如下步骤进行确定:获取乳制品生产流程中乳制品经过每一个环节后的蛋白质含量、pH值和酸度,基于蛋白质含量、pH值和酸度,确定观测节点,在所述观测节点,蛋白质含量、pH值和和酸度的变化率的和值超过设定的阈值。本发明实现了智能化的生产管理和质量控制。

Description

基于数据分析的乳制品生产智能管理平台
技术领域
本发明属于乳制品生产管理技术领域,具体涉及基于数据分析的乳制品生产智能管理平台。
背景技术
近年来,随着乳制品行业的快速发展,乳制品的生产管理面临着越来越大的挑战。传统的乳制品生产流程管理主要依赖于人工操作和经验判断,存在着生产过程难以实时监测、质量问题难以准确判断等问题。因此,针对乳制品生产过程中存在的管理难题,需要引入先进的技术手段来实现智能化的生产管理和质量控制。
目前,随着数据分析和人工智能技术的快速发展,基于数据分析的乳制品生产智能管理平台成为解决这一问题的新途径。这种平台通过采集和分析乳制品生产过程中的环境数据和微生物16SrRNA基因序列数据,以实现对生产流程的实时监测和质量控制。然而,在已有的相关技术中仍存在一些问题需要解决。
首先,传统的乳制品生产流程监测方法主要依赖人工抽样和实验室检测,存在着监测周期长、操作繁琐、数据收集不及时的问题。由于乳制品生产过程中涉及到多个观测节点,传统方法需要在每个观测节点进行抽样和检测,然后将样本送往实验室进行分析,导致监测结果的延迟和不及时性。
其次,传统的乳制品质量评估方法主要基于物理化学指标,如蛋白质含量、pH值和酸度等。这些指标虽然可以提供一些关于乳制品质量的信息,但无法全面评估微生物群落的多样性和稳定性。乳制品生产过程中微生物群落的变化对乳制品的质量具有重要影响,但传统方法无法直接评估微生物群落的质量特征。
另外,传统的数据分析方法对于大规模的微生物16SrRNA基因序列数据处理能力较弱,无法有效地从海量数据中提取有用的信息。此外,现有的OTU聚类算法在计算多样性指数时存在一定的局限性,无法充分考虑样本间的差异和权重。
发明内容
本发明的主要目的在于提供基于数据分析的乳制品生产智能管理平台,旨在解决传统乳制品生产流程中的管理难题,实现智能化的生产管理和质量控制。通过采集和分析乳制品生产过程中的环境数据和微生物16SrRNA基因序列数据,该平台能够实时监测生产流程、评估乳制品质量,并定位潜在的问题环节。
为解决上述技术问题,本发明提供的基于数据分析的乳制品生产智能管理平台,所述平台包括:样本间隔采样组、环境数据监测系统和数据分析系统;所述样本间隔采样组包括多个相同的采样单元;所述采样单元分别设置于乳制品生产流程中的不同观测节点,对经过该观测节点的乳制品中间产物进行采样,以获得微生物16SrRNA基因序列数据;所述观测节点通过如下步骤进行确定:获取乳制品生产流程中乳制品经过每一个环节后的蛋白质含量、pH值和酸度,基于蛋白质含量、pH值和酸度,确定观测节点,在所述观测节点,蛋白质含量、pH值和和酸度的变化率的和值超过设定的阈值;所述环境数据监测系统,配置用于实时获取乳制品生产过程中的环境数据;在环境数据监测系统实时获取环境数据时,若乳制品中间产物经过一个观测节点,则将对应时刻的环境数据绑定到该观测节点对应的采样单元采样得到的微生物16SrRNA基因序列数据中;所述数据分析系统,配置用于基于采样得到的微生物16SrRNA基因序列数据,进行OTU聚类后,计算得到乳制品质量指数,再使用环境数据对乳制品质量指数进行校正,得到最终的质量指数,通过将质量指数与预设的阈值范围进行比较,判断乳制品生产流程中是否出现问题,以及定位出现问题的环节。
进一步的,所述环境数据包括:温度、湿度和氧气浓度。
进一步的,所述数据分析系统,基于采样得到的微生物16SrRNA基因序列数据,进行OTU聚类的方法包括:对微生物16SrRNA基因序列数据进行预处理,去除低质量序列和去除噪声,得到预处理序列;将预处理序列与参考数据库中的已知序列进行比对,根据序列的相似性将序列聚类为OTU;根据OTU聚类结果,生成OTU表,记录每个OTU在每个样本中的相对差异丰度。
进一步的,所述对微生物16SrRNA基因序列数据进行预处理,去除低质量序列和去除噪声,得到预处理序列的方法包括:首先将微生物16SrRNA基因序列数据通过一个高斯滤波器,然后对微生物16SrRNA基因序列数据进行测序读取,对于每个测序读取,使用Phred质量值作为其质量值;确定一个质量阈值,所述质量阈值的范围在20到30之间;将质量值低于20的微生物16SrRNA基因序列数据作为低质量序列,去除低质量序列后,得到预处理序列。
进一步的,所述数据分析系统计算得到乳制品质量指数的方法包括:基于OUT表,使用改进的丰度计算算法,计算出Alpha多样性指数;使用改进的距离计算算法,计算出Beta多样性指数;设每个采样单元采集到的微生物16SrRNA基因序列数据的Alpha多样性指数为;设每个采样单元采集到的微生物16SrRNA基因序列数据的Beta多样性指数为/>;则使用如下公式计算出乳制品质量指数:
;
其中,为采样单元的数量;/>为乳制品质量指数;/>为调整系数,取值范围为
进一步的,所述使用改进的丰度计算算法,计算出Alpha多样性指数的方法包括:输入OUT表;选择Shannon指数作为多样性指数;计算每个OTU在样本中的相对差异丰度;使用如下公式计算Alpha多样性指数:
其中,是OTU的数量,/>是第/>个OTU的相对差异丰度,/>是总OTU数。
进一步的,所述使用改进的距离计算算法,计算出Beta多样性指数的方法包括:输入OTU表;选择Bray-Curtis距离作为计算距离;计算每个OTU在样本中的相对差异丰度;根据所选的计算距离,计算每对样本之间的距离,然后将这些距离用于计算Beta多样性指数。
其中,表示样本/>和样本/>之间的Bray-Curtis距离,/>是OTU的数量,/>表示样本/>中第/>个OTU的相对差异丰度,/>表示样本/>中第/>个OTU的相对差异丰度。
进一步的,所述OTU的相对差异丰度通过如下过程进行计算:根据OTU表中记录的每个样本中各个OTU的计数,获取每个OTU在每个样本中的计数值;对于每个样本,计算其所有OTU的计数之和,以获得该样本中微生物总计数;对于每个OTU,在给定样本中,将其计数除以该样本的总计数,然后乘以100,以获得该OTU在样本中的相对丰度;计算每个OTU在每个样本中的计数值的标准差;将相对丰度除以标准差得到相对差异丰度。
进一步的,所述使用环境数据对乳制品质量指数进行校正,得到最终的质量指数的方法包括:计算环境数据中每种数据与预设的对应的标准值的差异率的和值的倒数作为校正系数,将该校正系数乘以乳制品质量指数得到最终的质量指数。
本发明的基于数据分析的乳制品生产智能管理平台,具有以下有益效果:传统的乳制品生产流程监测方法依赖人工抽样和实验室检测,周期长、操作繁琐,导致监测结果的延迟和不及时性。而本发明通过设置采样单元和观测节点,结合环境数据监测系统,能够实时获取乳制品生产过程中的环境数据。通过对环境数据的实时监测,可以及时掌握生产过程中的变化和异常情况,实现对乳制品生产流程的实时监测。本发明引入了微生物16SrRNA基因序列数据的采样和分析,能够更全面地评估乳制品的质量。传统的乳制品质量评估方法主要基于物理化学指标,无法全面评估微生物群落的多样性和稳定性。而通过采集乳制品中间产物的样本,获取微生物16SrRNA基因序列数据,并经过OTU聚类和多样性指数计算,可以得到乳制品的质量指数。这种基于微生物群落的质量评估能够更全面地反映乳制品质量的特征,为生产管理提供更准确的参考。本发明的数据分析系统具备处理大规模微生物16SrRNA基因序列数据的能力。在乳制品生产过程中,采集的微生物16SrRNA基因序列数据往往具有大量样本和OTU的特点,传统的数据分析方法处理能力有限。而本发明中的数据分析系统通过改进的OTU聚类算法和丰度计算算法,能够高效地从海量数据中提取有用的信息。这样可以加快数据分析过程,准确获取乳制品质量指数,为生产决策提供及时依据。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的基于数据分析的乳制品生产智能管理平台的平台结构示意图。
具体实施方式
下面结合附图及本发明的实施例对本发明的方法作进一步详细的说明。
基于数据分析的乳制品生产智能管理平台,所述平台包括:样本间隔采样组、环境数据监测系统和数据分析系统;所述样本间隔采样组包括多个相同的采样单元;所述采样单元分别设置于乳制品生产流程中的不同观测节点,对经过该观测节点的乳制品中间产物进行采样,以获得微生物16SrRNA基因序列数据;所述观测节点通过如下步骤进行确定:获取乳制品生产流程中乳制品经过每一个环节后的蛋白质含量、pH值和酸度,基于蛋白质含量、pH值和酸度,确定观测节点,在所述观测节点,蛋白质含量、pH值和和酸度的变化率的和值超过设定的阈值;所述环境数据监测系统,配置用于实时获取乳制品生产过程中的环境数据;在环境数据监测系统实时获取环境数据时,若乳制品中间产物经过一个观测节点,则将对应时刻的环境数据绑定到该观测节点对应的采样单元采样得到的微生物16SrRNA基因序列数据中;所述数据分析系统,配置用于基于采样得到的微生物16SrRNA基因序列数据,进行OTU聚类后,计算得到乳制品质量指数,再使用环境数据对乳制品质量指数进行校正,得到最终的质量指数,通过将质量指数与预设的阈值范围进行比较,判断乳制品生产流程中是否出现问题,以及定位出现问题的环节。
具体的,样本间隔采样组包含多个相同的采样单元,每个采样单元设置在乳制品生产流程中的不同观测节点。观测节点是指乳制品生产过程中的特定位置或环节。这些采样单元的作用是在每个观测节点上采样乳制品中间产物,以获得微生物16SrRNA基因序列数据。
采样单元通过设置在不同的观测节点上,可以对乳制品生产过程中的特定环节进行监测。观测节点的确定依赖于乳制品经过每个环节后的蛋白质含量、pH值和酸度。当蛋白质含量、pH值和酸度的变化率总和超过设定的阈值时,确定该位置为观测节点。这样做的目的是通过监测关键环节,了解乳制品在不同阶段的质量特征和微生物遗传信息。
该系统实时获取乳制品生产过程中的环境数据。这些环境数据可以包括温度、湿度、气体浓度等参数。当乳制品中间产物经过一个观测节点时,对应时刻的环境数据会绑定到该观测节点对应的采样单元采样得到的微生物16SrRNA基因序列数据中。这样可以建立环境数据与微生物遗传信息之间的关联,帮助分析人员理解微生物的生长环境和其对乳制品质量的影响。
数据分析系统是对采样得到的微生物16SrRNA基因序列数据进行处理和分析的关键组件。首先,采用OTU聚类算法对微生物序列数据进行分类和鉴定,将相似的序列归为同一类别,以便更好地理解微生物的物种多样性。接着,计算得到乳制品质量指数,这个指数综合考虑微生物多样性、丰度和相对丰度等指标,反映乳制品的质量状况。最后,使用环境数据对乳制品质量指数进行校正,以考虑环境因素对质量的影响,进一步提高质量指数的准确性和可靠性。
OTU聚类在该乳制品生产智能管理平台中的作用是对采样得到的微生物16SrRNA基因序列数据进行分类和鉴定,将相似的序列归为同一类别。基于这个分类结果,可以得到微生物的物种多样性信息。
在乳制品生产中,微生物的存在和活动可能对产品的质量和安全性产生重要影响。正常的生产流程中,乳制品中的微生物群落应该符合一定的特征和稳定状态。然而,如果生产流程出现问题,例如受到污染、工艺异常或不当操作等因素影响,可能会导致微生物群落发生变化。
通过对采样得到的微生物16SrRNA基因序列数据进行OTU聚类,可以获得不同微生物分类单元(OTU)的信息。通过分析不同OTU的丰度、物种组成和多样性等指标,可以比较正常生产流程和异常情况下的微生物群落差异。
如果生产流程正常,正常情况下的微生物群落结构应该稳定,并符合预期的物种组成和多样性特征。然而,当生产流程出现问题时,可能导致微生物群落的结构变化,包括物种组成的改变、丰度的变化以及多样性的降低或增加。
因此,通过对OTU聚类结果进行分析,可以比较不同生产流程样本之间的微生物群落差异,判断乳制品生产流程是否出现问题。异常情况下的微生物群落结构与正常情况下的差异可以作为潜在的指标来检测生产流程的异常和质量问题。
优选地,所述环境数据包括:温度、湿度和氧气浓度。
气体浓度是指空气中特定气体的浓度,可能包括二氧化碳(CO2)、氧气(O2)和氨气(NH3)等。在乳制品生产中,气体浓度的监测可以提供有关生产环境的信息。例如,CO2浓度的变化可以反映发酵过程的进行和微生物活动情况,而氧气和氨气浓度的监测可以帮助评估通风和卫生条件是否良好。通过实时监测气体浓度,可以及时发现环境异常或潜在问题,并采取相应的控制措施。
湿度是指空气中水分的含量。在乳制品生产中,适宜的湿度可以影响产品的水分蒸发、细菌生长和酶的活性等因素。过高的湿度可能导致产品受潮、霉变和微生物污染,而过低的湿度可能导致产品干燥、质地变硬等问题。通过监测和调节湿度,可以确保在适宜的湿度条件下进行乳制品生产,维持产品的质量和口感。
温度是乳制品生产过程中最基本的环境参数之一。乳制品生产通常需要控制特定温度条件来促进微生物发酵、防止细菌繁殖和保持产品质量稳定。通过实时监测和记录温度数据,可以确保生产环境的温度处于适宜的范围内,避免过高或过低的温度对产品质量造成不利影响。
优选地,所述数据分析系统,基于采样得到的微生物16SrRNA基因序列数据,进行OTU聚类的方法包括:对微生物16SrRNA基因序列数据进行预处理,去除低质量序列和去除噪声,得到预处理序列;将预处理序列与参考数据库中的已知序列进行比对,根据序列的相似性将序列聚类为OTU;根据OTU聚类结果,生成OTU表,记录每个OTU在每个样本中的相对差异丰度。
具体的,对采样得到的微生物16SrRNA基因序列数据进行预处理是为了提高数据质量。这通常包括去除低质量的序列(如含有过多测序错误的序列)和去除噪声(如引物污染或测序仪的技术噪声)。通过预处理,可以获得更准确和可靠的序列数据用于后续分析。在预处理后,预处理序列将与参考数据库中的已知序列进行比对。比对的目的是找到已知序列中与预处理序列相似的部分,进而将它们聚类为OTU。常用的比对算法包括BLAST、USEARCH和VSEARCH等。通过比对和聚类,可以将相似的序列归为同一OTU,即将具有相似遗传信息的微生物序列归为一类。根据OTU聚类结果,生成OTU表,记录每个OTU在每个样本中的相对丰度。OTU表是一个矩阵,行表示不同的OTU,列表示不同的样本,而每个元素则表示相应OTU在相应样本中的相对丰度。OTU表提供了对微生物群落结构和组成的定量描述,为后续的分析和解释提供了基础。
优选地,所述对微生物16SrRNA基因序列数据进行预处理,去除低质量序列和去除噪声,得到预处理序列的方法包括:首先将微生物16SrRNA基因序列数据通过一个高斯滤波器,然后对微生物16SrRNA基因序列数据进行测序读取,对于每个测序读取,使用Phred质量值作为其质量值;确定一个质量阈值,所述质量阈值的范围在20到30之间;将质量值低于20的微生物16SrRNA基因序列数据作为低质量序列,去除低质量序列后,得到预处理序列。
具体的,将微生物16SrRNA基因序列数据通过一个高斯滤波器进行平滑处理。高斯滤波器可以帮助去除测序数据中的一些随机噪声和异常值,提高数据的质量和可靠性。对于经过高斯滤波器处理的微生物16SrRNA基因序列数据,进行测序读取。每个测序读取都会有一个与之相关的质量值,用于表示该读取的质量。质量值通常使用Phred质量值来衡量,Phred质量值是一种常用的表示测序质量的指标。
优选地,所述数据分析系统计算得到乳制品质量指数的方法包括:基于OUT表,使用改进的丰度计算算法,计算出Alpha多样性指数;使用改进的距离计算算法,计算出Beta多样性指数;设每个采样单元采集到的微生物16SrRNA基因序列数据的Alpha多样性指数为;设每个采样单元采集到的微生物16SrRNA基因序列数据的Beta多样性指数为/>;则使用如下公式计算出乳制品质量指数:
其中,为采样单元的数量;/>为乳制品质量指数;/>为调整系数,取值范围为
具体的,乳制品质量指数是综合考虑Alpha多样性指数和Beta多样性指数的结果。公式中的乳制品质量指数Q通过对Alpha多样性指数和Beta多样性指数进行处理得到。在公式中,首先对Alpha多样性指数求和并取对数,然后取绝对值;接着对Beta多样性指数求和并取对数,再取绝对值;最后将两部分的结果进行乘积并进行指数运算。这样的计算方式综合考虑了样本内物种丰富度和均匀度以及样本间的差异程度,得到了乳制品的质量指数。
调整系数C是一个常数,用于调整乳制品质量指数的范围和敏感度。它可以根据实际需求进行设定。通过调整系数C的值,可以对乳制品质量指数的计算结果进行调节,以满足不同质量评估的要求。
优选地,所述使用改进的丰度计算算法,计算出Alpha多样性指数的方法包括:输入OUT表;选择Shannon指数作为多样性指数;计算每个OTU在样本中的相对差异丰度;使用如下公式计算Alpha多样性指数:
其中,是OTU的数量,/>是第/>个OTU的相对差异丰度,/>是总OTU数。
:这部分的原理是基于信息论中的香农熵(Shannonentropy)的概念。香农熵用于衡量系统的不确定性或信息的平均量。在这里,对于每个OTU,根据其相对差异丰度/>,计算其贡献的信息量,即/>,然后将所有OTU的信息量进行加权求和。这部分表示了样本内物种的信息量或多样性。
:这部分是对上述加权求和的结果进行取绝对值。取绝对值是为了确保指数结果为非负数。
:这部分乘以0.23是为了对指数结果进行标准化。
优选地,所述使用改进的距离计算算法,计算出Beta多样性指数的方法包括:输入OTU表;选择Bray-Curtis距离作为计算距离;计算每个OTU在样本中的相对差异丰度;根据所选的计算距离,计算每对样本之间的距离,然后将这些距离用于计算Beta多样性指数:
其中,表示样本/>和样本/>之间的Bray-Curtis距离,/>是OTU的数量,表示样本/>中第/>个OTU的相对差异丰度,/>表示样本/>中第/>个OTU的相对差异丰度。
优选地,所述OTU的相对差异丰度通过如下过程进行计算:根据OTU表中记录的每个样本中各个OTU的计数,获取每个OTU在每个样本中的计数值;对于每个样本,计算其所有OTU的计数之和,以获得该样本中微生物总计数;对于每个OTU,在给定样本中,将其计数除以该样本的总计数,然后乘以100,以获得该OTU在样本中的相对丰度;计算每个OTU在每个样本中的计数值的标准差;将相对丰度除以标准差得到相对差异丰度。
具体的,Bray-Curtis距离是一种常用的度量样本之间差异的距离指标。Bray-Curtis距离的取值范围在0到1之间,其中0表示完全相似,1表示完全不相似。它反映了样本之间物种组成的差异程度,距离越大表示样本之间的差异越大。
假设有一个样本包含4个OTU,其计数分别为OTU1:500,OTU2:300,OTU3:200,OTU4:100。该样本的总计数为500+300+200+100=1100。
计算每个OTU的相对丰度:
OTU1的相对丰度 = (500 / 1100) * 100 = 45.45%;
OTU2的相对丰度 = (300 / 1100) * 100 = 27.27%;
OTU3的相对丰度 = (200 / 1100) * 100 = 18.18%;
OTU4的相对丰度 = (100 / 1100) * 100 = 9.09%。
优选地,所述使用环境数据对乳制品质量指数进行校正,得到最终的质量指数的方法包括:计算环境数据中每种数据与预设的对应的标准值的差异率的和值的倒数作为校正系数,将该校正系数乘以乳制品质量指数得到最终的质量指数。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些具体实施方式仅是举例说明,本领域的技术人员在不脱离本发明的原理和实质的情况下,可以对上述方法和系统的细节进行各种省略、替换和改变。例如,合并上述方法步骤,从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此,本发明的范围仅由所附权利要求书限定。

Claims (2)

1.基于数据分析的乳制品生产智能管理平台,其特征在于,所述平台包括:样本间隔采样组、环境数据监测系统和数据分析系统;所述样本间隔采样组包括多个相同的采样单元;所述采样单元分别设置于乳制品生产流程中的不同观测节点,对经过该观测节点的乳制品中间产物进行采样,以获得微生物16SrRNA基因序列数据;所述观测节点通过如下步骤进行确定:获取乳制品生产流程中乳制品经过每一个环节后的蛋白质含量、pH值和酸度,基于蛋白质含量、pH值和酸度,确定观测节点,在所述观测节点,蛋白质含量、pH值和和酸度的变化率的和值超过设定的阈值;所述环境数据监测系统,配置用于实时获取乳制品生产过程中的环境数据;在环境数据监测系统实时获取环境数据时,若乳制品中间产物经过一个观测节点,则将对应时刻的环境数据绑定到该观测节点对应的采样单元采样得到的微生物16SrRNA基因序列数据中;所述数据分析系统,配置用于基于采样得到的微生物16SrRNA基因序列数据,进行OTU聚类后,计算得到乳制品质量指数,再使用环境数据对乳制品质量指数进行校正,得到最终的质量指数,通过将质量指数与预设的阈值范围进行比较,判断乳制品生产流程中是否出现问题,以及定位出现问题的环节;
所述数据分析系统,基于采样得到的微生物16SrRNA基因序列数据,进行OTU聚类的方法包括:对微生物16SrRNA基因序列数据进行预处理,去除低质量序列和去除噪声,得到预处理序列;将预处理序列与参考数据库中的已知序列进行比对,根据序列的相似性将序列聚类为OTU;根据OTU聚类结果,生成OTU表,记录每个OTU在每个样本中的相对差异丰度;
所述对微生物16SrRNA基因序列数据进行预处理,去除低质量序列和去除噪声,得到预处理序列的方法包括:首先将微生物16SrRNA基因序列数据通过一个高斯滤波器,然后对微生物16SrRNA基因序列数据进行测序读取,对于每个测序读取,使用Phred质量值作为其质量值;确定一个质量阈值,所述质量阈值的范围在20到30之间;将质量值低于20的微生物16SrRNA基因序列数据作为低质量序列,去除低质量序列后,得到预处理序列;
所述数据分析系统计算得到乳制品质量指数的方法包括:基于OUT表,使用改进的丰度计算算法,计算出Alpha多样性指数;使用改进的距离计算算法,计算出Beta多样性指数;设每个采样单元采集到的微生物16SrRNA基因序列数据的Alpha多样性指数为;设每个采样单元采集到的微生物16SrRNA基因序列数据的Beta多样性指数为/>;则使用如下公式计算出乳制品质量指数:
;其中,/>为采样单元的数量;/>为乳制品质量指数;/>为调整系数,取值范围为/>
所述使用改进的丰度计算算法,计算出Alpha多样性指数的方法包括:输入OUT表;选择Shannon指数作为多样性指数;计算每个OTU在样本中的相对差异丰度;使用如下公式计算Alpha多样性指数:
;其中,其中,/>是OTU的数量,/>是第个OTU的相对差异丰度,/>是总OTU数;
所述使用改进的距离计算算法,计算出Beta多样性指数的方法包括:输入OTU表;选择Bray-Curtis距离作为计算距离;计算每个OTU在样本中的相对差异丰度;根据所选的计算距离,计算每对样本之间的距离,然后将这些距离用于计算Beta多样性指数;;其中,/>表示样本/>和样本/>之间的Bray-Curtis距离,/>是OTU的数量,/>表示样本/>中第/>个OTU的相对差异丰度,/>表示样本/>中第/>个OTU的相对差异丰度;
所述OTU的相对差异丰度通过如下过程进行计算:根据OTU表中记录的每个样本中各个OTU的计数,获取每个OTU在每个样本中的计数值;对于每个样本,计算其所有OTU的计数之和,以获得该样本中微生物总计数;对于每个OTU,在给定样本中,将其计数除以该样本的总计数,然后乘以100,以获得OTU在样本中的相对丰度;计算每个OTU在每个样本中的计数值的标准差;将相对丰度除以标准差得到相对差异丰度;
所述使用环境数据对乳制品质量指数进行校正,得到最终的质量指数的方法包括:计算环境数据中每种数据与预设的对应的标准值的差异率的和值的倒数作为校正系数,将该校正系数乘以乳制品质量指数得到最终的质量指数。
2.如权利要求1所述的基于数据分析的乳制品生产智能管理平台,其特征在于,所述环境数据包括:温度、湿度和氧气浓度。
CN202310889208.2A 2023-07-20 2023-07-20 基于数据分析的乳制品生产智能管理平台 Active CN116612820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310889208.2A CN116612820B (zh) 2023-07-20 2023-07-20 基于数据分析的乳制品生产智能管理平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310889208.2A CN116612820B (zh) 2023-07-20 2023-07-20 基于数据分析的乳制品生产智能管理平台

Publications (2)

Publication Number Publication Date
CN116612820A CN116612820A (zh) 2023-08-18
CN116612820B true CN116612820B (zh) 2023-09-19

Family

ID=87682159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310889208.2A Active CN116612820B (zh) 2023-07-20 2023-07-20 基于数据分析的乳制品生产智能管理平台

Country Status (1)

Country Link
CN (1) CN116612820B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279391A (zh) * 2015-09-06 2016-01-27 苏州协云和创生物科技有限公司 一种宏基因组16S rRNA的高通量测序数据处理及分析流程控制方法
WO2017198137A1 (zh) * 2016-05-19 2017-11-23 完美(中国)有限公司 微生物操作分类单元确定和序列辅助分离
CN110734989A (zh) * 2019-11-06 2020-01-31 华中科技大学鄂州工业技术研究院 一种药用植物共生微生物鉴定方法及其应用
CN112071366A (zh) * 2020-10-13 2020-12-11 南开大学 一种基于二代测序技术的宏基因组数据分析方法
CN114807391A (zh) * 2021-01-28 2022-07-29 中国石油天然气集团有限公司 炼油点源废水水质状况表征方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3384025A4 (en) * 2015-12-04 2019-07-03 Biome Makers Inc. MICROBIAL-BASED IDENTIFICATION, MONITORING AND IMPROVEMENT OF FERMENTATION PROCESSES AND PRODUCTS

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279391A (zh) * 2015-09-06 2016-01-27 苏州协云和创生物科技有限公司 一种宏基因组16S rRNA的高通量测序数据处理及分析流程控制方法
WO2017198137A1 (zh) * 2016-05-19 2017-11-23 完美(中国)有限公司 微生物操作分类单元确定和序列辅助分离
CN110734989A (zh) * 2019-11-06 2020-01-31 华中科技大学鄂州工业技术研究院 一种药用植物共生微生物鉴定方法及其应用
CN112071366A (zh) * 2020-10-13 2020-12-11 南开大学 一种基于二代测序技术的宏基因组数据分析方法
CN114807391A (zh) * 2021-01-28 2022-07-29 中国石油天然气集团有限公司 炼油点源废水水质状况表征方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
养猪发酵床微生物宏基因组基本分析方法;刘波;王阶平;陈倩倩;刘国红;车建美;陈德局;郑雪芳;葛慈斌;;福建农业学报(06);全文 *
应用Illumina MiSeq测序技术比较风干肉中细菌多样性和微生物安全性;田建军;张开屏;杨明阳;景智波;李权威;赵丽华;靳烨;;食品科学(08);全文 *

Also Published As

Publication number Publication date
CN116612820A (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN115876258B (zh) 基于多源数据的畜禽养殖环境异常监测及报警系统
EP2828398B1 (en) Method and system for detection of microbial growth in a specimen container
CN109979529B (zh) Cnv检测装置
CN102876816A (zh) 基于多传感器信息融合的发酵过程状态监测与控制方法
CN110738346A (zh) 一种基于威布尔分布的批次电能表可靠度预测方法
CN108090324A (zh) 基于高通量基因测序数据的病原微生物鉴定方法
CN115453064B (zh) 一种细颗粒物空气污染成因分析方法及系统
CN114757413A (zh) 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法
CN114038501B (zh) 一种基于机器学习的背景菌判定方法
CN113658640B (zh) 一种淡水生态系统健康评价方法
CN114970675A (zh) 基于特征选择的人工鼻冰箱食物新鲜度检测系统和方法
CN116612820B (zh) 基于数据分析的乳制品生产智能管理平台
CN112651173B (zh) 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统
CN117332358A (zh) 一种玉米浸泡水处理方法及系统
CN116776252A (zh) 一种改进Mallow's Cp变量选择的工业过程软测量方法和系统
CN114944208B (zh) 质量控制方法、装置、电子设备及存储介质
CN115985411A (zh) 基于高斯过程回归模型的高分子熔融指数软测量方法
CN115659195A (zh) 一种大气污染在线识别方法
CN115236044A (zh) 荧光光谱法计算水环境中溶解性有机碳浓度的方法和装置
CN111007220B (zh) 一种生猪养殖污水水质敏捷监测的方法
CN107817784A (zh) 一种基于并发偏最小二乘的过程故障检测方法
JP2935735B2 (ja) 培養状態の診断方法
CN111504944A (zh) 基于近红外光谱的柠檬酸发酵液化清液的统计监控方法
CN113674796B (zh) 一种建立抗药抗体计算阈值群的方法及用于实现该方法的系统
CN117250161B (zh) 一种大豆耐盐碱鉴定池的实时监测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant