CN116659589B - 基于数据分析的阿胶糕保存环境监测方法 - Google Patents
基于数据分析的阿胶糕保存环境监测方法 Download PDFInfo
- Publication number
- CN116659589B CN116659589B CN202310911428.0A CN202310911428A CN116659589B CN 116659589 B CN116659589 B CN 116659589B CN 202310911428 A CN202310911428 A CN 202310911428A CN 116659589 B CN116659589 B CN 116659589B
- Authority
- CN
- China
- Prior art keywords
- data
- moment
- sequence
- time
- temperature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108010010803 Gelatin Proteins 0.000 title claims abstract description 64
- 229920000159 gelatin Polymers 0.000 title claims abstract description 64
- 239000008273 gelatin Substances 0.000 title claims abstract description 64
- 235000019322 gelatine Nutrition 0.000 title claims abstract description 64
- 235000011852 gelatine desserts Nutrition 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004321 preservation Methods 0.000 title claims abstract description 33
- 238000012544 monitoring process Methods 0.000 title claims abstract description 24
- 238000007405 data analysis Methods 0.000 title claims abstract description 14
- 230000002159 abnormal effect Effects 0.000 claims abstract description 94
- 230000007613 environmental effect Effects 0.000 claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims abstract description 39
- 238000007781 pre-processing Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims abstract description 9
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 79
- 229910052760 oxygen Inorganic materials 0.000 claims description 79
- 239000001301 oxygen Substances 0.000 claims description 79
- 230000008859 change Effects 0.000 claims description 38
- 230000000630 rising effect Effects 0.000 claims description 34
- 238000001514 detection method Methods 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 9
- 230000005856 abnormality Effects 0.000 description 29
- 239000004973 liquid crystal related substance Substances 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 6
- 230000001174 ascending effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000013450 outlier detection Methods 0.000 description 2
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 235000007215 black sesame Nutrition 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种基于数据分析的阿胶糕保存环境监测方法,该方法包括:采集阿胶糕在保存过程中设定时间段内不同时刻的至少两种环境数据,构成数据预处理矩阵;根据每个时刻的每种环境数据在预设的时间窗口内的变化趋势差异、数据变化趋势和数据波动情况,确定每个时刻的异常权重;根据每两个时刻对应的相同种环境数据之间的差异,得到每两个时刻的时间间隔距离,基于时间间隔距离获取每个时刻的局部可达密度;基于每个时刻的局部可达密度以及异常权重得到每个时刻的局部离群因子,根据每个时刻的局部离群因子获得阿胶糕的保存环境监测结果。本发明能够获得更加准确的阿胶糕的保存环境监测结果。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于数据分析的阿胶糕保存环境监测方法。
背景技术
阿胶糕是由阿胶、黑芝麻、核桃仁等制作而出的一种食品,具有补血、止血、清肺润肺的功能,其质量问题关乎食用者的生命健康问题。若阿胶糕质量存在问题,在食用后可能会影响使用者的健康,因此,需要严格把关阿胶糕的保存环境,进而对阿胶糕的保存环境进行监测就显得尤为重要。
阿胶糕主要是在阴凉且干燥的环境下保存的,在对阿胶糕的保存环境进行监测时,一般是基于阿胶糕所处的保存环境中多种环境数据进行异常检测,而现有的LOF局部离群检测算法对于多维数据进行异常检测的结果较不准确,进而导致环境检测结果较不准确。
发明内容
为了解决现有的算法对于环境检测结果较不准确的技术问题,本发明的目的在于提供一种基于数据分析的阿胶糕保存环境监测方法,所采用的技术方案具体如下:
采集阿胶糕在保存过程中设定时间段内不同时刻的至少两种环境数据,构成数据预处理矩阵;
根据数据预处理矩阵中每个时刻的每种环境数据在预设的时间窗口内的变化趋势差异、数据变化趋势和数据波动情况,确定每个时刻对应的异常权重;
根据数据预处理矩阵中每两个时刻对应的相同种环境数据之间的差异,得到每两个时刻对应的时间间隔距离,基于所述时间间隔距离获取每个时刻对应的局部可达密度;
基于每个时刻对应的局部可达密度以及异常权重得到每个时刻对应的局部离群因子,根据每个时刻对应的局部离群因子获得阿胶糕的保存环境监测结果。
优选地,所述采集阿胶糕在保存过程中设定时间段内不同时刻的至少两种环境数据,构成数据预处理矩阵,具体包括:
将阿胶糕保存环境在设定时间段内不同时刻的温度的归一化值,构成温度数据序列;将阿胶糕保存环境在设定时间段内不同时刻的湿度的归一化值,构成湿度数据序列;将阿胶糕保存环境在设定时间段内不同时刻的氧气浓度的归一化值,构成浓度数据序列;将温度数据序列、湿度数据序列和浓度数据序列中的元素按照设定顺序放置在矩阵中得到数据预处理矩阵;所述数据预处理矩阵中每一行数据为同一种环境数据。
优选地,所述根据数据预处理矩阵中每个时刻的每种环境数据在预设的时间窗口内的变化趋势差异、数据变化趋势和数据波动情况,确定每个时刻对应的异常权重,具体包括:
根据温度数据序列中每个时刻的数据在预设的时间窗口内的数据变化趋势和数据波动情况得到温度异常权重,根据湿度数据序列中每个时刻的数据在预设的时间窗口内的数据变化情况变化趋势和数据波动情况得到湿度异常权重,根据浓度数据序列和温度数据序列中每个时刻的数据在预设的时间窗口内的变化趋势差异、浓度数据序列和湿度数据序列中每个时刻的数据在预设的时间窗口内的变化趋势差异、浓度数据序列中每个时刻的数据在预设的时间窗口内的数据变化趋势和数据波动情况,得到浓度异常权重;
计算每个时刻对应的温度异常权重的归一化值、湿度异常权重的归一化值和浓度异常权重的归一化值之间的和值,根据所述和值得到每个时刻对应的异常权重;所述和值与异常权重呈正相关关系。
优选地,所述温度异常权重的获取方法具体为:
在温度数据序列中,将以任意一个时刻对应的温度数据为中心点,预设长度的时间窗口内的温度数据作为该时刻对应的第一温度序列;获取第一温度序列中的温度上升子序列;
将任意一个时刻记为目标时刻,若目标时刻对应的温度数据不在温度上升子序列中,则目标时刻的温度异常权重的取值为第一预设值;
若目标时刻对应的温度数据在温度上升子序列中,则将目标时刻对应的温度数据所在的温度上升子序列的长度记为第一长度,将目标时刻对应的温度数据所在的温度上升子序列的第一个温度数据对应的时刻与目标时刻之间的时间长度记为第二长度,计算第二长度与时间窗口的长度之间的比值得到目标时刻的时间占比;计算目标时刻对应的温度数据所在的温度上升子序列中所有温度数据的极差;
计算第一长度、时间占比和所述极差的乘积,将乘积与第一预设值的和值记为目标时刻的温度异常权重。
优选地,所述湿度异常权重的获取方法具体为:
在湿度数据序列中,将以任意一个时刻对应的湿度数据为中心点,预设长度的时间窗口内的湿度数据作为该时刻对应的第一湿度序列;
将任意一个时刻记为选定时刻,将选定时刻对应的湿度数据与标准湿度数据的最大值与最小值的比值记为第一比值;将选定时刻对应的第一温度序列中所有湿度数据的极差作为第一系数;获取选定时刻对应的第一湿度序列中所有湿度数据的最大值与最小值对应的时刻之间的时间长度,记为第三长度;获取选定时刻对应的第一湿度序列中所有湿度数据的最大值与最小值之间的中点时刻与选定时刻之间的时间长度,记为第四长度;获取第四长度与第二预设值之间的和值,获取时间窗口的长度与第三长度之间的差值,将差值与和值之间的比值作为第二比值;
计算第一比值、第一系数和第二比值之间的乘积得到选定时刻的湿度异常权重。
优选地,所述浓度异常权重的获取方法具体为:
在浓度数据序列中,将以任意一个时刻对应的氧气浓度数据为中心点,预设长度的时间窗口内的氧气浓度数据作为该时刻对应的第一浓度序列;
将任意一个时刻记为标记时刻,对标记时刻对应的第一浓度序列进行一阶差分处理得到浓度差分序列,将浓度差分序列中元素的取值满足预设条件的相邻两个元素对应的时刻划分到同一个子时间段,所述预设条件为浓度差分序列中相邻两个元素取值完全相同,或者元素取值的符号相同;
将任意一个子时间段记为目标子时间段,获取目标子时间段到标记时刻之间的时间长度,记为第五长度,对第五长度进行负相关归一化得到目标子时间段对应的特征系数;计算每个子时间段对应的特征系数和时间长度的乘积的均值得到第二系数;
根据标记时刻对应的第一浓度序列和第一浓度序列中氧气浓度数据对应时刻的温度数据之间的变化趋势差异得到第三系数;根据标记时刻对应的第一浓度序列和第一浓度序列中氧气浓度数据对应时刻的湿度数据之间的变化趋势差异得到第四系数;
将第二系数、第三系数和第四系数之间的乘积作为标记时刻的浓度异常权重。
优选地,所述第三系数的获取方法具体为:
将第一浓度序列中每个氧气浓度数据对应的时刻对应的温度数据记为第二温度序列,对第二温度序列进行一阶差分处理得到温度差分序列;获取温度差分序列和浓度差分序列之间元素取值完全相同以及元素取值的符号相同的总数量,对总数量进行负相关归一化得到第三系数;
所述第四系数的获取方法具体为:
将第一浓度序列中氧气浓度数据对应的任意两个相邻时刻,分别记为第一时刻和第二时刻,计算第一时刻与第二时刻对应的氧气浓度数据之间的差值得到第一差值,计算第一时刻与第二时刻对应的湿度数据之间的差值得到第二差值;将第一差值与第二差值之间的比值的绝对值记为第三比值,将第二差值与第一差值之间的比值的绝对值记为第四比值;
将以2为底数、以第三比值和第四比值之和为真数的对数函数的值,作为第一时刻和第二时刻对应的特征指标;计算所有两个相邻时刻对应的特征指标之间的均值得到第四系数。
优选地,所述根据数据预处理矩阵中每两个时刻对应的相同种环境数据之间的差异,得到每两个时刻对应的时间间隔距离,具体包括:
对于任意两个时刻,计算两个时刻对应的温度数据之间的差值、两个时刻对应的湿度数据之间的差值以及两个时刻对应的氧气浓度数据之间的差值,并计算三个差值的平方和,对平方和进行开根号处理得到所述任意两个时刻对应的时间间隔距离。
优选地,所述局部离群因子具体为:
对于任意一个时刻,计算该时刻的局部可达密度与异常权重之间的乘积,得到该时刻对应的特征乘积;将任意一个时刻记为待分析时刻,计算待分析时刻邻域内所有邻域时刻的特征乘积的均值,将均值与待分析时刻对应的特征乘积之间的比值作为待分析时刻的局部离群因子。
优选地,所述根据每个时刻对应的局部离群因子获得阿胶糕的保存环境监测结果具体为:
将设定时间段内每个时刻对应的局部离群因子作为异常得分,将异常得分大于预设的异常阈值对应的时刻记为疑似异常时刻,获取设定时间段内的疑似异常时刻的总数量,若疑似异常时刻的总数量大于或等于数量阈值,则在设定时间段内阿胶糕保存环境的检测结果为处于异常状态。
本发明实施例至少具有如下有益效果:
本发明首先获取设定时间段内不同时刻的多种环境数据,进而使得在后续基于多种环境数据的变化情况对每个时刻的异常情况进行分析,使得环境异常情况的检测结果更加准确。然后分别对每个时刻的每种环境数据在一定范围内的数据变化趋势、变化趋势差异以及数据波动情况进行分析,获得每个时刻对应的异常权重,利用异常权重表征每个时刻下的环境数据存在异常的可能性。进一步的,基于两个时刻对应的相同种环境数据之间的差异获得每两个时刻对应的时间间隔距离,便于后续将对多维数据进行异常检测转化为对多维环境数据对应的时刻进行异常检测,使得最终根据每个时刻对应的局部离群因子获得阿胶糕保存环境较为准确的监测结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明的一种基于数据分析的阿胶糕保存环境监测方法的方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于数据分析的阿胶糕保存环境监测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于数据分析的阿胶糕保存环境监测方法的具体方案。
实施例
请参阅图1,其示出了本发明一个实施例提供的一种基于数据分析的阿胶糕保存环境监测方法的方法流程图,该方法包括以下步骤:
步骤一,采集阿胶糕在保存过程中设定时间段内不同时刻的至少两种环境数据,构成数据预处理矩阵。
首先,采集阿胶糕在保存过程中设定时间段内不同时刻的至少两种环境数据,由于阿胶糕的保存环境一般为阴凉且干燥的,故在本实施例中通过对阿胶糕保存环境中的温度、湿度和氧气浓度进行异常检测。
具体地,通过温度传感器、湿度传感器以及氧气浓度传感器采集阿胶糕保存环境在设定时间段内不同时刻的温度、湿度以及氧气浓度,将阿胶糕保存环境在设定时间段内不同时刻的温度的归一化值,构成温度数据序列;将阿胶糕保存环境在设定时间段内不同时刻的湿度的归一化值,构成湿度数据序列;将阿胶糕保存环境在设定时间段内不同时刻的氧气浓度的归一化值,构成浓度数据序列;将温度数据序列、湿度数据序列和浓度数据序列中的元素按照设定顺序放置在矩阵中得到数据预处理矩阵;所述数据预处理矩阵中每一行数据为同一种环境数据。
其中,数据预处理矩阵D可以表示为:
式中,表示数据预处理矩阵D中第一行第一列的元素,/>表示数据预处理矩阵D中第一行第二列的元素,/>表示数据预处理矩阵D中第一行第N列的元素,/>表示数据预处理矩阵D中第二行第一列的元素,/>表示数据预处理矩阵D中第二行第二列的元素,表示数据预处理矩阵D中第二行第N列的元素,/>表示数据预处理矩阵D中第三行第一列的元素,/>表示数据预处理矩阵D中第三行第二列的元素,/>表示数据预处理矩阵D中第三行第N列的元素。数据预处理矩阵D中位于同一行的元素为相同种类的环境数据,且均为归一化的数值。
在本实施例中,数据预处理矩阵D中的第一行所有的元素为温度数据,即将设定时间段内每个时刻的温度归一化后的数值记为温度数据,进而设定时间段对应的温度数据序列可以表示为。数据预处理矩阵D中第二行所有的元素为湿度数据,即将设定时间段内每个时刻的湿度归一化后的数值记为湿度数据,进而设定时间段对应的湿度数据序列可以表示为/>。数据预处理矩阵D中第三行所有的元素为氧气浓度数据,即将设定时间段内每个时刻的氧气浓度归一化后的数值记为氧气浓度数据,进而设定时间段对应的浓度数据序列可以表示为/>。
需要说明的是,在本实施例中的设定顺序为,将温度数据序列中的温度数据放置在第一行,将湿度数据序列中的湿度数据放置在第二行,将浓度数据序列中的氧气浓度数据放置在第三行,实施者可根据具体实施场景对设定顺序进行设置。
在本实施例中,N为设定时间段内时刻的总数量,将时刻的总数量设置为1500,相邻两个时刻之间的时间间隔为5s,进而设定时间段的时间长度为7500s,实施者可根据具体实施场景进行设置。
步骤二,根据数据预处理矩阵中每个时刻的每种环境数据在预设的时间窗口内的变化趋势差异、数据变化趋势和数据波动情况,确定每个时刻对应的异常权重。
局部离群因子(Local Outlier Factor,LOF)算法是一种基于密度的离群点检测算法,通过比较每个样本点与其相邻的样本点的密度来判断每个样本点是否属于异常点,密度越小,样本点异常的可能性越大,密度越大,样本点异常的可能性越小。但是传统的局部离群因子算法对于多维数据对应的样本点进行异常检测的效果较不理想,即对于每个时刻对应的多种环境数据,利用局部离群因子算法进行异常检测时,无法考虑在同一时刻下不同种类的环境数据之间的数据变化关系,以及每一种环境数据在时序上的变化趋势,进而使得异常检测结果的效果较不理想,故本发明实施例通过对每个时刻的每种环境数据在一定范围内的数据变化趋势、变化趋势差异以及数据波动情况进行分析,获取每个时刻对应的异常权重,利用异常权重对传统的局部离群因子算法中计算的局部离群因子进行调整。
基于每种环境数据在每个时刻发生前后的数据异常情况,分别对每种环境数据进行分析,构建异常加权因子,即需要分别对温度数据序列、湿度数据序列以及浓度数据序列中每个时刻的数据在预设的时间窗口内的变化趋势情况进行分析。
具体地,在本实施例中将时间窗口的预设长度设置为2m+1,其中m的取值为7,实施者可根据具体实施场景进行设置,进而以温度数据序列为例进行说明,在温度数据序列中,对于任意一个时刻,以该时刻为中心点,获取预设长度的时间窗口内的温度数据组成该时刻对应的第一温度序列,即获取该时刻之前m个时刻的温度数据,以及该时刻之后m个时刻的温度数据,并加上该时刻的温度数据,共同构成了该时刻对应的第一温度序列,即第一温度序列的长度为2m+1,且第一温度序列中所有的温度数据对应了2m+1个时刻。
需要说明的是,在设定时间段内第一个时刻至第m个时刻之间的时刻,以及第N-m个时刻至第N个时刻之间的时刻,无法获取在时间窗口内的温度数据构成第一温度序列,故在本实施例中对于无法获取对应的第一温度序列的时刻不进行异常加权因子的分析。
首先,根据温度数据序列中每个时刻的数据在预设的时间窗口内的数据变化趋势和数据波动情况得到温度异常权重。由于阿胶糕一般保存在较为阴凉的环境下,故在阿胶糕的保存环境中的初始时刻的温度一般较低,当保存环境中的温度持续升高时,可能会对阿胶糕的质量产生影响,当保存环境持续存在温度较高的情况,使得阿胶糕较长时间保存在较高的温度环境中容易变质,因此,可以通过第一温度序列中温度数据处于上升阶段的变化情况构建异常加权因子。
获取第一温度序列中的温度上升子序列,具体地,对于任意一个时刻对应的第一温度序列,计算每个时刻的温度数据与其相邻的上一时刻的温度数据之间的差值记为标记差值数据,构成标记差分序列。当标记差分序列中标记差值数据满足第一预设条件时,将标记差值数据对应时刻的温度数据构成温度上升子序列,其中,第一预设条件为相邻两个标记差值数据的取值均大于0。基于此,第一温度序列中的温度上升子序列表征了第一温度序列中处于上升阶段的温度数据构成的序列。
例如,若任意一个时刻对应的第一温度序列为{1,2,2.5,3,2.8,2.6,2,3.3,3.1,3,3,3,3.5,3.7,4.3},则该第一温度序列对应的标记差分序列为{1,0.5,0.5,-0.2,-0.2,-0.6,1.3,-0.2,-0.1,0,0,0.5,0.2,0.6},标记差分序列中的第一个标记差值数据和第二个标记差值数据分别为1和0.5,均大于0,说明第一个标记差值数据与第二个标记差值数据对应的三个时刻内的温度数据均处于上升阶段,进而将第一个标记差值数据和第二个标记差值数据划分到同一个温度上升子序列中,以此类推,对所有的标记差值数据均进行判断。特殊地,在标记差分序列中仅存在第7个标记差值数据的取值大于0,即与其相邻的第6个标记差值数据-0.6,以及第8个标记差值数据-0.2,均小于0,故只将第7个标记差值数据对应的两个时刻的温度数据2和3.3构成一个温度上升子序列。最终,第一温度序列中的温度上升子序列分别为{1,2,2.5,3},{2,3.3},{3.5,3.7,4.3}。需要说明的是,在本发明实施例中的所有温度数据为归一化后的数值,在上述举例中为了能够更加详细的说明温度上升子序列的获取方法而给出的数值。
将任意一个时刻记为目标时刻,若目标时刻对应的温度数据不在温度上升子序列中,则目标时刻的温度异常权重的取值为第一预设值;若目标时刻对应的温度数据在温度上升子序列中,则将目标时刻对应的温度数据所在的温度上升子序列的长度记为第一长度,将目标时刻对应的温度数据所在的温度上升子序列的第一个温度数据对应的时刻与目标时刻之间的时间长度记为第二长度,计算第二长度与时间窗口的长度之间的比值得到目标时刻的时间占比;计算目标时刻对应的温度数据所在的温度上升子序列中所有温度数据的极差;计算第一长度、时间占比和所述极差的乘积,将乘积与第一预设值的和值记为目标时刻的温度异常权重。
在本实施例中,将设定时间段内第t个时刻作为目标时刻,进而以第t个时刻为例进行说明。若设定时间段内第t个时刻对应的温度数据不存在与温度上升子序列中,说明第t个时刻的温度数据并不处于上升阶段,进而说明该时刻对应的温度数据异常的可能性越小,故在本实施例,将第t个时刻对应的温度异常权重设置为第一预设值,第一预设值的取值为0.01,实施者可根据具体实施场景进行设置。
若设定时间段内第t个时刻对应的温度数据存在于温度上升子序列中,则第t个时刻即目标时刻的温度异常权重的计算公式可以表示为:
其中,表示第t个时刻的温度异常权重,/>表示第t个时刻所在的温度上升序列的长度,即第一长度;/>表示第t个时刻所在的温度上升序列中温度数据的极差;/>表示第t个时刻所在的温度上升序列的第一个时刻到第t个时刻之间的时间长度,即第二长度,可以通过两个时刻之间的时刻数量进行表征;/>表示时间窗口的长度,在本实施例中的取值为2m+1,/>表示第一预设值,在本实施例中的取值为0.01。
第一长度的取值越大,说明第t个时刻所在的温度上升子序列的长度越长,进而说明温度数据处于上升阶段的时间越长,对应的温度异常权重取值越大,说明第t个时刻的温度数据存在异常的可能性越大。的取值越大,说明第t个时刻所在的温度上升子序列中温度数据的最大值和最小值之间的差值越大,进而说明温度数据处于上升阶段的变化幅度越大,对应的温度异常权重取值越大,说明第t个时刻的温度数据存在异常的可能性越大。
表示时间占比,/>第二长度取值越大,说明从温度数据开始上升时,到目标时刻之间温度数据处于上升阶段的时间越长,对应的时间占比取值越大,说明在目标时刻之前已经处于很长一段时间的温度上升时刻,对应的温度异常权重取值越大,说明第t个时刻的温度数据存在异常的可能性越大。设定时间段内每个时刻的温度异常权重反应了每个时刻对应的温度数据异常的可能性大小。
然后,根据湿度数据序列中每个时刻的数据在预设的时间窗口内的数据变化情况变化趋势和数据波动情况得到湿度异常权重。由于环境中的湿度容易受到多方面因素的影响,而产生变化,环境中的湿度过大或者过小,均不利于阿胶糕保存,基于此,可以通过对第一湿度数据中的湿度数据变化趋势和波动情况进行分析,构建异常加权因子。
类比第一温度序列的获取方法,在湿度数据序列中,将以任意一个时刻对应的湿度数据为中心点,预设长度的时间窗口内的湿度数据作为该时刻对应的第一湿度序列,例如,以设定时间段内第t个时刻为例进行说明,获取第t个时刻之前m个时刻的湿度数据,以及第t个时刻之后的m个时刻的湿度数据,并和第t个时刻的湿度数据共同构成第t个时刻对应的第一湿度序列,则第一湿度序列的长度为2m+1,且第一湿度序列中所有湿度数据对应的时刻数量为2m+1个。
将任意一个时刻记为选定时刻,将选定时刻对应的湿度数据与标准湿度数据的最大值与最小值的比值记为第一比值;将选定时刻对应的第一温度序列中所有湿度数据的极差作为第一系数;获取选定时刻对应的第一湿度序列中所有湿度数据的最大值与最小值对应的时刻之间的时间长度,记为第三长度;获取选定时刻对应的第一湿度序列中所有湿度数据的最大值与最小值之间的中点时刻与选定时刻之间的时间长度,记为第四长度;获取第四长度与第二预设值之间的和值,获取时间窗口的长度与第三长度之间的差值,将差值与和值之间的比值作为第二比值;计算第一比值、第一系数和第二比值之间的乘积得到选定时刻的湿度异常权重。
在本实施例中,将设定时间段内第u个时刻作为选定时刻,则选定时刻的湿度异常权重的计算公式可以表示为:
其中,表示设定时间段内第u个时刻的湿度异常权重,/>表示设定时间段内第u个时刻的湿度数据,/>表示标准湿度数据,/>表示第一系数,即第u个时刻对应的第一湿度序列中所有湿度数据的极差;/>表示时间窗口的长度,/>表示第u个时刻对应的第一湿度序列中所有湿度数据的最大值与最小值对应的时刻之间的时间长度,即第三长度;表示第u个时刻对应的第一湿度序列中所有湿度数据的最大值与最小值对应的时刻之间的中点时刻,与第u个时刻之间的时间长度,即第四长度;/>为第二预设值,在本实施例中的取值为1,为了防止分母为0,实施者可根据具体实施场景进行设置;max()表示求最大值的函数,min()表示求最小值的函数。
表示第一比值,表征选定时刻的湿度数据与标准湿度数据之间的较大值与较小值的比值,第一比值的取值越大,说明选定时刻的湿度数据越偏离标准湿度数据,即选定时刻的湿度数据越大于标准湿度数据,或者选定时刻的湿度数据越小于标准湿度数据,对应的湿度异常权重的取值越大,说明选定时刻的湿度数据存在异常的可能性越大。第一比值的取值越小,说明选定时刻的湿度数据越接近标准湿度数据,对应的湿度异常权重的取值越小,说明选定时刻的湿度数据存在异常点可能性越小。其中,标准湿度数据为阿胶糕保存环境中的最佳的湿度,并且,由于在本实施例中所有时刻对应的湿度数据均为归一化后的数据,故在本实施例中将标准湿度数据设置为0.65,实施者可根据具体实施场景进行设置。
第一系数反应了选定时刻对应的第一湿度序列中所有湿度数据的最大值与最小值的差值,第一系数的取值越大,说明第一湿度序列中湿度数据的波动程度越大,对应的湿度差异权重的取值越大,说明选定时刻的湿度数据存在异常的可能性越大。
表示第二比值,第三长度/>反应了选定时刻对应的第一湿度序列中最大值与最小值对应的时刻之间的时间间隔,第三长度的取值越小,说明最大值与最小值的时间间隔越短,进而说明在第一湿度序列中湿度数据发生突变的程度越大,对应的选定时刻发生异常的可能性越大,对应的湿度异常权重的取值越大,故利用/>对第三长度进行负相关映射。
第四长度的获取方法为,首先获取选定时刻对应的第一湿度序列中最大值与最小值对应的时刻之间的中点时刻,例如,第一湿度序列中湿度数据的最大值对应的时刻为设定时间段内第3个时刻,第一湿度序列中湿度数据的最小值对应的时刻为设定时间段内的第5个时刻,则中点时刻为设定时间段内第4个时刻,进而设定时间段内第4个时刻与第u个时刻之间的时间长度即为第四长度。第四长度表征了第一湿度序列中最大值与最小值变化阶段距离选定时刻的时间长度,第四长度的取值越大,说明第一湿度序列中湿度数据的最大变化阶段对选定时刻的湿度数据异常情况的影响程度越小,第二比值取值越小,对应的湿度异常权重的取值越小。
进一步的,根据浓度数据序列和温度数据序列中每个时刻的数据在预设的时间窗口内的变化趋势差异、浓度数据序列和湿度数据序列中每个时刻的数据在预设的时间窗口内的变化趋势差异、浓度数据序列中每个时刻的数据在预设的时间窗口内的数据变化趋势和数据波动情况,得到浓度异常权重。
当阿胶糕保存环境中的氧气浓度持续降低时,可能会对阿胶糕的质量产生一定的影响,严重时可能会使阿胶糕氧化变质。而当保存环境中的温度发生变化时,空气中的水分子对氧气的溶解度会发生变化,进而对氧气浓度产生一定的影响,同时湿度变化对空气中的氧气浓度也会产生一定的影响,即保存环境中的湿度发生变化的一段时间后,氧气浓度也会存在一定的波动情况。
基于此,类比第一温度序列的获取方法,在浓度数据序列中,将以任意一个时刻对应的氧气浓度数据为中心点,预设长度的时间窗口内的氧气浓度数据作为该时刻对应的第一浓度序列;例如,以设定时间段内第t个时刻为例进行说明,获取第t个时刻之前m个时刻的氧气浓度数据,以及第t个时刻之后的m个时刻的氧气浓度数据,并和第t个时刻的氧气浓度数据共同构成第t个时刻对应的第一浓度序列,则第一浓度序列的长度为2m+1,且第一浓度序列中所有氧气浓度数据对应的时刻数量为2m+1个。
将任意一个时刻记为标记时刻,对标记时刻对应的第一浓度序列进行一阶差分处理得到浓度差分序列,将浓度差分序列中元素的取值满足预设条件的相邻两个元素对应的时刻划分到同一个子时间段,所述预设条件为浓度差分序列中相邻两个元素取值完全相同,或者元素取值的符号相同。其中,浓度差分序列中的元素为每个时刻的氧气浓度数据与其相邻的上一个时刻的氧气浓度数据之间的差值。
相邻两个元素取值完全相同,或者元素取值的符号相同,具体表征为,浓度差分序列中相邻两个元素的取值均大于0,即浓度差分序列中相邻两个元素取值的符号均为正;或者浓度差分序列中中相邻两个元素的取值均小于0,即浓度差分序列中相邻两个元素取值的符号均为负;或者浓度差分序列中中相邻两个元素的取值均为0,即浓度差分序列中相邻两个元素取值完全相同。
基于此,在同一子时间段内的氧气浓度数据的变化趋势相同,即表征氧气浓度数据持续上升或者持续下降或者保持不变。若标记时刻对应的第一浓度序列中的氧气浓度数据出现长时间的上升情况或者长时间的下降情况,则第一浓度序列对应时间长度内的子时间段的数量较少,且子时间段的长度较长。若氧气浓度数据误明显的变化趋势,则标记时刻对应的第一浓度序列中的氧气浓度数据持续上升或者持续下降的持续时间较短,即第一浓度序列对应时间长度内的子时间段的数量较多,且子时间段的长度较短。
将任意一个子时间段记为目标子时间段,获取目标子时间段到标记时刻之间的时间长度,记为第五长度,对第五长度进行负相关归一化得到目标子时间段对应的特征系数;计算每个子时间段对应的特征系数和时间长度的乘积的均值得到第二系数。
在本实施例中,将设定时间段内第v个时刻记为标记时刻,将标记时刻对应的第一浓度序列对应的时间窗口内包含的第s个子时间段作为目标子时间段,则第二系数的计算公式可以表示为:
其中,表示第二系数,/>表示设定时间段内第v个时刻对应的时间窗口的时间长度内包含的子时间段的总数量,/>表示设定时间段内第v个时刻对应的时间窗口的时间长度内包含的第s个子时间段的时间长度,/>表示第s个子时间段到设定时间段内第v个时刻之间的时间长度,即第五长度,/>表示时间窗口的长度。
在获取第五长度时,需要根据第v个时刻和子时间段在时序上的位置关系,具体地,若第s个子时间段在第v个时刻之前,则将第s个子时间段内最后一个时刻到第v个时刻之间的时间长度,作为第五长度;若第v个时刻在第s个子时间段之前,则将第v个时刻到第s个子时间段内第一个时刻之间的时间长度,作为第五长度。
第五长度表征了在时序上子时间段对标记时刻的影响距离,第五长度的取值越大,说明第v个子时间段与第s个时刻之间的时间长度越长,进而说明在时序上子时间段对标记时刻的影响距离越远,对应的第二系数的取值越小,为特征系数,表示对第五长度进行负相关归一化处理后的数值。
子时间段的时间长度反应了氧气浓度数据保持上升状态或者保持下降状态或者保持不变状态的时间长短,子时间段的时间长度越长,说明氧气浓度数据保持某种变化状态的时间越长,对应的特征系数取值越大时,说明该子时间段对标记时刻的影响越大,对应的第二系数取值越大,说明标记时刻对应的氧气浓度数据存在异常的可能性越大。
第二系数从标记时刻对应的第一浓度序列中氧气浓度数据的变化趋势等情况方面,反应了标记时刻的氧气浓度数据存在异常的可能性,进而需要分析标记时刻对应的时间窗口内,氧气浓度、温度以及湿度之间变化趋势的差异情况。即根据标记时刻对应的第一浓度序列和第一浓度序列中氧气浓度数据对应时刻的温度数据之间的变化趋势差异得到第三系数。
具体地,将第一浓度序列中每个氧气浓度数据对应的时刻对应的温度数据记为第二温度序列,即将设定时间段内第v个时刻对应的时间窗口内的温度数据构成的序列记为第二温度序列。对第二温度序列进行一阶差分处理得到温度差分序列,在本实施例中,通过计算第二温度序列中每个温度数据与其相邻的前一个温度数据之间的差值,得到温度差分序列。
获取温度差分序列和浓度差分序列之间元素取值完全相同以及元素取值的符号相同的总数量,对总数量进行负相关归一化得到第三系数。
需要说明的是,温度差分序列中的元素为第二温度序列中相邻两个温度数据之间的差值,浓度差分序列中的元素为第一浓度序列中相邻两个氧气浓度数据之间的差值。在温度差分序列和浓度差分序列中,元素的取值均存在三种情况,即大于0、小于0和等于0,大于0即表示元素取值的符号为正,小于0即表示元素取值的符号为负。当元素取值大于0时,说明温度数据或者氧气浓度处于上升状态,当元素取值小于0时,说明温度数据或者氧气浓度数据处于下降状态,当元素取值等于0时,说明温度数据或者氧气浓度数据处于无变化状态。
当温度差分序列和浓度差分序列之间元素取值完全相同以及元素取值的符号相同时,说明第二温度序列和第一浓度序列对应时刻的温度数据与氧气浓度数据之间的变化趋势相同,进而获取变化趋势相同时对应的元素总数量,其取值越大,说明标记时刻对应的时间窗口内温度数据和氧气浓度数据的变化趋势相似程度越大,对应的标记时刻的氧气浓度数据存在异常的可能性越小,对应的第三系数的取值越小,在本实施例中,利用对M进行负相关归一化处理,其中,M表示温度差分序列和浓度差分序列之间元素取值完全相同以及元素取值的符号相同的总数量,/>表示时间窗口的长度。
根据标记时刻对应的第一浓度序列和第一浓度序列中氧气浓度数据对应时刻的湿度数据之间的变化趋势差异得到第四系数。
具体地,将第一浓度序列中氧气浓度数据对应的任意两个相邻时刻,分别记为第一时刻和第二时刻,计算第一时刻与第二时刻对应的氧气浓度数据之间的差值得到第一差值,计算第一时刻与第二时刻对应的湿度数据之间的差值得到第二差值;将第一差值与第二差值之间的比值的绝对值记为第三比值,将第二差值与第一差值之间的比值的绝对值记为第四比值;将以2为底数、以第三比值和第四比值之和为真数的对数函数的值,作为第一时刻和第二时刻对应的特征指标;计算所有两个相邻时刻对应的特征指标之间的均值得到第四系数。
在本实施例中,将标记时刻对应的时间窗口内第n个时刻作为第一时刻,将第n+1个时刻作为第二时刻进行说明,则第四系数的计算公式可以表示为:
/>
其中,表示第四系数,/>表示时间窗口的长度,/>和/>分别表示设定时间段内第v个时刻对应的时间窗口内第n个时刻的氧气浓度数据和湿度数据,和/>分别表示设定时间段内第v个时刻对应的时间窗口内第n+1个时刻的氧气浓度数据和湿度数据,/>表示以2为底的对数函数。
为第一差值,表示第一浓度序列中两个相邻时刻之间氧气浓度数据的差异,/>为第二差值,表示两个相邻时刻之间湿度数据的差异。/>为第三比值,/>为第四比值,为第n个时刻与第n+1个时刻对应的特征指标。
当第一差值和第二差值的取值相等时,特征指标的取值为1,此时对应的特征指标的取值最小,说明相邻的两个时刻对应的氧气浓度数据之间的变化情况与湿度数据之间的变化情况相同,对应的第四系数的取值越小,说明标记时刻的氧气浓度数据存在异常的可能性越小。
当第一差值和第二差值的取值不相等时,第三比值与第四比值互为倒数,此时第三比值与第四比值的和值大于2,进而特征指标的取值大于1,此时对应的特征指标的取值越大,说明相邻的两个时刻对应的氧气浓度数据之间的变化情况与湿度数据之间的变化情况之间的差异越大,对应的第四系数的取值越大,说明标记时刻的氧气浓度数据存在异常的可能性越大。
特殊地,在计算第四系数的过程中,若任意两个相邻时刻对应的第一差值和第二差值均等于0,则此时将这两个相邻时刻的特征系数的取值设置为1;若任意两个相邻时刻对应的第一差值和第二差值仅存在其中一个等于0,具体地,在计算第三比值时,若第二差值的取值为0,则为了防止分母为0,可以首先计算第二差值与1的和值,再计算第一差值与该和值之间的比值得到第三比值。同理,在计算第四比值时,若第一差值为0,则为了防止分母为0,可以首先计算第一差值与1的和值,再计算第二差值与该和值之间的比值得到第四比值。
第二系数从标记时刻对应的第一浓度序列中氧气浓度数据的变化趋势等情况方面,反应了标记时刻的氧气浓度数据存在异常的可能性,第三系数从标记时刻对应的时间窗口内氧气浓度数据与温度数据之间变化趋势差异方面,反应了标记时刻的氧气浓度数据存在异常的可能性,第四系数从标记时刻对应的时间窗口内氧气浓度数据与湿度数据之间变化趋势差异方面,反应了标记时刻的氧气浓度数据存在异常的可能性。基于此,结合三个方面综合表征标记时刻的氧气浓度存在差异的可能性大小,即将第二系数、第三系数和第四系数之间的乘积作为标记时刻的浓度异常权重。
最后,结合温度异常权重、湿度异常权重和浓度异常权重,构建异常加权因子,即计算每个时刻对应的温度异常权重的归一化值、湿度异常权重的归一化值和浓度异常权重的归一化值之间的和值,根据所述和值得到每个时刻对应的异常权重;所述和值与异常权重呈正相关关系。
在本实施例中,以目标时刻为例进行说明,则设定时间段内第t个时刻的异常权重,即目标时刻的异常权重的计算公式可以表示为:
其中,表示设定时间段内第t个时刻的异常权重,/>表示设定时间段内第t个时刻的温度异常权重的归一化值,/>表示设定时间段内第t个时刻的湿度异常权重的归一化值,/>表示设定时间段内第t个时刻的浓度异常权重的归一化值,exp()表示以自然常数e为底的指数函数。
需要说明的是,在本实施例中,对数据进行归一化的方法实施者可根据具体实施场景进行选择,例如最大值最小值归一化的方法等。
步骤三,根据数据预处理矩阵中每两个时刻对应的相同种环境数据之间的差异,得到每两个时刻对应的时间间隔距离,基于所述时间间隔距离获取每个时刻对应的局部可达密度。
由于在设定时间段内每个时刻均对应了多种环境数据,每种环境数据的异常程度能够反应对应时刻下阿胶糕保存环境中的异常情况,故本发明实施例将设定时间段内每个时刻均作为一个时间数据点,通过每个时刻的多种环境数据的变化情况对每个时间数据点进行异常检测,检测结果中存在异常的时间数据点对应时刻的保存环境即存在异常情况。
首先,通过分析两个时刻之间的温度数据差异、湿度数据差异和氧气浓度数据差异,获得两个时间数据点之间的距离,对于任意两个时刻,计算两个时刻对应的温度数据之间的差值、两个时刻对应的湿度数据之间的差值以及两个时刻对应的氧气浓度数据之间的差值,并计算三个差值的平方和,对平方和进行开根号处理得到所述任意两个时刻对应的时间间隔距离。根据传统的LOF算法,可以计算获得每个时刻对应的第k距离邻域,在本实施例中k的取值为5,实施者可根据具体实施场景进行设置。进一步的,基于每个时刻对应的第k距离邻域,计算每个时刻的局部可达密度。
需要说明的是,每个时刻对应的第k距离邻域以及每个时刻的局部可达密度的获取方法为传统的LOF算法中的公知技术,在本实施例中,只是将任意两个时刻对应的时间间隔距离作为对应的任意两个时间数据点之间的欧氏距离,进而计算每个时间数据点的第k距离,以及第k距离邻域和局部可达密度。
步骤四,基于每个时刻对应的局部可达密度以及异常权重得到每个时刻对应的局部离群因子,根据每个时刻对应的局部离群因子获得阿胶糕的保存环境监测结果。
每个时刻对应的局部可达密度反应了时刻对应的时间数据点的密度分布情况,每个时刻的异常权重反应了每个时刻的温度数据、湿度数据和氧气浓度数据存在异常的可能性。在传统的LOF算法中,对于任意一个数据点,通过计算数据点的第k距离邻域内所有数据点的平均局部可达密度,与所述任意一个数据点的局部可达密度之间的比值,该比值越大于1,说明所述任意一个数据点的密度越小于其周围数据点的密度,则所述任意一个数据点越可能是离群点。
在本实施例中,将设定时间段内每一个时刻均作为对应的时间数据点,在对每个时刻的异常情况进行分析时,不仅需要分析每个时间数据点的密度分布情况,还需要分析每个时刻下温度数据、湿度数据和氧气浓度数据的变化趋势以及波动情况,进而利用每个时刻的异常权重对每个时刻对应的局部可达密度进行调整,获得每个时刻对应的密度和异常情况的表征值,进而比较数据点的第k距离邻域内所有数据点的平均情况与数据点的自身表征值之间的差异情况。
具体地,对于任意一个时刻,计算该时刻的局部可达密度与异常权重之间的乘积,得到该时刻对应的特征乘积;将任意一个时刻记为待分析时刻,计算待分析时刻邻域内所有邻域时刻的特征乘积的均值,将均值与待分析时刻对应的特征乘积之间的比值作为待分析时刻的局部离群因子。其中,时刻对应的特征乘积即为时刻对应的时间数据点的密度分布情况和数据异常情况的表征值。
需要说明的是,在设定时间段内第一个时刻至第m个时刻之间的时刻,以及第N-m个时刻至第N个时刻之间的时刻,在本实施例中不进行异常加权因子的分析,即在这两个时间段内对应的所有时刻的异常权重可以看作取值为1,即根据LOF算法,基于每个时刻的局部可达密度获得每个时刻的局部离群因子。
最后,根据每个时刻对应的局部离群因子获得阿胶糕的保存环境监测结果,具体地,将设定时间段内每个时刻对应的局部离群因子作为异常得分,将异常得分大于预设的异常阈值对应的时刻记为疑似异常时刻,获取设定时间段内的疑似异常时刻的总数量,若疑似异常时刻的总数量大于或等于数量阈值,则在设定时间段内阿胶糕保存环境的检测结果为处于异常状态。
其中,在本实施例中,异常阈值的取值为1,数量阈值的取值为20,实施者可根据具体实施场景进行设置。当设定时间段内疑似异常时刻的总数量较少时,此时可能是由于外界的客观因素干扰,使得这些时刻下的环境数据存在一定的波动情况,例如,可能是仓库的工作人员进出阿胶糕保存的仓库而造成的,则此时在设定时间段内阿胶糕的保存环境不存在异常情况。当设定时间段内疑似异常时刻的总数量较多时,则可能是阿胶糕的保存环境存在异常情况,需要相关工作人员对环境产生异常的原因及时进行排查,避免出现财产损失的情况。
综上所述,本发明通过分析设定时间段内每个时刻的温度数据、湿度数据和氧气浓度数据在一定范围内的变化趋势差异、数据变化趋势和数据波动情况,确定每个时刻对应的异常权重,从多个方面充分考虑了不同环境数据的数据变化情况对环境异常情况的影响,并基于该影响的程度,获得每个时刻对应的局部离群因子,能够较为准确的检测出阿胶糕保存环境中存在异常的情况。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。
Claims (5)
1.一种基于数据分析的阿胶糕保存环境监测方法,其特征在于,该方法包括以下步骤:
采集阿胶糕在保存过程中设定时间段内不同时刻的至少两种环境数据,构成数据预处理矩阵;
根据数据预处理矩阵中每个时刻的每种环境数据在预设的时间窗口内的变化趋势差异、数据变化趋势和数据波动情况,确定每个时刻对应的异常权重;
根据数据预处理矩阵中每两个时刻对应的相同种环境数据之间的差异,得到每两个时刻对应的时间间隔距离,基于所述时间间隔距离获取每个时刻对应的局部可达密度;
基于每个时刻对应的局部可达密度以及异常权重得到每个时刻对应的局部离群因子,根据每个时刻对应的局部离群因子获得阿胶糕的保存环境监测结果;
所述采集阿胶糕在保存过程中设定时间段内不同时刻的至少两种环境数据,构成数据预处理矩阵,具体包括:
将阿胶糕保存环境在设定时间段内不同时刻的温度的归一化值,构成温度数据序列;将阿胶糕保存环境在设定时间段内不同时刻的湿度的归一化值,构成湿度数据序列;将阿胶糕保存环境在设定时间段内不同时刻的氧气浓度的归一化值,构成浓度数据序列;将温度数据序列、湿度数据序列和浓度数据序列中的元素按照设定顺序放置在矩阵中得到数据预处理矩阵;所述数据预处理矩阵中每一行数据为同一种环境数据;
所述根据数据预处理矩阵中每个时刻的每种环境数据在预设的时间窗口内的变化趋势差异、数据变化趋势和数据波动情况,确定每个时刻对应的异常权重,具体包括:
根据温度数据序列中每个时刻的数据在预设的时间窗口内的数据变化趋势和数据波动情况得到温度异常权重,根据湿度数据序列中每个时刻的数据在预设的时间窗口内的数据变化情况变化趋势和数据波动情况得到湿度异常权重,根据浓度数据序列和温度数据序列中每个时刻的数据在预设的时间窗口内的变化趋势差异、浓度数据序列和湿度数据序列中每个时刻的数据在预设的时间窗口内的变化趋势差异、浓度数据序列中每个时刻的数据在预设的时间窗口内的数据变化趋势和数据波动情况,得到浓度异常权重;
计算每个时刻对应的温度异常权重的归一化值、湿度异常权重的归一化值和浓度异常权重的归一化值之间的和值,根据所述和值得到每个时刻对应的异常权重;所述和值与异常权重呈正相关关系;
所述温度异常权重的获取方法具体为:
在温度数据序列中,将以任意一个时刻对应的温度数据为中心点,预设长度的时间窗口内的温度数据作为该时刻对应的第一温度序列;获取第一温度序列中的温度上升子序列;
将任意一个时刻记为目标时刻,若目标时刻对应的温度数据不在温度上升子序列中,则目标时刻的温度异常权重的取值为第一预设值;
若目标时刻对应的温度数据在温度上升子序列中,则将目标时刻对应的温度数据所在的温度上升子序列的长度记为第一长度,将目标时刻对应的温度数据所在的温度上升子序列的第一个温度数据对应的时刻与目标时刻之间的时间长度记为第二长度,计算第二长度与时间窗口的长度之间的比值得到目标时刻的时间占比;计算目标时刻对应的温度数据所在的温度上升子序列中所有温度数据的极差;
计算第一长度、时间占比和所述极差的乘积,将乘积与第一预设值的和值记为目标时刻的温度异常权重;
所述湿度异常权重的获取方法具体为:
在湿度数据序列中,将以任意一个时刻对应的湿度数据为中心点,预设长度的时间窗口内的湿度数据作为该时刻对应的第一湿度序列;
将任意一个时刻记为选定时刻,将选定时刻对应的湿度数据与标准湿度数据的最大值与最小值的比值记为第一比值;将选定时刻对应的第一温度序列中所有湿度数据的极差作为第一系数;获取选定时刻对应的第一湿度序列中所有湿度数据的最大值与最小值对应的时刻之间的时间长度,记为第三长度;获取选定时刻对应的第一湿度序列中所有湿度数据的最大值与最小值之间的中点时刻与选定时刻之间的时间长度,记为第四长度;获取第四长度与第二预设值之间的和值,获取时间窗口的长度与第三长度之间的差值,将差值与和值之间的比值作为第二比值;
计算第一比值、第一系数和第二比值之间的乘积得到选定时刻的湿度异常权重;
所述浓度异常权重的获取方法具体为:
在浓度数据序列中,将以任意一个时刻对应的氧气浓度数据为中心点,预设长度的时间窗口内的氧气浓度数据作为该时刻对应的第一浓度序列;
将任意一个时刻记为标记时刻,对标记时刻对应的第一浓度序列进行一阶差分处理得到浓度差分序列,将浓度差分序列中元素的取值满足预设条件的相邻两个元素对应的时刻划分到同一个子时间段,所述预设条件为浓度差分序列中相邻两个元素取值完全相同,或者元素取值的符号相同;
将任意一个子时间段记为目标子时间段,获取目标子时间段到标记时刻之间的时间长度,记为第五长度,对第五长度进行负相关归一化得到目标子时间段对应的特征系数;计算每个子时间段对应的特征系数和时间长度的乘积的均值得到第二系数;
根据标记时刻对应的第一浓度序列和第一浓度序列中氧气浓度数据对应时刻的温度数据之间的变化趋势差异得到第三系数;根据标记时刻对应的第一浓度序列和第一浓度序列中氧气浓度数据对应时刻的湿度数据之间的变化趋势差异得到第四系数;
将第二系数、第三系数和第四系数之间的乘积作为标记时刻的浓度异常权重。
2.根据权利要求1所述的一种基于数据分析的阿胶糕保存环境监测方法,其特征在于,所述第三系数的获取方法具体为:
将第一浓度序列中每个氧气浓度数据对应的时刻对应的温度数据记为第二温度序列,对第二温度序列进行一阶差分处理得到温度差分序列;获取温度差分序列和浓度差分序列之间元素取值完全相同以及元素取值的符号相同的总数量,对总数量进行负相关归一化得到第三系数;
所述第四系数的获取方法具体为:
将第一浓度序列中氧气浓度数据对应的任意两个相邻时刻,分别记为第一时刻和第二时刻,计算第一时刻与第二时刻对应的氧气浓度数据之间的差值得到第一差值,计算第一时刻与第二时刻对应的湿度数据之间的差值得到第二差值;将第一差值与第二差值之间的比值的绝对值记为第三比值,将第二差值与第一差值之间的比值的绝对值记为第四比值;
将以2为底数、以第三比值和第四比值之和为真数的对数函数的值,作为第一时刻和第二时刻对应的特征指标;计算所有两个相邻时刻对应的特征指标之间的均值得到第四系数。
3.根据权利要求1所述的一种基于数据分析的阿胶糕保存环境监测方法,其特征在于,所述根据数据预处理矩阵中每两个时刻对应的相同种环境数据之间的差异,得到每两个时刻对应的时间间隔距离,具体包括:
对于任意两个时刻,计算两个时刻对应的温度数据之间的差值、两个时刻对应的湿度数据之间的差值以及两个时刻对应的氧气浓度数据之间的差值,并计算三个差值的平方和,对平方和进行开根号处理得到所述任意两个时刻对应的时间间隔距离。
4.根据权利要求1所述的一种基于数据分析的阿胶糕保存环境监测方法,其特征在于,所述局部离群因子具体为:
对于任意一个时刻,计算该时刻的局部可达密度与异常权重之间的乘积,得到该时刻对应的特征乘积;
将任意一个时刻记为待分析时刻,计算待分析时刻邻域内所有邻域时刻的特征乘积的均值,将均值与待分析时刻对应的特征乘积之间的比值作为待分析时刻的局部离群因子。
5.根据权利要求1所述的一种基于数据分析的阿胶糕保存环境监测方法,其特征在于,所述根据每个时刻对应的局部离群因子获得阿胶糕的保存环境监测结果具体为:
将设定时间段内每个时刻对应的局部离群因子作为异常得分,将异常得分大于预设的异常阈值对应的时刻记为疑似异常时刻,获取设定时间段内的疑似异常时刻的总数量,若疑似异常时刻的总数量大于或等于数量阈值,则在设定时间段内阿胶糕保存环境的检测结果为处于异常状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310911428.0A CN116659589B (zh) | 2023-07-25 | 2023-07-25 | 基于数据分析的阿胶糕保存环境监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310911428.0A CN116659589B (zh) | 2023-07-25 | 2023-07-25 | 基于数据分析的阿胶糕保存环境监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116659589A CN116659589A (zh) | 2023-08-29 |
CN116659589B true CN116659589B (zh) | 2023-10-27 |
Family
ID=87715559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310911428.0A Active CN116659589B (zh) | 2023-07-25 | 2023-07-25 | 基于数据分析的阿胶糕保存环境监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116659589B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116861370B (zh) * | 2023-09-05 | 2023-12-01 | 山东千颐科技有限公司 | 用于井下防爆胶轮车的运动数据处理方法 |
CN116878590B (zh) * | 2023-09-06 | 2023-11-21 | 山东远联信息科技有限公司 | 一种数智化服务协同运营管理系统 |
CN116879662B (zh) * | 2023-09-06 | 2023-12-08 | 山东华尚电气有限公司 | 基于数据分析的变压器故障检测方法 |
CN116992246B (zh) * | 2023-09-27 | 2023-12-19 | 华洋通信科技股份有限公司 | 一种矿井下风流参数智能感知方法及系统 |
CN117035618B (zh) * | 2023-10-09 | 2024-01-12 | 山东爱福地生物股份有限公司 | 一种有机水溶肥储存料仓管理方法及系统 |
CN117216489B (zh) * | 2023-11-07 | 2024-01-26 | 山东正为新材料科技有限公司 | 一种基于互联网的防水涂料质检分析方法及系统 |
CN117216484B (zh) * | 2023-11-08 | 2024-01-26 | 山东汇蓝环保科技有限公司 | 基于多维数据分析的环境数据监测方法 |
CN117235656B (zh) * | 2023-11-16 | 2024-02-27 | 广州视安智能科技有限公司 | 一种基于大数据和云计算的城市交通管理系统及方法 |
CN117290718B (zh) * | 2023-11-24 | 2024-03-08 | 山东三矿地质勘查有限公司 | 一种地质矿产勘查数据提取方法及系统 |
CN117352094B (zh) * | 2023-12-04 | 2024-03-08 | 山东恒信科技发展有限公司 | 一种用于原料油的物性预测分析方法及系统 |
CN117540325B (zh) * | 2024-01-05 | 2024-04-26 | 杭银消费金融股份有限公司 | 基于数据变化量捕获的业务数据库异常检测方法及系统 |
CN117573667B (zh) * | 2024-01-08 | 2024-04-09 | 华洋通信科技股份有限公司 | 一种煤矿井间数据优化清洗方法及系统 |
CN117539307B (zh) * | 2024-01-09 | 2024-03-22 | 北京盛拓达生物技术有限公司 | 一种复合酶生产过程自动管理方法及系统 |
CN117786371B (zh) * | 2024-02-27 | 2024-05-10 | 聊城市检验检测中心 | 一种温度监测数据优化预测分析方法及系统 |
CN117892248B (zh) * | 2024-03-15 | 2024-05-28 | 山东鲁新国合节能环保科技有限公司 | 一种烧结烟气内循环过程中异常数据监测方法 |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004093806A (ja) * | 2002-08-30 | 2004-03-25 | Canon Inc | 電子写真感光体、該電子写真感光体を有するプロセスカートリッジおよび電子写真装置 |
JP2005134516A (ja) * | 2003-10-29 | 2005-05-26 | Konica Minolta Business Technologies Inc | 電子写真感光体、プロセスカートリッジ、画像形成装置及び画像形成方法 |
AR058568A1 (es) * | 2005-12-20 | 2008-02-13 | Bristol Myers Squibb Co | Metodos para producir una composicion con moleculas ctla4-ig a partir de un medio de cultivo |
JP2010033536A (ja) * | 2007-12-20 | 2010-02-12 | Nippon Steel Corp | 製品材質値の予測方法、装置、操業条件の決定方法、プログラム及びコンピュータ読み取り可能な記録媒体 |
CN104665573A (zh) * | 2014-08-22 | 2015-06-03 | 广东美的厨房电器制造有限公司 | 烹饪设备和烹饪设备的控制方法 |
WO2017074505A1 (en) * | 2015-10-28 | 2017-05-04 | Spectral Md, Inc. | Reflective mode multi-spectral time-resolved optical imaging methods and apparatuses for tissue classification |
CN106709197A (zh) * | 2016-12-31 | 2017-05-24 | 浙江大学 | 基于滑动窗口t‑s模糊神经网络模型的铁水硅含量预测方法 |
CN109105887A (zh) * | 2018-09-18 | 2019-01-01 | 耿庆刚 | 一种阿胶糕及其制备方法 |
CN110826749A (zh) * | 2018-08-07 | 2020-02-21 | 中国农业大学 | 基于snn的溶解氧含量预测方法、电子设备及系统 |
CN111557277A (zh) * | 2020-06-12 | 2020-08-21 | 无锡职业技术学院 | 一种昆虫养殖的智能化立体生产系统和养殖方法 |
CN113139342A (zh) * | 2021-04-23 | 2021-07-20 | 上海交通大学 | 一种好氧堆肥监测系统及结果预测方法 |
JP2022075582A (ja) * | 2020-11-05 | 2022-05-18 | 正行 廣瀬 | 閾値分析に基づく非破壊検査装置、及び非破壊検査方法 |
CN114723188A (zh) * | 2022-06-09 | 2022-07-08 | 广东盈峰科技有限公司 | 水质预测方法、装置、计算机设备和存储介质 |
CN115600932A (zh) * | 2022-12-12 | 2023-01-13 | 杭州原数科技有限公司(Cn) | 一种基于大数据的文物储藏环境异常评估方法 |
CN116012383A (zh) * | 2023-03-28 | 2023-04-25 | 山东鑫晟生物技术股份有限公司 | 用于硫酸软骨素生产监测的数据处理方法 |
WO2023070568A1 (zh) * | 2021-10-29 | 2023-05-04 | 京东方科技集团股份有限公司 | 一种基于迭代的多重pcr引物设计方法及系统 |
CN116228176A (zh) * | 2023-05-10 | 2023-06-06 | 安徽皖欣环境科技有限公司 | 一种基于数据处理的污水处理数据高效管理系统 |
CN116304962A (zh) * | 2023-05-25 | 2023-06-23 | 湖南东润智能仪表有限公司 | 一种用于水表计量数据的智能异常监测方法 |
CN116413395A (zh) * | 2023-06-08 | 2023-07-11 | 山东瑞程数据科技有限公司 | 一种环境异常智能检测方法 |
CN116414097A (zh) * | 2023-05-15 | 2023-07-11 | 广东思创智联科技股份有限公司 | 基于工业设备数据的告警管理方法及系统 |
CN116451014A (zh) * | 2023-06-20 | 2023-07-18 | 北京云摩科技股份有限公司 | 一种无线无源设备内动部件温度实时监测方法 |
-
2023
- 2023-07-25 CN CN202310911428.0A patent/CN116659589B/zh active Active
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004093806A (ja) * | 2002-08-30 | 2004-03-25 | Canon Inc | 電子写真感光体、該電子写真感光体を有するプロセスカートリッジおよび電子写真装置 |
JP2005134516A (ja) * | 2003-10-29 | 2005-05-26 | Konica Minolta Business Technologies Inc | 電子写真感光体、プロセスカートリッジ、画像形成装置及び画像形成方法 |
AR058568A1 (es) * | 2005-12-20 | 2008-02-13 | Bristol Myers Squibb Co | Metodos para producir una composicion con moleculas ctla4-ig a partir de un medio de cultivo |
JP2010033536A (ja) * | 2007-12-20 | 2010-02-12 | Nippon Steel Corp | 製品材質値の予測方法、装置、操業条件の決定方法、プログラム及びコンピュータ読み取り可能な記録媒体 |
CN104665573A (zh) * | 2014-08-22 | 2015-06-03 | 广东美的厨房电器制造有限公司 | 烹饪设备和烹饪设备的控制方法 |
WO2017074505A1 (en) * | 2015-10-28 | 2017-05-04 | Spectral Md, Inc. | Reflective mode multi-spectral time-resolved optical imaging methods and apparatuses for tissue classification |
CN106709197A (zh) * | 2016-12-31 | 2017-05-24 | 浙江大学 | 基于滑动窗口t‑s模糊神经网络模型的铁水硅含量预测方法 |
CN110826749A (zh) * | 2018-08-07 | 2020-02-21 | 中国农业大学 | 基于snn的溶解氧含量预测方法、电子设备及系统 |
CN109105887A (zh) * | 2018-09-18 | 2019-01-01 | 耿庆刚 | 一种阿胶糕及其制备方法 |
CN111557277A (zh) * | 2020-06-12 | 2020-08-21 | 无锡职业技术学院 | 一种昆虫养殖的智能化立体生产系统和养殖方法 |
JP2022075582A (ja) * | 2020-11-05 | 2022-05-18 | 正行 廣瀬 | 閾値分析に基づく非破壊検査装置、及び非破壊検査方法 |
CN113139342A (zh) * | 2021-04-23 | 2021-07-20 | 上海交通大学 | 一种好氧堆肥监测系统及结果预测方法 |
WO2023070568A1 (zh) * | 2021-10-29 | 2023-05-04 | 京东方科技集团股份有限公司 | 一种基于迭代的多重pcr引物设计方法及系统 |
CN114723188A (zh) * | 2022-06-09 | 2022-07-08 | 广东盈峰科技有限公司 | 水质预测方法、装置、计算机设备和存储介质 |
CN115600932A (zh) * | 2022-12-12 | 2023-01-13 | 杭州原数科技有限公司(Cn) | 一种基于大数据的文物储藏环境异常评估方法 |
CN116012383A (zh) * | 2023-03-28 | 2023-04-25 | 山东鑫晟生物技术股份有限公司 | 用于硫酸软骨素生产监测的数据处理方法 |
CN116228176A (zh) * | 2023-05-10 | 2023-06-06 | 安徽皖欣环境科技有限公司 | 一种基于数据处理的污水处理数据高效管理系统 |
CN116414097A (zh) * | 2023-05-15 | 2023-07-11 | 广东思创智联科技股份有限公司 | 基于工业设备数据的告警管理方法及系统 |
CN116304962A (zh) * | 2023-05-25 | 2023-06-23 | 湖南东润智能仪表有限公司 | 一种用于水表计量数据的智能异常监测方法 |
CN116413395A (zh) * | 2023-06-08 | 2023-07-11 | 山东瑞程数据科技有限公司 | 一种环境异常智能检测方法 |
CN116451014A (zh) * | 2023-06-20 | 2023-07-18 | 北京云摩科技股份有限公司 | 一种无线无源设备内动部件温度实时监测方法 |
Non-Patent Citations (7)
Title |
---|
Effect of an Oxygen Scavenger on the Stability of Preservative-Free Flour Tortillas;Antunez, PD等;JOURNAL OF FOOD SCIENCE;第77卷(第1期);全文 * |
Response of three citrus species to different hygrometric conditions;D\'Aquino, S等;PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON QUALITY IN CHAINS;第1卷(第2期);全文 * |
基于时空关联性的温室环境多传感器数据融合;周金生;王纪章;贺通;王建平;李萍萍;;江苏农业科学(第05期);全文 * |
复杂数据类型的离群检测方法研究;刘靖;中国博士学位论文全文数据库(电子期刊);全文 * |
多变量时间序列结构化预测方法及应用;蒋梦雪;中国优秀硕士学位论文全文数据库(电子期刊);全文 * |
浅谈食品检测实验室质量控制与管理;李坤全等;现代食品;全文 * |
阿胶糕类食品生产企业质量安全管理探究;相光明等;食品与药品;第19卷(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116659589A (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116659589B (zh) | 基于数据分析的阿胶糕保存环境监测方法 | |
JP6442398B2 (ja) | 試料容器内の微生物増殖を検出する方法及びシステム | |
Hong et al. | Use of electronic nose and tongue to track freshness of cherry tomatoes squeezed for juice consumption: comparison of different sensor fusion approaches | |
CN108304970B (zh) | 苹果贮藏期的快速预测方法及系统、气调贮藏监控系统 | |
CN114912852A (zh) | 一种用于冷藏仓储箱的异常监测预警系统 | |
CN117196353B (zh) | 基于大数据的环境污染评估与监测方法及系统 | |
CN112105923B (zh) | 利用人工智能深度学习的生物测量对象浓度测量方法 | |
CN115876258B (zh) | 基于多源数据的畜禽养殖环境异常监测及报警系统 | |
CN112978128B (zh) | 基于大数据和图像分析技术的冷链物流运输商品品质监测管理系统 | |
WO2021135688A1 (zh) | 一种低血糖预警方法和装置 | |
CN115800245A (zh) | 基于sarima-随机森林组合模型的短期负荷预测方法 | |
CN116843236A (zh) | 一种基于人工智能的食品存储监管系统 | |
CN117349664B (zh) | 一种芽苗菜生长环境在线监测方法及系统 | |
CN113593708A (zh) | 基于集成学习算法的脓毒症预后预测方法 | |
Wei et al. | Prediction of the maturity of greenhouse grapes based on imaging technology | |
CN117216484B (zh) | 基于多维数据分析的环境数据监测方法 | |
CN114297264A (zh) | 一种时序信号异常片段检测方法及系统 | |
CN116842330B (zh) | 一种可对比历史记录的保健信息处理方法及装置 | |
CN116776252A (zh) | 一种改进Mallow's Cp变量选择的工业过程软测量方法和系统 | |
CN116258087A (zh) | 冰铜品位软测量方法、装置、电子设备及存储介质 | |
CN117390569B (zh) | 一种基于数据处理的水环境监测方法 | |
CN117928655A (zh) | 一种物料反应瞬时酸价数据在线监测系统 | |
CN116612820B (zh) | 基于数据分析的乳制品生产智能管理平台 | |
CN117541626B (zh) | 基于深度学习的遥感影像变化检测方法 | |
CN117408734B (zh) | 基于物联网设备的客户信息智能管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Monitoring method of ass hide glue cake preservation environment based on data analysis Granted publication date: 20231027 Pledgee: Shandong Dong'a Rural Commercial Bank Co.,Ltd. Pledgor: Aorun (Shandong) Pharmaceutical Co.,Ltd. Registration number: Y2024980007345 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |