CN117332283B - 一种中药材生长信息采集分析方法及系统 - Google Patents
一种中药材生长信息采集分析方法及系统 Download PDFInfo
- Publication number
- CN117332283B CN117332283B CN202311628130.5A CN202311628130A CN117332283B CN 117332283 B CN117332283 B CN 117332283B CN 202311628130 A CN202311628130 A CN 202311628130A CN 117332283 B CN117332283 B CN 117332283B
- Authority
- CN
- China
- Prior art keywords
- segment
- data
- traditional chinese
- chinese medicine
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 239000000463 material Substances 0.000 title claims abstract description 39
- 239000003814 drug Substances 0.000 claims abstract description 97
- 230000008859 change Effects 0.000 claims abstract description 35
- 238000005070 sampling Methods 0.000 claims abstract description 20
- 230000008569 process Effects 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 3
- 230000035800 maturation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000009331 sowing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 229940126680 traditional chinese medicines Drugs 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Abstract
本发明涉及数据处理技术领域,具体涉及一种中药材生长信息采集分析方法及系统。该方法包括:获取中药材生长中各项数据;获取一条中药环境维度曲线,并分成若干曲线段;根据不同维度曲线段的特征获取曲线段的初始匹配程度;根据初始匹配程度获取一个维度的分段的待确定分段,将待确定分段组合并计算合并程度,根据合并程度获取匹配第二分段,根据某一维度分段与其匹配第二分段的IMF分量获取两个维度的联系性,并获取二元维度数据标记组;根据两个维度获取两个孤立森林,获取两个维度下两个时刻的变化特征相似性,根据所有两个维度下的变化特征相似性获取若干聚类簇;根据聚类簇调整采样频率。本发明使得获取的数据的采集频率更加准确。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种中药材生长信息采集分析方法及系统。
背景技术
人们由于对健康的需求,对中医药的需求也在增加。在此背景下,对中药材生长信息的精确采集与有效分析成为了行业关注的焦点。准确的生长信息数据能够帮助我们监控和预测中药材的产量与质量,进一步指导优化种植策略,提高产量和品质。然而,传统的采集方式往往以固定频率进行,这样可能会忽视中药材生长中的关键变化时刻,例如生长突变或生态环境突变等。另一方面,在数据不变或变化较小的时期,固定频率采集又可能造成资源的浪费。在对中药材生长信息数据的采集过程中,由于一些数据变化较小,且需要分析数据的调整变化,因此需要自适应获取数据的采集频率来使得采集的数据更加准确。由于在中药材生长过程中,需要不断的调整生长环境数据,例如调整温度值、湿度值等,则对应的应该需要判断当前数据与理想的数据之间的差距来判断采集频率的调整程度。
发明内容
为了解决采集数据不精准无法实时调控的技术问题,本发明提供了一种中药材生长信息采集分析方法及系统,所采用的技术方案具体如下:
第一方面,本发明提出了一种中药材生长信息采集分析方法,该方法包括以下步骤:
获取中药材生长中的生长环境数据、中药环境维度以及初始采样频率;
根据每个中药环境维度构成一条中药环境维度曲线,并将中药环境维度曲线分成若干曲线段;将任意一个中药环境维度中的曲线段记为第一分段,另一个中药环境维度的曲线段记为第二分段,根据不同中药环境维度的第一分段和第二分段内每个点的特征获取第一分段和第二分段的初始匹配程度;
根据初始匹配程度将部分第二分段作为第一分段的待确定分段;将第一分段对应的两个相邻的待确定分段构成合并分段,对第一分段和合并分段使用EMD分解获取IMF分量,并根据IMF分量之间的距离获取合并分段的合并程度;根据合并程度获取第一分段对应的匹配第二分段,根据第一分段和匹配第二分段的IMF分量获取第一分段和匹配第二分段的联系性;根据联系性获取第一分段的最终匹配分段,计算所有第一分段和最终匹配分段的联系性均值作为两个中药环境维度的联系性,将同一时刻不同中药环境维度对应的数据值作为二元维度数据标记组;
通过两个中药环境维度的所有二元维度数据标记组获取两个中药环境维度的孤立森林,并根据孤立森林获取不同时刻在任意两个中药环境维度下的变化特征相似性;根据中药环境维度下的变化特征相似性和联系性获取不同时刻的最终相似性,根据最终相似性聚类获取若干聚类簇;
根据聚类簇调整采样频率。
优选的,所述获取中药材生长中的生长环境数据、中药环境维度以及初始采样频率的方法为:
中药材的生长环境数据通过不同种类的传感器采集不同的数据值,其中每个中药环境维度对应一种传感器采集的值,每经过初始采样频率的时间通过传感器采集一次中药环境数据。
优选的,所述根据每个中药环境维度构成一条中药环境维度曲线,并将中药环境维度曲线分成若干曲线段的方法为:
在一个生长次数内,将一个中药环境维度的所有数据值构成一条中药环境曲线,中药环境维度曲线的横坐标为时间,纵坐标为该中药环境维度下对应的数据值;
对中药环境曲线求导数获取曲线上每个点的斜率,对于任意一个点,令其和后一个点的斜率值作差,将差值记为斜率差值,将斜率差值和1的差值的绝对值进行线性归一化,将归一化后的值作为每个点的分段值,将分段值大于预设分段阈值的点作为分段点,将相邻分段点之间的数据构成一个曲线段。
优选的,所述根据不同中药环境维度的第一分段和第二分段内每个点的特征获取第一分段和第二分段的初始匹配程度的方法为:
对于两个中药环境维度,计算第一分段和第二分段的方差贡献率,令第一分段与第二分段的每个点的方差贡献率作差,差值绝对值小于预设阈值则第二分段的点是第一分段点的匹配点;
式中,表示第a个分段的第/>个点的方差贡献率,/>表示第b个分段中与第/>个点匹配的第u个匹配点的方差贡献率,/>表示第a个分段的第/>个点的时刻,/>表示第b个分段的第u个点的时刻,/>表示以自然常数为底的指数函数,/>表示第/>个点的匹配点的数量,/>表示第a个分段中点的数量,/>表示第a个分段和第b个分段的初始匹配程度;其中第a个分段为第一分段,第b个分段为第二分段。
优选的,所述对第一分段和合并分段使用EMD分解获取IMF分量,并根据IMF分量之间的距离获取合并分段的合并程度的方法为:
将第一分段的IMF分量记为第一IMF分量,将合并分段的IMF分量记为合并IMF分量;
计算第一IMF分量和合并IMF分量的DTW距离,获取此DTW距离的最小值,并将最小值归一化,将第一分段的所有第一IMF分量使用变异系数计算,将计算后的值反比例归一化作为合并分段的合并程度。
优选的,所述根据第一分段和匹配第二分段的IMF分量获取第一分段和匹配第二分段的联系性的方法为:
式中,表示第一分段的第一IMF分量的次序,M表示第一分段的IMF分量的数量,表示以自然常数为底的指数函数,/>表示DTW距离,/>表示第一分段的第m个第一IMF分量,/>表示第m个第一IMF分量对应的第b个匹配第二IMF分量,/>表示第一分段与匹配第二分段的联系性;所述匹配第二IMF分量为匹配第二分段的IMF分量。
优选的,所述通过两个中药环境维度的所有二元维度数据标记组获取两个中药环境维度的孤立森林,并根据孤立森林获取不同时刻在任意两个中药环境维度下的变化特征相似性的方法为:
将任意两个维度的所有二元维度数据标记组作为输入构建两个维度的孤立森林,若两个不同孤立森林中存在具有相同时刻的树,则两个具有相同时刻的树记为目标树组合,每棵树作为一个目标树;
对于每个时刻的二元维度数据标记组,每个数据值在目标树的层数为二维向量的值;
将每个时刻所在的分段中所有时刻的二元维度数据标记组的二维向量记为分段二维向量,将每个时刻对应的所有分段二维向量两两之间计算余弦相似度,将所计算的余弦相似度的均值作为每个时刻的余弦相似均值;
根据两个时刻所在的目标树组合内节点的数量以及两个时刻的余弦相似均值获取两个时刻的变化特征相似性。
优选的,所述根据两个时刻所在的目标树组合内节点的数量以及两个时刻的余弦相似均值获取两个时刻的变化特征相似性的方法为:
式中,表示第h次数据的第v个时刻,/>表示第p次数据的第q个时刻,/>表示第h次数据的第v个时刻的余弦相似均值,/>表示第p次数据的第q个时刻的余弦相似均值,/>表示所有目标树组合的节点的数量,/>表示所有目标树组合的数量,/>表示第c个目标树的节点的数量,/>表示第h次数据的第v个时刻与第p次数据的第q个时刻的变化特征相似性。
优选的,所述根据聚类簇调整采样频率的方法为:
将每个聚类簇的每个维度数据进行最小二乘法拟合获取每个维度对应的数据变化曲线;
采集最新的生长环境数据记为当前数据,计算当前数据与聚类簇的聚类中心的相似性距离,所述相似性为余弦相似度;计算当前数据每个维度的数据值与该维度的数据变化曲线的距离,将每个维度的距离归一化求均值后作为当前差异值;
根据当前差异值对初始采样频率进行调整获取新的采样频率。
第二方面,本发明实施例还提供了一种中药材生长信息采集分析系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述一种中药材生长信息采集分析方法的步骤。
本发明具有如下有益效果:本发明通过自适应获取数据的采集频率来使得采集的数据更加准确。在获取多维度的数据过程中,对单个维度的数据进行分段,而在计算维度与维度的之间的关系时对两个维度之间的分段数据需要进行匹配,匹配之后再计算联系性,构建二元维度数据标记组。通过计算二元维度数据标记组的对应的两个孤立森林之间结构进行比较,获取不同时刻的二元维度数据标记组之间结构的变化特征,进而进行准确的聚类为同一个生长周期的生长环境数据,得到精准的数据变化曲线,并根据当前数据与数据变化曲线自适应获取数据的采集频率,避免了传统的分类过程中仅根据数据值大小,由于不同生长周期的数据可能会存在生长环境数据相同的情况发生,因此若仅根据数据值的大小来判断,会出现较大的分类误差的缺点,使得获取的数据的采集频率更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种中药材生长信息采集分析方法及系统流程图;
图2为合并分段示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种中药材生长信息采集分析方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
一种中药材生长信息采集分析方法实施例:
下面结合附图具体的说明本发明所提供的一种中药材生长信息采集分析方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种中药材生长信息采集分析方法流程图,该方法包括以下步骤:
步骤S001,获取中药材生长中的生长环境数据、中药环境维度以及初始采样频率。
在中药材生长过程中,在其生长的位置放置不同种类的传感器采集中药材生长过程中的生长环境数据,在本实施例中,以放置温度传感器、湿度传感器、PH值传感器为例,采集中药材生长过程中的温度值、湿度值和PH值。每种传感器采集一种数据,所采集的数据为时间序列数据,其中温度值、PH值和湿度值分别作为一个中药环境维度,每种传感器每一小时采集一次数据,即初始采样频率为60。
至此,获取了中药材生长过程中的生长环境数据。
步骤S002,获取中药材的生长周期和生长次数,对于中药材的每一个生长次数,根据每个中药环境维度构成一条中药环境维度曲线,并将中药环境维度曲线分成若干曲线段;根据不同中药环境维度的两个曲线段内每个点的特征获取不同中药环境维度的两个曲线段的初始匹配程度。
由于中药材在生长过程中,从种子播种到药材成熟这段时间存在不同的生长阶段,例如萌芽阶段,发芽阶段,成长阶段,成熟阶段,每个阶段作为一个生长周期,将种子播种到药材成熟的这段时间采集的数据作为单次数据。
在一个单次数据内,对于每个中药环境维度的构成一个中药环境维度曲线,中药环境维度曲线的横坐标为时间,纵坐标为该中药环境维度下对应的数据值,利用中药环境维度曲线求导数获取每个数据点的斜率值,对于任意一个数据点,将其和后一个数据点的斜率值作差记为斜率差值,将斜率差值和1的差值的绝对值进行线性归一化获取每个数据点的分段值,预设分段阈值,在本实施例中分段阈值为0.65,若分段值大于分段阈值,则说明该数据点为此中药环境维度的分段点,获取每条中药环境维度曲线的所有分段点,将相邻分段点之间的所有数据构成一个曲线段。
对于任意两个中药环境维度,将其中一个中药环境维度的曲线段记为第一分段,将另一个中药环境维度的曲线段记为第二分段,对于每一个曲线段使用因子分析获取每个数据点在曲线段中的方差贡献率,对于第一分段和第二分段,令第一分段每个数据点的方差贡献率与第二分段每个数据点的方差贡献率作差,若差值的绝对值小于0.3,那么认为两个数据点互相匹配,即第二分段的数据点为第一分段数据点的匹配点。第一分段数据点的匹配点可能存在多个。
根据第一分段和第二分段每个数据点的方差贡献率以及时间差异获取第一分段与第二分段的初始匹配程度,公式如下:
式中,表示第a个分段的第/>个数据点的方差贡献率,/>表示第b个分段中与第/>个数据点匹配的第u个匹配点的方差贡献率,/>表示第a个分段的第/>个数据点的时刻,/>表示第b个分段的第u个数据点的时刻,/>表示以自然常数为底的指数函数,/>表示第/>个数据点的匹配点的数量,/>表示第a个分段中数据点的数量,/>表示第a个分段和第b个分段的初始匹配程度。其中第a个分段为第一分段,第b个分段为第二分段。
其中,若第一分段的数据点的方差贡献率与其匹配点的方差贡献率越大,则说明其影响力越大,即权重越大,而此时数据点与其匹配点的时间差异越小说明第一分段和第二分段越匹配,将方差贡献率作为权重,权重越大,时间差异越小越说明第一分段和第二分段的初始匹配程度越大。
至此,获取了第一分段和第二分段的初始匹配程度。
步骤S003,根据初始匹配程度将部分第二分段作为第一分段的待确定分段;将第一分段对应的两个相邻的待确定分段构成合并分段,对第一分段和合并分段使用EMD分解获取IMF分量,并根据IMF分量之间的距离获取合并分段的合并程度;根据合并程度获取第一分段对应的匹配第二分段,根据第一分段和匹配第二分段的IMF分量获取第一分段和匹配第二分段的联系性;根据联系性获取第一分段的最终匹配分段,计算所有第一分段和最终匹配分段的联系性均值作为两个中药环境维度的联系性,将同一时刻不同中药环境维度对应的数据值作为二元维度数据标记组。
根据上述步骤获取每个第一分段和第二分段的初始匹配程度,每个第一分段与所有第二分段会获取多个初始匹配程度,若每个第一分段获取的初始匹配程度大于预设匹配阈值,则认为此第二分段为第一分段的待确定分段,在本实施例中预设匹配阈值为0.58。
而第一分段可能拥有多个待确定分段,若每个第一分段对应的待确定分段中存在两个相邻的待确定分段时,说明第一分段与两个待确定分段都有较大的匹配度,而在中药材生长过程中,由于不同中药环境维度的变化因素不同,不同中药环境维度的数据在变化时可能会有时间上的变化,因此此时的第一分段可能与两个待确定分段的组合匹配,因此会出现较大的误差,需要对该类情况进行调整。
将第一分段对应的任意两个相邻待确定分段合并为一个分段,由于两个相邻待确定分段在时间上是相邻的,因此将两个相邻待确定分段中的最先时间到最后时间中间的所有数据作为合并分段;如图2所示,图2中Q1到Q2为一个待确定分段,Q2到Q3为一个待确定分段,合并后Q1到Q3为一个合并分段。
对第一分段进行EMD分解,获取对应的多个IMF分量,记为第一IMF分量,类似的将合并分段使用EMD分解,获取对应的多个IMF分量,记为合并IMF分量。计算第一IMF分量与合并IMF分量之间的相似性变化,若在多个IMF分量中均相似,则表明合并分段对应的分段需要进行合并,合并分段的合并程度计算方法如下:
式中,表示第一分段的第m个第一IMF分量,/>表示合并分段的第b个合并IMF分量,/>表示DTW距离,/>表示最大值函数,其中合并分段的合并IMF分量一直在改变,计算第m个第一IMF分量和每个合并IMF分量的DTW值,选取最小值;/>表示第m个第一IMF分量的分布相似度,将第一分段的所有第一IMF分量作为输入使用变异系数归一化获取合并程度,/>表示变异系数计算公式,/>表示以自然常数为底的指数函数,/>表示合并分段的合并程度。
若合并分段的合并程度大于合并预设值0.65,那么认为合并分段作为第一分段的匹配第二分段,将第一分段的每个待确定分段也记为第一分段的匹配第二分段,对于每个第一分段,基于其与每个匹配第二分段的联系性,公式如下:
式中,表示第一分段的第一IMF分量的次序,M表示第一分段的IMF分量的数量,表示以自然常数为底的指数函数,/>表示DTW距离,/>表示第一分段的第m个第一IMF分量,/>表示第m个第一IMF分量对应的第b个匹配第二IMF分量,/>表示第一分段与匹配第二分段的联系性。所述第b个匹配第二IMF分量为第一IMF分量计算的分布相似度对应的第二IMF分量。
其中表示第一分段的第/>个的/>分量的权重值,即分量序号越小,越可能包含有高频的信息,而高频信息表征的为细节的变化,而这里需要的为整体的变化,因此分量序号越小,该分量的权重值越小。
第一分段与每个匹配第二分段的联系性中最大联系性对应对匹配第二分段作为第一分段的最终匹配分段。
对于第一分段对应的中药环境维度,该中药环境维度中每个第一分段都与其最终匹配分段有一个联系性,计算所有联系性的均值作为两个中药环境维度的联系性,预设联系性阈值,若联系性大于联系性阈值,则将同一时刻的两个中药环境维度对应的数据作为一个二元维度数据标记组。
至此,获取了二元维度数据标记组。
步骤S004,通过两个中药环境维度的所有二元维度数据标记组获取两个中药环境维度的孤立森林,并根据孤立森林获取不同时刻在任意两个中药环境维度下的变化特征相似性;根据中药环境维度下的变化特征相似性和联系性获取不同时刻的最终相似性,根据最终相似性聚类获取若干聚类簇。
对于历史中种子播种到药材成熟的所有次数据中,将任意两个维度的所有二元维度数据标记组作为输入分别构建两个维度的孤立森林,在本实施例中令每个孤立森林中的树有100棵。在这些树中由于同一时刻在两个维度都有数据,因此将两个孤立森林中包含同一时刻的树记为目标树组合,每棵树作为一棵目标树。例如,两个孤立森林分别为和/>,/>中的第3棵树中包含有第6个时刻的二元维度数据标记组中第一个维度数据值,而/>中的第5棵树中包含有同第6个时刻的二元维度数据标记组中第二个维度数据值,则对应的中的第3棵树与/>中的第5棵树为包含同一个时刻的树。
对于每一次数据的每个时刻对应的二元维度数据标记组,其二元维度数据标记组在树中的某一层,根据树的层数获取二元维度数据标记组的二维环境向量;例如,第v个时刻的二元维度数据标记组的第一个数据在一棵树的第五层,第二个数据在另一个树的第八层,那么该二元维度数据标记组对应的二维向量为[5,8]。
对于每个时刻,将每个时刻所在的分段中所有时刻的二元维度数据标记组的二维向量记为分段二维向量,将每个时刻对应的所有分段二维向量两两之间计算余弦相似度,将所计算的余弦相似度的均值作为每个时刻的余弦相似均值。
根据两个时刻所在的目标树组合内节点的数量以及两个时刻的余弦相似均值获取两个时刻的变化特征相似性,公式如下:
式中,表示第h次数据的第v个时刻,/>表示第p次数据的第q个时刻,/>表示第h次数据的第v个时刻的余弦相似均值,/>表示第p次数据的第q个时刻的余弦相似均值,/>表示所有目标树组合的节点的数量,/>表示所有目标树组合的数量,/>表示第c个目标树的节点的数量,/>表示第h次数据的第v个时刻与第p次数据的第q个时刻的变化特征相似性。
其中对于上述联系性强的两个维度来获取同一时刻的树结构的变化,若树结构的变化特征较为规律,则表明这些次的数据的时刻应表征的为同一种生长周期的数据。
对于第次数据的第/>个时刻与第/>次数据的第/>时刻在不同的两个维度下都会获得一个变化特征相似性,将任意两个维度下的变化特征相似性利用其联系性质作为权重得到第/>次数据的第/>个时刻与第/>次数据的第/>时刻的最终相似性。
将每个时刻的数据点作为输入使用K-means聚类,由于在本实施例中生长周期为4,因此设定生长周期为4,聚类距离为两个时刻的最终相似性,最终将所有数据点分为四类。
至此,获取了所有数据点的类别。
步骤S005,根据聚类簇调整采样频率。
对所有的数据进行聚类后,得到最终的聚类结果,表征为不同的生长周期的环境数据聚簇。将每一个聚类簇中每一个维度的数据进行最小二乘法拟合得到该维度对应的数据变化曲线。
对于最新采集的生长环境数据,将该生长环境数据与每个聚类簇的聚类中心进行相似性计算,由于生长环境数据和聚类中心都可看作一个多维数据点,将多维数据点看作一个向量,计算两个向量的余弦相似性,将最新的生长环境数据分到余弦相似度最小的聚类簇中。计算最新采集的生长环境数据每个维度的数据值与每个维度的数据变化曲线的距离,将每个维度的距离线性归一化后求均值作为当前差异值。
令1与当前差异值的差与初始采样频率相乘作为新的采样频率。
本实施例提供一种中药材生长信息采集分析系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,处理器执行所述计算机程序时实现上述步骤S001至步骤S005的方法。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (4)
1.一种中药材生长信息采集分析方法,其特征在于,该方法包括以下步骤:
获取中药材生长中的生长环境数据、中药环境维度以及初始采样频率;
根据每个中药环境维度构成一条中药环境维度曲线,并将中药环境维度曲线分成若干曲线段;将任意一个中药环境维度中的曲线段记为第一分段,另一个中药环境维度的曲线段记为第二分段,根据不同中药环境维度的第一分段和第二分段内每个点的特征获取第一分段和第二分段的初始匹配程度;
根据初始匹配程度将部分第二分段作为第一分段的待确定分段;将第一分段对应的两个相邻的待确定分段构成合并分段,对第一分段和合并分段使用EMD分解获取IMF分量,并根据IMF分量之间的距离获取合并分段的合并程度;根据合并程度获取第一分段对应的匹配第二分段,根据第一分段和匹配第二分段的IMF分量获取第一分段和匹配第二分段的联系性;根据联系性获取第一分段的最终匹配分段,计算所有第一分段和最终匹配分段的联系性均值作为两个中药环境维度的联系性,将同一时刻不同中药环境维度对应的数据值作为二元维度数据标记组;
通过两个中药环境维度的所有二元维度数据标记组获取两个中药环境维度的孤立森林,并根据孤立森林获取不同时刻在任意两个中药环境维度下的变化特征相似性;根据中药环境维度下的变化特征相似性和联系性获取不同时刻的最终相似性,根据最终相似性聚类获取若干聚类簇;
根据聚类簇调整采样频率;
所述根据不同中药环境维度的第一分段和第二分段内每个点的特征获取第一分段和第二分段的初始匹配程度的方法为:
对于两个中药环境维度,计算第一分段和第二分段的方差贡献率,令第一分段与第二分段的每个点的方差贡献率作差,差值绝对值小于预设阈值则第二分段的点是第一分段点的匹配点;
式中,表示第a个分段的第/>个点的方差贡献率,/>表示第b个分段中与第/>个点匹配的第u个匹配点的方差贡献率,/>表示第a个分段的第/>个点的时刻,/>表示第b个分段的第u个点的时刻,/>表示以自然常数为底的指数函数,/>表示第/>个点的匹配点的数量,/>表示第a个分段中点的数量,/>表示第a个分段和第b个分段的初始匹配程度;其中第a个分段为第一分段,第b个分段为第二分段;
所述对第一分段和合并分段使用EMD分解获取IMF分量,并根据IMF分量之间的距离获取合并分段的合并程度的方法为:
将第一分段的IMF分量记为第一IMF分量,将合并分段的IMF分量记为合并IMF分量;
计算第一IMF分量和合并IMF分量的DTW距离,获取此DTW距离的最小值,并将最小值归一化,将第一分段的所有第一IMF分量使用变异系数计算,将计算后的值反比例归一化作为合并分段的合并程度;
所述根据第一分段和匹配第二分段的IMF分量获取第一分段和匹配第二分段的联系性的方法为:
式中,表示第一分段的第一IMF分量的次序,M表示第一分段的IMF分量的数量,/>表示以自然常数为底的指数函数,/>表示DTW距离,/>表示第一分段的第m个第一IMF分量,/>表示第m个第一IMF分量对应的第b个匹配第二IMF分量,/>表示第一分段与匹配第二分段的联系性;所述匹配第二IMF分量为匹配第二分段的IMF分量;
所述通过两个中药环境维度的所有二元维度数据标记组获取两个中药环境维度的孤立森林,并根据孤立森林获取不同时刻在任意两个中药环境维度下的变化特征相似性的方法为:
将任意两个维度的所有二元维度数据标记组作为输入构建两个维度的孤立森林,若两个不同孤立森林中存在具有相同时刻的树,则两个具有相同时刻的树记为目标树组合,每棵树作为一个目标树;
对于每个时刻的二元维度数据标记组,每个数据值在目标树的层数为二维向量的值;
将每个时刻所在的分段中所有时刻的二元维度数据标记组的二维向量记为分段二维向量,将每个时刻对应的所有分段二维向量两两之间计算余弦相似度,将所计算的余弦相似度的均值作为每个时刻的余弦相似均值;
根据两个时刻所在的目标树组合内节点的数量以及两个时刻的余弦相似均值获取两个时刻的变化特征相似性;
所述根据两个时刻所在的目标树组合内节点的数量以及两个时刻的余弦相似均值获取两个时刻的变化特征相似性的方法为:
式中,表示第h次数据的第v个时刻,/>表示第p次数据的第q个时刻,/>表示第h次数据的第v个时刻的余弦相似均值,/>表示第p次数据的第q个时刻的余弦相似均值,/>表示所有目标树组合的节点的数量,/>表示所有目标树组合的数量,/>表示第c个目标树的节点的数量,/>表示第h次数据的第v个时刻与第p次数据的第q个时刻的变化特征相似性;
所述根据聚类簇调整采样频率的方法为:
将每个聚类簇的每个维度数据进行最小二乘法拟合获取每个维度对应的数据变化曲线;
采集最新的生长环境数据记为当前数据,计算当前数据与聚类簇的聚类中心的相似性距离,所述相似性为余弦相似度;计算当前数据每个维度的数据值与该维度的数据变化曲线的距离,将每个维度的距离归一化求均值后作为当前差异值;
根据当前差异值对初始采样频率进行调整获取新的采样频率。
2.如权利要求1所述的一种中药材生长信息采集分析方法,其特征在于,所述获取中药材生长中的生长环境数据、中药环境维度以及初始采样频率的方法为:
中药材的生长环境数据通过不同种类的传感器采集不同的数据值,其中每个中药环境维度对应一种传感器采集的值,每经过初始采样频率的时间通过传感器采集一次中药环境数据。
3.如权利要求1所述的一种中药材生长信息采集分析方法,其特征在于,所述根据每个中药环境维度构成一条中药环境维度曲线,并将中药环境维度曲线分成若干曲线段的方法为:
在一个生长次数内,将一个中药环境维度的所有数据值构成一条中药环境曲线,中药环境维度曲线的横坐标为时间,纵坐标为该中药环境维度下对应的数据值;
对中药环境曲线求导数获取曲线上每个点的斜率,对于任意一个点,令其和后一个点的斜率值作差,将差值记为斜率差值,将斜率差值和1的差值的绝对值进行线性归一化,将归一化后的值作为每个点的分段值,将分段值大于预设分段阈值的点作为分段点,将相邻分段点之间的数据构成一个曲线段。
4.一种中药材生长信息采集分析系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-3任意一项所述一种中药材生长信息采集分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311628130.5A CN117332283B (zh) | 2023-12-01 | 2023-12-01 | 一种中药材生长信息采集分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311628130.5A CN117332283B (zh) | 2023-12-01 | 2023-12-01 | 一种中药材生长信息采集分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117332283A CN117332283A (zh) | 2024-01-02 |
CN117332283B true CN117332283B (zh) | 2024-03-05 |
Family
ID=89279645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311628130.5A Active CN117332283B (zh) | 2023-12-01 | 2023-12-01 | 一种中药材生长信息采集分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117332283B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112162860A (zh) * | 2020-09-25 | 2021-01-01 | 中国民航大学 | 基于if-emd-lstm的cpu负载趋势预测方法 |
CN114266913A (zh) * | 2021-12-27 | 2022-04-01 | 海南天祜应用技术有限公司 | 基于人工智能和大数据分析的协同养老服务方法及系统 |
CN116609720A (zh) * | 2023-07-19 | 2023-08-18 | 深圳市北汉科技有限公司 | 基于数据驱动的台式万用表误差智能补偿方法及系统 |
CN116705337A (zh) * | 2023-08-07 | 2023-09-05 | 山东第一医科大学第一附属医院(山东省千佛山医院) | 一种健康数据采集及智能分析方法 |
CN116719983A (zh) * | 2023-07-28 | 2023-09-08 | 中日友好医院(中日友好临床医学研究所) | 一种动静脉内瘘远程监测及警示系统 |
CN117037450A (zh) * | 2023-07-28 | 2023-11-10 | 中交第一航务工程局有限公司 | 一种智能化打桩船的环境预警方法、装置、设备及介质 |
CN117131369A (zh) * | 2023-10-27 | 2023-11-28 | 福建福昇消防服务集团有限公司 | 智慧安全管理与应急救援一体站的数据处理方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108777873B (zh) * | 2018-06-04 | 2021-03-02 | 江南大学 | 基于加权混合孤立森林的无线传感网络异常数据检测方法 |
US20220373646A1 (en) * | 2021-05-21 | 2022-11-24 | Samsung Electronics Co., Ltd. | Joint estimation of respiratory and heart rates using ultra-wideband radar |
-
2023
- 2023-12-01 CN CN202311628130.5A patent/CN117332283B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112162860A (zh) * | 2020-09-25 | 2021-01-01 | 中国民航大学 | 基于if-emd-lstm的cpu负载趋势预测方法 |
CN114266913A (zh) * | 2021-12-27 | 2022-04-01 | 海南天祜应用技术有限公司 | 基于人工智能和大数据分析的协同养老服务方法及系统 |
CN116609720A (zh) * | 2023-07-19 | 2023-08-18 | 深圳市北汉科技有限公司 | 基于数据驱动的台式万用表误差智能补偿方法及系统 |
CN116719983A (zh) * | 2023-07-28 | 2023-09-08 | 中日友好医院(中日友好临床医学研究所) | 一种动静脉内瘘远程监测及警示系统 |
CN117037450A (zh) * | 2023-07-28 | 2023-11-10 | 中交第一航务工程局有限公司 | 一种智能化打桩船的环境预警方法、装置、设备及介质 |
CN116705337A (zh) * | 2023-08-07 | 2023-09-05 | 山东第一医科大学第一附属医院(山东省千佛山医院) | 一种健康数据采集及智能分析方法 |
CN117131369A (zh) * | 2023-10-27 | 2023-11-28 | 福建福昇消防服务集团有限公司 | 智慧安全管理与应急救援一体站的数据处理方法及系统 |
Non-Patent Citations (3)
Title |
---|
Improving Anomaly Detection Fusion Method of Rotating Machinery Based on ANN and Isolation Forest;Liu Shaoqing 等;《2020 International Conference on Computer Vision, Image and Deep Learning (CVIDL)》;20201130;全文 * |
基于EMD的时间序列相似性度量算法;贾瑞玉 等;《计算机技术与发展》;20171130(第11期);全文 * |
形变观测数据的多异常形态统一识别;杨德贺 等;《地球物理学报》;20171215(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117332283A (zh) | 2024-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pandith et al. | Performance evaluation of machine learning techniques for mustard crop yield prediction from soil analysis | |
Gandge | A study on various data mining techniques for crop yield prediction | |
Gümüşçü et al. | Estimation of wheat planting date using machine learning algorithms based on available climate data | |
Charoen-Ung et al. | Sugarcane yield grade prediction using random forest with forward feature selection and hyper-parameter tuning | |
Rao et al. | Crop prediction using machine learning | |
CN109063660B (zh) | 一种基于多光谱卫星影像的作物识别方法 | |
Verma et al. | Crop Yield Forecasting with Precise Machine Learning | |
Corrales et al. | An empirical multi-classifier for coffee rust detection in colombian crops | |
Parameswari et al. | Machine learning approaches for crop recommendation | |
Nandhini et al. | Automatic detection of leaf disease using CNN algorithm | |
Yaiprasert | Artificial intelligence for para rubber identification combining five machine learning methods | |
CN112232387B (zh) | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 | |
CN117332283B (zh) | 一种中药材生长信息采集分析方法及系统 | |
Cho et al. | Fruit ripeness prediction based on dnn feature induction from sparse dataset | |
Ahmed et al. | Improving prediction of plant disease using k-efficient clustering and classification algorithms | |
Ashish et al. | Survey on detection and classification of plant leaf disease in agriculture environment | |
CN115238965A (zh) | 基于专利信息的技术趋势预测方法、装置、设备及介质 | |
Jayalakshmi | Mining Agricultural Data to Predict Soil Fertility Using Ensemble Boosting Algorithm | |
Rahadiyan et al. | Classification of chili plant condition based on color and texture features | |
Ketheneni et al. | Crop, Fertilizer and Pesticide Recommendation using Ensemble Method and Sequential Convolutional Neural Network | |
VASANTHANAGESWARI | Improving svm classifier model using tree structured parzen estimator optimization for crop prediction | |
CN111488520B (zh) | 一种农作物种植种类推荐信息处理装置、方法及存储介质 | |
Nath et al. | Design of intelligent system in agriculture using data mining | |
Shingade et al. | Random Forest Machine Learning Classifier for Seed Recommendation | |
Kumar et al. | Design and development of machine learning model for crop yield prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |