CN117809070B - 一种用于蔬菜农药残留检测的光谱数据智能处理方法 - Google Patents
一种用于蔬菜农药残留检测的光谱数据智能处理方法 Download PDFInfo
- Publication number
- CN117809070B CN117809070B CN202410232300.6A CN202410232300A CN117809070B CN 117809070 B CN117809070 B CN 117809070B CN 202410232300 A CN202410232300 A CN 202410232300A CN 117809070 B CN117809070 B CN 117809070B
- Authority
- CN
- China
- Prior art keywords
- vegetable
- wavelength
- samples
- data set
- individual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000013311 vegetables Nutrition 0.000 title claims abstract description 279
- 239000000447 pesticide residue Substances 0.000 title claims abstract description 56
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 230000003595 spectral effect Effects 0.000 title claims description 22
- 238000002835 absorbance Methods 0.000 claims abstract description 67
- 238000001228 spectrum Methods 0.000 claims abstract description 67
- 238000000034 method Methods 0.000 claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 230000008602 contraction Effects 0.000 claims description 63
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000012804 iterative process Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 5
- 102000004190 Enzymes Human genes 0.000 claims description 4
- 108090000790 Enzymes Proteins 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000005764 inhibitory process Effects 0.000 claims description 4
- 238000004611 spectroscopical analysis Methods 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000005755 formation reaction Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012306 spectroscopic technique Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及物理分析技术领域,具体涉及一种用于蔬菜农药残留检测的光谱数据智能处理方法,包括:获取光谱数据集;根据相同波长下不同光谱数据的吸光度得到特征波长;根据每一蔬菜样本的光谱数据集,得到不同蔬菜样本之间的距离;根据蔬菜样本间的距离通过CURE算法对蔬菜样本进行聚类时,对含有蔬菜样本个数较多的聚类簇选择代表点,根据代表点的局部密度,得到代表点的自适应收缩因子;由此得到最终聚类结果;最后得到农药残留含量超标的蔬菜样本。本发明通过CURE算法对蔬菜样本进行聚类的过程中根据代表点的局部密度得到代表点的自适应收缩因子,使得聚类结果更准确。
Description
技术领域
本发明涉及物理分析技术领域,具体涉及一种用于蔬菜农药残留检测的光谱数据智能处理方法。
背景技术
光谱技术是一种非破坏性的检测方法,可以在不破坏蔬菜样品的情况下获取光谱信息。这意味着可以在蔬菜采摘、加工等阶段进行实时监测,而无需破坏样品,光谱数据智能处理方法可以为蔬菜农药残留检测提供高效、准确和可靠的解决方案,有助于确保食品安全和质量;而蔬菜对应光谱数据之间的差异可能是由于多种不同类型因素造成的,例如对应蔬菜内的含水量多少的差异导致相同波长下不同蔬菜的光谱数据出现差异,故考虑利用聚类分析的方式,对光谱数据相近或相同的蔬菜样本聚为一类以进行农药残留检测。
本方法通过CURE聚类算法对不同蔬菜的光谱数据进行聚类,但传统的CURE聚类算法中,CURE聚类算法的一个参数即收缩因子为一固定值。但通过固定的收缩因子聚类时,可能将农药残留有较大差异的光谱数据聚为一类,造成通过聚类结果对蔬菜农药残留进行检测时所得检测结果可能与实际结果有较大差异,降低了蔬菜农药残留检测的光谱数据的处理效果。
发明内容
本发明提供一种用于蔬菜农药残留检测的光谱数据智能处理方法,以解决现有的问题。
本发明的一种用于蔬菜农药残留检测的光谱数据智能处理方法采用如下技术方案:
本发明一个实施例提供了一种用于蔬菜农药残留检测的光谱数据智能处理方法,该方法包括以下步骤:
在一个波长范围内,获取每一波长下多个蔬菜样本的吸光度,得到多个蔬菜样本的光谱数据集;根据相同波长下不同光谱数据集所对应的吸光度的大小,得到多个特征波长;
根据每一蔬菜样本的光谱数据集,得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度;
根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度,得到每一蔬菜样本与其他蔬菜样本之间的距离;
根据每一蔬菜样本与其他蔬菜样本之间的距离,通过CURE算法对所有蔬菜样本进行迭代聚类,在聚类迭代过程中的聚类簇中筛选出若干个代表点;根据每一代表点的光谱数据集,得到不同收缩因子下每一代表点的局部密度;根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子;
根据聚类过程中每一代表点的自适应收缩因子,得到聚类簇中每一代表点的新的光谱数据集,并继续进行聚类,得到最终聚类结果;
根据最终聚类结果,进行农药残留检测,得到农药残留含量超标的蔬菜样本。
进一步地根据相同波长下不同光谱数据集所对应的吸光度的大小,得到多个特征波长,包括的具体步骤如下:
计算每一波长下所有蔬菜样本的吸光度的标准差,根据波长由小到大,依次统计所有波长下所有蔬菜样本的吸光度的标准差,得到一个标准差序列;对标准差序列使用滑动窗口法,获得若干个局部极大值;使用最小最大规范法对标准差序列进行归一化处理,得到每个标准差的归一化值;在标准差序列中的所有局部极大值中,将归一化值大于预设的判断阈值的局部极大值所对应的波长,记为特征波长。
进一步地根据每一蔬菜样本的光谱数据集,得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度,包括的具体公式如下:
其中,表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度,表示第/>个特征波长的波长值,/>表示第/>个特征波长的波长值,/>为预设的波长数量阈值,/>表示方向系数,/>表示第/>个蔬菜样本的光谱数据集中第/>个特征波长的波长值沿/>所表征波长变化方向上的第/>个波长下第/>个蔬菜样本吸光度的一阶差分值,/>表示在第/>个特征波长下第/>个蔬菜样本的吸光度,/>为绝对值函数,为以自然常数为底的指数函数,/>表示在波长/>下第/>个蔬菜样本的吸光度,/>表示在波长/>下第/>个蔬菜样本的吸光度。
进一步地根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度,得到每一蔬菜样本与其他蔬菜样本之间的距离,包括的具体公式如下:
其中,表示第/>个蔬菜样本与第/>个蔬菜样本之间的距离,/>表示特征波长的个数,/>表示特征波长/>对特征波长/>下第/>个蔬菜样本的吸光度的影响程度,为绝对值函数,/>表示特征波长/>下第/>个蔬菜样本的吸光度,/>表示特征波长/>下第/>个蔬菜样本的吸光度,/>表示以自然常数为底的指数函数;/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度,/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度,/>表示第/>个特征波长的波长值,/>表示第/>个特征波长的波长值。
进一步地根据每一蔬菜样本与其他蔬菜样本之间的距离,通过CURE算法对所有蔬菜样本进行迭代聚类,在聚类迭代过程中的聚类簇中筛选出若干个代表点,包括的具体步骤如下:
在聚类迭代过程中将第一个样本点个数大于或等于的聚类簇视为目标簇,获取目标簇中/>个蔬菜样本作为代表点以及目标簇的聚类中心点,其中/>为预设的代表点数量,为预设的样本数量阈值。
进一步地根据每一代表点的光谱数据集,得到不同收缩因子下每一代表点的局部密度,包括的具体步骤如下:
收缩因子为时收缩后第/>个代表点所对应的新的光谱数据集的具体计算公式为:
式中:表示收缩因子为/>时收缩后第/>个代表点所对应的新的光谱数据集,表示目标簇当中第/>个代表点所对应的蔬菜样本的光谱数据集,/>表示收缩因子,/>表示目标簇的聚类中心点所对应的蔬菜样本的光谱数据集;
根据所述每一蔬菜样本与其他蔬菜样本之间的距离的获取方式,使用收缩因子为时收缩后第/>个代表点所对应的新的光谱数据集,获得收缩因子为/>时收缩后第/>个代表点与其他蔬菜样本之间的距离;
根据收缩因子为时收缩后第/>个代表点与其他蔬菜样本之间的距离,得到收缩因子为/>时收缩后的第/>个代表点对应的局部密度。
进一步地根据收缩因子为时收缩后第/>个代表点与其他蔬菜样本之间的距离,得到收缩因子为/>时收缩后的第/>个代表点对应的局部密度,包括的具体公式如下:
其中,表示收缩因子为/>时收缩后的第/>个代表点对应的局部密度,/>为预设的距离度量;/>表示目标簇当中与收缩因子为/>时收缩后的第/>个代表点之间的距离小于/>的蔬菜样本的个数;/>表示目标簇当中收缩因子为/>时收缩后的第/>个代表点与目标簇当中收缩后的第/>个代表点之间的距离小于L的第/>个蔬菜样本之间的距离。
进一步地根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子,包括的具体步骤如下:
将收缩因子为时收缩后的第/>个代表点对应的局部密度构成的序列,记为第/>个代表点的局部密度序列;所述/>表示收缩因子,/>;
获取第个代表点的局部密度序列的一阶导序列,将一阶导序列中的最大值对应的收缩因子,记为目标簇当中第/>个代表点的自适应收缩因子。
进一步地根据聚类过程中每一代表点的自适应收缩因子,得到聚类簇中每一代表点的新的光谱数据集,包括的具体步骤如下:
将目标簇当中第个代表点的自适应收缩因子与第/>个代表点所对应蔬菜样本的光谱数据集中的每一个数据相乘,得到一个第一新数据集;
将1减目标簇当中第个代表点的自适应收缩因子,记为聚类中心点的权重;
将聚类中心点的权重与目标簇的聚类中心点所对应的蔬菜样本的光谱数据集中的每一个数据相乘,得到一个第二新数据集;
将第一新数据集与第二新数据集中对应的数据进行相加所得的数据集,记为第个代表点所对应蔬菜样本的新的光谱数据集。
进一步地根据最终聚类结果,进行农药残留检测,得到农药残留含量超标的蔬菜样本,包括的具体步骤如下:
在最终聚类结果中,根据酶抑制率法得到每一个聚类簇的聚类中心点所对应蔬菜样本的每公斤农药残留含量,若聚类中心点所对应蔬菜样本的每公斤农药残留含量大于或等于毫克,则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量超标;若聚类中心点所对应蔬菜样本的每公斤农药残留含量小于/>毫克,则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量合格;所述R为预设的每公斤农药残留含量阈值。
本发明的技术方案的有益效果是:在一个波长范围内,获取每一波长下多个蔬菜样本的吸光度,得到多个蔬菜样本的光谱数据集;根据相同波长下不同光谱数据集所对应的吸光度的大小,得到多个特征波长,之后在后续过程中只依据蔬菜样本在特征波长下的吸光度来进行后续操作去,减少了后续操作的计算量;根据每一蔬菜样本的光谱数据集,得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度;根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度,得到每一蔬菜样本与其他蔬菜样本之间的距离,在在计算每一蔬菜样本与其他蔬菜样本之间的距离时还考虑了每个特征波长对其他特征波长的影响程度,从而使得每一蔬菜样本与其他蔬菜样本之间的距离更加接近真实情况;根据每一蔬菜样本与其他蔬菜样本之间的距离,通过CURE算法对所有蔬菜样本进行迭代聚类,在聚类迭代过程中的聚类簇中筛选出若干个代表点;根据每一代表点的光谱数据集,得到不同收缩因子下每一代表点的局部密度;根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子,在计算自适应收缩因子时,从多个收缩因子里面筛选自适应收缩因子,从而使得每个代表点的自适应收缩因子更符合真实情况;根据聚类过程中每一代表点的自适应收缩因子,得到聚类簇中每一代表点的新的光谱数据集,并继续进行聚类,得到最终聚类结果,因为聚类时,每个代表点的自适应收缩因子更符合真实情况从而使得聚类结果更为准确;根据最终聚类结果,进行农药残留检测,得到农药残留含量超标的蔬菜样本,在进行农药残留含量检测时,因为聚类结果更接近真实情况,从而使得农药残留含量检测结果更接近真实情况。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种用于蔬菜农药残留检测的光谱数据智能处理方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用于蔬菜农药残留检测的光谱数据智能处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种用于蔬菜农药残留检测的光谱数据智能处理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种用于蔬菜农药残留检测的光谱数据智能处理方法的步骤流程图,该方法包括以下步骤:
步骤S001:在一个波长范围内,获取每一波长下多个蔬菜样本的吸光度,得到多个蔬菜样本的光谱数据集;根据相同波长下不同光谱数据集所对应的吸光度的大小,得到多个特征波长。
采集多个蔬菜样本,通过光谱仪获取一个波长范围内每一波长下多个蔬菜样本的吸光度,得到多个蔬菜样本的光谱数据集。以第个蔬菜样本为例,第/>个蔬菜样本的光谱数据集为/>,/>表示第/>个蔬菜样本的光谱数据集,/>表示波长为t时第/>个蔬菜样本的吸光度。通过光谱仪获取蔬菜样本的光谱数据集时,每一波长与其左右邻接波长的波长值差异为d纳米,在本实施例中令/>,其他实施例中可设置为其他值,本实施例不进行限定。
根据每一蔬菜样本的光谱数据集,计算每一蔬菜样本与其余蔬菜样本之间的距离时,传统方法是根据每一蔬菜样本与其余蔬菜样本在波长相同时蔬菜样本吸光度的平均差异,得到每个蔬菜样本与其他蔬菜样本之间的距离,但是这种方法的计算量较大。因为正常情况中在许多波长下每一蔬菜样本的吸光度与其他蔬菜样本在同一波长下的吸光度较为近似,使得可以通过多个同一波长下蔬菜样本吸光度有较大差异的光谱数据,计算每一蔬菜样本与其余蔬菜样本的距离。因此本方法选取多个波长下不同蔬菜样本吸光度有较大差异的波长作为特征波长,通过特征波长下每一蔬菜样本吸光度与对应波长下其余蔬菜样本吸光度得到每一蔬菜样本与其余蔬菜样本之间的距离。
获取特征波长的具体步骤如下:
计算每一波长下所有蔬菜样本的吸光度的标准差,根据波长由小到大,依次统计所有波长下所有蔬菜样本的吸光度的标准差,得到一个标准差序列,/>表示波长为/>时所有蔬菜样本的吸光度的标准差;对标准差序列使用滑动窗口法,获得若干个局部极大值;使用最小最大规范法对标准差序列进行归一化处理,得到每个标准差的归一化值;在标准差序列中的所有局部极大值中,将归一化值大于预设的判断阈值的局部极大值所对应的波长,记为特征波长,得到一个特征波长集/>,/>表示第/>个特征波长的波长值。
所需说明的是:最小最大规范法和滑动窗口法为公知技术,具体方法在此不做介绍,本实施例中滑动窗口的大小为60nm,以此为例进行叙述,其它实施方式中可设置为其它值,本实施例不进行限定。本实施例预设的判断阈值为0.12,并以此为例进行叙述,其它实施方式中可设置为其它值,本实施例不进行限定。
步骤S002:根据每一蔬菜样本的光谱数据集,得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度。
由于蔬菜内所包含物质的复杂性,会有较大概率出现不同特征波长下同一蔬菜样本的吸光度与蔬菜样本内的同一种物质有较大关系,进而造成某一特征波长下蔬菜样本的吸光度有较大可能与其他特征波长下同一蔬菜样本的吸光度有联系。因此计算每一特征波长下蔬菜样本的吸光度受其他特征波长下同一蔬菜样本的吸光度的影响程度。其中当两个特征波长之间距离较近时,两个特征波长之间的影响程度较大,当一个特征波长下蔬菜样本吸光度的值较大时,说明蔬菜内所包含某种物质的可能性较大,说明此特征波长对其余特征波长的影响程度可能较大,当某一特征波长到其余特征波长之间的蔬菜样本吸光度在不断增加,说明此特征波长对其余特征波长的影响程度较大,综合所述得到同一蔬菜样本中某一特征波长对其余特征波长的影响程度。
以第个蔬菜样本中第/>个和第/>个特征波长为例,将第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度记为/>,其计算公式如下:
其中,表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度,表示第/>个特征波长的波长值,/>表示第/>个特征波长的波长值,/>为预设的波长数量阈值,其体现了在计算第/>个特征波长对第/>个特征波长的影响程度时在所述蔬菜样本的光谱数据集中选择/>个光谱数据计算第/>个特征波长对第/>个特征波长的影响程度,在本实施例中令预设的波长数量阈值/>,其他实施方式中可设置为其他值,本实施例不对其进行限定,/>为绝对值函数;/>表示方向系数即第/>个特征波长的波长值与第/>个特征波长的波长值的大小,/>表示第/>个蔬菜样本的光谱数据集中第/>个特征波长的波长值沿/>所表征波长变化方向上的第/>个波长下第/>个蔬菜样本吸光度的一阶差分值,/>表示在第/>个特征波长下第/>个蔬菜样本的吸光度,/>表示在波长/>下第/>个蔬菜样本的吸光度,/>表示在波长下第/>个蔬菜样本的吸光度。
公式逻辑:在计算第个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度时,需要考虑的是第/>个特征波长在指向第/>个特征波长的波长范围内第/>个蔬菜样本的吸光度的变化情况,若第/>个特征波长邻域内每一波长所对应的蔬菜样本吸光度沿对应方向上的数值减小速度较小,或其有增长的趋势,则第/>个特征波长有较大可能会影响该方向其他特征波长,故利用一阶差分值对第/>个特征波长下第/>个蔬菜样本的吸光度进行加权,得到该蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度。
按照上述方式,得到每个蔬菜样本中,每一个特征波长对其他特征波长的影响程度。
步骤S003:根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度,得到每一蔬菜样本与其他蔬菜样本之间的距离。
在计算两个蔬菜样本之间的距离时,不仅需要考虑同一特征波长下不同蔬菜样本的吸光度差异,还需要根据同一蔬菜样本中每一特征波长受其余特征波长的影响程度,若这两个蔬菜样本中某一特征波长受其余特征波长的影响程度较大,则这两个蔬菜样本在该特征波长下的吸光度差异的可靠性较低,因为这两个蔬菜样本在该特征波长下的吸光度差异可能是由其余特征波长的影响造成的。因此根据每一特征波长下每一蔬菜样本吸光度以及同一蔬菜样本中每一蔬菜样本的特征波长受其余特征波长的影响程度,获取两个蔬菜样本之间的距离。
将第个蔬菜样本与第/>个蔬菜样本之间的距离记为/>,计算公式如下:
其中,表示第/>个蔬菜样本与第/>个蔬菜样本之间的距离,/>表示特征波长的个数,/>表示特征波长/>对特征波长/>下第/>个蔬菜样本吸光度的差异影响程度,表示特征波长/>下第/>个蔬菜样本的吸光度,/>表示特征波长/>下第/>个蔬菜样本的吸光度,/>为绝对值函数,/>为以自然常数为底的指数函数,本实施例以来呈现反比例关系及归一化处理,实施者可根据实际情况设置反比例函数及归一化函数;/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度,/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度;所需说明的是/>。
公式逻辑:因为不同特征波长下不同蔬菜样本的吸光度受其余特征波长的影响程度可能不同,所以根据每一蔬菜样本下每一特征波长受其余特征波长的影响程度,结合每一特征下每一蔬菜样本的吸光度与其余蔬菜样本的吸光度的差异,得到两个蔬菜样本之间的距离。
步骤S004:根据每一蔬菜样本与其他蔬菜样本之间的距离,通过CURE算法对所有蔬菜样本进行迭代聚类,在聚类迭代过程中的聚类簇中筛选出若干个代表点;根据每一代表点的光谱数据集,得到不同收缩因子下每一代表点的局部密度;根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子。
通过CURE算法对样本进行聚类时,聚类过程如下:
1.将每一个蔬菜样本视为一个单独的聚类簇;
2.计算每一个聚类簇到其他聚类簇之间的距离;
3.找到距离最近的两个聚类簇,将它们合并成一个新的聚类簇;
4.计算新形成的聚类簇与其他聚类簇之间的距离;
5.不断重复步骤3与步骤4,直到聚类簇的个数为预设的最终聚类个数时停止。
需要说明的是,通过CURE算法对蔬菜样本进行聚类时,当某一样本簇中含有样本的个数大于或等于样本数量阈值时,需要从所述样本簇中选择/>个代表点,根据每一个代表点的光谱数据集与收缩因子来计算每一聚类簇与其他聚类簇的距离,其中/>为预设的代表点数量,/>为预设的样本数量阈值。
在聚类过程中每一聚类簇与其他聚类簇之间的距离获取方式如下:在聚类过程中当两个聚类簇中所含蔬菜样本个数均小于时,那么所述两个聚类簇的距离为每一个聚类簇中每一个蔬菜样本到所述另一个聚类簇中每一个蔬菜样本的平均距离之和;当两个聚类簇中所含蔬菜样本个数均大于或等于/>时,那么所述两个聚类簇的距离为每一个聚类簇中每一个代表点到所述另一个聚类簇中每一个代表点的平均距离之和;当一个聚类簇中所含蔬菜样本个数均大于或等于/>而另一个聚类簇中所含蔬菜样本个数小于/>,那么所述两个聚类簇的距离为一个聚类簇中每一个代表点到所述另一个聚类簇中每一个蔬菜样本的平均距离之和。
需要说明的是:收缩因子为CURE算法中的超参数。在本实施例中令预设的样本数量阈值,预设的代表点数量/>,其他实施方式中可设置为5,本实施例不对其进行限定。
传统的CURE算法中聚类代表点的收缩因子是一固定的超参数,即对每个聚类代表点与聚类代表点所在聚类中心点之间的距离进行相同程度的放缩。由于聚类形状并不一定是凸多边形,调整后的代表点并不能较好的表现出聚类的形态特征。故本实施例依据每一聚类簇中每一代表点在不同收缩因子下周围蔬菜样本的局部密度,得到每一聚类簇中每一代表点的收缩因子。
在聚类过程中选择第一个簇内蔬菜样本的个数大于或等于n的簇作为目标簇,选择目标簇中的个蔬菜样本作为代表点。将在目标簇中与目标簇中其余蔬菜样本之间的平均距离最短的蔬菜样本作为目标簇的中心。将目标簇当中第/>个代表点所对应的蔬菜样本的光谱数据集记为/>。
需要说明的是在目标簇中选择代表点为公知技术本实施例不进行详细描写。
在CURE算法中,收缩因子为时收缩后的第/>个代表点所对应的新的光谱数据集的计算方式如下:
式中:表示收缩因子为/>时收缩后第/>个代表点所对应的新的光谱数据集,表示目标簇当中第/>个代表点所对应的蔬菜样本的光谱数据集,/>为收缩因子,/>表示目标簇的聚类中心点所对应的蔬菜样本的光谱数据集,/>表示对第/>个代表点所对应的蔬菜样本的光谱数据集中的每一个数据的数值进行整体放缩,/>表示对目标簇的聚类中心点所对应的蔬菜样本的光谱数据集中的每一个数据的数值进行相同的放缩,需要说明的是在本实施例中/>为序列/>中的值,并以此为例进行叙述,其它实施方式中/>可为其他数据序列中的值,本实施例不进行限定。/>
按照的获取方式,根据收缩因子为/>时收缩后第/>个代表点所对应的新的光谱数据集,获取收缩后的第/>个代表点与其它蔬菜样本的距离,得到收缩因子为/>时收缩后的第/>个代表点对应的局部密度为/>,计算公式如下:
其中,表示收缩因子为/>时收缩后的第/>个代表点对应的局部密度为/>,/>为一预设的距离度量,在本实施例中令预设的距离度量/>,在其他实施例中可为其他值,本实施例不对其进行限定;/>为收缩因子,/>表示目标簇当中与收缩因子为/>时收缩后的第/>个代表点之间的距离小于/>的蔬菜样本的个数;/>表示目标簇当中收缩因子为时收缩后的第/>个代表点与目标簇当中收缩因子为/>时收缩后的第/>个代表点之间的距离小于L的第/>个蔬菜样本之间的距离,需要说明的是在本实施例中/>为序列中的值,并以此为例进行叙述,其它实施方式中/>可为其他数据序列中的值,本实施例不进行限定。
公式逻辑:根据收缩后的第个代表点周围其余蔬菜样本与收缩后的第/>个代表点的距离,得到收缩因子为/>时收缩后的第/>个代表点的局部密度。
按照上述方式,得到序列中每一数据时,收缩后的第/>个代表点的局部密度,并根据收缩因子从小到大排列,得到收缩后的第/>个代表点的局部密度序列/>,进一步根据局部密度序列/>,得到收缩后的第/>个代表点的局部密度关于收缩因子的一阶导序列,在一阶导序列中选择数值最大的一阶导对应的收缩因子作为目标簇当中第/>个代表点的收缩因子,将其记为目标簇当中第/>个代表点的自适应收缩因子/>,需要说明的是,/>中每一个局部密度的一阶导是根据其右侧邻接局部密度的数值得到的。
公式逻辑:各代表点的选取是根据与中心点之间的距离最远的点依次选取的,即所得各点对应位置均处于聚类的边缘位置,此时代表点对应局部密度相对较低,随着收缩因子的逐渐增加,各代表点的位置逐渐靠近聚类中心点,此时其局部密度会逐渐升高,而在这一从小变大的过程中,选取变化最为迅速的收缩因子,即二阶导数的最大点,此时对应代表点的位置从低密度区域突升至高密度区域,更能表现对应聚类的真实形态特征。
步骤S005:根据聚类过程中每一代表点的自适应收缩因子,得到聚类簇中每一代表点的新的光谱数据集,并继续进行聚类,得到最终聚类结果。
在目标簇当中第个代表点所对应的光谱数据集在收缩后的光谱数据集为:
式中:表示目标簇当中第/>个代表点的自适应收缩因子,/>表示第/>个代表点所对应蔬菜样本的光谱数据集,/>表示第/>个代表点所对应蔬菜样本的新的光谱数据集,为第/>个代表点所对应的光谱数据集在收缩后的光谱数据集。
对目标簇中每一代表点都进行上述操作,得到目标簇中每一代表点的收缩因子,并进一步得到当前聚类结果中所含蔬菜样本个数大于或等于的簇内每一代表点的收缩因子。
根据每一个代表点的收缩因子计算两个聚类之间距离时,根据两个聚类中各代表点之间的距离的平均值得到两个聚类之间距离,预设CURE算法最终的聚类个数为,获取聚类结果。
在本实施例中令,其他实施方式中可设置为其他值,本实施例不对其进行限定。
步骤S006:根据最终聚类结果,进行农药残留检测,得到农药残留含量超标的蔬菜样本。
根据对应聚类结果,分别选取各聚类的聚类中心点进行农药残留量检测。
在最终聚类结果中,首先根据酶抑制率法得到每一个聚类的聚类中心点所对应蔬菜样本的每公斤农药残留含量,若聚类中心点所对应蔬菜样本的每公斤农药残留含量大于或等于毫克,则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量超标;若聚类中心点所对应蔬菜样本的每公斤农药残留含量小于/>毫克,则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量合格;所述R为预设的每公斤农药残留含量阈值。
按照上述方式,得到每个聚类簇的农药残留检测结果。
需要说明的是,酶抑制率法为公知技术,具体方法在此不做介绍。在本实施例中预设的每公斤农药残留含量阈值,以此为例进行叙述,其它实施方式中可设置为其它值,本实施例不进行限定。
至此,本发明完成。
综上所述,在本发明实施例中,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种用于蔬菜农药残留检测的光谱数据智能处理方法,其特征在于,该方法包括以下步骤:
在一个波长范围内,获取每一波长下多个蔬菜样本的吸光度,得到多个蔬菜样本的光谱数据集;根据相同波长下不同光谱数据集所对应的吸光度的大小,得到多个特征波长;
根据每一蔬菜样本的光谱数据集,得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度;
根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度,得到每一蔬菜样本与其他蔬菜样本之间的距离;
根据每一蔬菜样本与其他蔬菜样本之间的距离,通过CURE算法对所有蔬菜样本进行迭代聚类,在聚类迭代过程中的聚类簇中筛选出若干个代表点;根据每一代表点的光谱数据集,得到不同收缩因子下每一代表点的局部密度;根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子;
根据聚类过程中每一代表点的自适应收缩因子,得到聚类簇中每一代表点的新的光谱数据集,并继续进行聚类,得到最终聚类结果;
根据最终聚类结果,进行农药残留检测,得到农药残留含量超标的蔬菜样本;
所述根据每一蔬菜样本的光谱数据集,得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度,包括的具体公式如下:
其中,表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度,/>表示第/>个特征波长的波长值,/>表示第/>个特征波长的波长值,/>为预设的波长数量阈值,/>表示方向系数,/>表示第/>个蔬菜样本的光谱数据集中第/>个特征波长的波长值沿/>所表征波长变化方向上的第/>个波长下第/>个蔬菜样本吸光度的一阶差分值,表示在第/>个特征波长下第/>个蔬菜样本的吸光度,/>为绝对值函数,/>为以自然常数为底的指数函数,/>表示在波长/>下第/>个蔬菜样本的吸光度,/>表示在波长/>下第/>个蔬菜样本的吸光度;
所述根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度,得到每一蔬菜样本与其他蔬菜样本之间的距离,包括的具体公式如下:
其中,表示第/>个蔬菜样本与第/>个蔬菜样本之间的距离,/>表示特征波长的个数,表示特征波长/>对特征波长/>下第/>个蔬菜样本的吸光度的影响程度,/>为绝对值函数,/>表示特征波长/>下第/>个蔬菜样本的吸光度,/>表示特征波长/>下第/>个蔬菜样本的吸光度,/>表示以自然常数为底的指数函数;/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度,/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度,/>表示第/>个特征波长的波长值,/>表示第/>个特征波长的波长值;
所述根据每一蔬菜样本与其他蔬菜样本之间的距离,通过CURE算法对所有蔬菜样本进行迭代聚类,在聚类迭代过程中的聚类簇中筛选出若干个代表点,包括的具体步骤如下:
在聚类迭代过程中将第一个样本点个数大于或等于的聚类簇视为目标簇,获取目标簇中/>个蔬菜样本作为代表点以及目标簇的聚类中心点,其中/>为预设的代表点数量,/>为预设的样本数量阈值;
所述根据每一代表点的光谱数据集,得到不同收缩因子下每一代表点的局部密度,包括的具体步骤如下:
收缩因子为时收缩后第/>个代表点所对应的新的光谱数据集的具体计算公式为:
式中:表示收缩因子为/>时收缩后第/>个代表点所对应的新的光谱数据集,/>表示目标簇当中第/>个代表点所对应的蔬菜样本的光谱数据集,/>表示收缩因子,/>表示目标簇的聚类中心点所对应的蔬菜样本的光谱数据集;
根据所述每一蔬菜样本与其他蔬菜样本之间的距离的获取方式,使用收缩因子为时收缩后第/>个代表点所对应的新的光谱数据集,获得收缩因子为/>时收缩后第/>个代表点与其他蔬菜样本之间的距离;
根据收缩因子为时收缩后第/>个代表点与其他蔬菜样本之间的距离,得到收缩因子为时收缩后的第/>个代表点对应的局部密度;
所述根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子,包括的具体步骤如下:
将收缩因子为时收缩后的第/>个代表点对应的局部密度构成的序列,记为第/>个代表点的局部密度序列;所述/>表示收缩因子,/>;
获取第个代表点的局部密度序列的一阶导序列,将一阶导序列中的最大值对应的收缩因子,记为目标簇当中第/>个代表点的自适应收缩因子;
所述根据聚类过程中每一代表点的自适应收缩因子,得到聚类簇中每一代表点的新的光谱数据集,包括的具体步骤如下:
将目标簇当中第个代表点的自适应收缩因子与第/>个代表点所对应蔬菜样本的光谱数据集中的每一个数据相乘,得到一个第一新数据集;
将1减目标簇当中第个代表点的自适应收缩因子,记为聚类中心点的权重;
将聚类中心点的权重与目标簇的聚类中心点所对应的蔬菜样本的光谱数据集中的每一个数据相乘,得到一个第二新数据集;
将第一新数据集与第二新数据集中对应的数据进行相加所得的数据集,记为第个代表点所对应蔬菜样本的新的光谱数据集。
2.根据权利要求1所述一种用于蔬菜农药残留检测的光谱数据智能处理方法,其特征在于,所述根据相同波长下不同光谱数据集所对应的吸光度的大小,得到多个特征波长,包括的具体步骤如下:
计算每一波长下所有蔬菜样本的吸光度的标准差,根据波长由小到大,依次统计所有波长下所有蔬菜样本的吸光度的标准差,得到一个标准差序列;对标准差序列使用滑动窗口法,获得若干个局部极大值;使用最小最大规范法对标准差序列进行归一化处理,得到每个标准差的归一化值;在标准差序列中的所有局部极大值中,将归一化值大于预设的判断阈值的局部极大值所对应的波长,记为特征波长。
3.根据权利要求1所述一种用于蔬菜农药残留检测的光谱数据智能处理方法,其特征在于,所述根据收缩因子为时收缩后第/>个代表点与其他蔬菜样本之间的距离,得到收缩因子为/>时收缩后的第/>个代表点对应的局部密度,包括的具体公式如下:
其中,表示收缩因子为/>时收缩后的第/>个代表点对应的局部密度,/>为预设的距离度量;/>表示目标簇当中与收缩因子为/>时收缩后的第/>个代表点之间的距离小于/>的蔬菜样本的个数;/>表示目标簇当中收缩因子为/>时收缩后的第/>个代表点与目标簇当中收缩后的第/>个代表点之间的距离小于L的第/>个蔬菜样本之间的距离。
4.根据权利要求1所述一种用于蔬菜农药残留检测的光谱数据智能处理方法,其特征在于,所述根据最终聚类结果,进行农药残留检测,得到农药残留含量超标的蔬菜样本,包括的具体步骤如下:
在最终聚类结果中,根据酶抑制率法得到每一个聚类簇的聚类中心点所对应蔬菜样本的每公斤农药残留含量,若聚类中心点所对应蔬菜样本的每公斤农药残留含量大于或等于毫克,则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量超标;若聚类中心点所对应蔬菜样本的每公斤农药残留含量小于/>毫克,则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量合格;所述R为预设的每公斤农药残留含量阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410232300.6A CN117809070B (zh) | 2024-03-01 | 2024-03-01 | 一种用于蔬菜农药残留检测的光谱数据智能处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410232300.6A CN117809070B (zh) | 2024-03-01 | 2024-03-01 | 一种用于蔬菜农药残留检测的光谱数据智能处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117809070A CN117809070A (zh) | 2024-04-02 |
CN117809070B true CN117809070B (zh) | 2024-05-14 |
Family
ID=90433811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410232300.6A Active CN117809070B (zh) | 2024-03-01 | 2024-03-01 | 一种用于蔬菜农药残留检测的光谱数据智能处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117809070B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109374574A (zh) * | 2018-12-20 | 2019-02-22 | 中国烟草总公司郑州烟草研究院 | 一种利用近红外光谱信息鉴别烤烟烟叶蜡质感的方法 |
CN111595805A (zh) * | 2020-05-09 | 2020-08-28 | 滁州职业技术学院 | 一种可能性聚类的白菜农药残留定性分析方法 |
CN111912823A (zh) * | 2020-06-30 | 2020-11-10 | 淮阴工学院 | 一种多成分农药残留荧光检测分析方法 |
WO2021051505A1 (zh) * | 2019-09-18 | 2021-03-25 | 平安科技(深圳)有限公司 | 基于样本量的声纹聚类方法、装置、设备及存储介质 |
WO2021144785A1 (en) * | 2020-01-14 | 2021-07-22 | Centure Application Ltd. | System and method for real-time crop management |
CN116298048A (zh) * | 2023-05-05 | 2023-06-23 | 唐山市食品药品综合检验检测中心(唐山市农产品质量安全检验检测中心、唐山市检验检测研究院) | 一种韭菜中农药残留的同步检测方法 |
CN116437909A (zh) * | 2020-06-10 | 2023-07-14 | 迪斯拉普申实验室公司 | 用于递送治疗剂的组合物及其使用方法和制备方法 |
CN116879184A (zh) * | 2023-06-06 | 2023-10-13 | 武汉大学 | 一种基于高光谱图像的果蔬农药残留检测方法及系统 |
CN117349630A (zh) * | 2023-12-04 | 2024-01-05 | 邢台医学高等专科学校 | 一种用于生化数据分析的方法及系统 |
CN117589741A (zh) * | 2024-01-18 | 2024-02-23 | 天津博霆光电技术有限公司 | 基于光学特征的吲哚菁绿智能检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160357840A1 (en) * | 2015-06-03 | 2016-12-08 | Fujitsu Limited | Apparatus and method for clustering data in streaming clustering without reducing precision |
-
2024
- 2024-03-01 CN CN202410232300.6A patent/CN117809070B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109374574A (zh) * | 2018-12-20 | 2019-02-22 | 中国烟草总公司郑州烟草研究院 | 一种利用近红外光谱信息鉴别烤烟烟叶蜡质感的方法 |
WO2021051505A1 (zh) * | 2019-09-18 | 2021-03-25 | 平安科技(深圳)有限公司 | 基于样本量的声纹聚类方法、装置、设备及存储介质 |
WO2021144785A1 (en) * | 2020-01-14 | 2021-07-22 | Centure Application Ltd. | System and method for real-time crop management |
CN111595805A (zh) * | 2020-05-09 | 2020-08-28 | 滁州职业技术学院 | 一种可能性聚类的白菜农药残留定性分析方法 |
CN116437909A (zh) * | 2020-06-10 | 2023-07-14 | 迪斯拉普申实验室公司 | 用于递送治疗剂的组合物及其使用方法和制备方法 |
CN111912823A (zh) * | 2020-06-30 | 2020-11-10 | 淮阴工学院 | 一种多成分农药残留荧光检测分析方法 |
CN116298048A (zh) * | 2023-05-05 | 2023-06-23 | 唐山市食品药品综合检验检测中心(唐山市农产品质量安全检验检测中心、唐山市检验检测研究院) | 一种韭菜中农药残留的同步检测方法 |
CN116879184A (zh) * | 2023-06-06 | 2023-10-13 | 武汉大学 | 一种基于高光谱图像的果蔬农药残留检测方法及系统 |
CN117349630A (zh) * | 2023-12-04 | 2024-01-05 | 邢台医学高等专科学校 | 一种用于生化数据分析的方法及系统 |
CN117589741A (zh) * | 2024-01-18 | 2024-02-23 | 天津博霆光电技术有限公司 | 基于光学特征的吲哚菁绿智能检测方法 |
Non-Patent Citations (2)
Title |
---|
Pesticide Residues Detection in Agricultural Products;Braja Manggala et al.;《Natural and Life Sciences Communications》;20230731;全文 * |
基于 CURE 聚类算法改进的原型选择算法;孙元元 等;《计算机系统应用》;20190808;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117809070A (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818298B (zh) | 用于机器学习物质识别算法的通用拉曼光谱特征提取方法 | |
CN109934269B (zh) | 一种电磁信号的开集识别方法和装置 | |
Gómez-Meire et al. | Assuring the authenticity of northwest Spain white wine varieties using machine learning techniques | |
Bin et al. | A modified random forest approach to improve multi-class classification performance of tobacco leaf grades coupled with NIR spectroscopy | |
CN112732748B (zh) | 一种基于自适应特征选择的非侵入式家电负荷识别方法 | |
CN111062425B (zh) | 基于c-k-smote算法的不平衡数据集处理方法 | |
CN103048273A (zh) | 基于模糊聚类的水果近红外光谱分类方法 | |
CN106780347B (zh) | 一种基于oct图像处理的枇杷早期瘀伤鉴别方法 | |
CN111553186A (zh) | 一种基于深度长短时记忆网络的电磁信号识别方法 | |
CN117495849A (zh) | 基于图像特征的电源适配器质量检测方法 | |
CN117809070B (zh) | 一种用于蔬菜农药残留检测的光谱数据智能处理方法 | |
Waliyansyah et al. | Comparison of tree method, support vector machine, Naïve Bayes, and logistic regression on coffee bean image | |
CN110542659B (zh) | 基于可见光光谱的珍珠光泽检测方法 | |
Nie et al. | Machine vision-based apple external quality grading | |
CN109508350B (zh) | 一种对数据进行采样的方法和装置 | |
CN114358191A (zh) | 一种基于深度自动编码器的基因表达数据聚类方法 | |
CN110826599B (zh) | 一种稀疏表示样本分布边界保持特征提取方法 | |
CN113607681A (zh) | 杏鲍菇菌丝体检测方法、装置、电子设备及存储介质 | |
Nie et al. | Apple external quality analysis based on bp neural network | |
CN116678840B (zh) | 一种水性低温耐腐蚀性涂料成分分析方法 | |
CN110623662B (zh) | 一种适用于心电信号检测的自适应阈值迭代算法 | |
CN116504314B (zh) | 基于细胞动态分化的基因调控网络构建方法 | |
CN117934469B (zh) | 一种矿用高压变频器外壳生产质量视觉检测方法 | |
CN117893537B (zh) | 托盘表面材质的脱色检测方法及系统 | |
CN112378942B (zh) | 一种基于核磁共振指纹图谱的白酒等级分类识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |