CN117809070B

CN117809070B - 一种用于蔬菜农药残留检测的光谱数据智能处理方法

Info

Publication number: CN117809070B
Application number: CN202410232300.6A
Authority: CN
Inventors: 王磊; 尹喆; 张凯江; 刘珊珊; 郭金颖; 张贺凤; 果杨威; 尚久舒; 李梁; 王颖; 孟哲; 黄月; 董浩爽; 单平阳; 赵春杰; 李晓龙; 杨硕; 王建华
Original assignee: Tangshan Food And Drug Comprehensive Inspection And Testing Center Tangshan Agricultural Product Quality And Safety Inspection And Testing Center Tangshan Inspection And Testing Research Institute
Current assignee: Tangshan Food And Drug Comprehensive Inspection And Testing Center Tangshan Agricultural Product Quality And Safety Inspection And Testing Center Tangshan Inspection And Testing Research Institute
Priority date: 2024-03-01
Filing date: 2024-03-01
Publication date: 2024-05-14
Anticipated expiration: 2044-03-01
Also published as: CN117809070A

Abstract

本发明涉及物理分析技术领域，具体涉及一种用于蔬菜农药残留检测的光谱数据智能处理方法，包括：获取光谱数据集；根据相同波长下不同光谱数据的吸光度得到特征波长；根据每一蔬菜样本的光谱数据集，得到不同蔬菜样本之间的距离；根据蔬菜样本间的距离通过CURE算法对蔬菜样本进行聚类时，对含有蔬菜样本个数较多的聚类簇选择代表点，根据代表点的局部密度，得到代表点的自适应收缩因子；由此得到最终聚类结果；最后得到农药残留含量超标的蔬菜样本。本发明通过CURE算法对蔬菜样本进行聚类的过程中根据代表点的局部密度得到代表点的自适应收缩因子，使得聚类结果更准确。

Description

一种用于蔬菜农药残留检测的光谱数据智能处理方法

技术领域

本发明涉及物理分析技术领域，具体涉及一种用于蔬菜农药残留检测的光谱数据智能处理方法。

背景技术

光谱技术是一种非破坏性的检测方法，可以在不破坏蔬菜样品的情况下获取光谱信息。这意味着可以在蔬菜采摘、加工等阶段进行实时监测，而无需破坏样品，光谱数据智能处理方法可以为蔬菜农药残留检测提供高效、准确和可靠的解决方案，有助于确保食品安全和质量；而蔬菜对应光谱数据之间的差异可能是由于多种不同类型因素造成的，例如对应蔬菜内的含水量多少的差异导致相同波长下不同蔬菜的光谱数据出现差异，故考虑利用聚类分析的方式，对光谱数据相近或相同的蔬菜样本聚为一类以进行农药残留检测。

本方法通过CURE聚类算法对不同蔬菜的光谱数据进行聚类，但传统的CURE聚类算法中，CURE聚类算法的一个参数即收缩因子为一固定值。但通过固定的收缩因子聚类时，可能将农药残留有较大差异的光谱数据聚为一类，造成通过聚类结果对蔬菜农药残留进行检测时所得检测结果可能与实际结果有较大差异，降低了蔬菜农药残留检测的光谱数据的处理效果。

发明内容

本发明提供一种用于蔬菜农药残留检测的光谱数据智能处理方法，以解决现有的问题。

本发明的一种用于蔬菜农药残留检测的光谱数据智能处理方法采用如下技术方案：

本发明一个实施例提供了一种用于蔬菜农药残留检测的光谱数据智能处理方法，该方法包括以下步骤：

在一个波长范围内，获取每一波长下多个蔬菜样本的吸光度，得到多个蔬菜样本的光谱数据集；根据相同波长下不同光谱数据集所对应的吸光度的大小，得到多个特征波长；

根据每一蔬菜样本的光谱数据集，得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度；

根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度，得到每一蔬菜样本与其他蔬菜样本之间的距离；

根据每一蔬菜样本与其他蔬菜样本之间的距离，通过CURE算法对所有蔬菜样本进行迭代聚类，在聚类迭代过程中的聚类簇中筛选出若干个代表点；根据每一代表点的光谱数据集，得到不同收缩因子下每一代表点的局部密度；根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子；

根据聚类过程中每一代表点的自适应收缩因子，得到聚类簇中每一代表点的新的光谱数据集，并继续进行聚类，得到最终聚类结果；

根据最终聚类结果，进行农药残留检测，得到农药残留含量超标的蔬菜样本。

进一步地根据相同波长下不同光谱数据集所对应的吸光度的大小，得到多个特征波长，包括的具体步骤如下：

计算每一波长下所有蔬菜样本的吸光度的标准差，根据波长由小到大，依次统计所有波长下所有蔬菜样本的吸光度的标准差，得到一个标准差序列；对标准差序列使用滑动窗口法，获得若干个局部极大值；使用最小最大规范法对标准差序列进行归一化处理，得到每个标准差的归一化值；在标准差序列中的所有局部极大值中，将归一化值大于预设的判断阈值的局部极大值所对应的波长，记为特征波长。

进一步地根据每一蔬菜样本的光谱数据集，得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度，包括的具体公式如下：

其中，表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度，表示第/>个特征波长的波长值，/>表示第/>个特征波长的波长值，/>为预设的波长数量阈值，/>表示方向系数，/>表示第/>个蔬菜样本的光谱数据集中第/>个特征波长的波长值沿/>所表征波长变化方向上的第/>个波长下第/>个蔬菜样本吸光度的一阶差分值，/>表示在第/>个特征波长下第/>个蔬菜样本的吸光度，/>为绝对值函数，为以自然常数为底的指数函数，/>表示在波长/>下第/>个蔬菜样本的吸光度，/>表示在波长/>下第/>个蔬菜样本的吸光度。

进一步地根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度，得到每一蔬菜样本与其他蔬菜样本之间的距离，包括的具体公式如下：

其中，表示第/>个蔬菜样本与第/>个蔬菜样本之间的距离，/>表示特征波长的个数，/>表示特征波长/>对特征波长/>下第/>个蔬菜样本的吸光度的影响程度，为绝对值函数，/>表示特征波长/>下第/>个蔬菜样本的吸光度，/>表示特征波长/>下第/>个蔬菜样本的吸光度，/>表示以自然常数为底的指数函数；/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度，/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度，/>表示第/>个特征波长的波长值，/>表示第/>个特征波长的波长值。

进一步地根据每一蔬菜样本与其他蔬菜样本之间的距离，通过CURE算法对所有蔬菜样本进行迭代聚类，在聚类迭代过程中的聚类簇中筛选出若干个代表点，包括的具体步骤如下：

在聚类迭代过程中将第一个样本点个数大于或等于的聚类簇视为目标簇，获取目标簇中/>个蔬菜样本作为代表点以及目标簇的聚类中心点，其中/>为预设的代表点数量，为预设的样本数量阈值。

进一步地根据每一代表点的光谱数据集，得到不同收缩因子下每一代表点的局部密度，包括的具体步骤如下：

收缩因子为时收缩后第/>个代表点所对应的新的光谱数据集的具体计算公式为：

式中：表示收缩因子为/>时收缩后第/>个代表点所对应的新的光谱数据集，表示目标簇当中第/>个代表点所对应的蔬菜样本的光谱数据集，/>表示收缩因子，/>表示目标簇的聚类中心点所对应的蔬菜样本的光谱数据集；

根据所述每一蔬菜样本与其他蔬菜样本之间的距离的获取方式，使用收缩因子为时收缩后第/>个代表点所对应的新的光谱数据集，获得收缩因子为/>时收缩后第/>个代表点与其他蔬菜样本之间的距离；

根据收缩因子为时收缩后第/>个代表点与其他蔬菜样本之间的距离，得到收缩因子为/>时收缩后的第/>个代表点对应的局部密度。

进一步地根据收缩因子为时收缩后第/>个代表点与其他蔬菜样本之间的距离，得到收缩因子为/>时收缩后的第/>个代表点对应的局部密度，包括的具体公式如下：

其中，表示收缩因子为/>时收缩后的第/>个代表点对应的局部密度，/>为预设的距离度量；/>表示目标簇当中与收缩因子为/>时收缩后的第/>个代表点之间的距离小于/>的蔬菜样本的个数；/>表示目标簇当中收缩因子为/>时收缩后的第/>个代表点与目标簇当中收缩后的第/>个代表点之间的距离小于L的第/>个蔬菜样本之间的距离。

进一步地根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子，包括的具体步骤如下：

将收缩因子为时收缩后的第/>个代表点对应的局部密度构成的序列，记为第/>个代表点的局部密度序列；所述/>表示收缩因子，/>；

获取第个代表点的局部密度序列的一阶导序列，将一阶导序列中的最大值对应的收缩因子，记为目标簇当中第/>个代表点的自适应收缩因子。

进一步地根据聚类过程中每一代表点的自适应收缩因子，得到聚类簇中每一代表点的新的光谱数据集，包括的具体步骤如下：

将目标簇当中第个代表点的自适应收缩因子与第/>个代表点所对应蔬菜样本的光谱数据集中的每一个数据相乘，得到一个第一新数据集；

将1减目标簇当中第个代表点的自适应收缩因子，记为聚类中心点的权重；

将聚类中心点的权重与目标簇的聚类中心点所对应的蔬菜样本的光谱数据集中的每一个数据相乘，得到一个第二新数据集；

将第一新数据集与第二新数据集中对应的数据进行相加所得的数据集，记为第个代表点所对应蔬菜样本的新的光谱数据集。

进一步地根据最终聚类结果，进行农药残留检测，得到农药残留含量超标的蔬菜样本，包括的具体步骤如下：

在最终聚类结果中，根据酶抑制率法得到每一个聚类簇的聚类中心点所对应蔬菜样本的每公斤农药残留含量，若聚类中心点所对应蔬菜样本的每公斤农药残留含量大于或等于毫克，则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量超标；若聚类中心点所对应蔬菜样本的每公斤农药残留含量小于/>毫克，则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量合格；所述R为预设的每公斤农药残留含量阈值。

本发明的技术方案的有益效果是：在一个波长范围内，获取每一波长下多个蔬菜样本的吸光度，得到多个蔬菜样本的光谱数据集；根据相同波长下不同光谱数据集所对应的吸光度的大小，得到多个特征波长，之后在后续过程中只依据蔬菜样本在特征波长下的吸光度来进行后续操作去，减少了后续操作的计算量；根据每一蔬菜样本的光谱数据集，得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度；根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度，得到每一蔬菜样本与其他蔬菜样本之间的距离，在在计算每一蔬菜样本与其他蔬菜样本之间的距离时还考虑了每个特征波长对其他特征波长的影响程度，从而使得每一蔬菜样本与其他蔬菜样本之间的距离更加接近真实情况；根据每一蔬菜样本与其他蔬菜样本之间的距离，通过CURE算法对所有蔬菜样本进行迭代聚类，在聚类迭代过程中的聚类簇中筛选出若干个代表点；根据每一代表点的光谱数据集，得到不同收缩因子下每一代表点的局部密度；根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子，在计算自适应收缩因子时，从多个收缩因子里面筛选自适应收缩因子，从而使得每个代表点的自适应收缩因子更符合真实情况；根据聚类过程中每一代表点的自适应收缩因子，得到聚类簇中每一代表点的新的光谱数据集，并继续进行聚类，得到最终聚类结果，因为聚类时，每个代表点的自适应收缩因子更符合真实情况从而使得聚类结果更为准确；根据最终聚类结果，进行农药残留检测，得到农药残留含量超标的蔬菜样本，在进行农药残留含量检测时，因为聚类结果更接近真实情况，从而使得农药残留含量检测结果更接近真实情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种用于蔬菜农药残留检测的光谱数据智能处理方法的步骤流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种用于蔬菜农药残留检测的光谱数据智能处理方法，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种用于蔬菜农药残留检测的光谱数据智能处理方法的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种用于蔬菜农药残留检测的光谱数据智能处理方法的步骤流程图，该方法包括以下步骤：

步骤S001：在一个波长范围内，获取每一波长下多个蔬菜样本的吸光度，得到多个蔬菜样本的光谱数据集；根据相同波长下不同光谱数据集所对应的吸光度的大小，得到多个特征波长。

采集多个蔬菜样本，通过光谱仪获取一个波长范围内每一波长下多个蔬菜样本的吸光度，得到多个蔬菜样本的光谱数据集。以第个蔬菜样本为例，第/>个蔬菜样本的光谱数据集为/>，/>表示第/>个蔬菜样本的光谱数据集，/>表示波长为t时第/>个蔬菜样本的吸光度。通过光谱仪获取蔬菜样本的光谱数据集时，每一波长与其左右邻接波长的波长值差异为d纳米，在本实施例中令/>，其他实施例中可设置为其他值，本实施例不进行限定。

根据每一蔬菜样本的光谱数据集，计算每一蔬菜样本与其余蔬菜样本之间的距离时，传统方法是根据每一蔬菜样本与其余蔬菜样本在波长相同时蔬菜样本吸光度的平均差异，得到每个蔬菜样本与其他蔬菜样本之间的距离，但是这种方法的计算量较大。因为正常情况中在许多波长下每一蔬菜样本的吸光度与其他蔬菜样本在同一波长下的吸光度较为近似，使得可以通过多个同一波长下蔬菜样本吸光度有较大差异的光谱数据，计算每一蔬菜样本与其余蔬菜样本的距离。因此本方法选取多个波长下不同蔬菜样本吸光度有较大差异的波长作为特征波长，通过特征波长下每一蔬菜样本吸光度与对应波长下其余蔬菜样本吸光度得到每一蔬菜样本与其余蔬菜样本之间的距离。

获取特征波长的具体步骤如下：

计算每一波长下所有蔬菜样本的吸光度的标准差，根据波长由小到大，依次统计所有波长下所有蔬菜样本的吸光度的标准差，得到一个标准差序列，/>表示波长为/>时所有蔬菜样本的吸光度的标准差；对标准差序列使用滑动窗口法，获得若干个局部极大值；使用最小最大规范法对标准差序列进行归一化处理，得到每个标准差的归一化值；在标准差序列中的所有局部极大值中，将归一化值大于预设的判断阈值的局部极大值所对应的波长，记为特征波长，得到一个特征波长集/>，/>表示第/>个特征波长的波长值。

所需说明的是：最小最大规范法和滑动窗口法为公知技术，具体方法在此不做介绍，本实施例中滑动窗口的大小为60nm，以此为例进行叙述，其它实施方式中可设置为其它值，本实施例不进行限定。本实施例预设的判断阈值为0.12，并以此为例进行叙述，其它实施方式中可设置为其它值，本实施例不进行限定。

步骤S002：根据每一蔬菜样本的光谱数据集，得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度。

由于蔬菜内所包含物质的复杂性，会有较大概率出现不同特征波长下同一蔬菜样本的吸光度与蔬菜样本内的同一种物质有较大关系，进而造成某一特征波长下蔬菜样本的吸光度有较大可能与其他特征波长下同一蔬菜样本的吸光度有联系。因此计算每一特征波长下蔬菜样本的吸光度受其他特征波长下同一蔬菜样本的吸光度的影响程度。其中当两个特征波长之间距离较近时，两个特征波长之间的影响程度较大，当一个特征波长下蔬菜样本吸光度的值较大时，说明蔬菜内所包含某种物质的可能性较大，说明此特征波长对其余特征波长的影响程度可能较大，当某一特征波长到其余特征波长之间的蔬菜样本吸光度在不断增加，说明此特征波长对其余特征波长的影响程度较大，综合所述得到同一蔬菜样本中某一特征波长对其余特征波长的影响程度。

以第个蔬菜样本中第/>个和第/>个特征波长为例，将第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度记为/>，其计算公式如下：

其中，表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度，表示第/>个特征波长的波长值，/>表示第/>个特征波长的波长值，/>为预设的波长数量阈值，其体现了在计算第/>个特征波长对第/>个特征波长的影响程度时在所述蔬菜样本的光谱数据集中选择/>个光谱数据计算第/>个特征波长对第/>个特征波长的影响程度，在本实施例中令预设的波长数量阈值/>，其他实施方式中可设置为其他值，本实施例不对其进行限定，/>为绝对值函数；/>表示方向系数即第/>个特征波长的波长值与第/>个特征波长的波长值的大小，/>表示第/>个蔬菜样本的光谱数据集中第/>个特征波长的波长值沿/>所表征波长变化方向上的第/>个波长下第/>个蔬菜样本吸光度的一阶差分值，/>表示在第/>个特征波长下第/>个蔬菜样本的吸光度，/>表示在波长/>下第/>个蔬菜样本的吸光度，/>表示在波长下第/>个蔬菜样本的吸光度。

公式逻辑：在计算第个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度时，需要考虑的是第/>个特征波长在指向第/>个特征波长的波长范围内第/>个蔬菜样本的吸光度的变化情况，若第/>个特征波长邻域内每一波长所对应的蔬菜样本吸光度沿对应方向上的数值减小速度较小，或其有增长的趋势，则第/>个特征波长有较大可能会影响该方向其他特征波长，故利用一阶差分值对第/>个特征波长下第/>个蔬菜样本的吸光度进行加权，得到该蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度。

按照上述方式，得到每个蔬菜样本中，每一个特征波长对其他特征波长的影响程度。

步骤S003：根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度，得到每一蔬菜样本与其他蔬菜样本之间的距离。

在计算两个蔬菜样本之间的距离时，不仅需要考虑同一特征波长下不同蔬菜样本的吸光度差异，还需要根据同一蔬菜样本中每一特征波长受其余特征波长的影响程度，若这两个蔬菜样本中某一特征波长受其余特征波长的影响程度较大，则这两个蔬菜样本在该特征波长下的吸光度差异的可靠性较低，因为这两个蔬菜样本在该特征波长下的吸光度差异可能是由其余特征波长的影响造成的。因此根据每一特征波长下每一蔬菜样本吸光度以及同一蔬菜样本中每一蔬菜样本的特征波长受其余特征波长的影响程度，获取两个蔬菜样本之间的距离。

将第个蔬菜样本与第/>个蔬菜样本之间的距离记为/>，计算公式如下：

其中，表示第/>个蔬菜样本与第/>个蔬菜样本之间的距离，/>表示特征波长的个数，/>表示特征波长/>对特征波长/>下第/>个蔬菜样本吸光度的差异影响程度，表示特征波长/>下第/>个蔬菜样本的吸光度，/>表示特征波长/>下第/>个蔬菜样本的吸光度，/>为绝对值函数，/>为以自然常数为底的指数函数，本实施例以来呈现反比例关系及归一化处理，实施者可根据实际情况设置反比例函数及归一化函数；/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度，/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度；所需说明的是/>。

公式逻辑：因为不同特征波长下不同蔬菜样本的吸光度受其余特征波长的影响程度可能不同，所以根据每一蔬菜样本下每一特征波长受其余特征波长的影响程度，结合每一特征下每一蔬菜样本的吸光度与其余蔬菜样本的吸光度的差异，得到两个蔬菜样本之间的距离。

步骤S004：根据每一蔬菜样本与其他蔬菜样本之间的距离，通过CURE算法对所有蔬菜样本进行迭代聚类，在聚类迭代过程中的聚类簇中筛选出若干个代表点；根据每一代表点的光谱数据集，得到不同收缩因子下每一代表点的局部密度；根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子。

通过CURE算法对样本进行聚类时，聚类过程如下：

1.将每一个蔬菜样本视为一个单独的聚类簇；

2.计算每一个聚类簇到其他聚类簇之间的距离；

3.找到距离最近的两个聚类簇，将它们合并成一个新的聚类簇；

4.计算新形成的聚类簇与其他聚类簇之间的距离；

5.不断重复步骤3与步骤4，直到聚类簇的个数为预设的最终聚类个数时停止。

需要说明的是，通过CURE算法对蔬菜样本进行聚类时，当某一样本簇中含有样本的个数大于或等于样本数量阈值时，需要从所述样本簇中选择/>个代表点，根据每一个代表点的光谱数据集与收缩因子来计算每一聚类簇与其他聚类簇的距离，其中/>为预设的代表点数量，/>为预设的样本数量阈值。

在聚类过程中每一聚类簇与其他聚类簇之间的距离获取方式如下：在聚类过程中当两个聚类簇中所含蔬菜样本个数均小于时，那么所述两个聚类簇的距离为每一个聚类簇中每一个蔬菜样本到所述另一个聚类簇中每一个蔬菜样本的平均距离之和；当两个聚类簇中所含蔬菜样本个数均大于或等于/>时，那么所述两个聚类簇的距离为每一个聚类簇中每一个代表点到所述另一个聚类簇中每一个代表点的平均距离之和；当一个聚类簇中所含蔬菜样本个数均大于或等于/>而另一个聚类簇中所含蔬菜样本个数小于/>，那么所述两个聚类簇的距离为一个聚类簇中每一个代表点到所述另一个聚类簇中每一个蔬菜样本的平均距离之和。

需要说明的是：收缩因子为CURE算法中的超参数。在本实施例中令预设的样本数量阈值，预设的代表点数量/>，其他实施方式中可设置为5，本实施例不对其进行限定。

传统的CURE算法中聚类代表点的收缩因子是一固定的超参数，即对每个聚类代表点与聚类代表点所在聚类中心点之间的距离进行相同程度的放缩。由于聚类形状并不一定是凸多边形，调整后的代表点并不能较好的表现出聚类的形态特征。故本实施例依据每一聚类簇中每一代表点在不同收缩因子下周围蔬菜样本的局部密度，得到每一聚类簇中每一代表点的收缩因子。

在聚类过程中选择第一个簇内蔬菜样本的个数大于或等于n的簇作为目标簇，选择目标簇中的个蔬菜样本作为代表点。将在目标簇中与目标簇中其余蔬菜样本之间的平均距离最短的蔬菜样本作为目标簇的中心。将目标簇当中第/>个代表点所对应的蔬菜样本的光谱数据集记为/>。

需要说明的是在目标簇中选择代表点为公知技术本实施例不进行详细描写。

在CURE算法中，收缩因子为时收缩后的第/>个代表点所对应的新的光谱数据集的计算方式如下：

式中：表示收缩因子为/>时收缩后第/>个代表点所对应的新的光谱数据集，表示目标簇当中第/>个代表点所对应的蔬菜样本的光谱数据集，/>为收缩因子，/>表示目标簇的聚类中心点所对应的蔬菜样本的光谱数据集，/>表示对第/>个代表点所对应的蔬菜样本的光谱数据集中的每一个数据的数值进行整体放缩，/>表示对目标簇的聚类中心点所对应的蔬菜样本的光谱数据集中的每一个数据的数值进行相同的放缩，需要说明的是在本实施例中/>为序列/>中的值，并以此为例进行叙述，其它实施方式中/>可为其他数据序列中的值，本实施例不进行限定。/>

按照的获取方式，根据收缩因子为/>时收缩后第/>个代表点所对应的新的光谱数据集，获取收缩后的第/>个代表点与其它蔬菜样本的距离，得到收缩因子为/>时收缩后的第/>个代表点对应的局部密度为/>，计算公式如下：

其中，表示收缩因子为/>时收缩后的第/>个代表点对应的局部密度为/>，/>为一预设的距离度量，在本实施例中令预设的距离度量/>，在其他实施例中可为其他值，本实施例不对其进行限定；/>为收缩因子，/>表示目标簇当中与收缩因子为/>时收缩后的第/>个代表点之间的距离小于/>的蔬菜样本的个数；/>表示目标簇当中收缩因子为时收缩后的第/>个代表点与目标簇当中收缩因子为/>时收缩后的第/>个代表点之间的距离小于L的第/>个蔬菜样本之间的距离，需要说明的是在本实施例中/>为序列中的值，并以此为例进行叙述，其它实施方式中/>可为其他数据序列中的值，本实施例不进行限定。

公式逻辑：根据收缩后的第个代表点周围其余蔬菜样本与收缩后的第/>个代表点的距离，得到收缩因子为/>时收缩后的第/>个代表点的局部密度。

按照上述方式，得到序列中每一数据时，收缩后的第/>个代表点的局部密度，并根据收缩因子从小到大排列，得到收缩后的第/>个代表点的局部密度序列/>，进一步根据局部密度序列/>，得到收缩后的第/>个代表点的局部密度关于收缩因子的一阶导序列，在一阶导序列中选择数值最大的一阶导对应的收缩因子作为目标簇当中第/>个代表点的收缩因子，将其记为目标簇当中第/>个代表点的自适应收缩因子/>，需要说明的是，/>中每一个局部密度的一阶导是根据其右侧邻接局部密度的数值得到的。

公式逻辑：各代表点的选取是根据与中心点之间的距离最远的点依次选取的，即所得各点对应位置均处于聚类的边缘位置，此时代表点对应局部密度相对较低，随着收缩因子的逐渐增加，各代表点的位置逐渐靠近聚类中心点，此时其局部密度会逐渐升高，而在这一从小变大的过程中，选取变化最为迅速的收缩因子，即二阶导数的最大点，此时对应代表点的位置从低密度区域突升至高密度区域，更能表现对应聚类的真实形态特征。

步骤S005：根据聚类过程中每一代表点的自适应收缩因子，得到聚类簇中每一代表点的新的光谱数据集，并继续进行聚类，得到最终聚类结果。

在目标簇当中第个代表点所对应的光谱数据集在收缩后的光谱数据集为：

式中：表示目标簇当中第/>个代表点的自适应收缩因子，/>表示第/>个代表点所对应蔬菜样本的光谱数据集，/>表示第/>个代表点所对应蔬菜样本的新的光谱数据集，为第/>个代表点所对应的光谱数据集在收缩后的光谱数据集。

对目标簇中每一代表点都进行上述操作，得到目标簇中每一代表点的收缩因子，并进一步得到当前聚类结果中所含蔬菜样本个数大于或等于的簇内每一代表点的收缩因子。

根据每一个代表点的收缩因子计算两个聚类之间距离时，根据两个聚类中各代表点之间的距离的平均值得到两个聚类之间距离，预设CURE算法最终的聚类个数为，获取聚类结果。

在本实施例中令，其他实施方式中可设置为其他值，本实施例不对其进行限定。

步骤S006：根据最终聚类结果，进行农药残留检测，得到农药残留含量超标的蔬菜样本。

根据对应聚类结果，分别选取各聚类的聚类中心点进行农药残留量检测。

在最终聚类结果中，首先根据酶抑制率法得到每一个聚类的聚类中心点所对应蔬菜样本的每公斤农药残留含量，若聚类中心点所对应蔬菜样本的每公斤农药残留含量大于或等于毫克，则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量超标；若聚类中心点所对应蔬菜样本的每公斤农药残留含量小于/>毫克，则所述聚类中心点所对应聚类簇内的所有蔬菜样本的农药残留含量合格；所述R为预设的每公斤农药残留含量阈值。

按照上述方式，得到每个聚类簇的农药残留检测结果。

需要说明的是，酶抑制率法为公知技术，具体方法在此不做介绍。在本实施例中预设的每公斤农药残留含量阈值，以此为例进行叙述，其它实施方式中可设置为其它值，本实施例不进行限定。

至此，本发明完成。

综上所述，在本发明实施例中，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用于蔬菜农药残留检测的光谱数据智能处理方法，其特征在于，该方法包括以下步骤：

根据最终聚类结果，进行农药残留检测，得到农药残留含量超标的蔬菜样本；

所述根据每一蔬菜样本的光谱数据集，得到每一蔬菜样本下每一个特征波长对其他特征波长的影响程度，包括的具体公式如下：

其中，表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度，/>表示第/>个特征波长的波长值，/>表示第/>个特征波长的波长值，/>为预设的波长数量阈值，/>表示方向系数，/>表示第/>个蔬菜样本的光谱数据集中第/>个特征波长的波长值沿/>所表征波长变化方向上的第/>个波长下第/>个蔬菜样本吸光度的一阶差分值，表示在第/>个特征波长下第/>个蔬菜样本的吸光度，/>为绝对值函数，/>为以自然常数为底的指数函数，/>表示在波长/>下第/>个蔬菜样本的吸光度，/>表示在波长/>下第/>个蔬菜样本的吸光度；

所述根据每一蔬菜样本的光谱数据集以及每一蔬菜样本中每一个特征波长对其他特征波长的影响程度，得到每一蔬菜样本与其他蔬菜样本之间的距离，包括的具体公式如下：

其中，表示第/>个蔬菜样本与第/>个蔬菜样本之间的距离，/>表示特征波长的个数，表示特征波长/>对特征波长/>下第/>个蔬菜样本的吸光度的影响程度，/>为绝对值函数，/>表示特征波长/>下第/>个蔬菜样本的吸光度，/>表示特征波长/>下第/>个蔬菜样本的吸光度，/>表示以自然常数为底的指数函数；/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度，/>表示第/>个蔬菜样本中第/>个特征波长对第/>个特征波长的影响程度，/>表示第/>个特征波长的波长值，/>表示第/>个特征波长的波长值；

所述根据每一蔬菜样本与其他蔬菜样本之间的距离，通过CURE算法对所有蔬菜样本进行迭代聚类，在聚类迭代过程中的聚类簇中筛选出若干个代表点，包括的具体步骤如下：

在聚类迭代过程中将第一个样本点个数大于或等于的聚类簇视为目标簇，获取目标簇中/>个蔬菜样本作为代表点以及目标簇的聚类中心点，其中/>为预设的代表点数量，/>为预设的样本数量阈值；

所述根据每一代表点的光谱数据集，得到不同收缩因子下每一代表点的局部密度，包括的具体步骤如下：

式中：表示收缩因子为/>时收缩后第/>个代表点所对应的新的光谱数据集，/>表示目标簇当中第/>个代表点所对应的蔬菜样本的光谱数据集，/>表示收缩因子，/>表示目标簇的聚类中心点所对应的蔬菜样本的光谱数据集；

根据收缩因子为时收缩后第/>个代表点与其他蔬菜样本之间的距离，得到收缩因子为时收缩后的第/>个代表点对应的局部密度；

所述根据不同收缩因子下每一代表点的局部密度得到聚类过程中每一代表点的自适应收缩因子，包括的具体步骤如下：

获取第个代表点的局部密度序列的一阶导序列，将一阶导序列中的最大值对应的收缩因子，记为目标簇当中第/>个代表点的自适应收缩因子；

所述根据聚类过程中每一代表点的自适应收缩因子，得到聚类簇中每一代表点的新的光谱数据集，包括的具体步骤如下：

2.根据权利要求1所述一种用于蔬菜农药残留检测的光谱数据智能处理方法，其特征在于，所述根据相同波长下不同光谱数据集所对应的吸光度的大小，得到多个特征波长，包括的具体步骤如下：

3.根据权利要求1所述一种用于蔬菜农药残留检测的光谱数据智能处理方法，其特征在于，所述根据收缩因子为时收缩后第/>个代表点与其他蔬菜样本之间的距离，得到收缩因子为/>时收缩后的第/>个代表点对应的局部密度，包括的具体公式如下：

4.根据权利要求1所述一种用于蔬菜农药残留检测的光谱数据智能处理方法，其特征在于，所述根据最终聚类结果，进行农药残留检测，得到农药残留含量超标的蔬菜样本，包括的具体步骤如下：