CN118090672A

CN118090672A - 猕猴桃特征检测方法、装置、介质及设备

Info

Publication number: CN118090672A
Application number: CN202410501214.0A
Authority: CN
Inventors: 刘鸿飞; 刘燕德; 黄晓晓; 熊康
Original assignee: Optosky Xiamen Optoelectronic Co ltd
Current assignee: Optosky Xiamen Optoelectronic Co ltd
Priority date: 2024-04-25
Filing date: 2024-04-25
Publication date: 2024-05-28

Abstract

本发明涉及一种猕猴桃特征检测方法、装置、介质及设备，方法包括：获取待检测猕猴桃的表面光信号和表面反射率；将表面光信号和表面反射率输入至目标猕猴桃特征预测模型中，得到待检测猕猴桃的特征信息；目标猕猴桃特征预测模型是通过如下方式训练得到的：获取校正集和更新集；确定与第二猕猴桃样本之间的相似度最高的M个第一猕猴桃样本，并添加至训练集中；建立初始的预测模型；确定与当前训练集中训练猕猴桃样本之间的不确定度最高的R个第二猕猴桃样本；将该R个第二猕猴桃样本添加至训练集中；对预测模型进行迭代更新，并对潜变量数量进行更新；判断是否满足迭代停止条件；若满足，则得到目标猕猴桃特征预测模型。如此，提高模型的泛化能力。

Description

猕猴桃特征检测方法、装置、介质及设备

技术领域

本发明涉及水果检测技术领域，具体地，涉及一种猕猴桃特征检测方法、装置、介质及设备。

背景技术

猕猴桃因其独特的风味和对消化系统的健康益处而成为全球农产品。为了降低猕猴桃的运输难度，并提高猕猴桃的储存寿命，猕猴桃通常在更年期前收获，此时水果尚未开始软化，收获后，作为一种更年期水果，猕猴桃的成熟相关事件继续发展。一般来说，果实在贮藏和运输过程中，其更年期成熟的程度(如硬度衰减、糖积累和颜色变化)存在一定的变化。然而，由于这种成熟度变化尚未在市场上得到评估和分类，消费者通常倾向于用手指轻压猕猴桃来选择购买哪种猕猴桃。因此，硬度和糖度的检测不仅对选择猕猴桃采摘后的储存方式至关重要，而且为客户提供挑选依据也很重要。传统的检测方法，如硬度测试和折射法，既耗时又会损害水果。

发明内容

本发明的目的是提供一种猕猴桃特征检测方法、装置、介质及设备，可以无损检测猕猴桃的硬度和甜度，且检测准确度高。

为了实现上述目的，第一方面，本发明提供一种猕猴桃特征检测方法，所述方法包括：

获取待检测猕猴桃的表面光信号和表面反射率；

将所述待检测猕猴桃的所述表面光信号和所述表面反射率输入至预先训练完成的目标猕猴桃特征预测模型中，得到所述目标猕猴桃特征预测模型输出的所述待检测猕猴桃的特征信息，其中，所述特征信息包括所述待检测猕猴桃的硬度信息和甜度信息；

其中，所述目标猕猴桃特征预测模型是通过如下方式训练得到的：

获取校正集和更新集，其中，所述校正集中包括多个第一猕猴桃样本各自的样本信息，所述更新集中包括多个第二猕猴桃样本各自的样本信息，所述样本信息包括猕猴桃样本的表面光信号、表面反射率、参考硬度和参考甜度，所述校正集中的第一猕猴桃样本与所述更新集中的第二猕猴桃样本之间无交集；

从所述校正集中确定与所述第二猕猴桃样本之间的相似度最高的M个所述第一猕猴桃样本，并将该M个所述第一猕猴桃样本各自的样本信息添加至训练集中，其中，所述训练集中的样本作为训练猕猴桃样本，M大于1；

根据当前训练集中M个所述训练猕猴桃样本各自的样本信息，建立初始的预测模型，其中，所述预测模型为偏最小二乘回归模型，所述预测模型中潜变量数量的值初始为预先确定的波长数量信息；

从当前更新集中确定与当前训练集中所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本，其中，R大于或等于1；

将该R个所述第二猕猴桃样本从所述更新集中删除，并将该R个所述第二猕猴桃样本添加至所述训练集中；

根据当前训练集中的所述训练猕猴桃样本对所述预测模型进行迭代更新，并对所述潜变量数量进行更新；

根据本次迭代更新得到的所述预测模型，判断是否满足迭代停止条件；

若满足，则得到所述目标猕猴桃特征预测模型；

若不满足，则重新执行所述从当前更新集中确定与当前训练集中的所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本的步骤至所述根据本次迭代更新得到的所述预测模型，判断是否满足迭代停止条件的步骤。

第二方面，本发明提供一种猕猴桃特征检测装置，所述装置包括：

第一获取模块，用于获取待检测猕猴桃的表面光信号和表面反射率；

输入模块，用于将所述待检测猕猴桃的所述表面光信号和所述表面反射率输入至预先训练完成的目标猕猴桃特征预测模型中，得到所述目标猕猴桃特征预测模型输出的所述待检测猕猴桃的特征信息，其中，所述特征信息包括所述待检测猕猴桃的硬度信息和甜度信息；

其中，所述目标猕猴桃特征预测模型是通过如下模块训练得到的：

第二获取模块，用于获取校正集和更新集，其中，所述校正集中包括多个第一猕猴桃样本各自的样本信息，所述更新集中包括多个第二猕猴桃样本各自的样本信息，所述样本信息包括猕猴桃样本的表面光信号、表面反射率、参考硬度和参考甜度，所述校正集中的第一猕猴桃样本与所述更新集中的第二猕猴桃样本之间无交集；

第一确定模块，用于从所述校正集中确定与所述第二猕猴桃样本之间的相似度最高的M个所述第一猕猴桃样本，并将该M个所述第一猕猴桃样本各自的样本信息添加至训练集中，其中，所述训练集中的样本作为训练猕猴桃样本，M大于1；

建立模块，用于根据当前训练集中M个所述训练猕猴桃样本各自的样本信息，建立初始的预测模型，其中，所述预测模型为偏最小二乘回归模型，所述预测模型中潜变量数量的值初始为预先确定的波长数量信息；

第二确定模块，用于从当前更新集中确定与当前训练集中所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本，其中，R大于或等于1；

处理模块，用于将该R个所述第二猕猴桃样本从所述更新集中删除，并将该R个所述第二猕猴桃样本添加至所述训练集中；

更新模块，用于根据当前训练集中的所述训练猕猴桃样本对所述预测模型进行迭代更新，并对所述潜变量数量进行更新；

判断模块，用于根据本次迭代更新得到的所述预测模型，判断是否满足迭代停止条件；

获得模块，用于若满足，则得到所述目标猕猴桃特征预测模型；

触发模块，用于若不满足，则触发第二确定模块重新执行从当前更新集中确定与当前训练集中的所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本至所述判断模块根据本次迭代更新得到的所述预测模型，判断是否满足迭代停止条件。

第三方面，本发明提供一种可读存储介质，其上存储有计算机程序，所述程序被处理器执行时，实现本发明第一方面提供的所述方法的步骤。

第四方面，本发明提供一种电子设备，包括存储器和处理器，所述存储器用于存储程序，所述处理器用于执行所述程序，以实现本发明第一方面提供的所述方法的步骤。

通过上述技术方案，通过目标猕猴桃特征预测模型得到待检测猕猴桃的硬度信息和甜度信息，其中，预测模型在训练时，从校正集中确定与更新集中第二猕猴桃样本之间的相似度最高的M个第一猕猴桃样本，并将该M个第一猕猴桃样本添加至训练集中，其中样本之间的相似度可通过光谱信息的离散程度进行衡量，再从当前更新集中确定与当前训练集中训练猕猴桃样本之间的不确定度最高的R个第二猕猴桃样本，这R个第二猕猴桃样本与当前训练集中的训练猕猴桃样本之间的差异性最大，将这R个第二猕猴桃样本作为新的训练猕猴桃样本，每次迭代更新选取出的新的训练样本都是根据样本之间的不确定度计算得出的，可以提高训练样本之间的差异性和多样性，通过迭代更新并逐渐增加训练样本的方式，可以使得训练样本更加丰富，信息量更大，提高训练出的模型的性能，并提高模型预测不同特征猕猴桃的硬度和甜度的准确性。本方案可以快速无损的同时检测出猕猴桃的硬度和甜度，通过不确定性采样的主动学习更新模型，回归模型拥有更强的泛化能力。

附图说明

图1是示例性示出的一种猕猴桃特征检测方法的流程图。

图2是示例性示出的目标猕猴桃特征预测模型的训练方法的流程图。

图3是示例性示出的从校正集中确定与第二猕猴桃样本之间的相似度最高的M个第一猕猴桃样本的方法的流程图。

图4是示例性示出的确定与训练猕猴桃样本之间的不确定度最高的R个第二猕猴桃样本的方法的流程图。

图5是示例性示出的一种猕猴桃特征检测装置的框图。

图6是示例性示出的目标猕猴桃特征预测模型训练装置的框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1是示例性示出的一种猕猴桃特征检测方法的流程图，如图1所示，该方法可包括步骤11和步骤12。

步骤11：获取待检测猕猴桃的表面光信号和表面反射率。

其中，待检测猕猴桃可以是任意需要检测硬度和甜度的猕猴桃。示例地，可以通过光收集器收集待检测猕猴桃表面的漫反射光，并将光收集器通过光纤连接器传输到光谱仪，通过光谱仪将待检测猕猴桃表面的漫反射光分散成光谱分量，从而得到待检测猕猴桃的表面光信号。

示例地，使用Savitzky-Golay滤波器（多项式阶为2，窗口大小为25）平滑测量的原始光信号，将待检测猕猴桃替换成白板，得到白板的参考数据，即白板的光信号强度值，通过关闭灯并覆盖光，收集光纤所传输的数据作为暗底，得到暗底的光信号强度值。然后，利用如下公式计算出待检测猕猴桃的表面反射率：

其中，R_λ表示待检测猕猴桃在波长λ处的表面反射率，S_λ表示待检测猕猴桃在波长λ处的光信号强度值，D_λ表示暗底波长λ处的光信号强度值，B_λ表示白板波长λ处的光信号强度值。

步骤12：将待检测猕猴桃的表面光信号和表面反射率输入至预先训练完成的目标猕猴桃特征预测模型中，得到目标猕猴桃特征预测模型输出的待检测猕猴桃的特征信息。其中，所述特征信息包括所述待检测猕猴桃的硬度信息和甜度信息。

图2是示例性示出的目标猕猴桃特征预测模型的训练方法的流程图，如图2所示，该训练方法可包括步骤21至步骤28。

步骤21：获取校正集和更新集。

其中，校正集中包括多个第一猕猴桃样本各自的样本信息，更新集中包括多个第二猕猴桃样本各自的样本信息，样本信息包括猕猴桃样本的表面光信号、表面反射率、参考硬度和参考甜度，校正集中的第一猕猴桃样本与更新集中的第二猕猴桃样本之间无交集。第一猕猴桃样本的样本信息包括第一猕猴桃样本的表面光信号、表面反射率、参考硬度和参考甜度，第二猕猴桃样本的样本信息包括第二猕猴桃样本的表面光信号、表面反射率、参考硬度和参考甜度。

具体地，可以购买不同商家的成熟期的猕猴桃作为样本，保存在寒冷的条件下，例如温度为3℃至7℃、湿度为25%至50%的条件下，随后，在测量之前，将样本移至室温条件下约12小时，以减少由于温差引起的光谱数据变化。猕猴桃样本的表面光信号的获取方式可参照上述待检测猕猴桃的表面光信号的获取方式，猕猴桃样本的表面反射率的计算方式可参照上述待检测猕猴桃的表面反射率的计算方式，此处不再赘述。示例地，采用硬度计对猕猴桃样本的三个位置分别进行测量，将三次测量的平均值作为猕猴桃样本的参考硬度，提取猕猴桃样本的新鲜果汁进行化学计量，将结果作为猕猴桃样本的参考甜度。

示例地，将第一部分商家的猕猴桃样本分为校正集和验证集，分别用于开发和验证预测模型。首先对第一部分商家的猕猴桃样本，按照样本的参考硬度进行从小到大排序，每4份样品为一组，每4份样品中前3份加入到校正集中，第4份样本加入到验证集中，这样，覆盖第一部分商家参考值范围的75%的样本构建了校正集，其余25%的样本形成了验证集。为了更客观地验证模型的性能，将除第一部分商家外其他商家的样本随机分为更新集和预测集，为了包括尽可能多的输入空间，并提供多样性样本，更新集包含了其他商家总样本的75%，更新集为模型的更新提供了样本，预测集用于比较不同模型更新方法的性能。考虑到随机划分的不确定性，将样本划分重复10次。为了更好地评价模型更新方法，对不同更新集的模型进行了平均和记录。校正集、验证集、更新集和预测集分别用符号C、V、U和P表示。

步骤22：从校正集中确定与第二猕猴桃样本之间的相似度最高的M个第一猕猴桃样本，并将该M个第一猕猴桃样本各自的样本信息添加至训练集中。其中，训练集中的样本作为训练猕猴桃样本，M大于1。

示例地，步骤22的实施方式可如图3所示，包括步骤221和步骤222。

步骤221：针对校正集中的每一第一猕猴桃样本，分别确定该第一猕猴桃样本与每一第二猕猴桃样本之间的离散程度，并将多个离散程度中的最大值作为该第一猕猴桃样本对应的最大离散程度。

其中，光谱信息离散程度（SIDD，Spectral Information Dispersion Degree）用来量化光谱相似性，以解释收集的光谱信息，SIDD值越小，两种光谱数据的差异越小，相似度越高。

第一猕猴桃样本与第二猕猴桃样本之间的离散程度通过如下公式确定：

其中，表示离散程度，/>表示第i个第一猕猴桃样本的表面光信号，/>，L表示样本的波长数量，/>表示第一猕猴桃样本在第一个波长下的表面光信号，/>表示第一猕猴桃样本在第L个波长下的表面光信号，/>表示第j个第二猕猴桃样本的表面光信号，/>，/>表示第二猕猴桃样本在第一个波长下的表面光信号，/>表示第二猕猴桃样本在第L个波长下的表面光信号，/>表示/>相对于/>的相对熵，/>表示/>相对于/>的相对熵，/>表示第i个第一猕猴桃样本在第l个波长下的表面光信号在第i个第一猕猴桃样本中的所占比重，/>表示第j个第二猕猴桃样本在第l个波长下的表面光信号在第j个第二猕猴桃样本中的所占比重，/>表示第i个第一猕猴桃样本在第l个波长下的表面光信号，/>表示第j个第二猕猴桃样本在第l个波长下的表面光信号。其中，/>的计算方式可如下公式所示：

例如校正集中的样本表示为，s∈（1,2…，S），S为校正集中的样本总数，更新集中的样本表示为/>，n∈（1,2…，N），N为更新集中的样本总数，则最大离散程度d^s,n可由下式求得：

步骤222：将多个第一猕猴桃样本分别对应的最大离散程度按照升序排序，将排名在前M位的第一猕猴桃样本，作为与第二猕猴桃样本之间的相似度最高的M个第一猕猴桃样本。其中，两个样本之间的离散程度越低表征两个样本之间的相似度越高。

步骤23：根据当前训练集中M个训练猕猴桃样本各自的样本信息，建立初始的预测模型。

其中，所述预测模型为偏最小二乘回归模型（PLSR，Partial Least SquaresRegression），所述预测模型中潜变量数量的值初始为预先确定的波长数量信息。

本发明中，波长数量信息可通过如下方式确定：

获取验证集，其中，验证集中包括第三猕猴桃样本各自的样本信息，校正集中的第一猕猴桃样本与所述验证集中的第三猕猴桃样本之间无交集；

将第一猕猴桃样本的样本信息和第三猕猴桃样本的样本信息输入至偏最小二乘路径算法中，得到算法输出的波长信息的第一结果；

重新执行将第一猕猴桃样本的样本信息和第三猕猴桃样本的样本信息输入至偏最小二乘路径算法中的步骤，得到算法输出的波长信息的第二结果；

将第一结果和第二结果中的交集，作为波长的选择结果，并将选择结果中波长的数量作为波长数量信息。

其中，验证集的获取方式已在上文介绍。可将校正集和验证集中样本的样本信息两次输入至偏最小二乘路径算法中，两次得到的结果可能不同，例如第一次得到的第一结果中有波长a、波长b、波长c，第二次得到的第二结果中有波长b、波长c、波长d，那么两次结果的交集即为波长b和波长c，波长数量信息为2。需要说明的是，该示例仅为示意，不够成对本发明实施方式的限制。该波长选择的方式，目的是为了减少波长数量，防止过度拟合，采用偏最小二乘路径算法对波长进行选择，信号一致且稳定，偏最小二乘路径算法算法同时考虑了每个波长信息对PLS模型的贡献(用PLS模型的回归系数表示)和每个波长的信息散度(用每个波长的标准差表示)。当然，也可以采用其他波长选择的算法，如竞争自适应重加权采样(CARS)方法。

示例地，可将M个训练猕猴桃样本各自的样本信息，以及潜变量数量的初始值输入至偏最小二乘回归模型中，以建立初始的预测模型。其中，潜变量数量是偏最小二乘回归模型中的一个参数，该潜变量数量初始可设置为预先确定的波长数量信息，后续在模型更新的过程中再随之优化。波长选择完成后，利用PLSR建立预测模型，与其他多元回归方法相比，PLSR是光谱分析中广泛使用的一种监督学习统计方法，PLSR的目的是通过将X变量和Y变量投影到一个新的潜在空间中，从而实现这些潜在变量之间的协方差最大化，从而建立一个潜在线性回归模型。其中，X变量为光信号和反射率经过波长选择后的结果，Y变量为样本的硬度和甜度。上述提及的L即样本的波长数量可设置为选择出的波长数量信息，分别使用光信号和反射率作为模型的输入自变量，并且同时将样本的糖度和硬度值作为模型的因变量，将光信号作为输入的波长选择的结果和反射率作为输入的波长选择的结果取并集。

步骤24：从当前更新集中确定与当前训练集中训练猕猴桃样本之间的不确定度最高的R个第二猕猴桃样本。其中，R大于或等于1。

步骤25：将该R个第二猕猴桃样本从更新集中删除，并将该R个第二猕猴桃样本添加至训练集中。

需要说明的是，更新集中初始包括N个样本，更新集中的样本是在变化的，每一轮迭代更新过程中，更新集中的样本减少R个，训练集中的样本增加R个，与当前训练集中训练猕猴桃样本之间的不确定度最高的R个第二猕猴桃样本，即这R个第二猕猴桃样本与当前训练集中的训练猕猴桃样本之间的差异性最大，将这R个第二猕猴桃样本作为新的训练猕猴桃样本，可以提高训练样本之间的差异性，从而使得训练样本更加丰富，提高训练出的模型的性能，并提高预测不同特征猕猴桃的硬度和甜度的准确性。

步骤26：根据当前训练集中的训练猕猴桃样本对预测模型进行迭代更新，并对潜变量数量进行更新。

步骤27：根据本次迭代更新得到的预测模型，判断是否满足迭代停止条件。若满足，则执行步骤28；若不满足，则重新执行步骤24至步骤27。

步骤28：得到目标猕猴桃特征预测模型。

其中，迭代停止条件包括：

当前训练集中所述训练猕猴桃样本的数量达到预设数量阈值、且决定系数和均方根误差均达到最小；

其中，均方根误差通过如下公式确定：

决定系数通过如下公式确定：

其中，RMSE表示均方根误差，n表示用于验证预测模型是否满足迭代停止条件的验证集中样本的数量，y _i为预先标注出的验证集中第i个样本的参考值，为通过预测模型得出的验证集中第i个样本的预测值，/>为验证集中样本参考值的平均值。

需要说明的是，本发明在介绍中，i和j均仅表示样本的代指符号，并不特指哪一样本，例如，第i个第一猕猴桃样本与验证集中第i个样本，并不指第同样数量个样本。

其中，预设数量阈值可预先设置，本发明对其取值不做限制，当前训练集中训练猕猴桃样本的数量达到预设数量阈值，可表征训练样本足够多，实现样本的多样性，以提高模型训练的准确性。决定系数和均方根误差达到最小，即模型性能达到最优，可将当前预测模型作为最终的目标猕猴桃特征预测模型，若不满足迭代停止条件，则再从更新集中选取R个第二猕猴桃样本作为新的训练样本，对预测模型进行下一轮的迭代更新，直至满足迭代停止条件的情况下得到目标猕猴桃特征预测模型。

示例地，步骤24的实施方式可如图4所示，包括步骤241和步骤242。

步骤241：针对当前更新集中的每一第二猕猴桃样本，分别确定该第二猕猴桃样本与当前训练集中多个训练猕猴桃样本之间的不确定度，并将多个不确定度中的最大值作为该第二猕猴桃样本对应的最大不确定度。

步骤242：将多个所第二猕猴桃样本分别对应的最大不确定度按照降序排序，将排名在前R位的第二猕猴桃样本，作为与训练猕猴桃样本之间的不确定度最高的R个第二猕猴桃样本。

其中，步骤241中分别确定该第二猕猴桃样本与当前训练集中多个训练猕猴桃样本之间的不确定度，包括：

获取该第二猕猴桃样本的预测值，其中，所述预测值包括通过上一次迭代得到的预测模型预测出的该第二猕猴桃样本的预测硬度信息和预测甜度信息；

针对当前训练集中的每一训练猕猴桃样本，根据该第二猕猴桃样本与训练猕猴桃样本之间的离散程度、该第二猕猴桃样本的预测值、预先标注的所述训练猕猴桃样本的参考值，确定该第二猕猴桃样本与训练猕猴桃样本之间的不确定度；

其中，第二猕猴桃样本与训练猕猴桃样本之间的不确定度通过如下公式确定：

其中，表示不确定度，/>表示更新集中的第n个第二猕猴桃样本，/>表示第m个训练猕猴桃样本，/>表示第二猕猴桃样本的预测值，/>表示训练猕猴桃样本的参考值，k表示已从更新集中删除并添加至训练集中的第二猕猴桃样本的数量，N表示更新集中初始的第二猕猴桃样本的数量。

其中，第二猕猴桃样本的预测值，包括通过上一次迭代得到的预测模型预测出的该第二猕猴桃样本的预测硬度信息和预测甜度信息，例如，第一次对预测模型进行迭代更新，第二猕猴桃样本的预测值可以是通过初始的预测模型预测出的第二猕猴桃样本的预测硬度信息和预测甜度信息。每一轮对模型迭代更新，通过更新后的预测模型，对当前更新集中剩余的第二猕猴桃样本的硬度和甜度进行预测，即得到第二猕猴桃样本的预测值，以用于下一轮迭代更新计算不确定度时使用。

近红外光谱主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的，记录的主要是含氢基团X-H(X=C、N、O)振动的倍频和合频吸收。不同团(如甲基、亚甲基，苯环等)或同一基团在不同化学环境中的近红外吸收波长与强度都有明显差别，NIR（Near Infrared，近红外）光谱具有丰富的结构和组成信息，非常适合用于碳氢有机物质的组成与性质测量。但在NIR区域，吸收强度弱，灵敏度相对较低，吸收带较宽且重叠严重。因此，依靠传统的建立工作曲线方法进行定量分析是十分困难的，化学计量学的发展为这一问题的解决奠定了数学基础。其工作原理是，如果样品的组成相同，则其光谱也相同，反之亦然。如果我们建立了光信号、反射率与待测参数之间的对应关系(称为分析模型)，那么，只要测得样品的光信号和反射率，通过模型中的对应关系，就能很快得到所需要的硬度和甜度数据。

为了最大限度地减少形状、颜色、产地变化的影响，提高原始回归模型的泛化能力，采用基于不确定性采样主动学习的模型更新方法来保持回归模型的性能。与完全基于输入空间样本的被动采样技术不同，主动学习需要在每次迭代中学习一个函数，并根据学习到的函数计算预测结果，以在更新集中找到最有利的样本。采用基于不确定性采样的主动学习，其中给出未标记样本池(无参考价值)，目标是依次选择信息量最大的样本。它可以增加输入和输出空间的多样性，扩展训练集集以更新预测模型。在迭代选择样本时，同时考虑了输入(特征)空间和输出(参考值)空间的特征。在输入空间中，根据光谱信息离散程度，选取不确定度值最大的新样本，从而实现了所选样本之间的多样性。一般来说，敏感预测因子的值越多样化，回归系数的确定就越准确。因此，未标记的样本(无参考价值)在输入和输出空间中都与之前选择的样本相距较远，通过查询标签(给出参考价值)进行模型更新。

图5是示例性示出的一种猕猴桃特征检测装置的框图，如图5所示，该装置50可包括：

第一获取模块51，用于获取待检测猕猴桃的表面光信号和表面反射率；

输入模块52，用于将所述待检测猕猴桃的所述表面光信号和所述表面反射率输入至预先训练完成的目标猕猴桃特征预测模型中，得到所述目标猕猴桃特征预测模型输出的所述待检测猕猴桃的特征信息，其中，所述特征信息包括所述待检测猕猴桃的硬度信息和甜度信息；

其中，所述目标猕猴桃特征预测模型是通过图6所示的目标猕猴桃特征预测模型训练装置得到的，如图6所示，该训练装置60包括：

第二获取模块61，用于获取校正集和更新集，其中，所述校正集中包括多个第一猕猴桃样本各自的样本信息，所述更新集中包括多个第二猕猴桃样本各自的样本信息，所述样本信息包括猕猴桃样本的表面光信号、表面反射率、参考硬度和参考甜度，所述校正集中的第一猕猴桃样本与所述更新集中的第二猕猴桃样本之间无交集；

第一确定模块62，用于从所述校正集中确定与所述第二猕猴桃样本之间的相似度最高的M个所述第一猕猴桃样本，并将该M个所述第一猕猴桃样本各自的样本信息添加至训练集中，其中，所述训练集中的样本作为训练猕猴桃样本，M大于1；

建立模块63，用于根据当前训练集中M个所述训练猕猴桃样本各自的样本信息，建立初始的预测模型，其中，所述预测模型为偏最小二乘回归模型，所述预测模型中潜变量数量的值初始为预先确定的波长数量信息；

第二确定模块64，用于从当前更新集中确定与当前训练集中所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本，其中，R大于或等于1；

处理模块65，用于将该R个所述第二猕猴桃样本从所述更新集中删除，并将该R个所述第二猕猴桃样本添加至所述训练集中；

更新模块66，用于根据当前训练集中的所述训练猕猴桃样本对所述预测模型进行迭代更新，并对所述潜变量数量进行更新；

判断模块67，用于根据本次迭代更新得到的所述预测模型，判断是否满足迭代停止条件；

获得模块68，用于若满足，则得到所述目标猕猴桃特征预测模型；

触发模块69，用于若不满足，则触发第二确定模块64重新执行从当前更新集中确定与当前训练集中的所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本至所述判断模块67根据本次迭代更新得到的所述预测模型，判断是否满足迭代停止条件。

可选地，所述第一确定模块62，包括：

第一确定子模块，用于针对所述校正集中的每一所述第一猕猴桃样本，分别确定该第一猕猴桃样本与每一所述第二猕猴桃样本之间的离散程度，并将多个所述离散程度中的最大值作为该第一猕猴桃样本对应的最大离散程度；

第二确定子模块，用于将多个所述第一猕猴桃样本分别对应的所述最大离散程度按照升序排序，将排名在前M位的所述第一猕猴桃样本，作为与所述第二猕猴桃样本之间的相似度最高的M个所述第一猕猴桃样本，其中，两个样本之间的离散程度越低表征两个样本之间的相似度越高。

可选地，所述第一猕猴桃样本与所述第二猕猴桃样本之间的离散程度通过如下公式确定：

其中，表示离散程度，/>表示第i个第一猕猴桃样本的表面光信号，/>，L表示样本的波长数量，/>表示第一猕猴桃样本在第一个波长下的表面光信号，/>表示第一猕猴桃样本在第L个波长下的表面光信号，/>表示第j个第二猕猴桃样本的表面光信号，/>，/>表示第二猕猴桃样本在第一个波长下的表面光信号，/>表示第二猕猴桃样本在第L个波长下的表面光信号，/>表示/>相对于/>的相对熵，/>表示/>相对于/>的相对熵，/>表示第i个第一猕猴桃样本在第l个波长下的表面光信号在第i个第一猕猴桃样本中的所占比重，/>表示第j个第二猕猴桃样本在第l个波长下的表面光信号在第j个第二猕猴桃样本中的所占比重，/>表示第i个第一猕猴桃样本在第l个波长下的表面光信号，/>表示第j个第二猕猴桃样本在第l个波长下的表面光信号。

可选地，所述第二确定模块64，包括：

第三确定子模块，用于针对当前更新集中的每一所述第二猕猴桃样本，分别确定该第二猕猴桃样本与当前训练集中多个所述训练猕猴桃样本之间的不确定度，并将多个所述不确定度中的最大值作为该第二猕猴桃样本对应的最大不确定度；

第四确定子模块，用于将多个所述第二猕猴桃样本分别对应的所述最大不确定度按照降序排序，将排名在前R位的所述第二猕猴桃样本，作为与所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本。

可选地，所述第三确定子模块，包括：

获取子模块，用于获取该第二猕猴桃样本的预测值，其中，所述预测值包括通过上一次迭代得到的所述预测模型预测出的该第二猕猴桃样本的预测硬度信息和预测甜度信息；

第五确定子模块，用于针对当前训练集中的每一所述训练猕猴桃样本，根据该第二猕猴桃样本与所述训练猕猴桃样本之间的离散程度、该第二猕猴桃样本的所述预测值、预先标注的所述训练猕猴桃样本的参考值，确定该第二猕猴桃样本与所述训练猕猴桃样本之间的不确定度；

其中，所述第二猕猴桃样本与所述训练猕猴桃样本之间的所述不确定度通过如下公式确定：

可选地，所述波长数量信息通过如下模块确定：

第三获取模块，用于获取验证集，其中，所述验证集中包括第三猕猴桃样本各自的样本信息，所述校正集中的第一猕猴桃样本与所述验证集中的第三猕猴桃样本之间无交集；

第三确定模块，用于将所述第一猕猴桃样本的样本信息和所述第三猕猴桃样本的样本信息输入至偏最小二乘路径算法中，得到算法输出的波长信息的第一结果；

第四确定模块，用于重新执行所述将所述第一猕猴桃样本的样本信息和所述第三猕猴桃样本的样本信息输入至偏最小二乘路径算法中的步骤，得到算法输出的波长信息的第二结果；

第五确定模块，用于将所述第一结果和所述第二结果中的交集，作为波长的选择结果，并将所述选择结果中波长的数量作为所述波长数量信息。

可选地，所述迭代停止条件包括：

其中，均方根误差通过如下公式确定：

决定系数通过如下公式确定：

本实施例公开了一种可读存储介质，其上存储有程序，所述程序被处理器执行时，实现如上述的猕猴桃特征检测方法的各个步骤。猕猴桃特征检测装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过程序来指令相关的硬件来完成，程序可存储于一可读存储介质中，该程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，程序包括程序代码，程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。可读介质可以包括：能够携带程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)以及软件分发介质等。

本实施例还公开了一种电子设备，包括存储器和处理器，所述存储器用于存储程序，所述处理器用于执行所述程序，以实现上述的猕猴桃特征检测方法的各个步骤。

进一步地，作为一个可执行方案，处理器可以是中央处理单元(CentralProcessing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，处理器是猕猴桃特征检测装置的控制中心，利用各种接口和线路连接整个猕猴桃特征检测装置的各个部分。

存储器可用于存储程序和/或模块，处理器通过运行或执行存储在存储器内的程序和/或模块，以及调用存储在存储器内的数据，实现猕猴桃特征检测方法的各种功能。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据手机的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种猕猴桃特征检测方法，其特征在于，所述方法包括：

获取待检测猕猴桃的表面光信号和表面反射率；

若满足，则得到所述目标猕猴桃特征预测模型；

若不满足，则重新执行所述从当前更新集中确定与当前训练集中所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本的步骤至所述根据本次迭代更新得到的所述预测模型，判断是否满足迭代停止条件的步骤。

2.根据权利要求1所述的方法，其特征在于，所述从所述校正集中确定与所述第二猕猴桃样本之间的相似度最高的M个所述第一猕猴桃样本，包括：

针对所述校正集中的每一所述第一猕猴桃样本，分别确定该第一猕猴桃样本与每一所述第二猕猴桃样本之间的离散程度，并将多个所述离散程度中的最大值作为该第一猕猴桃样本对应的最大离散程度；

将多个所述第一猕猴桃样本分别对应的所述最大离散程度按照升序排序，将排名在前M位的所述第一猕猴桃样本，作为与所述第二猕猴桃样本之间的相似度最高的M个所述第一猕猴桃样本，其中，两个样本之间的离散程度越低表征两个样本之间的相似度越高。

3.根据权利要求2所述的方法，其特征在于，所述第一猕猴桃样本与所述第二猕猴桃样本之间的离散程度通过如下公式确定：

其中，表示离散程度，/>表示第i个第一猕猴桃样本的表面光信号，，L表示样本的波长数量，/>表示第一猕猴桃样本在第一个波长下的表面光信号，/>表示第一猕猴桃样本在第L个波长下的表面光信号，/>表示第j个第二猕猴桃样本的表面光信号，/>，/>表示第二猕猴桃样本在第一个波长下的表面光信号，/>表示第二猕猴桃样本在第L个波长下的表面光信号，/>表示/>相对于/>的相对熵，/>表示/>相对于/>的相对熵，/>表示第i个第一猕猴桃样本在第l个波长下的表面光信号在第i个第一猕猴桃样本中的所占比重，/>表示第j个第二猕猴桃样本在第l个波长下的表面光信号在第j个第二猕猴桃样本中的所占比重，/>表示第i个第一猕猴桃样本在第l个波长下的表面光信号，/>表示第j个第二猕猴桃样本在第l个波长下的表面光信号。

4.根据权利要求1所述的方法，其特征在于，所述从当前更新集中确定与当前训练集中所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本，包括：

针对当前更新集中的每一所述第二猕猴桃样本，分别确定该第二猕猴桃样本与当前训练集中多个所述训练猕猴桃样本之间的不确定度，并将多个所述不确定度中的最大值作为该第二猕猴桃样本对应的最大不确定度；

将多个所述第二猕猴桃样本分别对应的所述最大不确定度按照降序排序，将排名在前R位的所述第二猕猴桃样本，作为与所述训练猕猴桃样本之间的不确定度最高的R个所述第二猕猴桃样本。

5.根据权利要求4所述的方法，其特征在于，所述分别确定该第二猕猴桃样本与当前训练集中多个所述训练猕猴桃样本之间的不确定度，包括：

获取该第二猕猴桃样本的预测值，其中，所述预测值包括通过上一次迭代得到的所述预测模型预测出的该第二猕猴桃样本的预测硬度信息和预测甜度信息；

针对当前训练集中的每一所述训练猕猴桃样本，根据该第二猕猴桃样本与所述训练猕猴桃样本之间的离散程度、该第二猕猴桃样本的所述预测值、预先标注的所述训练猕猴桃样本的参考值，确定该第二猕猴桃样本与所述训练猕猴桃样本之间的不确定度；

6.根据权利要求1所述的方法，其特征在于，所述波长数量信息通过如下方式确定：

获取验证集，其中，所述验证集中包括第三猕猴桃样本各自的样本信息，所述校正集中的第一猕猴桃样本与所述验证集中的第三猕猴桃样本之间无交集；

将所述第一猕猴桃样本的样本信息和所述第三猕猴桃样本的样本信息输入至偏最小二乘路径算法中，得到算法输出的波长信息的第一结果；

重新执行所述将所述第一猕猴桃样本的样本信息和所述第三猕猴桃样本的样本信息输入至偏最小二乘路径算法中的步骤，得到算法输出的波长信息的第二结果；

将所述第一结果和所述第二结果中的交集，作为波长的选择结果，并将所述选择结果中波长的数量作为所述波长数量信息。

7.根据权利要求1所述的方法，其特征在于，所述迭代停止条件包括：

其中，均方根误差通过如下公式确定：

决定系数通过如下公式确定：

8.一种猕猴桃特征检测装置，其特征在于，所述装置包括：

9.一种可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时，实现如权利要求1-7中任一项所述方法的步骤。

10.一种电子设备，包括存储器和处理器，其特征在于，所述存储器用于存储程序，所述处理器用于执行所述程序，以实现如权利要求1-7中任一项所述方法的步骤。