CN111160667B

CN111160667B - 一种提高食品安全预测模型鲁棒性的方法及装置

Info

Publication number: CN111160667B
Application number: CN202010002332.9A
Authority: CN
Inventors: 金学波; 张家辉; 余兴泓; 白玉廷; 孔建磊; 苏婷立
Original assignee: Beijing Technology and Business University
Current assignee: Beijing Technology and Business University
Priority date: 2020-01-02
Filing date: 2020-01-02
Publication date: 2023-05-30
Anticipated expiration: 2040-01-02
Also published as: CN111160667A

Abstract

本发明提出了一种提高食品安全预测模型鲁棒性的方法，所述方法包括：获取食品中待检测危害物的含量数据；根据所述待检测危害物的含量数据进行增大噪声处理，模拟噪声方差的增大，获取增大噪声方差的数据；在增大噪声处理后获得的数据的基础上添加突变点，模拟添加数据的突变，获取添加突变的数据；搭建至少一个食品安全预测模型，并通过所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据对所述至少一个食品安全预测模型进行训练，筛选出性能最优的食品安全预测模型。本发明通过科学的数据处理模拟了实际危害物测量环节的测量噪声及错误，训练出的模型在实际应用中拥有更好的鲁棒性。

Description

一种提高食品安全预测模型鲁棒性的方法及装置

技术领域

本申请涉及食品安全检测领域，尤其涉及一种提高食品安全预测模型鲁棒性的方法及装置。

背景技术

因为物联网技术的发展，人们可以获得食品供应链中越来越多的信息，再加上机器学习与人工神经网络的发展，食品供应链风险的预警变为现实，越来越多的食品安全预测模型出现。但这些食品安全预测模型有很大的潜在风险。

机器学习模型可以帮助人们做出预测和决策制定，在自动驾驶、股票走势、天气预报等领域广泛应用，机器学习模型的性能决定了每次预测效果，实际应用中模型的性能不好可能会带来灾难性的后果。在食品安全预测领域，实际测量的食品危害物含量可能因为传感器性能、读数错误、仪器损坏等原因，不可避免会出现测量噪声及错误的情况，如果模型的容错率太低而造成危害物含量的错误预测，那么结果不堪设想。正因为食品安全监测对准确率的要求极为严格，所以真的将这些机器学习模型预测方法运用到实际的食品安全检测时，提高机器学习模型的鲁棒性就成为一个极为关键的环节，但目前对于机器学习模型的鲁棒性问题研究还存在一定的空白。

发明内容

为解决上述技术问题之一，本发明提供了一种提高食品安全预测模型鲁棒性的方法及装置。

本发明实施例第一方面提供了一种提高食品安全预测模型鲁棒性的方法，所述方法包括：

获取食品中待检测危害物的含量数据；

根据所述待检测危害物的含量数据进行增大噪声处理，模拟噪声方差的增大，获取增大噪声方差数据；

在增大噪声处理后获得的数据的基础上添加突变点，模拟添加数据的突变，获取添加突变数据；

搭建至少一个食品安全预测模型，并通过所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据对所述至少一个食品安全预测模型进行训练，筛选出性能最优的食品安全预测模型。

优选地，所述根据所述待检测危害物的含量数据进行增大噪声处理，模拟噪声方差的增大，获取增大噪声方差数据的过程包括：

根据所述待检测危害物的浓度数据获取食品中待检测危害物在各个加工阶段的危害物衰减率；

根据所述危害物衰减率，添加高斯白噪声模拟实际的测量噪声，并增大数据的噪声方差，获取增大噪声方差数据。

优选地，所述搭建至少一个食品安全预测模型，并通过所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据对所述至少一个食品安全预测模型进行训练，筛选出性能最优的食品安全预测模型的过程包括：

将所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据分别划分为训练集和测试集；

通过所述训练集和测试集分别对所述食品安全预测模型进行测试，获得测试结果；

计算所述测试结果的均方根误差，根据所述测试结果的均方根误差筛选出性能最优的食品安全预测模型。

优选地，所述搭建至少一个食品安全预测模型，并通过所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据对所述至少一个食品安全预测模型进行训练，筛选出性能最优的食品安全预测模型的过程还包括：

在通过所述训练集和测试集分别对所述食品安全预测模型进行测试获得测试结果之后，对所述测试结果进行多源信息融合获得融合数据；

计算所述融合数据的均方根误差，根据所述融合数据的均方根误差筛选出性能最优的食品安全预测模型。

优选地，所述对所述测试结果进行多源信息融合获得融合数据的过程包括：对所述测试结果分别进行取平均、加权平均和CI融合获得融合数据。

本发明实施例第二方面提供了一种提高食品安全预测模型鲁棒性的装置，所述装置包括处理器，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

获取食品中待检测危害物的含量数据；

优选地，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

根据所述危害物衰减率，添加高斯白噪声模拟实际的测量噪声，并增大噪声方差，获取增大噪声方差数据。

优选地，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：对所述测试结果分别进行取平均、加权平均和CI融合获得融合数据。

本发明的有益效果如下：本发明通过科学的数据处理模拟了实际危害物测量环节的测量噪声及错误，训练出的模型在实际应用中拥有更好的鲁棒性。通过本发明得到的食品安全预测模型，在实际的食品安全检测中更加适用，尤其是在应对噪声大、出现测量错误等问题概率较大的预测任务中会有更好的效果。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本发明实施例1所述的一种提高食品安全预测模型鲁棒性的方法的流程图。

具体实施方式

为了使本申请实施例中的技术方案及优点更加清楚明白，以下结合附图对本申请的示例性实施例进行进一步详细的说明，显然，所描述的实施例仅是本申请的一部分实施例，而不是所有实施例的穷举。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。Huber从稳健统计的角度系统地给出的鲁棒性3个层面概念：预测模型具有较高的精度或有效性；对于模型假设出现的较小偏差(如噪声)，只能对算法性能产生较小的影响；对于模型假设出现的较大偏差(如离群点)，不可对算法性能产生“灾难性”的影响。本发明根据Huber给出的鲁棒性3层概念，针对机器学习模型在食品安全预测的工作中鲁棒性较差的问题提出一种提高食品安全预测模型鲁棒性的方法及装置。

实施例1

如图1所示，本实施例提出了一种提高食品安全预测模型鲁棒性的方法，所述方法包括：

S101、获取食品中待检测危害物的含量数据，根据所述待检测危害物的含量数据进行增大噪声处理，模拟噪声方差的增大，获取增大噪声方差数据。

具体的，本实施例中，首先通过传感器等手段获得食品供应链中的各个阶段的待检测危害物的含量数据。在获得最后一个阶段的待检测危害物的含量数据之后，根据供应链各阶段危害物的检测值计算待检测危害物在各个加工阶段的危害物衰减率：

A＝{a₁,a₂,L,a_i}

其中，A为供应链中危害物衰减率，a_i为第i个加工环节的危害物衰减率， X_i为第i个加工阶段危害物浓度，X_i+1为第i+1个加工阶段的危害物浓度。

由于实际危害物含量检测中，传感器的测量噪声主要包括散粒噪声、热噪声、低频噪声等，其中受散粒噪声、热噪声的影响较大，同时考虑到这两种噪声都是白噪声，本实施例根据各阶段的危害物衰减率，通过添加高斯白噪声的方式模拟实际的测量噪声：

x_i-1＝(1+a_i)×x_i+q×randn(1)

其中，x_i为各阶段危害物含量，a_i为数据衰减率，q为过程噪声方差，randn(1) 用来产生取值范围(0,1)内符合标准正态分布的随机数。

通过增大过程噪声方差q来模拟更大的传感器测量噪声方差，从而获取增大噪声方差数据。

S102、在增大噪声处理后获得的数据的基础上添加突变点，模拟添加数据的突变，获取添加突变数据。

具体的，在获得增大噪声方差数据之后，考虑到实际测量时可能会出现错误操作、读数错误、传感器损坏的情况，随机在数据中添加一定的突变点：

x_i＝k×x_i

其中，x_i为各阶段危害物含量，k为突变倍数。

通过上述S101和S102的过程最终获得待检测危害物的含量数据、增大噪声方差数据和添加突变数据。

S103、搭建至少一个食品安全预测模型，并通过所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据对所述至少一个食品安全预测模型进行训练，筛选出性能最优的食品安全预测模型。

具体的，本实施例搭建食品安全预测模型的过程是基于Keras Tensorflow 框架搭建LSTM、GRU模型。当然，本实施例不限定采用其他方式搭建食品安全预测模型，只要能应用至本实施例所提出的方法中即可。

LSTM是长短期记忆网路，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。

LSTM算法伪代码：

输入：训练数据集

输出：预测数据H

(1)对数据集进行归一化

(2)模型对训练数据进行学习

learnHbased on D

return H

GRU是LSTM的一个变体，较LSTM模型而言，一般效果更好。

GRU算法伪代码：

(1)对数据集进行归一化

(2)模型对训练数据进行学习

Learn Hbased on D

return H

本实施例中，首先将获取的待检测危害物的含量数据、增大噪声方差数据和添加突变数据分别划分为训练集和测试集。然后通过训练集和测试集分别对上述LSTM、GRU两个模型进行测试，获得测试结果。最后计算测试结果的均方根误差。通过该均方差根误差来评估训练结果：

其中，m为样本数，y_i为实际值，

为预测值。

将采用训练集和测试集对LSTM、GRU两个模型进行测试获得的均方根误差中最小值标记为Model1。

通过上述方式即可筛选出性能最优的食品安全预测模型，即均方根误差更小的则为最优的。本实施例为了更加准确且科学的筛选出性能最优的食品安全预测模型，在通过训练集和测试集分别对LSTM、GRU两个模型进行测试获得测试结果之后，对测试结果进行多源信息融合获得融合数据。该多源信息融合包括取平均、加权平均和CI融合。

取平均：

其中，x′为融合结果，y_L为LSTM模型预测结果，y_G为GRU模型预测结果。加权平均：

其中，x”为融合结果，R₁为LSTM模型预测结果方差，R₂为GRU模型预测结果方差。

CI融合算法：

其中，权系数ω∈[0,1]，P_aa为方差阵，P_bb为方差阵，P_cc为协方差阵，x”′为融合结果。

将上述取平均、加权平均和CI融合三种方式获得的融合数据进行计算求取均方根误差，标记为Model2。

最后，比较Model1和Model2的均方根误差，选择均方根误差最小的一种模型作为预测的首选模型。

选取规则为：

(1)比较LSTM、GRU模型的性能得到Model1。

(2)比较使用取平均、加权平均和CI融合得到的模型性能得到Model2。

(3)比较Model1和性能Model2得到首选模型。

为了更好的验证本实施例所提出的方法的可靠性，下面结合两个实例进行阐述。

实例1

利用搭建的食品安全预测模型，进行前6环节(x₁～x₆)危害物含量预测后5环节(x₇～x₁₁)危害物含量数据。

首先对实验所用数据进行说明，本实验使用的数据来自于小麦粉供应链，分别采集小麦粉供应链中脱氧雪腐镰刀菌烯醇(DON)、铅、镉三种危害物的含量。以DON为例，其供应链如表1所示，该供应链共有清理、润麦、加工1 等10个环节，假设原粮中污染物含量为X₁，则仓储环节检测到的污染物为X₁₁。首先采集到仓储环节X₁₁的DON、铅、镉危害物含量，其中DON 396组、铅1061 组、镉2057组，数据格式分别为(396,1)、(1061,1)、(2057,1)。

其次根据表2展示各环节危害物浓度按照步骤S101计算危害物衰减率，并添加原噪声方差，科学模拟实际危害物测量值。表1展示模拟的原始数据具体情况，最终原方差数据DON、铅、镉数据格式分别为(396,11)、(1061,11)、 (2057,11)。

表1

之后按照表1中“拟修改后的噪声方差”分别增大原始数据DON、铅、镉三种危害物的噪声方差，表2展示修改噪声方差后的小麦粉危害物含量情况。

表2

再对增加过噪声的数据进行部分随机突变处理，增加突变点的数据位置及大小设计原则如下：

(1)每一个数据的突变概率设为0.05；(设置依据：目前的数据为每一个样本11个数，该突变概率意味着每两条样本中平均有一个突变。)

(2)铅、镉数据突变的值以等概率(P＝1/5)取如下5个数值中的一个：当前数据的2、3、4、0.5、0.1倍；DON数据取如下5个数值中的一个：当前数据的0.1、0.2、0.3、0.4、0.5倍。(设置依据：如果数据采集时我们发现特别大的奇异值的话，一般会舍去重测，但是当前数据的几倍时是无法判断是否可以舍去的。考虑DON数据的量纲小数值大，适当缩小DON危害物数据突变倍数)

最终DON、铅、镉危害物数据分别产生198、576、1129个突变点，增大方差数据基础上添加突变点的数据细节如表3展示。

表3

处理好数据之后接下来进行数据划分，需要将原数据、增大方差数据、增大方差并添加突变点数据进行划分。划分DON、铅、镉污染物数据训练集和测试集，其中训练集格式分别为(300,6)、(861,6)、(1857,6)，标签分别为(300,5)、(861,5)、(1857,5)。测试集格式分别为(96,6)、(200,6)、 (200,6)，标签分别为(96,5)、(200,5)、(200,5)。其中训练集标签主要用于调整训练过程中模型各神经元权重与偏差，测试集标签用于检验预测结果。

分别使用原数据、增大噪声方差数据、添加突变数据训练食品安全预测模型，LSTM模型和GRU模型均迭代1200次，选择随机梯度下降(SGD)优化器，损失函数为平均绝对误差(mae)，损失函数完全收敛则训练完成。表3为DON 危害物原数据迭代1200次的GRU模型损失图，可见损失函数并没有完全收敛，增大训练次数至1500代。使用测试集对所得模型进行测试(由于铅、镉数据较小，所以训练时铅、镉危害物含量数据均放大1000倍)。表4、表5、表6分别为原数据、增大噪声数据、添加突变数据进行前6环节预测后5环节训练及预测细节，其中DON数据危害物的量纲为ug/kg，铅危害物数据量纲为mg/kg (数据放大1000倍后变为ug/kg)，镉危害物数据量纲为mg/kg(数据放大1000 倍后变为ug/kg)。

表4、表5、表6分别为危害物DON、铅、镉数据前6环节预测后5环节预测结果。根据结果，增大噪声方差数据后训练出的模型在准确度方面表现与原数据训练出的模型差距并不大。而添加突变数据训练出的模型较原方差数据训练的模型，其预测准确度有较大的下滑。其中铅危害物预测模型受突变点影响较大，其GRU预测模型的预测均方根误差增大14.01倍；DON危害物与镉危害物预测模型受突点变影响较小，但由于DON危害物数据的模拟值跨度较大，最大达到63916.2827071564ug/kg，最小为0ug/kg，所以DON危害物LSTM预测模型均方差误差最大为166.6654ug/kg。但是根据DON、铅、镉在食品中正常含量范围规定(DON要小于1000ug/kg，铅含量小于0.2mg/kg，镉含量小于 0.040mg/kg)，所得结果的误差仍在允许范围内，所以模型依旧可以使用，而且从最终的均方根误差看GRU模型的表现明显优于LSTM模型的结果。表7为部分添加突变的DON危害物数据LSTM、GRU模型预测结果及真实值，分别展示了LSTM、GRU模型预测结果其中的10组数据的预测结果共50个数据点，从表中可见绝大多数GRU模型的结果比LSTM模型要好，进一步说明GRU模型在前6 预测后5环节实验中表现更好。

使用取平均、加权平均、CI融合算法三种方式对LSTM、GRU两种模型的结果进行融合。以表6中LSTM模型预测DON含量结果与GRU模型预测DON含量结果为例，取平均均方根误差为160.3983ug/kg，加权平均均方根误差为 160.2517ug/kg，CI融合均方根误差为154.653874ug/kg，融合结果表明，LSTM 虽然有些预测结果比GRU模型更好，但比重很小，同样说明GRU模型在前6预测后5环节实验中表现更好，并且得到了性能更好的CI融合后的模型。

根据本实施例最后的选取规则，以添加突变点的DON危害物数据训练及融合结果为例，由于训练得到的GRU模型均方根误差最小，所以该模型为Model1， Model2为进行CI融合后的模型，经过比较Model2的性能更好，所以最终得到小麦粉食品供应链前6环节预测后5环节DON危害物含量的最优预测模型 Model2。

表4

表5

/>

表6

实验结果表明：在模型进行前6个环节危害物含量预测后5个环节危害物含量的任务中，使用增加传感器噪声数据及添加突变点数据，尽管会对模型的预测性能有所影响，但模型仍然可用，同时可以达到提高食品安全预测模型的鲁棒性的效果，并且在使用多源数据融合方法后会进一步提高模型性能。

实例2

利用搭建的食品安全预测模型，进行第4环节危害物含量预测第5环节危害物含量数据。

首先进行数据说明，数据处理过程同实例1，数据划分时使用x₄数据作为训练集，x₅数据作为标签。划分DON、铅、镉污染物数据训练集和测试集，其中训练集格式分别为(300,1)、(861,1)、(1857,1)，标签分别为(300,1)、 (861,1)、(1857,1)。测试集格式分别为(96,1)、(200,1)、(200,1)，标签分别为(96,1)、(200,1)、(200,1)。

分别使用原数据、增大噪声方差数据、添加突变点数据训练食品安全预测模型，(由于铅、镉数据较小，所以训练时铅、镉危害物含量数据均放大1000 倍)。表7、表8、表9分别为原方差、增大方差数据、增大方差并添加突变点数据第4环节预测第5环节训练及预测细节，所有模型训练1200次，由于 DON危害物增大噪声方差数据、添加突变数据训练迭代1200次并没有使目标函数收敛，增加训练迭代次数至1500次。

表7、表8、表9分别为危害物DON、铅、镉测试集在训练好的LSTM、 GRU预测模型下的预测结果。根据结果，1对1进行预测的效果要比6对5预测要差很多，这是由于模型在学习中并没有很好地学习到数据的规律。所有均方根误差的量纲为ug/kg，原方差、增大噪声方差数据训练出的铅、镉预测模型性能相差并不是很大，均方根误差最大为2.9314ug/kg，因为DON危害物数据规律太过复杂，导致两种DON预测模型的均方根误差较大，添加噪声数据训练出的模型均方根误差达到229.8378ug/kg。但与实例1相同，添加突变数据训练得到的模型虽然比原方差数据、增大方差数据训练得到的模型准确率低一些，但是模型依旧可以使用。从训练及预测结果上看在第4环节预测第5环节实验中，GRU模型稍好于LSTM模型。

对结果进行取平均、加权平均、CI融合，以添加突变的DON危害物数据为例，LSTM模型均方差误差为229.1615ug/kg，GRU模型均方根误差为 226.6161ug/kg，取平均的融合结果为227.0172ug/kg，加权平均的结果为227.0101ug/kg，CI融合结果为218.303475ug/kg，进一步说明GRU模型的性能更好，同时得到了CI融合后性能更好的模型。

根据本实施例最终的选取规则，以添加突变的DON危害物数据训练及融合结果为例，Model1为GRU模型，Model2为CI融合后的模型，经比较最终得到小麦粉食品供应链第4环节预测第5环节DON危害物含量的最优预测模型 Model2。

表7

表8

表9

结果分析：通过实例1、实例2可以得到，虽然通过科学模拟的到的增大方差数据、增加突变点数据训练出的模型会在预测准确度上略有下降，但预测误差仍在允许范围内，所以模型仍然可用，并且通过加大噪声、增加突变的方式可达到提高食品安全预测模型的鲁棒性的目的。

实施例2

对应实施例1，本实施例还提出了一种提高食品安全预测模型鲁棒性的装置，所述装置包括处理器，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

获取食品中待检测危害物的含量数据；

根据所述待检测危害物的含量数据进行增大噪声处理，模拟噪声方差的增大，获取增大噪声方差的数据；

在增大噪声处理后获得的数据的基础上添加突变点，模拟添加数据的突变，获取添加突变的数据；

其中，本实施例所提出的装置中所涉及的工作原理和计算过程可参照实施例1所记载的内容，本实施例不再进行赘述。本实施例根据Huber给出的鲁棒性3层概念，通过科学计算模拟食品供应链中实际危害物测量数据的测量噪声及错误，使用该模拟数据对预测模型进行训练，使预测模型适应这种实际中可能出现的噪声、突变等情况。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种提高食品安全预测模型鲁棒性的方法，其特征在于，所述方法包括：

获得食品供应链中的各个阶段的待检测危害物的含量数据；

搭建至少一个食品安全预测模型，并通过所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据对所述至少一个食品安全预测模型进行训练，筛选出性能最优的食品安全预测模型；

所述根据所述待检测危害物的含量数据进行增大噪声处理，模拟噪声方差的增大，获取增大噪声方差数据的过程包括：

在获得最后一个阶段的待检测危害物的含量数据之后，根据供应链各阶段危害物的检测值计算待检测危害物在各个加工阶段的危害物衰减率；

根据各阶段的危害物衰减率，添加高斯白噪声模拟实际的测量噪声，并增大噪声方差模拟数据的噪声，获取增大噪声方差数据。

2.根据权利要求1所述的方法，其特征在于，所述搭建至少一个食品安全预测模型，并通过所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据对所述至少一个食品安全预测模型进行训练，筛选出性能最优的食品安全预测模型的过程包括：

3.根据权利要求2所述的方法，其特征在于，所述搭建至少一个食品安全预测模型，并通过所述待检测危害物的含量数据、增大噪声方差数据和添加突变数据对所述至少一个食品安全预测模型进行训练，筛选出性能最优的食品安全预测模型的过程还包括：

4.根据权利要求3所述的方法，其特征在于，所述对所述测试结果进行多源信息融合获得融合数据的过程包括：对所述测试结果分别进行取平均、加权平均和CI融合获得融合数据。

5.一种提高食品安全预测模型鲁棒性的装置，其特征在于，所述装置包括处理器，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

获取食品供应链中的各个阶段的待检测危害物的含量数据；

根据各阶段的危害物衰减率，添加高斯白噪声模拟实际的测量噪声，并增大噪声方差模拟数据的噪声，获取增大噪声方差数据；

6.根据权利要求5所述的装置，其特征在于，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

7.根据权利要求6所述的装置，其特征在于，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

8.根据权利要求7所述的装置，其特征在于，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：对所述测试结果分别进行取平均、加权平均和CI融合获得融合数据。