CN115392618A - 一种基于ahp-ew和ae-rnn融合的食品安全风险预警模型及其建立方法 - Google Patents
一种基于ahp-ew和ae-rnn融合的食品安全风险预警模型及其建立方法 Download PDFInfo
- Publication number
- CN115392618A CN115392618A CN202210508457.8A CN202210508457A CN115392618A CN 115392618 A CN115392618 A CN 115392618A CN 202210508457 A CN202210508457 A CN 202210508457A CN 115392618 A CN115392618 A CN 115392618A
- Authority
- CN
- China
- Prior art keywords
- risk
- rnn
- food safety
- early warning
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000013305 food Nutrition 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 71
- 230000004927 fusion Effects 0.000 title claims abstract description 21
- 238000001514 detection method Methods 0.000 claims abstract description 65
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000012360 testing method Methods 0.000 claims abstract description 7
- 239000002131 composite material Substances 0.000 claims abstract description 4
- 238000012502 risk assessment Methods 0.000 claims description 17
- 235000013336 milk Nutrition 0.000 claims description 10
- 239000008267 milk Substances 0.000 claims description 10
- 210000004080 milk Anatomy 0.000 claims description 10
- 235000013365 dairy product Nutrition 0.000 claims description 9
- 235000013861 fat-free Nutrition 0.000 claims description 8
- 239000007787 solid Substances 0.000 claims description 8
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 claims description 7
- 239000008101 lactose Substances 0.000 claims description 7
- 102000004169 proteins and genes Human genes 0.000 claims description 7
- 108090000623 proteins and genes Proteins 0.000 claims description 7
- 229930195730 Aflatoxin Natural products 0.000 claims description 6
- 239000005409 aflatoxin Substances 0.000 claims description 6
- XWIYFDMXXLINPU-UHFFFAOYSA-N Aflatoxin G Chemical compound O=C1OCCC2=C1C(=O)OC1=C2C(OC)=CC2=C1C1C=COC1O2 XWIYFDMXXLINPU-UHFFFAOYSA-N 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 claims description 2
- 238000002203 pretreatment Methods 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 abstract description 20
- 238000004422 calculation algorithm Methods 0.000 abstract description 11
- 238000011156 evaluation Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 235000020191 long-life milk Nutrition 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000003344 environmental pollutant Substances 0.000 description 3
- 231100000719 pollutant Toxicity 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013058 risk prediction model Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 231100000678 Mycotoxin Toxicity 0.000 description 1
- 239000002108 aflatoxin M1 Substances 0.000 description 1
- 229930073161 aflatoxin M1 Natural products 0.000 description 1
- MJBWDEQAUQTVKK-IAGOWNOFSA-N aflatoxin M1 Chemical compound C=1([C@]2(O)C=CO[C@@H]2OC=1C=C(C1=2)OC)C=2OC(=O)C2=C1CCC2=O MJBWDEQAUQTVKK-IAGOWNOFSA-N 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 235000021393 food security Nutrition 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002636 mycotoxin Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 235000020185 raw untreated milk Nutrition 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000013349 risk mitigation Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明为一种基于AHP‑EW和AE‑RNN融合的食品安全风险预警模型及其建立方法。一种基于AHP‑EW和AE‑RNN融合的食品安全风险预警模型的建立方法,包括:(1)对检测数据进行预处理后,使用AHP‑EW方法,获得各检测指标的权重占比;(2)通过与检测数据的加权求和获得产品样本的综合风险值,将其作为AE‑RNN网络的期望输出;(3)对检测数据进行训练集和测试集的划分,调试AE‑RNN的网络参数进行网络训练,由此建立所述的食品安全风险预警模型。本发明所述的一种基于AHP‑EW和AE‑RNN融合的食品安全风险预警模型及其建立方法,基于熵权的层次分析法(AHP‑EW)和自编码器‑循环神经网络(AE‑RNN)的算法框架,对于避免食品安全事故的发生具有积极的意义。
Description
技术领域
本发明具体涉及一种基于AHP-EW和AE-RNN融合的食品安全风险预警 模型及其建立方法。
背景技术
食品安全是评价一个国家民生发展的重要指标。近年来食品污染问题 频发,民众对于食品安全的信任危机问题愈加严重,大规模的食品污染物 将会引起严重的公共卫生事件,不仅对民众的健康造成极大的威胁,对社 会和经济也有着深远的影响。为了防止食品安全事件的再次发生,监管机 构应当使用科学的数据分析工具对食品进行风险评估和预测来确保安全食 品的供应。
有鉴于此,本发明提出一种新的食品安全风险预警模型,基于熵权的 层次分析法(AHP-EW)和自编码器-循环神经网络(AE-RNN)相结合,查验 影响食品安全的污染物因素和营养素因素,实现精准的食品综合风险值预 测。
发明内容
本发明的目的在于提供一种基于AHP-EW和AE-RNN融合的食品安全风 险预警模型的建立方法,基于熵权的层次分析法(AHP-EW)和自编码器-循 环神经网络(AE-RNN)的算法框架,对于避免食品安全事故的发生具有积 极的意义。
为了实现上述目的,所采用的技术方案为:
一种基于AHP-EW和AE-RNN融合的食品安全风险预警模型的建立方法, 包括以下步骤:
(1)对检测数据进行预处理后,使用AHP-EW方法,获得各检测指标 的权重占比;
(2)通过与检测数据的加权求和获得产品样本的综合风险值,将其作 为AE-RNN网络的期望输出;
(3)对检测数据进行训练集和测试集的划分,调试AE-RNN的网络参 数进行网络训练,由此建立所述的食品安全风险预警模型。
进一步的,所述的建立方法还包括步骤(4)风险预测环节:将建立的 所述的食品安全风险预警模型对新的检测样本进行风险预测,通过风险评 估环节获得的初始风险值确定风险预警的区间,筛选出不合格样本和超过 高风险值门槛的合格样本。
进一步的,所述的食品安全风险预警模型用于乳制品检测。
再进一步的,所述的检测数据包括:乳糖、酸度、非脂乳固体、脂肪、 蛋白质、黄曲霉素。
所述的非脂乳固体、脂肪、蛋白质的数据的预处理方法为:
进一步的,所述的步骤(2)中,采用熵权法与层次分析法相结合将各 指标检测数据进行融合,获得综合风险值。
与现有技术相比,本发明的有益效果在于:
本文提出了一种融合基于熵权的层次分析法(AHP-EW)和自编码器-循 环神经网络(AE-RNN)的算法框架,具体的:首先使用AHP-EW方法获得各 检测指标的权重占比;再通过与检测数据的加权求和获得产品样本的综合 风险值,将其作为AE-RNN网络的期望输出;最后构建AE-RNN网络用来预 测未知产品的综合风险值,并根据风险值进行详细风险分析并采取管控措 施。本发明将这一方法应用于中国某乳制品品牌的检测数据进行实例验证,通过与反向传播算法(BP)、长短时记忆网络(LSTM)、基于注意力机制的 LSTM(LSTM-Attention)三个模型的性能比较。本发明使用的AE-RNN模型收 敛时间更短,数据预测更为准确,实验数据的均方根误差(RMSE)仅为0.004, 具有一定的可行性,有助于完善中国食品安全的监管体系,避免食品安全 事件的发生。
附图说明
图1为本发明提出的基于APH-EW融合AE-RNN的风险预警系统流程图;
图2为自编码器结构示意图;
图3为RNN结构示意图;
图4为AE-RNN总体结构示意图;
图5为各检测指标权重占比图;
图6为四种神经网络的拟合曲线图;
图7为四种神经网络预测值相对误差的箱线图;
图8为2021年10月样本的风险值。
具体实施方式
为了进一步阐述本发明一种基于AHP-EW和AE-RNN融合的食品安全风 险预警模型及其建立方法,达到预期发明目的,以下结合较佳实施例,对 依据本发明提出的一种基于AHP-EW和AE-RNN融合的食品安全风险预警模 型及其建立方法,其具体实施方式、结构、特征及其功效,详细说明如后。 在下述说明中,不同的“一实施例”或“实施例”指的不一定是同一实施 例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式 组合。
下面将结合具体的实施例,对本发明一种基于AHP-EW和AE-RNN融合 的食品安全风险预警模型及其建立方法做进一步的详细介绍:
保障食品安全的基础是根据食品检测数据进行科学合理的风险分析, 为了充分挖掘食品检测数据的内在特征和联系,早期研究者尝试使用数理 统计、情报学等方法对食品数据进行风险评价,例如控制图分析(QIN等, 2004)、基于关联规则挖掘(GU等,2011)、信号分析(BAI,2014),然而这 些方法只能对食品安全进行状态上的预测,无法进行具体的风险量化。
为了对食品数据进行更深层次的风险分析,食品安全风险的评价预警 方法在不断地发展与完善,比如基于数理统计学方法的贝叶斯建模 (BOUZEMBRAK等,2016),模糊综合评价法(SHEN等),灰度关联分析法 (LIN等,2019)和基于人工神经网络的方法。具体而言,BOUZEMBRAK等人 使用构建的贝叶斯模型对食品欺诈报告进行分类判断食品欺诈类型(BOUZEMBRAK等,2016);Shen等人使用基于粗糙集理论的权重确定方法与 常规的模糊综合评价方法相结合(SHEN等),提出并建立进出口食品风险综 合评价模型;Lin等人提出了一种基于灰色关联分析(GRA)的改进解释结 构建模(ISM)方法,对食品安全影响因素进行层次分析(LIN等,2019)。
然而基于统计的建模方法都在一定程度上依赖专家经验,缺乏一定的 客观性;且食品检测数据具有高维度和高复杂性等特点,基于统计分析的 回归预测效果并不稳定。而人工神经网络(ANN)作为一种并行分布式信 息处理结构,具有灵活快速的学习算法、多样的网络拓扑结构和高 容错性等特性,被人们看作是强大的数据分析工具(HUANG等,2007)。基于ANN高效、准确地处理复杂数据的潜在能力,许多学者将相关网 络应用到食品安全风险的预测中,Zhang等人构建了基于反向传播(BP)神 经网络的食品安全预警模型并进行了初步应用验证(ZHANG等,2010),但 他们的工作只能对月度食品数据进行整体的风险评估,而不能精准到单个 样本上;而且BP算法收敛速度慢,作为一种局部搜索的优化方法,其训练 过程容易陷入局部最优值(YONGMING HAN等,2019)。Mao等人提出了一个 基于长短时记忆网(LSTM)和区块链结合的食品供应链信用评估系统评估食 品安全质量状态(MAO等,2018),然而这一系统仅能进行食品安全状态“阴 性”“阳性”上的预测,缺少更深层次的风险分析。Geng等人提出了一 种基于深度径向基函数(DRBF)神经网络用于构建食品安全风险预 警模型(GENG等,2019),之后又使用LSTM网络和数据模糊化转换的方法 相结合,将食品各检测指标的数据融合得到综合风险值对食品风险做出预 警(GENG等,2021)。但是这两个模型各自存在着缺陷,对于前者使用 的RBF网络而言,其隐藏层中心位置数据获取使用的k均值聚类方 法随机确定原始聚类中心,使得聚类结果随初始位置而变动,容易 陷入局部最优解。而后者使用的数据模糊化算法由于设置数据间隔, 后期追溯高风险指标无法精准定位单个问题样本,需查验多个检测 样本进行筛选确定,给后期风险定位工作带来了不必要的麻烦,造 成了监管资源的浪费;并且对于更大量级的数据或更长的序列,LSTM的 性能依然是个棘手的问题。
作为对比,本发明将自编码器用于深度神经网络的预训练,获得数据 的高效表示,弥补了以往使用的ANN模型对于复杂数据在性能上的不足。 RNN不同于BP、RBF等标准神经网络,它允许隐层神经元的输出反馈作为神 经元的输入,通过这种方式具有了记忆功能,对于以时间序列进行训练的 食品检测数据能够表现出更好的预测性能,解决了上述模型因易陷入局部 最优解导致泛化能力不足的缺陷。本发明将熵权法和层次分析法相结合来 获取单个样本的综合风险值,既解决了层次分析法主观性强,不具备客观 依据的缺点,又弥补了前人算法中无法精准定位高风险样本造成监管资源 浪费的不足。
基于以上内容,本方面通过AHP-EW获取食品检测数据的综合风险值, 使用AE-RNN实现特征提取并进行二阶段的回归训练,弥补了前人使用的模 型在复杂数据处理、陷入局部最优解的缺陷,获得更为准确的风险预测效 果。
将本发明的模型应用于中国某企业的乳制品实际检测数据中进行实验 验证。实验结果表明,与目前主流的机器学习模型相比,本发明的方法更具 有优势,能够准确筛选出乳制品中高风险即存在食品安全问题的检测样本。 本文模型有助于监管部门在监察环节中快速筛选出不合格样本并精准定位, 追溯高风险食品存在的具体原因,管理食品相关风险,指导生产商正确规 范生产管理工作,并督促其制定风险缓解策略,有效减少食品安全事件的 发生,保障中国社会的食品安全问题。
实施例1.
本发明提出的基于APH-EW融合AE-RNN的风险预警系统流程图如图1 所示:从整体上来讲,本预警系统分为三个部分,分别是风险评估环节、 模型构建环节和风险预测环节。
首先,在风险评估中,对检测数据进行归一化预处理,将预处理完的 数据通过AHP-EW算法计算出每个风险指标占据的权重,将其与检测数据加 权相乘相加获取检测样本的综合风险值作为AE-RNN的期望输出值。
其次,在模型构建中,对检测数据进行训练集和测试集的划分,调试 AE-RNN的网络参数进行网络训练,由此建立AE-RNN风险预测模型,并与基 准模型比较评价其预测性能。
最后,在风险预测中,使用建立的AE-RNN风险预测模型对新的检测样 本进行风险预测,通过风险评估环节获得的初始风险值确定风险预警的区 间,筛选出不合格样本和超过高风险值门槛的合格样本。将不合格样本和 超过高风险值门槛的合格样本报告给监管部门,方便其开展进一步风险分 析,追溯具体的不合格指标,采取及时的监管和预防措施。
具体的:
(1)风险评估
①数据预处理
根据食品安全国家标准对于灭菌乳的技术要求(GB 25190-2010),乳 制品的原料要求、感官要求、理化指标、污染物限量、真菌毒素限量和微 生物限量需符合国家规定的含量及标准,由于各项指标的检测结果具有复 杂性和数据类型不同等特点,其中的描述性文字甚至无法进行量化 (GENG等,2017)。因此,为了保证风险预测中检测数据的有效性,筛选出 了乳糖、酸度、非脂乳固体、脂肪、蛋白质、黄曲霉素六项作为乳制品风 险预测的风险评价指标。由于各个指标的检测数据维度不同、规定限制不 同,为避免对综合风险值的计算产生干扰,我们对检测数据进行归一化处 理,将其转化为无量纲数据(GENG等,2021)。
由于乳糖、黄曲霉素指标具有最高限值要求即正指标,其指标检测数 值越高,造成的潜在食品安全风险越大;非脂乳固体、脂肪、蛋白质指标 具有最低限值要求即负指标,其检测数值越低,造成的潜在食品安全风险 越大;酸度为区间值限值即区间指标,其数值过高或过低都会使得潜在风 险变大。针对以上各项指标的特点,设计了以下数据预处理方法,见表1。
在以往的研究中,像酸度这样的区间限值指标被简单归类为正指标或 负指标进行数据预处理,本发明开创性地提出了对于区间指标的数据预处 理算法,更为科学的量化区间指标,获得合理的融合风险值,进行有效的 风险评价。
表1.各类指标的数据预处理方法
其中,xmn为第m个样本第n个指标的检测值,为所有检测样本中 第n个指标的最小值,为所有检测样本中第n个指标的最大值,为所有检测样本中第n个指标的平均值,通过对不同指标的不同预处理方 式来统一各指标的数值维度和消除不同数据维度对综合风险值造成的影响。
②基于熵权的层次分析法
层法分析法是一种多准则决策方法,一般用来处理多指标问题的决策 评估,它在多标准规划决策和资源分配以及冲突解决中得到了广泛的应用, 但这种方法主要根据专家个人的经验和知识来评判各个指标的相对重要性, 缺乏一定的客观性。而本发明采用熵权法与层次分析法相结合,利用数据 本身的价值作为客观依据,通过AHP-EW将各指标检测数据进行融合,获得 综合风险值。
对输入数据中的第m个样本来说,其第n个指标的标准相关函数 fmn(x)由公式1获得。
其中,χn(1)、χn(2)、χn(3)分别是第n个指标的最小值、平均 值和最大值。
假设经过预处理之后的数据为X=[X(1)X(2)X(3)…X(m)],我们用 上述的标准相关函数得到矩阵Um×n。
对矩阵Um×n的各数值进行标准化处理:
然后通过公式vmn=u'mn-tn+ε将矩阵中的负数变为正数,其中 tn=min(u′mn)<0(n=1,2,...,q)。
由上述获得正矩阵Rm×n。
由公式5获得m维对称矩阵:
熵权表示数据所提供的信息量,熵权法的基本思想是根据指标的可变 性来确定目标权重。指数值的可变性越大,信息熵越低,指数提供的有效 信息量越高,指数的权重也越高。由公式6获得各样本的em:
由公式7获得各样本的数据价值权重hm(HAO等,2017):
由公式8获得各指标的信息价值:
c=XTh (8)
由公式9对数值进行归一化,获得各指标的信息价值权重:
权重向量为W=[w1,w2,w3…wq],由公式10获得融合数据Y。
(2)AE-RNN模型的构建
①Autoencoder
自编码器由编码器和解码器构成,是一种包含输入层、隐藏层和输出 层三层的无监督神经网络如图2所示,它的输入数据和输出数据具有相同 的维度,输出数据要最大程度的重现输入数据,通过优化目标函数来保持 输入和输出的一致性。假设每个带有m个变量的输入数据样本都被表示为 x=[x1,x2,…,xm]T∈Rm,而输出数据样本被重建为x'=[x'1,x'2,…,x'm]∈ Rm。
编码器通过公式11将输入数据x映射到隐藏层得到隐藏特征h:
h=σ1(W1x+b1) (11)
解码器基于公式12使用隐藏特征h重构输出x'
x′=σ2(W2h+b2) (12)
作为一种无监督学习框架,自编码器通常用于降维或特征提取。通过 限制隐藏层特征h的维度,可以强制自编码器捕捉训练数据中最显著的特 征,获得输入数据的有用特征。利用其特征提取的特点,将自编码器叠加 到一个深度学习模型上,使总体模型利用数据的显著特征来挖掘数据的潜 在规律,实现更为精准的拟合预测。
②Recurrent Neural Network
传统的神经网络模型从输入层到隐含层再到输出层,层与层之间是全 连接的,每层之间的节点无连接。在RNN中一个序列当前的输出与前面的 输出也有关,如图3所示。网络会对前面的信息进行记忆并应用于当前输 出的计算中,即隐藏层之间的节点是有连接的,隐藏层的输入不仅包括输 入层的输出还包括上一时刻隐藏层的输出(ALEXSHERSTINSKY,2020)。
xt表示第t步的输入,st为隐藏层第t步的状态,为网络的记忆单元。 st根据当前输入层的输出与上一步隐藏层状态进行计算(HOCHREITER等, 1997)。
St=f(U·Xt+W·St-1) (13)
其中U是输入层到隐藏层的权重矩阵,w是隐藏层上一次的值作为这一 次的输入的权重矩阵。由此看出,st的值不仅仅取决于xt,还取决于st-1。
③AE-RNN
考虑到预测食品安全风险需要进行有监督的学习,因此本文的检测模 型由自编码器和RNN两个神经网络组成,如图4所示。训练分两个阶段进 行,具体来说,第一阶段将检测数据x输入自编码器,经过编码器获得隐 层向量h,再经由解码器获得输出值x'。以输出数据x'最大程度重构输入数 据x为目标对自编码器进行训练优化,通过限制隐藏层的数据维度,获取 输入数据的显著特征向量h,实现特征提取工作。第二阶段将从自编码器提 取的特征向量h由RNN输入层进行数据输入,经过隐藏层对输入数据h进 行非线性变换,由输出层获得输出值通过对输出值和期望输出y之间 的误差进行反向传播完成对RNN模型的构建优化,提高风险预测的准确率。
(3)风险预测
模型训练结束后,使用AE-RNN模型获得未知产品的预测风险值通 过对风险评估环节中各样本风险值的查验确定食品检测样本不同风险等级 (主要是不合格样本、高风险样本)的区间限值,对新产品进行不同风险 类型的样本分类,针对不合格样本和高风险样本进行进一步的追溯分析, 方便监管部门采取针对性的相关措施,具体风险分析和相关措施见案例研 究中对上述样本的详细分析和举措。
4.案例研究:乳制品的风险预警
表2.乳制品原始检测数据
Id | Lactose | Acidity | Solids non-fat | Fat | Protein | Aflatoxin M1 |
20211010-578 | 1.73 | 12.0 | 8.97 | 4.28 | 3.40 | <0.2 |
20211009-516 | 1.74 | 12.0 | 9.12 | 3.97 | 3.43 | <0.2 |
20211008-452 | 1.74 | 12.0 | 8.79 | 4.16 | 3.42 | <0.2 |
20211007-388 | 1.72 | 12.0 | 9.12 | 3.97 | 3.38 | <0.2 |
在案例研究中,本实施例使用贵州省某乳制品品牌的灭菌牛奶自检数 据,共有2017组检测数据,原始数据格式见表2。首先对2016年9月至 2021年9月的1987组检测数据通过AHP-EW方法计算各检测样本的综合风 险值,将其作为AE-RNN网络的期望输出风险值建立风险预警模型。然后通 过建立的AE-RNN风险预警模型预测2021年10月30组检测数据的综合风 险值。最后对于预测数据中的高风险值样本进行进一步风险预警和分析。
在数据预处理环节中,针对具有不同限值要求的各指标分别进行数据 预处理,将各指标量值替换为其距离标准值的差值作为风险计算的数据, 差值越大,说明检测数值离标准值越远,由此计算得到的风险值越大,则 此检测样本的不合格概率越大,需要引起厂商和监管部门的重视。之后利 用AHP-EW得到各检测指标的权重比,如图5所示,将经过预处理后的检测 数据与对应指标的权重相乘相加,完成对各指标数值的融合,得到了综合 风险值。将预处理的检测样本数据作为预警模型的输入,风险融合值作为 AE-RNN预警模型的期望输出,进行AE-RNN风险预警网络的训练。
对1987组训练集检测数据分别使用BP、LSTM和Attention-LSTM进行 模型构建,对30组测试集进行风险预测,分别设置四个神经网络模型的相 关参数。BP、LSTM和LSTM-Attention采用三层神经网络结构,输入层6个 节点,输出层1个节点,隐层16个节点,学习率设置为0.001。BP批量大 小设置为8,历元设置为500,LSTM和LSTM-Attention批量大小设置为2, 前者历元设置为30,后者历元设置为100。将AE-RNN的隐藏层节点设置为 3,提取3维主要特征,学习率设置为0.001,迭代次数设置为1900。此外, 使用平均相对泛化误差(ARGE)、均方根误差(RMSE)和模型收敛时间来 评估模型性能。计算公式如公式14、15所示,其中zi为期望输出值,yi为实 际输出值。
通过四个模型的输出数据比较平均相对泛化误差(ARGE)、均方根误 差(RMSE)和模型收敛时间来评估各模型的预测性能,验证AE-RNN模型具 有更好的风险预测效果。
表3.预测结果比较
比较四个预测模型的ARGE和RMSE数值如表3所示,AE-RNN的误差值 相较于前三者模型实现了倍数级别的提升,由此可得AE-RNN的泛化性能更 好,与期望风险数值的差距最小。由模型训练时间比较可知,对于监管过 程中所面临的大批量食品检测数据,BP、LSTM、LSTM-Attention等模型收 敛的耗费时间太长,其中LSTM-Attention模型的收敛时间甚至达到了30 分钟以上,缺乏一定的实践意义,而AE-RNN仅用23秒就实现了更为准确 的预测效果,满足了食品监管过程中对风险预测准确高效的需求。
BP、LSTM-Attention、LSTM、AE-RNN的拟合曲线如图6所示,从拟合 曲线中可以看出BP的数据拟合效果最差,与期望值差距最大。 LSTM-Attention网络的预测结果优于BP网络,但与实际值仍有一定差距。 LSTM Attention、LSTM与BP模型相比,预测性能依次有所提高,但AE-RNN 的数据拟合效果最好,预测值曲线在某些样本上几乎与期望值曲线重叠, 数值预测的准确率最高。
由BP、LSTM-Attention、LSTM和AE-RNN的相对误差分布范围如图7 所示可以看出,在BP模型中有超出50%的样本预测误差大于5%,甚至有一 个样本几乎达到16%。而在LSTM-Attention模型中,相较于BP模型虽然误 差有所减小,75%的样本误差值控制在5%左右,但仍有少量样本误差达到 7%,LSTM模型相较于前两者有了一定的提升,75%的样本可以控制在2%以 下,但误差最大达到了6%左右。对于AE-RNN,其75%以上的样本相对误差 值低于1%,且仅有一个误差为6%的预测数值。由此得出AE-RNN的泛化能 力强于BP、LSTM-Attention、LSTM三种模型。
通过对前期2016年9月至2021年9月的1987组的风险值的统计分析, 结合高风险值样本与不合格样本的验证,我们确定了不合格样本风险值的 门槛为0.28,风险值较高需重点关注并进行详细风险分析的门槛值为0.23。 针对此类高风险样本,为防止日后的食品安全事故的发生,监管部门应当 引起重视,进一步追踪此类样本的各项指标,定位具体样本的单项风险指 标,督促生产商在食品生产中严格控制相关指标的数值,避免潜在食品安全事故的发生。
在2021年10月30组检测数据的综合风险值如图8所示,可以看出第 5个样本风险值为0.281,已超过设立的不合格样本门槛值,监管部门应立 刻督促生产商中断与此样本相关生产线中的生产流程,进一步分析此样本 的单项指标数值,在接下来的生产流程中加大对此项指标的严格监督。第 15、19、25个高风险值样本分别为0.235、0.24和0.237,已超过设立的 高风险样本门槛值,虽然其综合风险值仍是合格的,但相较于其他检测样 本风险数值偏高,鉴于食品安全风险的最小化原则,监管部门依然要对相 关样本开展后续的风险分析,确定引起高风险的单项指标,督促生产商对 生产食品各指标实行严格管控。第30个指标风险值为0.179,相较于2021 年10月的其他样本综合风险值都低,安全状态更为可靠,而其他样本风险 值分布在0.21左右,未超过风险预警门槛,食品安全状态相对稳定。
在获取到不合格样本和高风险样本后,经过对相关样本的追踪和进一 步风险分析知,第5个不合格样本由于其单项指标非脂乳固体含量过少, 未达到国家对灭菌奶中非脂乳固体含量的要求,第15、19、25个高风险值 样本由于其样本中脂肪含量相较于其他样本较低,因此综合风险值相较于 其他样本高,监管部门可根据详细的风险分析结果加大对此生产商中这两 类单项指标含量重点关注,监督生产商在生产环节严格按国家规定标准含 量提供合格高质量的食品,避免食品安全事件的发生。
本发明提出了一种基于AHP-EW和AE-RNN的食品安全风险预警融合模 型。将这一模型应用于中国贵州省某乳制品品牌的灭菌牛奶检测数据,使 用AHP-EW方法获得产品的融合风险值并作为AE-RNN的期望输出进行网络 构建,实现对新产品的风险预测。通过与BP、LSTM、LSTM-Attention三个 模型的对比,验证了本文使用的AE-RNN模型收敛时间更短,数据拟合效果 最好,数据预测精度最高。
后期监管部门可根据本文模型的风险预测结果对高风险样本和不合格 样本进一步追踪进行详细的风险分析,查验其引起风险值升高的单项指标。 这有助于相关监管部门开启精准管控,采取相关措施,督促食品生产商定 向整改,避免食品安全事件的发生。
以上所述,仅是本发明实施例的较佳实施例而已,并非对本发明实施 例作任何形式上的限制,依据本发明实施例的技术实质对以上实施例所作 的任何简单修改、等同变化与修饰,均仍属于本发明实施例技术方案的范 围内。
Claims (7)
1.一种基于AHP-EW和AE-RNN融合的食品安全风险预警模型的建立方法,其特征在于,包括以下步骤:
(1)对检测数据进行预处理后,使用AHP-EW方法,获得各检测指标的权重占比;
(2)通过与检测数据的加权求和获得产品样本的综合风险值,将其作为AE-RNN网络的期望输出;
(3)对检测数据进行训练集和测试集的划分,调试AE-RNN的网络参数进行网络训练,由此建立所述的食品安全风险预警模型。
2.根据权利要求1所述的建立方法,其特征在于,
所述的建立方法还包括步骤(4)风险预测环节:将建立的所述的食品安全风险预警模型对新的检测样本进行风险预测,通过风险评估环节获得的初始风险值确定风险预警的区间,筛选出不合格样本和超过高风险值门槛的合格样本。
3.根据权利要求1所述的建立方法,其特征在于,
所述的食品安全风险预警模型用于乳制品检测。
4.根据权利要求3所述的建立方法,其特征在于,
所述的检测数据包括:乳糖、酸度、非脂乳固体、脂肪、蛋白质、黄曲霉素。
6.根据权利要求1所述的建立方法,其特征在于,
所述的步骤(2)中,采用熵权法与层次分析法相结合,通过AHP-EW将各指标检测数据进行融合,获得综合风险值。
7.一种基于AHP-EW和AE-RNN融合的食品安全风险预警模型,其特征在于,采用权利要求1-6任一项所述的建立方法获得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210508457.8A CN115392618A (zh) | 2022-05-11 | 2022-05-11 | 一种基于ahp-ew和ae-rnn融合的食品安全风险预警模型及其建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210508457.8A CN115392618A (zh) | 2022-05-11 | 2022-05-11 | 一种基于ahp-ew和ae-rnn融合的食品安全风险预警模型及其建立方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115392618A true CN115392618A (zh) | 2022-11-25 |
Family
ID=84115774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210508457.8A Pending CN115392618A (zh) | 2022-05-11 | 2022-05-11 | 一种基于ahp-ew和ae-rnn融合的食品安全风险预警模型及其建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115392618A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116993165A (zh) * | 2023-09-25 | 2023-11-03 | 乐百氏(广东)饮用水有限公司 | 一种儿童果蔬汁的安全性评价与风险预测方法及系统 |
CN118133147A (zh) * | 2024-05-10 | 2024-06-04 | 天津烽火信息管理技术有限公司 | 一种食品安全风险评估方法及系统 |
-
2022
- 2022-05-11 CN CN202210508457.8A patent/CN115392618A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116993165A (zh) * | 2023-09-25 | 2023-11-03 | 乐百氏(广东)饮用水有限公司 | 一种儿童果蔬汁的安全性评价与风险预测方法及系统 |
CN116993165B (zh) * | 2023-09-25 | 2024-01-30 | 乐百氏(广东)饮用水有限公司 | 一种儿童果蔬汁的安全性评价与风险预测方法及系统 |
CN118133147A (zh) * | 2024-05-10 | 2024-06-04 | 天津烽火信息管理技术有限公司 | 一种食品安全风险评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105117602B (zh) | 一种计量装置运行状态预警方法 | |
WO2023142424A1 (zh) | 基于gru-lstm神经网络的电力金融业务风控方法及系统 | |
Xie et al. | Blockchain financial investment based on deep learning network algorithm | |
CN106650797B (zh) | 一种基于集成elm的配电网窃电嫌疑用户智能识别方法 | |
CN115392618A (zh) | 一种基于ahp-ew和ae-rnn融合的食品安全风险预警模型及其建立方法 | |
CN102880934A (zh) | 一种食品企业诚信评价方法 | |
CN110837523A (zh) | 一种基于级联神经网络的高置信改造质量和减假暂量化评估方法 | |
Tang et al. | An optimal model based on multifactors for container throughput forecasting | |
Zhang et al. | Risk early warning safety model for sports events based on back propagation neural network machine learning | |
CN116307103A (zh) | 一种基于硬参数共享多任务学习的交通事故预测方法 | |
Amiri et al. | Evaluating the impact of socio-economic contributing factors of cities in California on their traffic safety condition | |
CN118246744A (zh) | 一种特长隧道施工现场风险评估方法及系统 | |
CN108596509A (zh) | 一种基于kpi和神经网络的作业车间绩效评价方法 | |
CN112801544A (zh) | 一种公路数字化管理绩效评价方法及系统 | |
CN111882150A (zh) | 一种神经网络与层次分析法结合的食品安全风险预警方法 | |
CN111143774B (zh) | 一种基于影响因素多状态模型的电力负荷预测方法和装置 | |
Zhang | Research of boosting algorithm machine learning in logistics enterprise financial risk prediction | |
Ovchynnikova et al. | Neural Network Forecasting of International Population Migration | |
An | Research on early warning of operation and maintenance cost of engineering construction projects | |
Chu et al. | An accurate financially-challenged college student identification model based on rough set-bp neural networks and its application | |
Li et al. | [Retracted] Analysis of Risk Assessment of Overseas Infrastructure Projects Integrating BP‐ANN Algorithm | |
CN118296389B (zh) | 一种数据指标模型的构建及评估方法 | |
Yang et al. | Research on the evaluation methods of bid of construction project based on improved BP neural network | |
Suo et al. | Analysis of physical test indexes of college students based on data mining model | |
Zuowei et al. | The integrated methodology of rough set theory and artificial neural network for safety assessment on construction sites |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |