CN112903919A - 一种海蟹安全性检测识别方法及系统 - Google Patents

一种海蟹安全性检测识别方法及系统 Download PDF

Info

Publication number
CN112903919A
CN112903919A CN202110099703.4A CN202110099703A CN112903919A CN 112903919 A CN112903919 A CN 112903919A CN 202110099703 A CN202110099703 A CN 202110099703A CN 112903919 A CN112903919 A CN 112903919A
Authority
CN
China
Prior art keywords
data
sea
sea crab
odor
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110099703.4A
Other languages
English (en)
Inventor
刘云翔
王春娅
原鑫鑫
徐齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Technology
Original Assignee
Shanghai Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Technology filed Critical Shanghai Institute of Technology
Priority to CN202110099703.4A priority Critical patent/CN112903919A/zh
Publication of CN112903919A publication Critical patent/CN112903919A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method, e.g. intermittent, or the display, e.g. digital
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0001Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00 by organoleptic means
    • G01N33/0068
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种海蟹安全性检测识别方法及系统,包括步骤:S1:海蟹样本预处理;S2:自定义采集海蟹样本块中的气味数据;S3:利用one‑hot编码对气味数据进行预处理;S4:对气味数据进行特征选择和提取;利用SVD分解协方差矩阵实现PCA算法的分解,对预处理后的气味数据进行降维处理,再利用one‑hot编码提取出能够反映目标要求的特征数据;S5:利用多元线性回归MLR对气味数据进行气味浓度判别;S6:预测分析检测结果;S7:新鲜度等级划分。本发明利用机器嗅觉对海蟹样本的气味进行无损检测,利用机器学习提取特征,对其食用安全等级分类,解决了蟹类检测在不被分割的完整状态下,面对微弱信号的检测难以提取有效表征气味信息的特征的难题。

Description

一种海蟹安全性检测识别方法及系统
技术领域
本发明涉及嗅觉识别技术,尤其涉及一种海蟹安全性检测识别方法及系统。
背景技术
随着国民经济的发展和生活水平的提高,海鲜的产出与消耗越来越大。海鲜极易存货各类微生物,如2020年初爆发的新冠病毒在湿冷环境中极易生存,因此海鲜成为其最佳食物载体,使得人们对海鲜的卫生品质及安全度的检测也越来越重。
本申请发明人研究海蟹时,发现新鲜度是海蟹质量的一个重要指标。海蟹打捞出海后会随着时间会慢慢的挥发出具有腐败性特征的气体,比如H2S、NH3等,即使在高温蒸煮也不会被破坏,误食这些不新鲜的海蟹则会引起食物中毒,后果不堪设想。而人们通常在日常生活中判断能否食用的方法是通过包装日期以及海蟹味道,然而一些有害气味很难被人的鼻子闻出,因此对于海蟹类的海鲜产品,在无法判断其食用安全性的前提下,有必要进行安全性检测识别。
发明内容
为解决上述问题,本申请实施例通过提供一种海蟹安全性检测识别方法及系统;利用机器嗅觉系统对海蟹的气体信息进行无损检测,利用机器学习的方法获得特征数据,最终对其食用安全等级进行分类,与理化指标挥发性盐基氮含量标准,解决了蟹类检测在不被分割的完整状态下,面对微弱信号的检测难以提取有效表征气味信息的特征的难题。
第一方面,本申请实施例提供了一种海蟹安全性检测识别方法,包括步骤:
S1:海蟹样本预处理;
选取不同储藏时间、不同批次的海蟹样本,切割为若干块后,混匀使污染程度较为均一,并密封冷藏;海蟹样本包括新鲜海蟹样本和冷冻海蟹样本;
S2:自定义采集海蟹样本块中的气味数据;
基于机器嗅觉系统利用电子鼻按照预设采集规则,对任意块所述海蟹样本所产生的气味数据进行采集保存;
S3:利用one-hot编码对气味数据进行预处理;
S4:对气味数据进行特征选择和提取;
利用SVD分解协方差矩阵实现PCA算法的分解,对预处理后的气味数据进行降维处理,再利用one-hot编码提取出能够反映目标要求的特征数据;
S5:利用多元线性回归MLR对气味数据进行气味浓度判别;
S6:预测分析检测结果;
采用BP神经网络建立并训练海蟹新鲜度等级的预测模型,将步骤S4和步骤S5中提取的特征数据和气味浓度作为预测模型的输入,根据步骤S4中降维后的可视化结果分析,得到存储时间的分类数据,将其作为预测模型的输出,将训练好的模型预测海蟹样本的新鲜度等级,对比可视化分析结果和挥发性盐基氮含量TVB-N检测结果;
S7:新鲜度等级划分;参照水产行业国家标准GB2733—2005鲜、冻动物性水产品卫生规定方法,基于可视化分析结果和挥发性盐基氮含量TVB-N检测结果,对海蟹样本进行新鲜度等级划分。
进一步地,所述步骤S2中,预设采集规则包括:新鲜的海蟹样本在1H、4H、7H、12H、15H、18H、21H、24H进行采样测量;冷冻的海蟹样本在1D、3D、7D、10D、13D、15D、17D进行采样测量。
进一步地,所述步骤S3中,利用one-hot编码对气味数据进行预处理包括:基于海蟹样本产生的气味数据为离散型数据,利用one-hot编码中的多个状态寄存器对多个状态分别进行编码。
进一步地,所述步骤S4包括:
奇异值分解SVD中:任何一个n*m(n>=m)矩阵B具有如下的分解形式:B=UΓVT(1),其中,U表示n*m的矩阵,且各列正交UTU=I,V表示m*m的正交矩阵VTV=I,m*m包含奇异值的对角阵;
通过矩阵B定义两个对称矩阵BBT和BTB,分解如下:
BBT=UΓVTVΓUT=UΓ2UT (2),
BTB=VΓ2VT (3),
其中,m各特征数据相同,剩余n-m各特征数据为0,并根据分解式(1)-(3)得到特征向量和特征值分别为V的列和的对角元素的平方;对角线上的元素表示奇异值,视为在输入与输出间进行的标量“膨胀控制”,以使特征数据的非零平方根,并与U和V的行向量相对应;
主成分分析方法PCA:海蟹样本所产生的的气味数据xi(i=i,2,...,n)的均值为μ,其协方差矩阵为:
Figure BDA0002915217200000031
若协方差大于0表示正相关,小于0表示负相关;
当协方差大于0时,一个变量增大,那么另一个变量也会增大;
当协方差小于0时,一个变量增大,那么另一个变量会减小;
协方差矩阵为一个数据集里变量两两之间协方差所组成的,表示一个方阵,行为属性节点集合,列和行的节点顺序一样,矩阵对角线上的属性自身的方差,C矩阵的第(i,j)个元素表示为数据集中第i和第j个元素的协方差;
若每个样本去掉各维数的均值:Xi,j=Xi,ji,那么协方差矩阵可以写成如下形式:
Figure BDA0002915217200000032
PCA通过寻找在协方差矩阵最大特征值对应的特征向量,把数据投影到对应方向上。
进一步地,所述步骤S4进一步包括:预设U表示特征向量,主成分分析方法PCA对采用式(8)对数据进行线性变换:Y=UTX (8),获取的特征向量为主成分;
若选取Y的m行,可以将数据从d维降到m维;
利用奇异值分解SVD进行主成分分析方法PCA分解矩阵:
Figure BDA0002915217200000041
最终可以得到主成分:U=XVS-1([∪SV]=svd(X) (10)。
进一步地,所述步骤S5中,利用多元线性回归MLR对气味数据进行气味浓度判别公式为:y=β01X12X2+…βnXn+e
其中,应变量y可以近似地表示为自变量X1,X2,...,Xm的线性函数;β0表示常数项,β1,β2,...,βm表示偏回归系数;
在其它自变量保持不变时,Xj增加或减少一个单位时y的平均变化量e表示去除m个自变量对y影响后的随机误差。
进一步地,所述步骤S2中的所述电子鼻采用德国PEN3电子鼻。
进一步地,所述S6进一步包括:通过BP神经网络训练特征数据,建立海蟹新鲜度等级预测模型,
BP神经网络中采用非线性变换函数Sigmoid函数传递特征数据,Sigmoid函数:
Figure BDA0002915217200000042
进一步地,所述步骤S2中,所述电子鼻在不同时刻对不同保藏的海蟹样本进行气味数据采集。
第二方面,本申请实施例提供了一种海蟹安全性检测识别系统,包括:数据传输模块、数据预处理模块、特征提取模块、浓度判别模块、预测分析模块以及等级划分模块;
所述数据传输模块配置为接收电子鼻自定义采集的海蟹样本块中的气味数据并保存;所述电子鼻基于机器嗅觉系统按照预设采集规则,对任意块所述海蟹样本所产生的气味数据进行采集;
所述数据预处理模块配置为利用one-hot编码对气味数据进行预处理;
所述特征提取模块配置为对气味数据进行特征选择和提取;其利用SVD分解协方差矩阵实现PCA算法的分解,对预处理后的气味数据进行降维处理,再利用one-hot编码提取出能够反映目标要求的特征数据;
所述浓度判别模块配置为用多元线性回归MLR对气味数据进行气味浓度判别;
所述预测分析模块配置为预测分析检测结果;包括:采用BP神经网络建立并训练海蟹新鲜度等级的预测模型,将所述特征提取模块和所述浓度判别模块中提取的特征数据和气味浓度作为预测模型的输入,根据所述特征提取模块中降维后的可视化结果分析,得到存储时间的分类数据,将其作为预测模型的输出,将训练好的模型预测海蟹样本的新鲜度等级,对比可视化分析结果和挥发性盐基氮含量TVB-N检测结果;
所述等级划分模块配置为新鲜度等级划分;参照水产行业国家标准GB2733—2005鲜、冻动物性水产品卫生规定方法,基于可视化分析结果和挥发性盐基氮含量TVB-N检测结果,对海蟹样本进行新鲜度等级划分。
本申请实施例中提供的两个技术方案,至少具有如下技术效果:
(1)本发明通过特征选择和分类结果结合起来的方式选择特征参数,通过瞬时信息和稳态信息两方面从复杂的多维数据中来选择最有效的特征,反应气味的浓度信息。
(2)通过SVD+PCA敏感的辨识出微弱的气味变化,提取气味信息中线性特征和非线性特征的多维特征进行降维处理,从而形成可视化结果,提高了对于海蟹新鲜度等级检测的精确度和检测速度。
(3)用BP神经网络建立海蟹新鲜度等级的预测模型,用SVD+PCA所提取的多维传感器的特征数据作为BP神经网络输入层的节点,将样本数据所对应的分类类别作为输出层节点,具有检测速度快、识别效果好、无损等优点。
(4)综合所述,本发明通过以上几个步骤能够快速精确地检测海蟹的新鲜度,有效辨识蟹类新鲜度等级,应用范围广,适合产业化。
附图说明
图1为本申请实施例一的一种海蟹安全性检测识别方法的流程图;
图2为本申请实施例一BP算法流程图;
图3为本申请实施例一响应信号图;
图4为本申请实施例二中一种海蟹安全性检测识别系统结构框图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
参考图1-3所示,本申请实施例提供了一种海蟹安全性检测识别方法,该方法包括如下步骤:
步骤S1:海蟹样本预处理。
本步骤中,选取不同储藏时间、不同批次的海蟹样本,切割为若干块后,混匀使污染程度较为均一,并密封冷藏。海蟹样本包括新鲜海蟹样本和冷冻海蟹样本。进一步地,在实验操作过程中,对新鲜海蟹以及冷冻海蟹分别进行检测。实验室中获取海蟹样本时,分四批取样。前两批为新鲜的海蟹取样,即海蟹样品打捞出海时立即取样,且取样工具干燥清洁,避免对海蟹样本产生污染,不影响海蟹样品挥发的气味和成分组成。新鲜的海蟹样本取样后采用保鲜袋密封包装后立即冷藏,可采用冰块使新鲜的海蟹样本迅速冷却,并运送至检测所在实验室,以便进行分割。后两批为冷冻的海蟹样本,随机采购后,置于冰箱或冷库5摄氏度条件下解冻。
实验室中对海蟹样本进行切割时,将新鲜的海蟹样本或者冷冻的海蟹样本放置在超净工作台上,用无菌刀具将海蟹样本切割成小块,并混匀后,以尽可能使海蟹样本的污染程度较为均一,然后用保鲜袋密封于冰箱中。
步骤S2:自定义采集所述海蟹样本块中的气味数据。
本步骤中,基于机器嗅觉系统利用电子鼻按照预设采集规则,对任意块所述海蟹样本所产生的气味数据进行采集保存。
进一步地,预设采集规则包括:新鲜的海蟹样本在1H、4H、7H、12H、15H、18H、21H、24H进行采样测量;冷冻的海蟹样本在1D、3D、7D、10D、13D、15D、17D进行采样测量。进一步地,前两批冷藏的新鲜海蟹样本分别在1H、4H、7H、12H、15H、18H、21H、24H利用电子鼻采集,H表示小时。采集规则中,后两批冷藏的冷冻海蟹样本分别在1D、3D、7D、10D、13D、15D、17D利用电子鼻采集,D表示天。
本步骤中,电子鼻在不同时刻对不同保藏的海蟹样本进行气味数据采集,优选地,电子鼻采用德国PEN3电子鼻。进一步地,本步骤中预设电子鼻50s响应信号,并建立海蟹样品的识别模式。电子鼻利用气体传感器阵列的响应图案来识别气味的电子系统,它可以在几小时、几天甚至数月的时间内连续地、实时地监测特定位置的气味状况。电子鼻主要由气味取样操作器、气体传感器阵列和信号处理系统三种功能器件组成。电子鼻识别气味的主要机理是在阵列中的每个传感器对被测气体都有不同的灵敏度,例如,一号气体可在某个传感器上产生高响应,而对其他传感器则是低响应,同样,二号气体产生高响应的传感器对一号气体则不敏感,归根结底,整个传感器阵列对不同气体的响应图案是不同的,正是这种区别,才使系统能根据传感器的响应图案来识别气味。进一步地,本实施例中利用电子鼻对不同保鲜袋内的海蟹样品在不同时刻进行气体数据采集。
步骤S3:对气味数据进行预处理。
本步骤中,利用one-hot编码对气味数据进行预处理。具有操作依据,基于海蟹样本所产生的气味数据为离散型数据,而分类器往往默认数据连续有序的,本步骤中利用one-hot编码中的多个状态寄存器对多个状态分别进行编码。不同时刻采集的气味数据表示为不同状态,因此可以理解one-hot编码用N位状态寄存器来对N个状态进行编码。
步骤S4:对气味数据进行特征选择和提取。
本步骤中,利用SVD分解协方差矩阵实现PCA算法的分解,对预处理后的气味数据进行降维处理,再利用one-hot编码提取出能够反映目标要求的特征数据。
进一步地,本步骤中利用SVD解PCA,其中,奇异值分解SVD、主成分分析方法PCA都属于降维算法。降维算法的应用就会联想到机器学习中的分类、聚类等任务,比如,一个或多个类别型的数据特征,如衣服颜色、商品类别等,该些特征的取值之前并无相对大小关系,难以直接作为机器学习模型的输入,需要先要对这类特征做转换才能作为模型输入。通常的处理模式为,先进行one-hot转换,再进行PCA降维。而本步骤中基于步骤S3中已完成气味数据的one-hot编码预处理,即已完成分类。
本步骤中对one-hot编码预处理后的气味数据进行特征选择和提取,可以理解为对含有多个变量的数据进行观测,分析寻找规律,用较少的综合指标代表存在于各个变量中的各类信息,本步骤中采用主成分分析方法PCA进行降维处理。数据降维是一种对高维度特征数据预处理方法。将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的,在一定的信息损失范围内,可以节省大量的时间和成本。具有以下有益效果:使得数据集更易使用;降低算法的计算开销;去除噪声;使得结果容易理解。降维的算法有很多,本步骤中结合奇异值分解(SVD)、主成分分析方法(PCA)。
PCA(主成分分析方法,Principal Component Analysis)的主要思想是将d维特征映射到m维上,这m维是全新的正交特征也被称为主成分,是在原有d维特征的基础上重新构造出来的m维特征。PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。其中,第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的,第三个轴是与第1、2个轴正交的平面中方差最大的。依次类推,可以得到d个的坐标轴。通过这种方式获得的新的坐标轴,发现大部分方差都包含在前面m个坐标轴中,后面的坐标轴所含的方差几乎为0。于是可以忽略余下的坐标轴,只保留前面m个含有绝大部分方差的坐标轴。事实上,这相当于只保留包含绝大部分方差的维度特征,而忽略包含方差几乎为0的特征维度,实现对数据特征的降维处理。
通过计算数据矩阵的协方差矩阵,然后得到协方差矩阵的特征值特征向量,选择特征值最大(即方差最大)的m个特征所对应的特征向量组成的矩阵,这样就可以将数据矩阵转换到新的空间当中,实现数据特征的降维。由于得到协方差矩阵的特征值特征向量有两种方法:特征值分解协方差矩阵、奇异值分解协方差矩阵,所以PCA算法有两种实现方法:基于特征值分解协方差矩阵实现PCA算法、基于SVD分解协方差矩阵实现PCA算法。本步骤采用基于SVD分解协方差矩阵实现PCA算法。
进一步地,基于步骤S3中one-hot编码预处理后的气味数据,将获取的气味数据xi(i=1,2,3,…,n)进行降维。具体计算步骤:去平均值,即每一位特征减去各自的平均值;计算协方差矩阵;通过SVD计算协方差矩阵的特征值与特征向量;对特征值从大到小排序,选择其中最大的m个;然后将其对应的m个特征向量分别作为列向量组成特征向量矩阵;将数据转换到m个特征向量构建的新空间中。
在PCA降维过程中,需要找到样本协方差矩阵BBT的最大m个特征向量,然后用这最大的m个特征向量组成的矩阵来做低维投影降维。可以看出,在这个过程中需要先求出协方差矩阵BBT。本步骤中利用SVD分解协方差矩阵进行降维的好处有:(1)一些SVD的实现算法可以先不求出协方差矩阵也能求出我们的右奇异矩阵V。也就是说,PCA算法可以不用做特征分解而是通过SVD来完成,这个方法在样本量很大的时候很有效。实际上,scikit-learn的PCA算法的背后真正的实现就是用的SVD,而不是特征值分解。(2)PCA仅仅使用了SVD的左奇异矩阵,没有使用到右奇异值矩阵,那么右奇异值矩阵有什么用呢?假设海蟹样本是n*m(n>=m)的矩阵B,如果我们通过SVD找到了矩阵BTB最大的m个特征向量组成的m*d的矩阵VT,则可以做如下处理:
Figure BDA0002915217200000091
Figure BDA0002915217200000101
可以得到一个m*d的矩阵B′,矩阵B′和原来m*n矩阵B相比,列数从d减到了m,可见对列数进行了压缩。也就是说,左奇异矩阵可以用于对行数的压缩;右奇异矩阵可以用于对列(即特征维度)的压缩,从而用SVD分解协方差矩阵实现PCA可以得到两个方向的PCA降维(即行和列两个方向)。
本步骤S4中,多维数据降维处理的具体步骤如下:奇异值分解SVD,任何一个n*m(n>=m)矩阵B具有如下的分解形式:B=UΓVT (1),其中,U表示n*m的矩阵,且各列正交UTU=I,V表示m*m的正交矩阵VTV=I,m*m包含奇异值的对角阵。
通过矩阵B定义两个对称矩阵:左奇异值矩阵BBT和右奇异值矩阵BTB,进一步分解如下:BBT=UΓVTVΓUT=UΓ2UT (2);BTB=VΓ2VT (3);m个特征数据相同,剩余n-m各特征数据为0,并根据分解式(1)-(3)得到特征向量和特征值分别为V的列和的对角元素的平方。其中,对角线上的元素表示奇异值,视为在输入与输出间进行的标量“膨胀控制”,以使特征数据的非零平方根,并与U和V的行向量相对应。
主成分分析方法PCA中,海蟹样本所产生的的气味数据xi(i=i,2,...,n)的均值为μ,其协方差矩阵为:
Figure BDA0002915217200000102
若协方差大于0表示正相关,小于0表示负相关;当协方差大于0时,一个变量增大,那么另一个变量也会增大;当协方差小于0时,一个变量增大,那么另一个变量会减小;协方差矩阵为一个数据集里变量两两之间协方差所组成的,表示一个方阵,行为属性节点集合,列和行的节点顺序一样,矩阵对角线上的属性自身的方差,C矩阵的第(i,j)个元素表示为数据集中第i和第j个元素的协方差。若每个样本去掉各维数的均值:Xi,j=Xi,ji,那么协方差矩阵可以写成如下形式:
Figure BDA0002915217200000103
PCA通过寻找在协方差矩阵最大特征值对应的特征向量,把数据投影到对应方向上。预设U表示特征向量,主成分分析方法PCA对采用式(8)对数据进行线性变换:Y=UTX (8),获取的特征向量为主成分;若选取Y的m行,可以将数据从d维降到m维;
利用奇异值分解SVD进行主成分分析方法PCA分解矩阵:
Figure BDA0002915217200000111
最终可以得到主成分:U=XVS-1([∪SV]=svd(X) (10)。本步骤中,利用随着海蟹储藏时间的延长,挥发出的硫化氢,氨气的含量会随之增多的特点,其变化过程如图3所示。进而采用SVD+PCA的方法使硫化氢,氨气成为主成分,使之成为T测量VB-N含量的依据。进一步地,通过PCA通过SVD实现的优点:一是因为SVD没有计算这一步,而矩阵中一些非常小的数容易在平方中丢失。二是在一些实现中,SVD的速度比特征值分解要快很多,充分地利用了协方差矩阵的性质。
进一步再利用one-hot编码提取能够反映目标要求的特征数据。
本步骤以及步骤S3中,关于one-hot编码,即独热编码,表示一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。举例说明,假设有四个样本(行),每个样本有三个特征(列),如图:
特征_1 特征_2 特征_3
海蟹样本1 1 4 3
海蟹样本2 2 3 2
海蟹样本3 1 2 2
海蟹样本4 2 1 1
上图中已经对每个特征进行了普通的数字编码:特征_1有两种可能的取值,比如是新鲜/冷冻,这里新鲜用1表示,冷冻用2表示。那么one-hot编码的编码过程用特征_2来说明:特征_2有4种取值(状态),我们就用4个状态位来表示这个特征,one-hot编码就是保证每个样本中的单个特征只有1位处于状态1,其他的都是0。{1->0001;2->0010;3->0100;4->1000}。对于2种状态、三种状态、甚至更多状态都是这样表示,所以我们可以得到这些样本特征的新表示:
特征_1 特征_2 特征_3
海蟹样本1 01 1000 100
海蟹样本2 10 0100 010
海蟹样本3 01 0010 010
海蟹样本4 10 0001 001
one-hot编码将每个状态位都看成一个特征。对于前两个样本我们可以得到它的特征向量分别为:海蟹样本-1->[01.1000.100];海蟹样本-2->[10.0100.010]。
可以看出,one-hot编码在步骤3中解决了分类器不好处理离散数据的问题,对步骤3中的气味数据进行分类预处理,在步骤4中一定程度上也起到了扩充特征的作用,对降维后的气味数据进行了特征提取。
步骤S5:对气味数据中的气味浓度进行判别。
本步骤利用多元线性回归MLR,对气味数据进行气味浓度判别。进一步地,多元线性回归MLR(Machine Learning Algorithm)的一般形式为:
y=β01X12X2+…βnXn+e
上式表示数据中应变量y可以近似地表示为自变量X1,X2,...,Xm的线性函数。其中,β0表示常数项,β1,β2,...,βm表示偏回归系数;
在其它自变量保持不变时,Xj表示增加或减少一个单位时y的平均变化量e表示去除m个自变量对y影响后的随机误差。
步骤S6:预测分析检测结果。
本步骤中,采用BP神经网络建立并训练海蟹新鲜度等级的预测模型,将步骤S4和步骤S5中提取的特征数据和气味浓度作为预测模型的输入,根据步骤S4中降维后的可视化结果分析,得到存储时间的分类数据,将其作为预测模型的输出,将训练好的模型预测海蟹样本的新鲜度等级,对比可视化分析结果和挥发性盐基氮含量TVB-N检测结果。
进一步地,本步骤中建立BP神经网络建立海蟹新鲜度等级的预测模型:BP网络采用的传递函数是非线性变换函数——Sigmoid函数(又称S函数)。其特点是函数本身及其导数都是连续的,因而在处理上十分方便。
其中,Sigmoid函数:
Figure BDA0002915217200000131
进一步地,用BP神经网络建立海蟹新鲜度等级的预测模型,用拉普拉斯特征映射所提取的多维传感器特征数据作为BP数据作为BP神经网络输入层的节点,将样本数据所对应的分类类别作为输出层节点,对于网络内部参数的设置要结合实际的预测结果,根据网络性能选择一个隐含层即可,那么BP神经网络即为三层网络。
步骤S7:新鲜度等级划分。
本步骤中参照水产行业国家标准GB2733—2005鲜、冻动物性水产品卫生规定方法,基于可视化分析结果和挥发性盐基氮含量TVB-N检测结果,对海蟹样本进行新鲜度等级划分。
本实施例提供的一种海蟹安全性检测识别方法包括如下技术效果:
(1)本发明通过特征选择和分类结果结合起来的方式选择特征参数,通过瞬时信息和稳态信息两方面从复杂的多维数据中来选择最有效的特征,反应气味的浓度信息;
(2)通过SVD+PCA敏感的辨识出微弱的气味变化,提取气味信息中线性特征和非线性特征的多维特征进行降维处理,从而形成可视化结果,提高了对于海蟹新鲜度等级检测的精确度和检测速度。
(3)用BP神经网络建立海蟹新鲜度等级的预测模型,用SVD+PCA所提取的多维传感器的特征数据作为BP神经网络输入层的节点,将样本数据所对应的分类类别作为输出层节点,具有检测速度快、识别效果好、无损等优点。
(4)综合所述,本发明通过以上几个步骤能够快速精确地检测海蟹的新鲜度,有效辨识蟹类新鲜度等级,应用范围广,适合产业化。
实施例二
参考图4所示,本申请实施例提供了一种海蟹安全性检测识别系统,该系统包括:数据传输模块100、数据预处理模块200、特征提取模块300、浓度判别模块400、预测分析模块500以及等级划分模块600。
数据传输模块100配置为接收电子鼻自定义采集的海蟹样本块中的气味数据并保存;所述电子鼻基于机器嗅觉系统按照预设采集规则,对任意块所述海蟹样本所产生的气味数据进行采集。
数据预处理模块200配置为利用one-hot编码对气味数据进行预处理。
特征提取模块300配置为对气味数据进行特征选择和提取;其利用SVD分解协方差矩阵实现PCA算法的分解,对预处理后的气味数据进行降维处理,再利用one-hot编码提取出能够反映目标要求的特征数据;
浓度判别模块400配置为用多元线性回归MLR对气味数据进行气味浓度判别。
预测分析模块500配置为预测分析检测结果;包括:采用BP神经网络建立并训练海蟹新鲜度等级的预测模型,将所述特征提取模块和所述浓度判别模块中提取的特征数据和气味浓度作为预测模型的输入,根据所述特征提取模块中降维后的可视化结果分析,得到存储时间的分类数据,将其作为预测模型的输出,将训练好的模型预测海蟹样本的新鲜度等级,对比可视化分析结果和挥发性盐基氮含量TVB-N检测结果。
等级划分模块600配置为新鲜度等级划分;参照水产行业国家标准GB2733—2005鲜、冻动物性水产品卫生规定方法,基于可视化分析结果和挥发性盐基氮含量TVB-N检测结果,对海蟹样本进行新鲜度等级划分。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种海蟹安全性检测识别方法,其特征在于,包括步骤:
S1:海蟹样本预处理;
选取不同储藏时间、不同批次的海蟹样本,切割为若干块后,混匀使污染程度较为均一,并密封冷藏;海蟹样本包括新鲜海蟹样本和冷冻海蟹样本;
S2:自定义采集海蟹样本块中的气味数据;
基于机器嗅觉系统利用电子鼻按照预设采集规则,对所述海蟹样本所产生的气味数据进行采集保存;
S3:利用one-hot编码对气味数据进行预处理;
S4:对气味数据进行特征选择和提取;
利用SVD分解协方差矩阵实现PCA算法的分解,对预处理后的气味数据进行降维处理,再利用one-hot编码提取出能够反映目标要求的特征数据;
S5:利用多元线性回归MLR对气味数据进行气味浓度判别;
S6:预测分析检测结果;
采用BP神经网络建立并训练海蟹新鲜度等级的预测模型,将步骤S4和步骤S5中提取的特征数据和气味浓度作为预测模型的输入,根据步骤S4中降维后的可视化结果分析,得到存储时间的分类数据,将其作为预测模型的输出,将训练好的模型预测海蟹样本的新鲜度等级,对比可视化分析结果和挥发性盐基氮含量TVB-N检测结果;
S7:新鲜度等级划分;参照水产行业国家标准GB2733-2005鲜、冻动物性水产品卫生规定方法,基于可视化分析结果和挥发性盐基氮含量TVB-N检测结果,对海蟹样本进行新鲜度等级划分。
2.如权利要求1所述的基于机器嗅觉技术的海蟹食用安全性的检测及识别方法,其特征在于,所述步骤S2中,预设采集规则包括:新鲜的海蟹样本在1H、4H、7H、12H、15H、18H、21H、24H进行采样测量;冷冻的海蟹样本在1D、3D、7D、10D、13D、15D、17D进行采样测量。
3.如权利要求1所述的基于机器嗅觉技术的海蟹食用安全性的检测及识别方法,其特征在于,所述步骤S3中,利用one-hot编码对气味数据进行预处理包括:基于海蟹样本产生的气味数据为离散型数据,利用one-hot编码中的多个状态寄存器对多个状态分别进行编码。
4.如权利要求1所述的基于机器嗅觉技术的海蟹食用安全性的检测及识别方法,其特征在于,所述步骤S4包括:
奇异值分解SVD中:任何一个n*m(n>=m)矩阵B具有如下的分解形式:B=U「VT (1),其中,U表示n*m的矩阵,且各列正交UTU=I,V表示m*m的正交矩阵VTV=I,m*m包含奇异值的对角阵;
通过矩阵B定义两个对称矩阵BBT和BTB,分解如下:
BBT=UΓVTVΓUT=UΓ2UT (2),
BTB=V「2VT (3),
其中,m各特征数据相同,剩余n-m各特征数据为0,并根据分解式(1)-(3)得到特征向量和特征值分别为V的列和的对角元素的平方;对角线上的元素表示奇异值,视为在输入与输出间进行的标量“膨胀控制”,以使特征数据的非零平方根,并与U和V的行向量相对应;
主成分分析方法PCA:海蟹样本所产生的的气味数据xi(i=i,2,...,n)的均值为μ,其协方差矩阵为:
Figure FDA0002915217190000021
若协方差大于0表示正相关,小于0表示负相关;
当协方差大于0时,一个变量增大,那么另一个变量也会增大;
当协方差小于0时,一个变量增大,那么另一个变量会减小;
协方差矩阵为一个数据集里变量两两之间协方差所组成的,表示一个方阵,行为属性节点集合,列和行的节点顺序一样,矩阵对角线上的属性自身的方差,C矩阵的第(i,j)个元素表示为数据集中第i和第j个元素的协方差;
每个样本去掉各维数的均值:Xi,j=Xi,ji,那么协方差矩阵可以写成如下形式:
Figure FDA0002915217190000031
PCA通过寻找在协方差矩阵最大特征值对应的特征向量,把数据投影到对应方向上。
5.如权利要求4所述的基于机器嗅觉技术的海蟹食用安全性的检测及识别方法,其特征在于,所述步骤S4进一步包括:预设U表示特征向量,主成分分析方法PCA对采用式(8)对数据进行线性变换:Y=UTX (8),获取的特征向量为主成分;
若选取Y的m行,可以将数据从d维降到m维;
利用奇异值分解SVD进行主成分分析方法PCA分解矩阵:
Figure FDA0002915217190000032
最终可以得到主成分:U=XVS-1([∪SV]=svd(X) (10)。
6.如权利要求1所述的基于机器嗅觉技术的海蟹食用安全性的检测及识别方法,其特征在于,所述步骤S5中,利用多元线性回归MLR对气味数据进行气味浓度判别公式为:y=β01X12X2+…βnXn+e
其中,应变量y可以近似地表示为自变量X1,X2,...,Xm的线性函数;β0表示常数项,β1,β2,...,βm表示偏回归系数;
在其它自变量保持不变时,Xj增加或减少一个单位时y的平均变化量e表示去除m个自变量对y影响后的随机误差。
7.如权利要求1所述的基于机器嗅觉技术的海蟹食用安全性的检测及识别方法,其特征在于,所述步骤S2中的所述电子鼻采用德国PEN3电子鼻。
8.如权利要求1所述的基于机器嗅觉技术的海蟹食用安全性的检测及识别方法,其特征在于,所述S6进一步包括:通过BP神经网络训练特征数据,建立海蟹新鲜度等级预测模型,
BP神经网络中采用非线性变换函数Sigmoid函数传递特征数据,Sigmoid函数:
Figure FDA0002915217190000033
9.如权利要求1所述的基于机器嗅觉技术的海蟹食用安全性的检测及识别方法,其特征在于,所述步骤S2中,所述电子鼻在不同时刻对不同保藏的海蟹样本进行气味数据采集。
10.一种海蟹安全性检测识别系统,其特征在于,包括:数据传输模块、数据预处理模块、特征提取模块、浓度判别模块、预测分析模块以及等级划分模块;
所述数据传输模块配置为接收电子鼻自定义采集的海蟹样本块中的气味数据并保存;所述电子鼻基于机器嗅觉系统按照预设采集规则,对任意块所述海蟹样本所产生的气味数据进行采集;
所述数据预处理模块配置为利用one-hot编码对气味数据进行预处理;
所述特征提取模块配置为对气味数据进行特征选择和提取;其利用SVD分解协方差矩阵实现PCA算法的分解,对预处理后的气味数据进行降维处理,再利用one-hot编码提取出能够反映目标要求的特征数据;
所述浓度判别模块配置为用多元线性回归MLR对气味数据进行气味浓度判别;
所述预测分析模块配置为预测分析检测结果;包括:采用BP神经网络建立并训练海蟹新鲜度等级的预测模型,将所述特征提取模块和所述浓度判别模块中提取的特征数据和气味浓度作为预测模型的输入,根据所述特征提取模块中降维后的可视化结果分析,得到存储时间的分类数据,将其作为预测模型的输出,将训练好的模型预测海蟹样本的新鲜度等级,对比可视化分析结果和挥发性盐基氮含量TVB-N检测结果;
所述等级划分模块配置为新鲜度等级划分;参照水产行业国家标准GB2733-2005鲜、冻动物性水产品卫生规定方法,基于可视化分析结果和挥发性盐基氮含量TVB-N检测结果,对海蟹样本进行新鲜度等级划分。
CN202110099703.4A 2021-01-25 2021-01-25 一种海蟹安全性检测识别方法及系统 Pending CN112903919A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110099703.4A CN112903919A (zh) 2021-01-25 2021-01-25 一种海蟹安全性检测识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110099703.4A CN112903919A (zh) 2021-01-25 2021-01-25 一种海蟹安全性检测识别方法及系统

Publications (1)

Publication Number Publication Date
CN112903919A true CN112903919A (zh) 2021-06-04

Family

ID=76120227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110099703.4A Pending CN112903919A (zh) 2021-01-25 2021-01-25 一种海蟹安全性检测识别方法及系统

Country Status (1)

Country Link
CN (1) CN112903919A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114113471A (zh) * 2021-11-08 2022-03-01 滁州怡然传感技术研究院有限公司 一种基于机器学习的人工鼻冰箱食品新鲜度检测方法及系统
CN114324781A (zh) * 2022-03-11 2022-04-12 中汽研汽车零部件检验中心(宁波)有限公司 一种智能嗅辨方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05180774A (ja) * 1991-12-26 1993-07-23 Hitachi Plant Eng & Constr Co Ltd 鮪の鮮度判別方法及びその装置
CA2314237A1 (en) * 2000-07-18 2002-01-18 Richard Nigel Coleman Method and apparatus for estimating odor concentration using an electronic nose
CN101666787A (zh) * 2009-10-16 2010-03-10 福州大学 海产品气味辨别方法
CN105044298A (zh) * 2015-07-13 2015-11-11 常熟理工学院 一种基于机器嗅觉的蟹类新鲜度等级检测方法
CN105223240A (zh) * 2015-11-20 2016-01-06 上海应用技术学院 一种利用电子鼻检测蟹新鲜度的方法
CN106568907A (zh) * 2016-11-07 2017-04-19 常熟理工学院 一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法
CN109376805A (zh) * 2018-12-21 2019-02-22 四川理工学院 一种基于白酒基酒指纹图谱特征的分类方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05180774A (ja) * 1991-12-26 1993-07-23 Hitachi Plant Eng & Constr Co Ltd 鮪の鮮度判別方法及びその装置
CA2314237A1 (en) * 2000-07-18 2002-01-18 Richard Nigel Coleman Method and apparatus for estimating odor concentration using an electronic nose
CN101666787A (zh) * 2009-10-16 2010-03-10 福州大学 海产品气味辨别方法
CN105044298A (zh) * 2015-07-13 2015-11-11 常熟理工学院 一种基于机器嗅觉的蟹类新鲜度等级检测方法
CN105223240A (zh) * 2015-11-20 2016-01-06 上海应用技术学院 一种利用电子鼻检测蟹新鲜度的方法
CN106568907A (zh) * 2016-11-07 2017-04-19 常熟理工学院 一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法
CN109376805A (zh) * 2018-12-21 2019-02-22 四川理工学院 一种基于白酒基酒指纹图谱特征的分类方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
刘辉等: "基于电子鼻的鱼粉中挥发性盐基氮检测模型比较", 《农业工程学报》 *
吴振荣: "《统计学》", 31 July 2020, 北京理工大学出版社 *
曾宪武: "《大数据技术》", 31 March 2020, 西安电子科技大学出版社 *
李鑫星等: "近红外光谱的河蟹新鲜度快速检测研究", 《光谱学与光谱分析》 *
管彬彬等: "基于可视嗅觉指纹技术的水产品新鲜度快速表征", 《食品与发酵工业》 *
黄星奕等: "嗅觉可视化技术对虾储藏期内新鲜度变化的研究", 《食品工业》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114113471A (zh) * 2021-11-08 2022-03-01 滁州怡然传感技术研究院有限公司 一种基于机器学习的人工鼻冰箱食品新鲜度检测方法及系统
CN114324781A (zh) * 2022-03-11 2022-04-12 中汽研汽车零部件检验中心(宁波)有限公司 一种智能嗅辨方法和系统

Similar Documents

Publication Publication Date Title
CN105044298B (zh) 一种基于机器嗅觉的蟹类新鲜度等级检测方法
US5734796A (en) Self-organization of pattern data with dimension reduction through learning of non-linear variance-constrained mapping
CN112903919A (zh) 一种海蟹安全性检测识别方法及系统
Soltis et al. Plants meet machines: Prospects in machine learning for plant biology
CN106568907B (zh) 一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法
Wijaya et al. Sensor array optimization for mobile electronic nose: Wavelet transform and filter based feature selection approach
CN103544499B (zh) 一种基于机器视觉的表面瑕疵检测的纹理特征降维方法
Weng et al. A comprehensive method for assessing meat freshness using fusing electronic nose, computer vision, and artificial tactile technologies
CN107610028A (zh) 一种基于无线云传感网的大气污染物在线监测系统
Yu et al. A cluster-based wavelet feature extraction method and its application
CN108052975A (zh) 一种基于核主元和神经网络的车辆运行实时工况预测方法
CN111898639A (zh) 基于降维的分层时间记忆工业异常检测方法与装置
Shereena et al. Significance of dimensionality reduction in image processing
Billheimer et al. Natural variability of benthic species composition in the Delaware Bay
Zhu et al. Modified unsupervised discriminant projection with an electronic nose for the rapid determination of Chinese mitten crab freshness
Guney et al. Fish freshness assessment by using electronic nose
Kodogiannis et al. Neuro-fuzzy based identification of meat spoilage using an electronic nose
Kumar et al. IoT-Edge Computing for Efficient and Effective Information Process on Industrial Automation
Elhariri et al. Random forests based classification for crops ripeness stages
Kaladevi et al. Detection of sardine fish freshness using deep convolution neural network
Feil et al. Visualization of fuzzy clusters by fuzzy Sammon mapping projection: application to the analysis of phase space trajectories
Astuti et al. Gas array sensors based on electronic nose for detection of tuna (euthynnus affinis) contaminated by Pseudomonas aeruginosa
CN116205688A (zh) 生鲜产品信息处理方法、装置、计算机设备及存储介质
Kodogiannis et al. A fuzzy-wavelet neural network model for the detection of meat spoilage using an electronic nose
Fox et al. In situ analysis for intelligent control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination