CN112485217A - 一种应用于产地溯源的肉类鉴别模型的构建方法以及装置 - Google Patents

一种应用于产地溯源的肉类鉴别模型的构建方法以及装置 Download PDF

Info

Publication number
CN112485217A
CN112485217A CN202011404737.1A CN202011404737A CN112485217A CN 112485217 A CN112485217 A CN 112485217A CN 202011404737 A CN202011404737 A CN 202011404737A CN 112485217 A CN112485217 A CN 112485217A
Authority
CN
China
Prior art keywords
model
spectrum
spectral
sample
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011404737.1A
Other languages
English (en)
Other versions
CN112485217B (zh
Inventor
吴霆
杨灵
钟南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongkai University of Agriculture and Engineering
Original Assignee
Zhongkai University of Agriculture and Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongkai University of Agriculture and Engineering filed Critical Zhongkai University of Agriculture and Engineering
Priority to CN202011404737.1A priority Critical patent/CN112485217B/zh
Publication of CN112485217A publication Critical patent/CN112485217A/zh
Application granted granted Critical
Publication of CN112485217B publication Critical patent/CN112485217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • Development Economics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Chemical & Material Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Analytical Chemistry (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明提供了一种应用于产地溯源的肉类鉴别模型的构建方法,包括以下步骤:步骤1:分别制备多个不同肉类的样本集,每个样本集包括多个检测样本;步骤2:采用红外光谱仪分别采集步骤1中每个检测样本的原始光谱数据;步骤3:对所述原始光谱数据使用OST划分算法进行奇异点检测,然后将奇异点样本从每种肉类的样本集中剔除后得到对应的剩余样本集;步骤4:对多个所述剩余样本集中所有样本的原始光谱数据分别进行归一化预处理;步骤5:获取步骤4中得到的每个预处理后的光谱数据的光谱波段,保留需要的光谱波段,剔除冗余光谱波段;步骤6:将步骤5得到的光谱数据随机划分为校正集和检测集,通过校正集和检测集分别对基于CNN‑LSTM‑SOFTMAX网络的鉴别模型进行训练和检测。所述构建方法能够构建出对肉类进行溯源的模型。

Description

一种应用于产地溯源的肉类鉴别模型的构建方法以及装置
技术领域
本发明涉及肉类鉴别领域,尤其涉及一种应用于产地溯源的肉类 鉴别模型的构建方法以及装置。
背景技术
传统的肉类鉴别方法包括生物鉴定法和感官评定法,而对于生物 鉴定法一般比如采用聚合酶链式反应(PCR)、酶联免疫分析(ELISA) 等,该类检测方法虽然检测精度很高但存在着工序复杂、成本高、破 坏样本、检测时间长等缺点;而对于感官评定法,需要人工丰富的经 验,误差较大。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种应用 于产地溯源的肉类假冒鉴别方法,其能够解决现有技术中家畜肉类假 冒鉴别的成本高、检测时间长、误差大等问题。
为了克服现有技术的不足,本发明的目的之二在于提供一种应用 于产地溯源的肉类假冒鉴别装置,其能够解决现有技术中家畜肉类假 冒鉴别的成本高、检测时间长、误差大等问题的问题。
本发明的目的之一采用以下技术方案实现:
一种应用于产地溯源的肉类鉴别模型的构建方法,其特征在于, 包括以下步骤:
步骤1:分别制备多个不同肉类的样本集,每个样本集包括多个 检测样本;
步骤2:采用红外光谱仪分别采集步骤1中每个检测样本的原始 光谱数据;
步骤3:对所述原始光谱数据使用OST划分算法进行奇异点检 测,然后将奇异点样本从每种肉类的样本集中剔除后得到对应的剩余 样本集;
步骤4:对多个所述剩余样本集中所有样本的原始光谱数据分别 进行归一化预处理;
步骤5:获取步骤4中得到的每个预处理后的光谱数据的光谱波 段,剔除冗余光谱波段;
步骤6:将步骤5得到的光谱数据随机划分为校正集和检测集, 通过校正集和检测集分别对基于CNN-LSTM-SOFTMAX网络的鉴别 模型进行训练和检测。
优选地,步骤3中,在采用OST划分算法时,需要以下三个步 骤:
步骤31:随机抽取多个所述原始光谱数据,构建多棵二叉树;
步骤32:根据构建的多棵二叉树,计算每个光谱的异常分值;
步骤33:根据异常分值识别出奇异点并剔除。
优选地,步骤31具体包括如下步骤:
步骤311:假设同一肉类原始光谱样本集为X,从X中随机选择 Ψ个作为光谱子样本,放入一棵孤立树的根节点;
步骤312:随机指定一个光谱子样本的测量维度,在当前光谱节 点数据范围内,随机产生一个切割点p,切割点p产生于当前节点数 据中指定维度的最大值与最小值之间;
步骤313:所述切割点p的选取生成了一个超平面,将当前光谱 节点数据空间切分为2个子空间,把当前所选维度下小于切割点p的 光谱节点放在当前节点的左分支,把大于等于切割点p的光谱节点 放在当前节点的右分支;
步骤314:在当前光谱节点的左分支和右分支递归步骤2、3, 不断构造新的叶子节点,直到叶子节点上只有一个数据、无法再继续 切割或二叉树已经生长到了所设定的高度。
步骤315:重复步骤311-314过程,构建多颗二叉树。
优选地,在所述步骤32中,采用以下公式计算异常分值:
Figure BDA0002813613520000031
其中h(x)为光谱样本x在每棵树的高度,
Figure BDA0002813613520000032
E(h(x))为在N课树中的高度平均值,
H(ψ)=ln(n-1)+0.577,
Figure BDA0002813613520000033
c(ψ)为ψ个子样本下该棵树的平均高度,因此,E(h(x))/c(ψ)为光 谱样本x在N课树中的高度平均值的归一化值。
通过s(x,ψ)得到光谱样本x的异常分值后,通过判断该值是否接 近1来判断该光谱样本x是否为异常点。
优选地,在步骤5中,通过Sparse Adaptive Lasso算法寻找光谱 重要特征波段:
假设Y=Xβ+Σβε
其中Y=(y1,y2,...yn)为光谱因变量向量,X为光谱自变量矩阵, β为未知参数,ε为随机误差,则:
Sparse Adaptive-Lasso的代价函数为:
Figure BDA0002813613520000034
其中
Figure BDA0002813613520000035
来限定该方程的稀疏性,为求该代价函数的最小值
Figure BDA0002813613520000036
求λn使下列表达式最小:
Figure BDA0002813613520000041
输出:
Figure BDA0002813613520000042
全局最优解为:
Figure BDA0002813613520000043
由于
Figure BDA0002813613520000044
为代价函数的最优解,同时为光谱自变量X的系数,由于 代价函数中稀疏的限定,导致大部分
Figure BDA0002813613520000045
趋近于0,这说明光谱全波段 中的大部分波段的重要性为0,因此剩余的
Figure BDA0002813613520000046
对应的光谱波段即为重 要的特征波段。
优选地,在步骤6中,包括模型的搭建,所述模型搭建的步骤具 体包括:
1)根据不同肉类的鉴别任务建立不同的CNN卷积网络模型并 拓展卷积层和Maxpooling层的个数,所述卷积层和Maxpooling的个 数也是根据不同的肉类进行确定;
2)搭建LSTM模型,根据不同肉类的鉴别任务适当调整LSTM 层数和每层LSTM模型的输出个数,将CNN卷积网络模型的输出特 征合并为一维序列作为LSTM模型的输入
3)使用多分类SOFTMAX作为输出层,将LSTM模型的输出作 为多分类SOFTMAX的输入,SOFTMAX的输出为肉类的源地,完 成鉴别模型的搭建。
优选地,在步骤6中还包括对搭建好的模型的训练,具体包括如 下步骤:
a)将所述校正集转换为一维序列数据作为CNN模型的输入;
b)使用一维卷积提取校正集中的光谱特征信息,使用Maxpooling 对所述光谱特征信息进行池化以保留边缘特征;
c)将步骤b中的得到的光谱特征信息输入到LSTM模型中,并 使用SOFTMAX输出分类结果。在训练过程中,选择分类交叉熵作 为损失函数,Adam作为优化器,ReLU为CNN激活函数,预测准 确率和ROC为评价指标;
d)在所有的校正集执行完所述步骤a)-c)之后,将所述检测集 输入训练好的CNN-LSTM-SOFTMAX模型,通过鉴别模型输出的结 果来判断鉴别模型鉴别的准确性。
相比现有技术,本发明具有以下有益效果:
本发明通过红外光谱技术结合相应的建模方法对不同种类的肉 类进行鉴别判断,解决了现有技术中肉类假冒鉴别时的成本高、检测 试剂、误差大等问题。
附图说明
图1为本发明提供的鉴别方法的流程图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述:
实施例
一种应用于产地溯源的肉类鉴别模型的构建方法,包括以下步 骤:
步骤1:分别制备多个不同肉类的样本集,每个样本集包括多个 检测样本;
将猪肉、牛肉和羊肉等不同种类的精瘦肉购买后放到实验室冰箱 冷藏或立即进行样本制作。制作方法为对每个样本切成薄片并放入 45度恒温箱烘干48小时,研磨成粉末后装入干燥保鲜膜中保存。
步骤2:分别采集步骤S1中每个检测样本的原始光谱数据;
使用傅里叶变换红外光谱仪对制作的样本进行透射光谱采集,扫 描的波数范围为4000-450cm-1、分辨率为4cm-1、扫描环境温度为 25℃、湿度为30±5%,对每个样本连续扫描多次求平均值得到每个 样本的原始光谱数据。
步骤3:对所述原始光谱数据使用OST划分算法进行奇异点检 测,然后将奇异点样本从每种肉类的样本集中剔除后得到对应的剩余 样本集。
由于样本制备过程中被污染或光谱采集过程中受设备、环境等因 素的影响,可能存在个别样本成为奇异点样本,其对建模的稳健性、 精度都有较大的影响,因此本发明采用OST划分算法首先将奇异点 样本从该肉类的样本集中剔除,以免影响后建模,影响鉴别结果。
对于在剔除奇异点样本与不剔除奇异点样本的两种情况对鉴别 的结果性能影响进行了检测,检测结果如表1所示。
表1剔除奇异点样本与不剔除奇异点样本的两种情况的检测结果对比
Figure BDA0002813613520000061
从表1可以看出校正集决定系数R2 cal、检测集决定系数R2 val、校 正集均方根误差RMSEC和检测集均方根误差RMSECV均有所提高, 说明奇异点样本对建模模型有较大影响,排除奇异点样本后进行建模 模型鉴别时,其性能更好。
步骤4:对多个剩余样本集中所有样本的原始光谱数据分别进行 预处理来消除畸变、噪声影响。
预处理方法为多元散射校正(MSC)预处理、标准正则变换(SNV) 预处理、一阶求导预处理、二阶求导预处理、Sacitzky-Golay平滑预 处理以及归一化六种预处理方法中的一种。
对上述六种预处理的方法进行分析后得到每种预处理的方法对 鉴别结果的影响性能,如表2所示。
表2不同预处理方法对鉴别结果的影响性能
Figure BDA0002813613520000062
从表2中可以看出,一阶求导预处理方法和二阶求导预处理方法 不仅放大了特征吸收波段,同时也放大了噪声,导致模型性能和准确 率反而下降,而归一化处理由于能够排除不同样本之间厚度、透过率 的影响,因此更能有效消除同种肉类样本间的差异,效果最好。其中, R2 cal为校正集决定系数、R2 val为检测集决定系数、RMSEC为校正集 均方根误差、RMSECV为预测集均方根误差。另外,从表2中的数 据还可以看出,归一化预处理方法的校正集决定系数R2 cal、检测集决 定系数R2 val均为0.99、校正集均方根误差RMSEC为0.06、预测集均 方根误差RMSECV为0.08、检测集预测准确率为100%,由此可以 看出归一化预处理应用于建模时使得预测准确率最高。因此,归一化 预处理为最为优选地预处理方法。
步骤5:对步骤4中得到的每个预处理后的光谱数据寻找对 CNN-LSTM-SOFTMAX模型具有一定影响程度的光谱波段,剔除冗 余波段,即光谱数据中的光谱波段仅仅为具有一定影响程度的光谱波 段。通过步骤5的处理能够增加鉴别模型的鲁棒性和稳定性。
步骤6:将步骤5得到的光谱数据随机划分为校正集和检测集, 通过建模方法对校正集建立基于CNN-LSTM-SOFTMAX网络的鉴别 模型。
校正集和检测集划分方法为随机法:将特征提取后肉类光谱样本 进行随机按比例2:1分为两部分,校正集和检测集占比为2:1,使用 校正集来搭建光谱鉴别模型,检测集不参与模型搭建,使用检测集来 测试模型对外部样本的检测性能。
步骤3中,在采用OST划分算法时,需要以下三个步骤:
步骤31:随机抽取多个所述原始光谱数据,构建多棵二叉树;
步骤32:根据构建的多棵二叉树,计算每个光谱的异常分值;
步骤33:根据异常分值识别出奇异点并剔除。
进一步,步骤31又具体包括如下步骤:
步骤311:假设同一肉类原始光谱样本集为X,从X中随机选择 Ψ个作为光谱子样本,放入一棵孤立树的根节点;
步骤312:随机指定一个光谱子样本的测量维度,在当前光谱节 点数据范围内,随机产生一个切割点p,切割点p产生于当前节点数 据中指定维度的最大值与最小值之间;
步骤313:所述切割点p的选取生成了一个超平面,将当前光谱 节点数据空间切分为2个子空间,把当前所选维度下小于切割点p的 光谱节点放在当前节点的左分支,把大于等于切割点p的光谱节点 放在当前节点的右分支;
步骤314:在当前光谱节点的左分支和右分支递归步骤2、3, 不断构造新的叶子节点,直到叶子节点上只有一个数据、无法再继续 切割或二叉树已经生长到了所设定的高度。
步骤315:重复步骤311-314过程,构建N颗二叉树。
在所述步骤32中,采用以下公式计算异常分值:
Figure BDA0002813613520000081
其中h(x)为光谱样本x在每棵树的高度,
Figure BDA0002813613520000082
E(h(x))为在N课树中的高度平均值,
H(ψ)=ln(n-1)+0.577,
Figure BDA0002813613520000083
c(ψ)为ψ个子样本下该棵树的平均高度,因此,E(h(x))/c(ψ)为光 谱样本x在N课树中的高度平均值的归一化值。
通过s(x,ψ)得到光谱样本x的异常分值后,通过判断该值是否接 近1来判断该光谱样本x是否为异常点。
在步骤5中,Sparse Adaptive Lasso算法通过以下公式寻找光谱 重要特征波段:
假设Y=Xβ+Σβε
其中Y=(y1,y2,...yn)为光谱因变量向量,X为光谱自变量矩阵, β为未知参数,ε为随机误差,则:
Sparse Adaptive-Lasso的代价函数为:
Figure BDA0002813613520000084
其中
Figure BDA0002813613520000091
来限定该方程的稀疏性,为求该代价函数的最小值
Figure BDA0002813613520000092
求λn使下列表达式最小:
Figure BDA0002813613520000093
输出:
Figure BDA0002813613520000094
全局最优解为:
Figure BDA0002813613520000095
由于
Figure BDA0002813613520000096
为代价函数的最优解,同时为光谱自变量X的系数,由于 代价函数中稀疏的限定,导致大部分
Figure BDA0002813613520000097
趋近于0,这说明光谱全波段 中的大部分波段的重要性为0,因此剩余的
Figure BDA0002813613520000098
对应的光谱波段即为重 要的特征波段。特征提取后对肉类假冒鉴别起决定性作用的特征波段 为:
[451-453cm-1,472-474cm-1,619-622.8948cm-1,642cm-1,657-670cm-1,661cm-1,698-707cm-1,829-831cm-1,860-862cm-1,910-918cm-1,946-963cm-1,1070-1072 cm-1,1191-1194cm-1,1880-1898cm-1,1922-1938cm-1]。
在步骤6中,通过建立CNN-LSTM-SOFTMAX光谱鉴别模型, 对特征提取后的光谱波段进行预测,实现不同肉类的假冒鉴别。
CNN-LSTM-SOFTMAX模型搭建和训练过程如下:
模型的搭建:
1)根据不同肉类的鉴别任务建立不同的CNN卷积网络模型并 拓展卷积层和Maxpooling层的个数,所述卷积层和Maxpooling的个 数也是根据不同的肉类进行确定;
2)搭建LSTM模型,根据不同肉类的鉴别任务适当调整LSTM 层数和每层LSTM模型的输出个数,将CNN卷积网络模型的输出特 征合并为一维序列作为LSTM模型的输入
3)使用多分类SOFTMAX作为输出层,将LSTM模型的输出作 为多分类SOFTMAX的输入,SOFTMAX的输出为肉类的源地,完 成鉴别模型的搭建。
对模型的训练:
a)将所述校正集转换为一维序列数据作为CNN模型的输入;
b)使用一维卷积提取校正集中的光谱特征信息,使用Maxpooling 对所述光谱特征信息进行池化以保留边缘特征;
c)将步骤b中的得到的光谱特征信息输入到LSTM模型中,并 使用SOFTMAX输出分类结果。在训练过程中,选择分类交叉熵作 为损失函数,Adam作为优化器,ReLU为CNN激活函数,预测准 确率和ROC为评价指标;
d)在所有的校正集执行完所述步骤a)-c)之后,将所述检测集 输入训练好的CNN-LSTM-SOFTMAX模型,通过鉴别模型输出的结 果来判断鉴别模型鉴别的准确性。
对本领域的技术人员来说,可根据以上描述的技术方案以及构 思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变 都应该属于本发明权利要求的保护范围之内。

Claims (8)

1.一种应用于产地溯源的肉类鉴别模型的构建方法,其特征在于,包括以下步骤:
步骤1:分别制备多个不同肉类的样本集,每个样本集包括多个检测样本;
步骤2:采用红外光谱仪分别采集步骤1中每个检测样本的原始光谱数据;
步骤3:对所述原始光谱数据使用OST划分算法进行奇异点检测,然后将奇异点样本从每种肉类的样本集中剔除后得到对应的剩余样本集;
步骤4:对多个所述剩余样本集中所有样本的原始光谱数据分别进行归一化预处理;
步骤5:获取步骤4中得到的每个预处理后的光谱数据的光谱波段,保留需要的光谱波段,剔除冗余光谱波段;
步骤6:将步骤5得到的光谱数据随机划分为校正集和检测集,通过校正集和检测集分别对基于CNN-LSTM-SOFTMAX网络的鉴别模型进行训练和检测。
2.根据权利要求1所述的构建方法,其特征在于,步骤3中,在采用OST划分算法时,需要以下三个步骤:
步骤31:随机抽取多个所述原始光谱数据,构建多棵二叉树;
步骤32:根据构建的多棵二叉树,计算每个光谱的异常分值;
步骤33:根据异常分值识别出奇异点并剔除。
3.根据权利要求1所述的构建方法,其特征在于,步骤31具体包括如下步骤:
步骤311:假设同一肉类原始光谱样本集为X,从X中随机选择Ψ个作为光谱子样本,放入一棵孤立树的根节点;
步骤312:随机指定一个光谱子样本的测量维度,在当前光谱节点数据范围内,随机产生一个切割点p,切割点p产生于当前节点数据中指定维度的最大值与最小值之间;
步骤313:所述切割点p的选取生成了一个超平面,将当前光谱节点数据空间切分为2个子空间,把当前所选维度下小于切割点p的光谱节点放在当前节点的左分支,把大于等于切割点p的光谱节点放在当前节点的右分支;
步骤314:在当前光谱节点的左分支和右分支递归步骤2、3,不断构造新的叶子节点,直到叶子节点上只有一个数据、无法再继续切割或二叉树已经生长到了所设定的高度。
步骤315:重复步骤311-314过程,构建N颗二叉树。
4.根据权利要求1所述的构建方法,其特征在于,在所述步骤32中,采用以下公式计算异常分值:
Figure FDA0002813613510000021
其中h(x)为光谱样本x在每棵树的高度,
Figure FDA0002813613510000022
E(h(x))为在N课树中的高度平均值,
H(ψ)=ln(n-1)+0.577,
Figure FDA0002813613510000023
c(ψ)为ψ个子样本下该棵树的平均高度,因此,E(h(x))/c(ψ)为光谱样本x在N课树中的高度平均值的归一化值。
通过s(x,ψ)得到光谱样本x的异常分值后,通过判断该值是否接近1来判断该光谱样本x是否为异常点。
5.根据权利要求1所述的构建方法,其特征在于,在步骤5中,通过Sparse AdaptiveLasso算法寻找需要的光谱波段:
假设Y=Xβ+Σβε
其中Y=(y1,y2,...yn)为光谱因变量向量,X为光谱自变量矩阵,β为未知参数,ε为随机误差,则:
Sparse Adaptive-Lasso的代价函数为:
Figure FDA0002813613510000024
其中
Figure FDA0002813613510000025
来限定该方程的稀疏性,为求该代价函数的最小值
Figure FDA0002813613510000026
求λn使下列表达式最小:
Figure FDA0002813613510000031
输出:
Figure FDA0002813613510000032
全局最优解为:
Figure FDA0002813613510000033
Figure FDA0002813613510000034
为代价函数的最优解,同时为光谱自变量X的系数,
Figure FDA0002813613510000035
趋近于0对应的光谱波段即为冗余波段,非趋近于0对应的光谱波段即为需要的光谱波段。
6.根据权利要求1所述的构建方法,其特征在于,在步骤6中,包括模型的搭建,所述模型搭建的步骤具体包括:
1)根据不同肉类的鉴别任务建立不同的CNN卷积网络模型并拓展卷积层和Maxpooling层的个数,所述卷积层和Maxpooling的个数也是根据不同的肉类进行确定;
2)搭建LSTM模型,根据不同肉类的鉴别任务适当调整LSTM层数和每层LSTM模型的输出个数,将CNN卷积网络模型的输出特征合并为一维序列作为LSTM模型的输入
3)使用多分类SOFTMAX作为输出层,将LSTM模型的输出作为多分类SOFTMAX的输入,SOFTMAX的输出为肉类的源地,完成鉴别模型的搭建。
7.根据权利要求6所述的构建方法,其特征在于,在步骤6中还包括对搭建好的模型的训练,具体包括如下步骤:
a)将所述校正集转换为一维序列数据作为CNN模型的输入;
b)使用一维卷积提取校正集中的光谱特征信息,使用Maxpooling对所述光谱特征信息进行池化以保留边缘特征;
c)将步骤b中的得到的光谱特征信息输入到LSTM模型中,并使用SOFTMAX输出分类结果。在训练过程中,选择分类交叉熵作为损失函数,Adam作为优化器,ReLU为CNN激活函数,预测准确率和ROC为评价指标;
d)在所有的校正集执行完所述步骤a)-c)之后,得到训练后的CNN-LSTM-SOFTMAX模型,即为鉴别模型;
e)将所述检测集输入到训练好的CNN-LSTM-SOFTMAX模型中,通过鉴别模型输出的结果来判断鉴别模型鉴别的准确性。
8.一种应用于产地溯源的肉类鉴别装置,其特征在于,包括采用权利要求1-5所述的构建方法构建的模型。
CN202011404737.1A 2020-12-02 2020-12-02 一种应用于产地溯源的肉类鉴别模型的构建方法以及装置 Active CN112485217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011404737.1A CN112485217B (zh) 2020-12-02 2020-12-02 一种应用于产地溯源的肉类鉴别模型的构建方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011404737.1A CN112485217B (zh) 2020-12-02 2020-12-02 一种应用于产地溯源的肉类鉴别模型的构建方法以及装置

Publications (2)

Publication Number Publication Date
CN112485217A true CN112485217A (zh) 2021-03-12
CN112485217B CN112485217B (zh) 2023-04-25

Family

ID=74939556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011404737.1A Active CN112485217B (zh) 2020-12-02 2020-12-02 一种应用于产地溯源的肉类鉴别模型的构建方法以及装置

Country Status (1)

Country Link
CN (1) CN112485217B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113376114A (zh) * 2021-06-24 2021-09-10 北京市生态环境监测中心 一种基于紫外-可见光谱数据的水污染溯源方法
CN116008208A (zh) * 2023-03-27 2023-04-25 山东省科学院海洋仪器仪表研究所 一种海水硝酸盐浓度特征光谱波段的选择方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107219184A (zh) * 2017-04-24 2017-09-29 仲恺农业工程学院 一种应用于产地溯源的肉类鉴别方法及装置
CN109632693A (zh) * 2018-12-10 2019-04-16 昆明理工大学 一种基于blstm-rnn的太赫兹光谱识别方法
US20190294869A1 (en) * 2018-03-26 2019-09-26 Nvidia Corporation Object behavior anomaly detection using neural networks
CN110954499A (zh) * 2019-11-20 2020-04-03 中国计量大学 一种进口三文鱼产地混合鉴别方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107219184A (zh) * 2017-04-24 2017-09-29 仲恺农业工程学院 一种应用于产地溯源的肉类鉴别方法及装置
US20190294869A1 (en) * 2018-03-26 2019-09-26 Nvidia Corporation Object behavior anomaly detection using neural networks
CN109632693A (zh) * 2018-12-10 2019-04-16 昆明理工大学 一种基于blstm-rnn的太赫兹光谱识别方法
CN110954499A (zh) * 2019-11-20 2020-04-03 中国计量大学 一种进口三文鱼产地混合鉴别方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
WENG SHIZHUANG ET AL.: "Rapid detection of adulteration of minced beef using Vis/NIR reflectance spectroscopy with multivariate methods" *
刘晓瑜: "基于卷积神经网络的新鲜-冷冻猪肉近红外光谱检测研究" *
张宁: "羊肉产地近红外光谱溯源模型的建立与机理初探" *
杨灵 等: "光谱技术在肉类检测中的应用及研究进展" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113376114A (zh) * 2021-06-24 2021-09-10 北京市生态环境监测中心 一种基于紫外-可见光谱数据的水污染溯源方法
CN116008208A (zh) * 2023-03-27 2023-04-25 山东省科学院海洋仪器仪表研究所 一种海水硝酸盐浓度特征光谱波段的选择方法

Also Published As

Publication number Publication date
CN112485217B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN109493287B (zh) 一种基于深度学习的定量光谱数据分析处理方法
Krier et al. Feature clustering and mutual information for the selection of variables in spectral data.
CN112485217B (zh) 一种应用于产地溯源的肉类鉴别模型的构建方法以及装置
CN111157698B (zh) 一种利用发射率数据获取黑土土壤全钾含量的反演方法
CN109870421B (zh) 一种基于可见光/近红外光谱分析的递增式木材树种分类识别方法
CN109034261A (zh) 一种基于支持向量机的近红外光谱数据分析方法
CN105372198B (zh) 基于集成l1正则化的红外光谱波长选择方法
CN112285056B (zh) 一种用于光谱样品个性化校正集选择及建模方法
CN111950795B (zh) 基于随机森林的松散回潮加水比例的预测方法
CN106248621A (zh) 一种评价方法与系统
CN112817954A (zh) 一种基于多种方法集成学习的缺失值插补方法
CN117852949A (zh) 一种烟叶烘烤自动评价考核方法
CN116619136A (zh) 一种多工况多源数据的刀具磨损预测方法
CN113868960B (zh) 一种基于典型相关森林的土壤重金属特征选取方法及系统
Huang et al. Optimal wavelength selection for hyperspectral scattering prediction of apple firmness and soluble solids content
CN112782115A (zh) 一种基于近红外光谱检验卷烟感官特征一致性的方法
CN117057464A (zh) 基于非线性记忆学习的土壤有机质光谱预测方法和装置
CN115824996A (zh) 基于近红外光谱的烟叶常规化学成分通用模型建模方法
CN112881333B (zh) 一种基于改进免疫遗传算法的近红外光谱波长筛选方法
CN115931773A (zh) 一种近红外光谱定量分析中的波长选择方法
CN114062306B (zh) 一种近红外光谱数据分段预处理方法
CN115630332A (zh) 一种小麦粉粉质特性预测方法
CN113607683A (zh) 一种近红外光谱定量分析的自动建模方法
CN111595802A (zh) 一种基于nir光谱的忧遁草种源地分类模型的构建方法及应用
CN109342352A (zh) 一种基于混合模拟退火与遗传算法的面粉质量检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant