CN114399674A - 一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统 - Google Patents

一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统 Download PDF

Info

Publication number
CN114399674A
CN114399674A CN202210070246.0A CN202210070246A CN114399674A CN 114399674 A CN114399674 A CN 114399674A CN 202210070246 A CN202210070246 A CN 202210070246A CN 114399674 A CN114399674 A CN 114399674A
Authority
CN
China
Prior art keywords
shellfish
toxin
layer
particle
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210070246.0A
Other languages
English (en)
Inventor
刘瑶
乔付
王树文
李明
王润涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lingnan Normal University
Original Assignee
Lingnan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lingnan Normal University filed Critical Lingnan Normal University
Priority to CN202210070246.0A priority Critical patent/CN114399674A/zh
Publication of CN114399674A publication Critical patent/CN114399674A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统,涉及贝类毒素检测技术领域,用以解决现有贝类毒素检测方法对于贝类的检测时间长、操作复杂且需要对样品进行预先处理的问题。本发明的技术要点包括:采集多个贝类样本的高光谱图像;对高光谱图像进行光谱数据提取和预处理;基于模糊聚类与粒子群优化的特征选择算法,获取最优特征波段子集;将最优特征波段子集输入基于代价敏感概率神经网络的贝类毒素无损检测模型中进行训练,获取训练好的检测模型;将经过预处理的待检测贝类样本的光谱数据输入到训练好的检测模型中,获取检测结果。本发明将高光谱图像技术应用于贝类毒素无损检测中,为解决贝类食用安全问题提供了新途径。

Description

一种基于高光谱图像技术的贝类毒素无损快速检测方法及 系统
技术领域
本发明涉及贝类毒素检测技术领域,具体涉及一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统。
背景技术
我国是世界上最大的贝类养殖国家,近十几年来,大量未经处理的工农业和生活废水直接排放到海洋,导致水体富营养化,赤潮频繁发生,赤潮毒素泛滥。海洋贝类通过滤食使得毒素在体内富集,再通过食物链进入人体,严重危害食用者的身体健康,甚至威胁生命。民以食为天,食以安为先,贝类毒素的污染不仅对海水养殖业造成巨大经济损失,更是对人类健康造成了严重威胁。因此,开展对贝类毒素的检测和监控,提高贝类毒素污染检测能力已成为迫切需要解决的问题。
传统的海洋贝类毒素检测方法有小鼠生物检测法、液相色谱法、酶联免疫法等,这些方法均有各自的优势,但是都存在检测时间长、操作复杂、需要对样品进行相应的预处理等问题。并且,在贝类毒素检测实际应用中缺少用于现场检测的快速筛查技术,因此,开发快速、准确、低成本的贝类毒素检测技术具有重要的应用价值。兼具图像处理技术和光谱分析技术优点的高光谱图像技术的迅速发展为实现贝类毒素快速、无损检测提供了技术可行性。由于检测对象因其所含的化学成分和组成结构不同,在特定波长点处对相同光的吸光度、反射率和分散度不同,各化学成分在特定波长处又有官能团独特属性的吸收值。因此,对高光谱图像中所提取光谱数据进行分析,可以实现化学成分的定量分析、品质的定性检测。与传统的毒素检测方法相比,高光谱图像检测技术特点是无需对样品做复杂的预处理,检测是非破坏性的且操作简便快速,适于大批量检测,分析过程中不需要任何化学试剂辅助,对环境无污染。
结合目前研究现状分析,现有的针对贝类毒素的高光谱图像快速无损检测研究还存在以下挑战:1)在特征波段选择方面,针对待处理的对象和数据类型的多样化问题,目前的波段选择方法缺乏特征波段与样本对象内在差异之间关系的充分考虑,算法泛化能力普遍较差,难以实现特征波段子集的快速准确获取。2)在高光谱图像分类检测方面,针对同种物质光谱曲线较为相似难于区分的问题,目前的研究工作主要集中在分类模型的优化设计上,如提高分类精度、检测速度等,忽略了实际所获取的数据集各类别样本的数量和分布不平衡问题。
综上,在应用高光谱图像技术进行贝类毒素检测问题上,很多关键问题没有得到充分地研究和解决,缺乏系统性的建模理论和方法框架,大大制约了高光谱无损检测在贝类食品安全检测中的应用和推广。
发明内容
鉴于以上问题,本发明提出一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统,用以解决现有贝类毒素检测方法对于贝类的检测时间长、操作复杂且需要对样品进行预先处理的问题。
根据本发明的一方面,提供一种基于高光谱图像技术的贝类毒素无损快速检测方法,该方法包括以下步骤:
步骤一、采集多个贝类样本的高光谱图像作为训练样本集;所述贝类样本包括感染毒素的贝类和未感染毒素的贝类;
步骤二、对所述高光谱图像进行光谱数据提取和预处理;
步骤三、基于模糊聚类与粒子群优化的特征选择算法,获取最优特征波段子集;
步骤四、将所述最优特征波段子集输入基于代价敏感概率神经网络的贝类毒素无损检测模型中进行训练,获取训练好的贝类毒素无损检测模型;
步骤五、将经过预处理的待检测贝类样本的光谱数据输入到训练好的贝类毒素无损检测模型中,获取检测结果;所述检测结果为待检测贝类样本是否为感染毒素的贝类。
进一步地,步骤二中所述预处理包括基线校正、变量标准化、多元散射校正和求导处理。
进一步地,步骤三的具体步骤包括:
步骤三一、随机选择波段生成初始粒子群,并且将它们设置为初始聚类中心;根据下式计算初始隶属度矩阵:
Figure BDA0003481804830000021
式中,uij表示第j个波段属于第i个聚类簇中心的隶属度;C表示波段个数即聚类个数;m表示模糊因子;dij表示第i个聚类簇中心到第j个波段的欧几里得距离;dkj表示第k个聚类簇中心到第j个波段的欧几里得距离;
按照下式计算所有粒子的目标函数J,并且将它们保存为
Figure BDA0003481804830000022
即粒子pi最优位置对应的目标函数:
Figure BDA0003481804830000031
式中,N表示波段总数即聚类总数;
设置初始局部最优粒子pbi(1)=pi(1),使得初始粒子即为局部最优粒子;
设置初始全局最优目标函数值
Figure BDA0003481804830000032
即等于粒子pi初始位置对应的目标函数,并保存相关的全局最优粒子为pg(1);设置初始速度vi(1)=0,迭代计数指针t=1;
步骤三二、对于群体中的每个粒子pi(t),i=1,2,……,N,按照下述步骤处理:
步骤三二一、计算更新速率vi(t+1),并且按照下式更新粒子pi(t+1):
Figure BDA0003481804830000033
式中,ω是惯性系数;c1和c2分别是局部最优解和全局最优解的学习率权重;r1和r2是在[0,1]内随机生成的参数;
步骤三二二、计算更新后粒子pi(t+1)的目标函数值,并将结果保存为fpi(t+1);
步骤三二三、比较局部最优解并更新:如果fpi(t+1)<fbi(t),那么更新局部最优函数值fbi(t+1)=fpi(t)和局部最优粒子位置pbi(t+1)=pi(t+1);
步骤三二四、比较全局最优解并更新:如果
Figure BDA0003481804830000034
那么更新全局最优函数值fpg(t+1)=minfpi(t+1)和全局最优粒子位置pg(t+1);
步骤三三、设置迭代计数指针t=t+1,若计数t大于预设最大迭代次数或者在连续多次迭代过程中相邻两次的全局最优目标函数值变化很小|fpg(t+1)-fpg(t)|≤0.0001,则停止迭代上述过程,并输出最终结果,获得多个聚类簇;
步骤三四、对于每个聚类簇,选择该聚类簇中具有最大信息熵的波段作为最优波段。
进一步地,步骤四的具体步骤包括:
步骤四一、分别估算将未感染毒素的贝类样本和感染毒素的贝类样本进行错误分类所带来的损失,并以此构建代价矩阵;
步骤四二、根据所述代价矩阵确定贝类样本的置信度向量;
步骤四三、基于所述置信度向量构建代价敏感概率神经网络,并将最优特征波段子集输入,训练获得基于代价敏感概率神经网络的贝类毒素无损检测模型。
进一步地,步骤四中所述代价敏感概率神经网络结构包括8层卷积池化层,第一层卷积层,卷积核大小为11*11,步长为4,总共64个特征;第一最大池化层,池化范围3*3,步长为2;第二层卷积层,卷积核大小为5*5,步长为1,总共192个特征;第二最大池化层,池化范围3*3,步长为2;第三层卷积层,卷积核大小为3*3,步长为1,总共384个特征;第四层卷积层,卷积核大小为3*3,步长为4,总共384个特征;第五层卷积层,卷积核大小为3*3,步长为4,总共256个特征;第五最大池化层,池化范围3*3,步长为2;第六卷积层,卷积核大小为5*5,步长为1,总共4096个特征;第七卷积层,卷积核大小为1*1,步长为1,总共4096个特征;第八卷积层,卷积核大小为1*1,步长为1,总共2个特征;其中,在第八卷积层与损失函数之间加入代价敏感激活层,对第八卷积层的输出向量使用代价敏感激活层激活,计算方式为:
Figure BDA0003481804830000041
式中,β表示对应当前样本的置信度向量;O表示第八卷积层的输出向量,输出两个类别的概率;n、k分别表示第八卷积层的第n、k个输出向量。
根据本发明的另一方面,提供一种基于高光谱图像技术的贝类毒素无损快速检测系统,该系统包括:
样本采集模块,其配置成采集多个贝类样本的高光谱图像作为训练样本集;所述贝类样本包括感染毒素的贝类和未感染毒素的贝类;
预处理模块,其配置成对所述高光谱图像进行光谱数据提取和预处理;
特征选择模块,其配置成基于模糊聚类与粒子群优化的特征选择算法,获取最优特征波段子集;
分类模型训练模块,其配置成将所述最优特征波段子集输入基于代价敏感概率神经网络的贝类毒素无损检测模型中进行训练,获取训练好的贝类毒素无损检测模型;
检测模块,其配置成将经过预处理的待检测贝类样本的光谱数据输入到训练好的贝类毒素无损检测模型中,获取检测结果;所述检测结果为待检测贝类样本是否为感染毒素的贝类。
进一步地,所述预处理模块中所述预处理包括基线校正、变量标准化、多元散射校正和求导处理。
进一步地,所述特征选择模块中获取最优特征波段子集的具体步骤包括:
步骤三一、随机选择波段生成初始粒子群,并且将它们设置为初始聚类中心;根据下式计算初始隶属度矩阵:
Figure BDA0003481804830000051
式中,uij表示第j个波段属于第i个聚类簇中心的隶属度;C表示波段个数即聚类个数;m表示模糊因子;dij表示第i个聚类簇中心到第j个波段的欧几里得距离;dkj表示第k个聚类簇中心到第j个波段的欧几里得距离;
按照下式计算所有粒子的目标函数J,并且将它们保存为
Figure BDA0003481804830000052
即粒子pi最优位置对应的目标函数:
Figure BDA0003481804830000053
式中,N表示波段总数即聚类总数;
设置初始局部最优粒子pbi(1)=pi(1),使得初始粒子即为局部最优粒子;
设置初始全局最优目标函数值
Figure BDA0003481804830000054
即等于粒子pi初始位置对应的目标函数,并保存相关的全局最优粒子为pg(1);设置初始速度vi(1)=0,迭代计数指针t=1;
步骤三二、对于群体中的每个粒子pi(t),i=1,2,……,N,按照下述步骤处理:
步骤三二一、计算更新速率vi(t+1),并且按照下式更新粒子pi(t+1):
Figure BDA0003481804830000055
式中,ω是惯性系数;c1和c2分别是局部最优解和全局最优解的学习率权重;r1和r2是在[0,1]内随机生成的参数;
步骤三二二、计算更新后粒子pi(t+1)的目标函数值,并将结果保存为fpi(t+1);
步骤三二三、比较局部最优解并更新:如果fpi(t+1)<fbi(t),那么更新局部最优函数值fbi(t+1)=fpi(t)和局部最优粒子位置pbi(t+1)=pi(t+1);
步骤三二四、比较全局最优解并更新:如果
Figure BDA0003481804830000056
那么更新全局最优函数值fpg(t+1)=minfpi(t+1)和全局最优粒子位置pg(t+1);
步骤三三、设置迭代计数指针t=t+1,若计数t大于预设最大迭代次数或者在连续多次迭代过程中相邻两次的全局最优目标函数值变化很小|fpg(t+1)-fpg(t)|≤0.0001,则停止迭代上述过程,并输出最终结果,获得多个聚类簇;
步骤三四、对于每个聚类簇,选择该聚类簇中具有最大信息熵的波段作为最优波段。
进一步地,所述分类模型训练模块中获取训练好的贝类毒素无损检测模型的具体步骤包括:
步骤四一、分别估算将未感染毒素的贝类样本和感染毒素的贝类样本进行错误分类所带来的损失,并以此构建代价矩阵;
步骤四二、根据所述代价矩阵确定贝类样本的置信度向量;
步骤四三、基于所述置信度向量构建代价敏感概率神经网络,并将最优特征波段子集输入,训练获得基于代价敏感概率神经网络的贝类毒素无损检测模型。
进一步地,所述分类模型训练模块中所述代价敏感概率神经网络结构包括8层卷积池化层,第一层卷积层,卷积核大小为11*11,步长为4,总共64个特征;第一最大池化层,池化范围3*3,步长为2;第二层卷积层,卷积核大小为5*5,步长为1,总共192个特征;第二最大池化层,池化范围3*3,步长为2;第三层卷积层,卷积核大小为3*3,步长为1,总共384个特征;第四层卷积层,卷积核大小为3*3,步长为4,总共384个特征;第五层卷积层,卷积核大小为3*3,步长为4,总共256个特征;第五最大池化层,池化范围3*3,步长为2;第六卷积层,卷积核大小为5*5,步长为1,总共4096个特征;第七卷积层,卷积核大小为1*1,步长为1,总共4096个特征;第八卷积层,卷积核大小为1*1,步长为1,总共2个特征;其中,在第八卷积层与损失函数之间加入代价敏感激活层,对第八卷积层的输出向量使用代价敏感激活层激活,计算方式为:
Figure BDA0003481804830000061
式中,β表示对应当前样本的置信度向量;O表示第八卷积层的输出向量,输出两个类别的概率;n、k分别表示第八卷积层的第n、k个输出向量。
本发明的有益技术效果是:
本发明首先针对高光谱数据量大导致数据传输和处理难度大的问题,结合了FCM与PSO两种方法的优点,针对性地设计了一个符合高光谱波段选择需求的PSO算法,并将它与传统的FCM结合取代了原有的拉格朗日乘子法作为其优化算法,因为PSO算法是一种全局优化算法,所以它减轻了标准FCM易于陷入局部最优并且对初始值很敏感的问题,从而显著提高了所选波段子集的质量,实现了高维数据的降维;其次,针对贝类毒素检测中数据集不平衡的问题,引入代价敏感机制,考虑了错分代价的不同,有效地提高了对毒素感染样本的敏感性,以期望代价最小化为目标,有效地改善了数据集不平衡问题造成的影响。本发明将高光谱图像技术应用于贝类毒素无损检测中,为解决贝类食用安全问题提供了新途径,从而丰富和完善了毒素无损检测理论和方法。
附图说明
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。
图1是本发明一种基于高光谱图像技术的贝类毒素无损快速检测方法的流程示意图;
图2是本发明实施例中高光谱图像数据获取及预处理流程示意图;
图3是本发明实施例中样本高光谱图像示例图;
图4是本发明实施例中识别结果准确率对比图;
图5是本发明实施例中分类准确率随波段数量变化情况示意图;
图6是本发明一种基于高光谱图像技术的贝类毒素无损快速检测系统的结构示意图。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
本发明首先提出了一种高光谱特征波段选择方法,能够有效区分毒素感染贝类与正常贝类的光谱波段集合,实现高维数据的降维;其次,构建了面向不平衡样本数据集的贝类毒素检测模型,确定模型最优参数,解决同种物质光谱分类难题;进一步,针对不平衡数据集,提出了综合考虑类别分布的检测模型评价指标和评价方法,构建性能验证和评价平台。
本发明的总体研究方案包括贝类毒素高光谱检测机理研究、高光谱特征波段选择方法研究、贝类毒素检测模型研究、检测模型性能评价研究四个部分,如图1所示,本发明方法主要包括以下步骤:
步骤一、采集多个贝类样本的高光谱图像作为训练样本集;贝类样本包括感染毒素的贝类和未感染毒素的贝类;
步骤二、对高光谱图像进行光谱数据提取和预处理;
步骤三、基于模糊聚类与粒子群优化的特征选择算法,获取最优特征波段子集;
步骤四、将最优特征波段子集输入基于代价敏感概率神经网络的贝类毒素无损检测模型中进行训练,获取训练好的贝类毒素无损检测模型;
步骤五、将经过预处理的待检测贝类样本的光谱数据输入到训练好的贝类毒素无损检测模型中,获取检测结果;检测结果为待检测贝类样本是否为感染毒素的贝类。
下面对本发明方法的具体实现进行详细说明。
1)贝类毒素高光谱检测机理研究
利用紫外、可见光、红外等电磁辐射与物质的相互作用而产生的反射、吸收等辐射变化来获取物质的物理化学信息是光谱检测的主要理论基础。采用反射式光谱仪,即通过测量光源入射样品并与样品内部分子发生相互作用的反射光进行分析。光在贝类组织内部的传输和分布情况与生物组织内部的物质组成和结构等信息密切相关。感染毒素的贝类的软体组织将发生复杂的化学变化,从而影响光谱的吸收系数和散射系数,使其光谱有别于未受感染的贝类。因此,光谱可作为获取信息的一种有效载体,进行贝类感染毒素情况的鉴别及分析。
本发明通过分析光源能量、曝光时间、移动平台速度、镜头到样本表面的距离、采集分辨率、采集角度等采集参数对样本高光谱图像信息的影响,确定合适的采集参数,减少高光谱图像失真现象。从贝类生物组织内部出发,通过研究光与贝类组织相互作用规律,挖掘光在组织内部传输过程中吸收和散射变化携带的细节信息,获得表征贝类高光谱反射信息的光学特性参数,结合检测分析模型,实现高光谱技术快速、无损检测贝类毒素。
2)高光谱特征波段选择方法研究
针对高光谱图像波段数量多、数据冗余严重等问题,研究贝类毒素高光谱检测中波段选择问题,以实现高维数据的降维。由于受光学检测系统内部和外部因素的干扰,采集的高光谱图像不可避免的存在噪声,因此在进行特征波段选择前需要进行光谱预处理。高光谱图像数据获取、分析和预处理流程如图2所示。在实验室制备毒素感染的贝类样本,在高光谱图像采集中,首先采集活的、未加工的完整贝类样本高光谱图像,然后采集开壳后完整软体组织的高光谱图像。探析贝壳的光传输特性及对内部软体组织的光吸收和散射特性的影响,对比分析应用软体和完整样本高光谱图像所建立模型的效果,深入挖掘贝壳中所蕴藏的重要信息,为后续贝类毒素大批量快速检测提供数据支撑和理论依据。
为减少外界干扰,高光谱图像的采集过程在暗室中进行。采用SRAnal710软件对获取的高光谱图像进行标准校正,包括光谱校准、辐射校准和反射率归一化。图3为感染毒素的完整和开壳的菲律宾蛤仔高光谱图像。在菲律宾蛤仔样本的高光谱图像的中心区域应用ENVI 4.8软件提取矩形区域作为感兴趣区域,将感兴趣区域内的所有像素的反射值的平均值作为该样本的光谱反射值。采集的高光谱数据通常包括不仅包含样本信息,还包含噪声。由于噪声对样本的分析没有任何帮助,在建立波段选择模型和分类模型之前需要对光谱进行预处理以去除噪声。本发明采用标准正态变换(SNV)、多元散射校正(MSC)、Savitzky-Golay平滑(SG)和一阶导数(DER)四种预处理方法。经过预处理后的光谱数据用于下一步的数据分析。实验证明,光谱预处理能有效提高分类模型的精度。
特征选择指的是为了提高效率和性能从原有的特征集合中选出一部分特征子集来表示原来全部的特征的一种手段。因为高维度的特征计算对于存储和计算成本消耗很大;在实际工程问题中样本数量有限,即是小样本问题的条件下,过高的维度会使得分类器的性能衰退。因此,从计算成本,效率和最后的性能等方面考虑,直接使用高维度的特征并不合适,利用特征选择进行降维是非常有必要的。在高光谱图像中,光谱波段被认为是其本身的重要特征,因此,对于高光谱技术来说,特征选择可以看作是波段选择,从原有的全部波段特征中,选择一组波段子集来表示原有的全部波段,并将这个波段子集用于后续的图像处理任务中。特征选择一般会设计一种评价标准即目标函数,这个函数就是建立的一个模型。基于这个评价标准的指导来进行优化搜索求解得到一组波段子集完成波段选择过程。
波段选择可以选择基于聚类的方法,该方法是将全部波段划分为几个类,并为每一类选择一个聚类中心,不断的迭代优化聚类过程来选择最优的波段子集。但是,由于光谱波段之间内部结构的复杂性,波段的属性值不具有足够的区分性,因此波段的数据是“模糊的”。当波段被聚类时,一个波段有可能同时属于多个聚类中心而不是确定的属于一个聚类中心。硬聚类方法比如C-means方法难以处理此类问题,得到的聚类效果并不好。而模糊聚类可以通过计算隶属度这个概念,来判断这个波段属于每一个聚类中心的概率大小,以此来进行聚类,适合高光谱图像的结构特点的需求。因此,模糊C均值聚类(fuzzy c-meansalgorithm,FCM)是一种最广泛使用的模糊聚类方法,但是,FCM方法对初始值和噪声波段(可以看作异常点)是非常敏感的,而且非常容易陷入局部最优解。而基于优化的方法的优点在于其具有强大的全局搜索和优化能力,对初始值具有鲁棒性并且不易于陷入局部最优,但是它的性能效果非常依赖于目标函数也就是模型的设置。可以看到,基于聚类的方法的优缺点与基于优化的方法的优缺点是互补的,因此,本发明结合基于聚类和基于优化两种方法的优势构造一个新的波段选择方法。
聚类方法采用FCM算法,全局优化算法采用广泛使用的粒子群优化算法,本发明算法结合了聚类方法和优化方法的优点,弥补了彼此的缺点。比起传统的单纯基于聚类或者基于优化的无监督特征选择方法,本发明提出的算法具有两个优势。第一,具有更好的全局搜索能力,可以尽量避免陷入局部最优并且对初始值具有一定的鲁棒性。第二,具有更贴合实际的物理模型使得优化过程和效率提升。
FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。FCM算法将N个向量划分进C个聚类簇中,之后可以得到C个模糊聚类簇中心。划分的最终目的是最小化FCM的目标函数,其目标函数如下式(1):
Figure BDA0003481804830000101
Figure BDA0003481804830000102
其中,对于波段选择来说,N代表波段总数,C是所选波段数子集中波段的个数即聚类的个数。隶属度uij如式(2)所定义,其代表第j个波段属于第i个聚类簇中心的隶属度。dij=||ci-xj||是第i个聚类簇中心到第j个波段的欧几里得距离。参数m是一个模糊因子满足m∈(1,∞)。为了优化目标函数即式(1),采用了拉格朗日乘子法将其构造为式(3):
Figure BDA0003481804830000103
经过推导可分别得到聚类中心和隶属度的迭代公式为式(4)和式(5)。
Figure BDA0003481804830000104
Figure BDA0003481804830000105
标准FCM的算法过程如下所示。
步骤1:随机生成使其满足式(2),生成初始隶属度矩阵U其尺寸大小为C*N;
步骤2:按照式(4)计算聚类中心ci,其中,i=1,2,…,C;
步骤3:按照式(1)计算目标函数值,如果迭代次数达到预设的终止数目或者两代目标函数的差值小于0.0001,停止算法输出结果;
步骤4:按照式(5)计算隶属度uij更新隶属度矩阵U,转到步骤2。
从标准FCM过程可以看出,是拉格朗日乘子法带来了对初始化的敏感和易于陷入局部最优的限制。为了解决这一局限,将FCM与PSO相结合,用PSO替代传统的拉格朗日乘子法来优化FCM的聚类过程。PSO是一种迭代算法,从随机初始化开始,利用目标函数迭代寻优。在PSO中,一个解称为一个粒子(即所选的波段子集),所有的粒子构成一个群体。速率的概念指的是一个粒子的更新。设置一个群体其中包含N个粒子,基于群体行为理论,粒子的更新速率定义如下:
Figure BDA0003481804830000111
其中,ω是惯性系数;c1和c2分别是局部最优解和全局最优解的学习率的权重;r1和r2是在[0,1]内随机生成的参数。PSO中术语表示如下表1所示。
表1
p<sub>i</sub>(t)i=1,2,…N 在第t次迭代中粒子p<sub>i</sub>的位置
v<sub>i</sub>(t)i=1,2,…N 在第t次迭代中粒子p<sub>i</sub>的速率
P<sub>bi</sub>(t)i=1,2,…N 在第t次迭代时粒子p<sub>i</sub>在它过去的轨迹中最好的位置
P<sub>g</sub>(t) 在第t次迭代时记录中所有粒子最好的粒子
fp<sub>i</sub>(t)i=1,2,…N 在第t次迭代时粒子p<sub>i</sub>对应的目标函数值
fp<sub>bi</sub>(t)i=1,2,…N 在第t次迭代时P<sub>bi</sub>(t)对应的目标函数值
fp<sub>g</sub>(t) 在第t次迭代时p<sub>g</sub>(t)对应的目标函数值
下面给出本发明提出的特征选择算法的详细过程。
步骤1、初始化:随机选择波段生成初始粒子群,并且将它们设置为初始聚类中心;根据式(5)计算初始隶属度矩阵;按照式(1)计算所有粒子的目标函数,并且将他们保存为
Figure BDA0003481804830000112
设置初始局部最优粒子pbi(1)=pi(1),使得初始粒子即为局部最优粒子;设置初始全局最优目标函数值
Figure BDA0003481804830000113
并且保存相关的全局最优粒子为pg(1);设置初始速度vi(1)=0,迭代计数指针t=1;
步骤2、更新粒子群:对于群体中的每个粒子pi(t),i=1,2,……,N,按照下述步骤处理:
步骤21、计算更新速率vi(t+1),并且通过式(6)更新粒子pi(t+1);
步骤22、计算更新后粒子pi(t+1)的目标函数值,并将结果保存为fpi(t+1);
步骤23、比较局部最优解并更新:如果fpi(t+1)<fbi(t),那么更新局部最优函数值fbi(t+1)=fpi(t)和局部最优粒子位置pbi(t+1)=pi(t+1);
步骤24、比较全局最优解并更新:如果
Figure BDA0003481804830000121
那么更新全局最优函数值fpg(t+1)=minfpi(t+1)和全局最优粒子位置pg(t+1)。
步骤3、设置迭代计数指针t=t+1,若计数t大于预设最大迭代次数或者在连续多次迭代过程中相邻两次的全局最优目标函数值变化很小|fpg(t+1)-fpg(t)|≤0.0001,则停止算法,并输出最终结果。
经过聚类之后,原来的全部波段被聚类为若干个聚类簇。与标准FCM不同,本发明提出的特征选择算法为每一个聚类簇选择代表波段时选择该聚类簇中具有最大信息熵的那个波段。信息熵是一个衡量波段信息量的有效准则,一个波段Y的信息熵定义如下:
H(Y)=-∑y∈Ωp(y)logp(y) (7)
其中,p(y)是Y的概率分布,且∑y∈Ωp(y)=1。对于高光谱图像而言,可以用波段的灰度直方图来计算概率分布p(y);即
Figure BDA0003481804830000122
h(y)是一个波段的灰度直方图,num是一个波段中的像素总数。因为FCM易于受到噪声波段的干扰,因此引进信息熵的概念来克服这个问题。
在一次迭代中,粒子群记录他们各自的局部最佳位置并相互共享比较来找到最佳的全局最佳位置。在下次迭代中,上一代的局部最优粒子和全局最优粒子被用来产生新的粒子。在这个过程中,新产生的粒子是通过继承上一代的全局和局部最优来进行更新的。传统的FCM利用导数下降的方向来更新粒子群,因此容易陷入局部最优。PSO则利用了概率状态转移代替了确定的下降导数信息,这样做使得更新过程易于跳出局部最优的区域去寻找更好的解。另外,由于聚类中心由PSO来搜索,所以该算法对初始状态具有更好的鲁棒性。本发明所提的算法可以显著的提高所选的波段子集质量。
3)面向不平衡数据的代价敏感概率神经网络检测模型研究
对于贝类毒素检测问题,分类模型的设计是关键因素。这部分研究的重点在于如何针对具体问题构建分类模型,在训练数据集上训练学习算法,使其掌握规律以便对未知的样本进行预测或者准确分类。
在贝类毒素检测的实际应用中,采集到的数据集并不总是平衡的,可能存在绝大部分检测数据都是正常贝类样本,而真正的受到毒素感染的贝类只占极小部分的情况,数据集在数量和分布上不平衡,导致传统分类器的分类性能下降。因此,如何有效分类不平衡数据是贝类重金属污染高光谱检测应用研究亟需解决的问题。本发明将代价敏感学习引入到贝类毒素检测中,以使分类器能够获得区分不同错误的能力。
首先,分别估算将未感染毒素的贝类样本和感染毒素的贝类样本进行错误分类所带来的损失,并以此构建代价矩阵;然后,根据代价矩阵确定贝类样本的置信度向量;最后,基于置信度向量构建代价敏感概率神经网络,并将最优特征波段子集输入,训练获得基于代价敏感概率神经网络的贝类毒素无损检测模型。
其中,构建代价矩阵的具体方法为:将不同错误引起的损失分为如下两类:将感染毒素的贝类判断成未感染毒素的贝类的代价,表示为cost1;将未感染毒素的贝类判断成感染毒素的贝类的代价,表示为cost0;则代价矩阵可以表示为:
Figure BDA0003481804830000131
式中,γ为cost1和cost0的最大公约数。
得到代价矩阵后,就可以通过代价矩阵获取样本的置信度向量。由于分类精度取决于这一类样本的置信程度,因此可以通过改变分类器对于正负样本的置信程度来调节分类器对不同类别的样本的重视程度。训练时,当分类器对于某类样本分类结果的置信度越低,分类器对于这类样本的要求越高,从而能够获取这类样本的更多特征。检测时,分类器对每一类样本公平对待,由于置信度低的类别获取到更多的特征,在检测阶段分类器会偏向置信度低的类别。因此置信度与代价成反比关系,用βi表示对应类别的置信程度,i代表对应类别,i=0表示未感染毒素,i=1表示感染毒素,基于此构成置信度向量(β1,β0)。
本发明设计的代价敏感卷积神经网络主体结构由8层卷积池化层组成,卷积层使用ReLU激活函数,代价敏感卷积神经网络结构包括:第一层卷积层,卷积核大小为11*11,步长为4,总共64个特征;第一最大池化层,池化范围3*3,步长为2;第二层卷积层,卷积核大小为5*5,步长为1,总共192个特征;第二最大池化层,池化范围3*3,步长为2;第三层卷积层,卷积核大小为3*3,步长为1,总共384个特征;第四层卷积层,卷积核大小为3*3,步长为4,总共384个特征;第五层卷积层,卷积核大小为3*3,步长为4,总共256个特征;第五最大池化层,池化范围3*3,步长为2;第六卷积层,卷积核大小为5*5,步长为1,总共4096个特征,dropout强度为0.5;第七卷积层,卷积核大小为1*1,步长为1,总共4096个特征,dropout强度为0.5;第八卷积层,卷积核大小为1*1,步长为1,总共2个特征。
其中,在第八卷积层与损失函数之间加入代价敏感激活层,对第八卷积层的输出向量使用代价敏感激活层激活,计算方式为:
Figure BDA0003481804830000132
式中,β代表对应当前样本的置信度向量;O代表第八卷积层的输出向量,输出两个类别的概率。
在训练过程中使用adam优化算法更新卷积神经网络参数。测试阶段将代价敏感激活层替换成常规的softmax激活层,计算方式为:
Figure BDA0003481804830000141
由于训练过程中网络中引入代价敏感层,训练好的网络对于高成本类别十分敏感,从而减少高成本类别误分类带来的经济损失,达到最小化损失的目的。本发明通过设置置信度向量,来使分类器获得代价敏感性,从而区分各种不同的错误,以此达到最小化损失的目的;根据不同错误分类产生的不同程度的损失来构建代价矩阵,从而区分不同错误分类;本发明中的分类器对高代价的类别具有更高的敏感度,由此可以最小化分损失,通过引入代价敏感性来区分不同错误分类所产生的不同影响,从而构建以最小化总体损失为目标的分类器。
4)贝类毒素检测模型性能评价研究
评价标准是评测分类效果和指导分类器建模的一个关键因素。传统的分类器是以整体准确率为准则来进行分类的,但对于贝类毒素检测问题,多数类样本(正常贝类样本)的数量远远多于少数类样本(毒素感染样本),且将少数类样本错分为多数类样本的代价很大,属于类别不平衡和误分类代价不等的问题。针对这种情况,评价模型性能时应同时关注两者的识别率,甚至更重视少数类的分类准确率。本发明采用F测度(F-measure)和几何均值(G-mean)来评价检测模型性能。
(a)F测度
定义分类器的少数类样本的查准率precision为:
precision=TP/(TP+FP) (11)
少数类样本的查全率recall为:
recall=TP/(TP+FN) (12)
其中,TP代表被正确划分的正类样本的个数,FN代表被错误划分为负类的正类样本的个数,FP代表被错误划分为正类的负类样本的个数,TN代表被正确划分的负类样本的个数。
分类器的F-measure为:
Figure BDA0003481804830000142
通常,β=1,F-measure综合了少数类样本的查准率和查全率,因而充分体现了分类器对少数类样本的分类性能。
(b)几何均值
定义分类器的少数类样本的准确率sensitivity和多数类样本的准确率specificity,分别为:
sensitivity=TP/(TP+FN) (14)
specificity=TN/(TN+FP) (15)
几何均值(G-mean)定义为:
Figure BDA0003481804830000151
G-mean综合考虑了少数类样本的准确率和多数类样本的准确率,体现了分类器在多数样本和少数类样本上的整体分类性能。
进一步通过实验验证本发明的技术效果。
实验数据集包括120个未感染毒素的菲律宾蛤仔样本和120个感染毒素的样本,取240个样本中的180个样本作为训练集,60个作为测试集,识别结果如图4所示。从图4中最右侧的图可以看出,本发明所提出的模型识别效果较好,最大识别准确率达到95%以上;选出的波段子集包含的最少的数量为7个,此时,最大识别准确率为95%,平均识别准确率为90.63%。
进一步分析准确率随波段数量的变化情况,选取波段数量为2到10这个范围,提取每种波段数量取值下分类准确率最佳的情况,给出如图5所示的分类准确率随波段数量变化情况示意图。从图中可以看出,分类准确率在整体是随着波段数量的增加而增加的,但是也存在一些特例。进一步表明,波段数量的增大并不一定会带来检测效果的提升。
本发明另一实施例提供一种基于高光谱图像技术的贝类毒素无损快速检测系统,如图6所示,该系统包括:
样本采集模块110,其配置成采集多个贝类样本的高光谱图像作为训练样本集;贝类样本包括感染毒素的贝类和未感染毒素的贝类;
预处理模块120,其配置成对高光谱图像进行光谱数据提取和预处理;
特征选择模块130,其配置成基于模糊聚类与粒子群优化的特征选择算法,获取最优特征波段子集;
分类模型训练模块140,其配置成将最优特征波段子集输入基于代价敏感概率神经网络的贝类毒素无损检测模型中进行训练,获取训练好的贝类毒素无损检测模型;
检测模块150,其配置成将经过预处理的待检测贝类样本的光谱数据输入到训练好的贝类毒素无损检测模型中,获取检测结果;检测结果为待检测贝类样本是否为感染毒素的贝类。
本实施例中,预处理模块120中预处理包括基线校正、变量标准化、多元散射校正和求导处理。
本实施例中,特征选择模块130中获取最优特征波段子集的具体步骤包括:
步骤三一、随机选择波段生成初始粒子群,并且将它们设置为初始聚类中心;根据下式计算初始隶属度矩阵:
Figure BDA0003481804830000161
式中,uij表示第j个波段属于第i个聚类簇中心的隶属度;C表示波段个数即聚类个数;m表示模糊因子;dij表示第i个聚类簇中心到第j个波段的欧几里得距离;dkj表示第k个聚类簇中心到第j个波段的欧几里得距离;
按照下式计算所有粒子的目标函数J,并且将它们保存为
Figure BDA0003481804830000162
即粒子pi最优位置对应的目标函数:
Figure BDA0003481804830000163
式中,N表示波段总数即聚类总数;
设置初始局部最优粒子pbi(1)=pi(1),使得初始粒子即为局部最优粒子;
设置初始全局最优目标函数值
Figure BDA0003481804830000164
即等于粒子pi初始位置对应的目标函数,并保存相关的全局最优粒子为pg(1);设置初始速度vi(1)=0,迭代计数指针t=1;
步骤三二、对于群体中的每个粒子pi(t),i=1,2,……,N,按照下述步骤处理:
步骤三二一、计算更新速率vi(t+1),并且按照下式更新粒子pi(t+1):
Figure BDA0003481804830000165
式中,ω是惯性系数;c1和c2分别是局部最优解和全局最优解的学习率权重;r1和r2是在[0,1]内随机生成的参数;
步骤三二二、计算更新后粒子pi(t+1)的目标函数值,并将结果保存为fpi(t+1);
步骤三二三、比较局部最优解并更新:如果fpi(t+1)<fbi(t),那么更新局部最优函数值fbi(t+1)=fpi(t)和局部最优粒子位置pbi(t+1)=pi(t+1);
步骤三二四、比较全局最优解并更新:如果
Figure BDA0003481804830000171
那么更新全局最优函数值fpg(t+1)=minfpi(t+1)和全局最优粒子位置pg(t+1);
步骤三三、设置迭代计数指针t=t+1,若计数t大于预设最大迭代次数或者在连续多次迭代过程中相邻两次的全局最优目标函数值变化很小|fpg(t+1)-fpg(t)|≤0.0001,则停止迭代上述过程,并输出最终结果,获得多个聚类簇;
步骤三四、对于每个聚类簇,选择该聚类簇中具有最大信息熵的波段作为最优波段。
本实施例中,分类模型训练模块140中获取训练好的贝类毒素无损检测模型的具体步骤包括:
步骤四一、分别估算将未感染毒素的贝类样本和感染毒素的贝类样本进行错误分类所带来的损失,并以此构建代价矩阵;
步骤四二、根据代价矩阵确定贝类样本的置信度向量;
步骤四三、基于置信度向量构建代价敏感概率神经网络,并将最优特征波段子集输入,训练获得基于代价敏感概率神经网络的贝类毒素无损检测模型。
本实施例中,分类模型训练模块140中代价敏感概率神经网络结构包括8层卷积池化层,第一层卷积层,卷积核大小为11*11,步长为4,总共64个特征;第一最大池化层,池化范围3*3,步长为2;第二层卷积层,卷积核大小为5*5,步长为1,总共192个特征;第二最大池化层,池化范围3*3,步长为2;第三层卷积层,卷积核大小为3*3,步长为1,总共384个特征;第四层卷积层,卷积核大小为3*3,步长为4,总共384个特征;第五层卷积层,卷积核大小为3*3,步长为4,总共256个特征;第五最大池化层,池化范围3*3,步长为2;第六卷积层,卷积核大小为5*5,步长为1,总共4096个特征;第七卷积层,卷积核大小为1*1,步长为1,总共4096个特征;第八卷积层,卷积核大小为1*1,步长为1,总共2个特征;其中,在第八卷积层与损失函数之间加入代价敏感激活层,对第八卷积层的输出向量使用代价敏感激活层激活,计算方式为:
Figure BDA0003481804830000172
式中,β表示对应当前样本的置信度向量;O表示第八卷积层的输出向量,输出两个类别的概率;n、k分别表示第八卷积层的第n、k个输出向量。
本实施例所述的一种基于高光谱图像技术的贝类毒素无损快速检测系统的功能可以由前述一种基于高光谱图像技术的贝类毒素无损快速检测方法实施例说明,因此本实施例未详述部分,可参见以上方法实施例,在此不再赘述。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种基于高光谱图像技术的贝类毒素无损快速检测方法,其特征在于,包括以下步骤:
步骤一、采集多个贝类样本的高光谱图像作为训练样本集;所述贝类样本包括感染毒素的贝类和未感染毒素的贝类;
步骤二、对所述高光谱图像进行光谱数据提取和预处理;
步骤三、基于模糊聚类与粒子群优化的特征选择算法,获取最优特征波段子集;
步骤四、将所述最优特征波段子集输入基于代价敏感概率神经网络的贝类毒素无损检测模型中进行训练,获取训练好的贝类毒素无损检测模型;
步骤五、将经过预处理的待检测贝类样本的光谱数据输入到训练好的贝类毒素无损检测模型中,获取检测结果;所述检测结果为待检测贝类样本是否为感染毒素的贝类。
2.根据权利要求1所述的一种基于高光谱图像技术的贝类毒素无损快速检测方法,其特征在于,步骤二中所述预处理包括基线校正、变量标准化、多元散射校正和求导处理。
3.根据权利要求2所述的一种基于高光谱图像技术的贝类毒素无损快速检测方法,其特征在于,步骤三的具体步骤包括:
步骤三一、随机选择波段生成初始粒子群,并且将它们设置为初始聚类中心;根据下式计算初始隶属度矩阵:
Figure FDA0003481804820000011
式中,uij表示第j个波段属于第i个聚类簇中心的隶属度;C表示波段个数即聚类个数;m表示模糊因子;dij表示第i个聚类簇中心到第j个波段的欧几里得距离;dkj表示第k个聚类簇中心到第j个波段的欧几里得距离;
按照下式计算所有粒子的目标函数J,并且将它们保存为
Figure FDA0003481804820000012
即粒子pi最优位置对应的目标函数:
Figure FDA0003481804820000013
式中,N表示波段总数即聚类总数;
设置初始局部最优粒子pbi(1)=pi(1),使得初始粒子即为局部最优粒子;
设置初始全局最优目标函数值
Figure FDA0003481804820000014
即等于粒子pi初始位置对应的目标函数,并保存相关的全局最优粒子为pg(1);设置初始速度vi(1)=0,迭代计数指针t=1;
步骤三二、对于群体中的每个粒子pi(t),i=1,2,……,N,按照下述步骤处理:
步骤三二一、计算更新速率vi(t+1),并且按照下式更新粒子pi(t+1):
Figure FDA0003481804820000021
式中,ω是惯性系数;c1和c2分别是局部最优解和全局最优解的学习率权重;r1和r2是在[0,1]内随机生成的参数;
步骤三二二、计算更新后粒子pi(t+1)的目标函数值,并将结果保存为fpi(t+1);
步骤三二三、比较局部最优解并更新:如果fpi(t+1)<fbi(t),那么更新局部最优函数值fbi(t+1)=fpi(t)和局部最优粒子位置pbi(t+1)=pi(t+1);
步骤三二四、比较全局最优解并更新:如果
Figure FDA0003481804820000022
那么更新全局最优函数值fpg(t+1)=minfpi(t+1)和全局最优粒子位置pg(t+1);
步骤三三、设置迭代计数指针t=t+1,若计数t大于预设最大迭代次数或者在连续多次迭代过程中相邻两次的全局最优目标函数值变化很小|fpg(t+1)-fpg(t)|≤0.0001,则停止迭代上述过程,并输出最终结果,获得多个聚类簇;
步骤三四、对于每个聚类簇,选择该聚类簇中具有最大信息熵的波段作为最优波段。
4.根据权利要求3所述的一种基于高光谱图像技术的贝类毒素无损快速检测方法,其特征在于,步骤四的具体步骤包括:
步骤四一、分别估算将未感染毒素的贝类样本和感染毒素的贝类样本进行错误分类所带来的损失,并以此构建代价矩阵;
步骤四二、根据所述代价矩阵确定贝类样本的置信度向量;
步骤四三、基于所述置信度向量构建代价敏感概率神经网络,并将最优特征波段子集输入,训练获得基于代价敏感概率神经网络的贝类毒素无损检测模型。
5.根据权利要求4所述的一种基于高光谱图像技术的贝类毒素无损快速检测方法,其特征在于,步骤四中所述代价敏感概率神经网络结构包括8层卷积池化层,第一层卷积层,卷积核大小为11*11,步长为4,总共64个特征;第一最大池化层,池化范围3*3,步长为2;第二层卷积层,卷积核大小为5*5,步长为1,总共192个特征;第二最大池化层,池化范围3*3,步长为2;第三层卷积层,卷积核大小为3*3,步长为1,总共384个特征;第四层卷积层,卷积核大小为3*3,步长为4,总共384个特征;第五层卷积层,卷积核大小为3*3,步长为4,总共256个特征;第五最大池化层,池化范围3*3,步长为2;第六卷积层,卷积核大小为5*5,步长为1,总共4096个特征;第七卷积层,卷积核大小为1*1,步长为1,总共4096个特征;第八卷积层,卷积核大小为1*1,步长为1,总共2个特征;其中,在第八卷积层与损失函数之间加入代价敏感激活层,对第八卷积层的输出向量使用代价敏感激活层激活,计算方式为:
Figure FDA0003481804820000031
式中,β表示对应当前样本的置信度向量;O表示第八卷积层的输出向量,输出两个类别的概率;n、k分别表示第八卷积层的第n、k个输出向量。
6.一种基于高光谱图像技术的贝类毒素无损快速检测系统,其特征在于,包括:
样本采集模块,其配置成采集多个贝类样本的高光谱图像作为训练样本集;所述贝类样本包括感染毒素的贝类和未感染毒素的贝类;
预处理模块,其配置成对所述高光谱图像进行光谱数据提取和预处理;
特征选择模块,其配置成基于模糊聚类与粒子群优化的特征选择算法,获取最优特征波段子集;
分类模型训练模块,其配置成将所述最优特征波段子集输入基于代价敏感概率神经网络的贝类毒素无损检测模型中进行训练,获取训练好的贝类毒素无损检测模型;
检测模块,其配置成将经过预处理的待检测贝类样本的光谱数据输入到训练好的贝类毒素无损检测模型中,获取检测结果;所述检测结果为待检测贝类样本是否为感染毒素的贝类。
7.根据权利要求6所述的一种基于高光谱图像技术的贝类毒素无损快速检测系统,其特征在于,所述预处理模块中所述预处理包括基线校正、变量标准化、多元散射校正和求导处理。
8.根据权利要求7所述的一种基于高光谱图像技术的贝类毒素无损快速检测系统,其特征在于,所述特征选择模块中获取最优特征波段子集的具体步骤包括:
步骤三一、随机选择波段生成初始粒子群,并且将它们设置为初始聚类中心;根据下式计算初始隶属度矩阵:
Figure FDA0003481804820000032
式中,uij表示第j个波段属于第i个聚类簇中心的隶属度;C表示波段个数即聚类个数;m表示模糊因子;dij表示第i个聚类簇中心到第j个波段的欧几里得距离;dkj表示第k个聚类簇中心到第j个波段的欧几里得距离;
按照下式计算所有粒子的目标函数J,并且将它们保存为
Figure FDA0003481804820000041
即粒子pi最优位置对应的目标函数:
Figure FDA0003481804820000042
式中,N表示波段总数即聚类总数;
设置初始局部最优粒子pbi(1)=pi(1),使得初始粒子即为局部最优粒子;
设置初始全局最优目标函数值
Figure FDA0003481804820000043
即等于粒子pi初始位置对应的目标函数,并保存相关的全局最优粒子为pg(1);设置初始速度vi(1)=0,迭代计数指针t=1;
步骤三二、对于群体中的每个粒子pi(t),i=1,2,……,N,按照下述步骤处理:
步骤三二一、计算更新速率vi(t+1),并且按照下式更新粒子pi(t+1):
Figure FDA0003481804820000044
式中,ω是惯性系数;c1和c2分别是局部最优解和全局最优解的学习率权重;r1和r2是在[0,1]内随机生成的参数;
步骤三二二、计算更新后粒子pi(t+1)的目标函数值,并将结果保存为fpi(t+1);
步骤三二三、比较局部最优解并更新:如果fpi(t+1)<fbi(t),那么更新局部最优函数值fbi(t+1)=fpi(t)和局部最优粒子位置pbi(t+1)=pi(t+1);
步骤三二四、比较全局最优解并更新:如果
Figure FDA0003481804820000045
那么更新全局最优函数值fpg(t+1)=minfpi(t+1)和全局最优粒子位置pg(t+1);
步骤三三、设置迭代计数指针t=t+1,若计数t大于预设最大迭代次数或者在连续多次迭代过程中相邻两次的全局最优目标函数值变化很小|fpg(t+1)-fpg(t)|≤0.0001,则停止迭代上述过程,并输出最终结果,获得多个聚类簇;
步骤三四、对于每个聚类簇,选择该聚类簇中具有最大信息熵的波段作为最优波段。
9.根据权利要求8所述的一种基于高光谱图像技术的贝类毒素无损快速检测系统,其特征在于,所述分类模型训练模块中获取训练好的贝类毒素无损检测模型的具体步骤包括:
步骤四一、分别估算将未感染毒素的贝类样本和感染毒素的贝类样本进行错误分类所带来的损失,并以此构建代价矩阵;
步骤四二、根据所述代价矩阵确定贝类样本的置信度向量;
步骤四三、基于所述置信度向量构建代价敏感概率神经网络,并将最优特征波段子集输入,训练获得基于代价敏感概率神经网络的贝类毒素无损检测模型。
10.根据权利要求9所述的一种基于高光谱图像技术的贝类毒素无损快速检测系统,其特征在于,所述分类模型训练模块中所述代价敏感概率神经网络结构包括8层卷积池化层,第一层卷积层,卷积核大小为11*11,步长为4,总共64个特征;第一最大池化层,池化范围3*3,步长为2;第二层卷积层,卷积核大小为5*5,步长为1,总共192个特征;第二最大池化层,池化范围3*3,步长为2;第三层卷积层,卷积核大小为3*3,步长为1,总共384个特征;第四层卷积层,卷积核大小为3*3,步长为4,总共384个特征;第五层卷积层,卷积核大小为3*3,步长为4,总共256个特征;第五最大池化层,池化范围3*3,步长为2;第六卷积层,卷积核大小为5*5,步长为1,总共4096个特征;第七卷积层,卷积核大小为1*1,步长为1,总共4096个特征;第八卷积层,卷积核大小为1*1,步长为1,总共2个特征;其中,在第八卷积层与损失函数之间加入代价敏感激活层,对第八卷积层的输出向量使用代价敏感激活层激活,计算方式为:
Figure FDA0003481804820000051
式中,β表示对应当前样本的置信度向量;O表示第八卷积层的输出向量,输出两个类别的概率;n、k分别表示第八卷积层的第n、k个输出向量。
CN202210070246.0A 2022-01-21 2022-01-21 一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统 Pending CN114399674A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210070246.0A CN114399674A (zh) 2022-01-21 2022-01-21 一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210070246.0A CN114399674A (zh) 2022-01-21 2022-01-21 一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统

Publications (1)

Publication Number Publication Date
CN114399674A true CN114399674A (zh) 2022-04-26

Family

ID=81233720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210070246.0A Pending CN114399674A (zh) 2022-01-21 2022-01-21 一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统

Country Status (1)

Country Link
CN (1) CN114399674A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114779467A (zh) * 2022-04-27 2022-07-22 吉林大学 一种基于探测器特性的新型光谱仪膜系组合的选择方法
CN114972895A (zh) * 2022-08-01 2022-08-30 武汉轻工大学 小龙虾品质无损检测方法及装置
CN117571107A (zh) * 2024-01-15 2024-02-20 山西富衡达自动化设备有限公司 一种智能化无人值守地磅异常监测系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114779467A (zh) * 2022-04-27 2022-07-22 吉林大学 一种基于探测器特性的新型光谱仪膜系组合的选择方法
CN114972895A (zh) * 2022-08-01 2022-08-30 武汉轻工大学 小龙虾品质无损检测方法及装置
CN114972895B (zh) * 2022-08-01 2022-09-30 武汉轻工大学 小龙虾品质无损检测方法及装置
CN117571107A (zh) * 2024-01-15 2024-02-20 山西富衡达自动化设备有限公司 一种智能化无人值守地磅异常监测系统
CN117571107B (zh) * 2024-01-15 2024-03-15 山西富衡达自动化设备有限公司 一种智能化无人值守地磅异常监测系统

Similar Documents

Publication Publication Date Title
US10671833B2 (en) Analyzing digital holographic microscopy data for hematology applications
CN114399674A (zh) 一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统
CN109871875B (zh) 一种基于深度学习的建筑物变化检测方法
Zhao et al. Center attention network for hyperspectral image classification
CN115953666B (zh) 一种基于改进Mask-RCNN的变电站现场进度识别方法
Yu et al. Automated diatom searching in the digital scanning electron microscopy images of drowning cases using the deep neural networks
CN111639697B (zh) 基于非重复采样与原型网络的高光谱图像分类方法
He et al. Large-scale dataset pruning with dynamic uncertainty
CN109558803B (zh) 基于卷积神经网络与np准则的sar目标鉴别方法
CN109145770B (zh) 一种基于多尺度特征融合网络与定位模型相结合的麦蜘蛛自动计数方法
CN111008652A (zh) 一种基于gan的高光谱遥感影像分类方法
Ming et al. Visual detection of sprouting in potatoes using ensemble‐based classifier
Sosa-Trejo et al. Vision-based techniques for automatic marine plankton classification
Hridya Krishna et al. Deep learning approach for brown spot detection and nitrogen deficiency estimation in rice crops
Zhao et al. Spectral–spatial classification of hyperspectral images using trilateral filter and stacked sparse autoencoder
CN116363507A (zh) 一种基于蛇优化算法的XGBoost和深度神经网络融合的遥感图像分类方法
CN116704241A (zh) 一种全通道3d卷积神经网络高光谱遥感图像分类方法
Sui et al. Weighted spectral-spatial classification of hyperspectral images via class-specific band contribution
Aksoy Introduction to pattern recognition
Li et al. Early drought plant stress detection with bi-directional long-term memory networks
Shishkin et al. Implementation of yolov5 for detection and classification of microplastics and microorganisms in marine environment
CN112801028A (zh) 基于归纳表示学习网络的光谱和空间图高光谱图像分类方法
Sun et al. MOBS-TD: Multi-Objective Band Selection with Ideal Solution Optimization Strategy for Hyperspectral Target Detection
CN109886340A (zh) 一种遥感影像分类方法
CN115546600B (zh) 基于Lush多层特征融合偏置网络的地物识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination