CN113095305B - 一种医药异物高光谱分类检测方法 - Google Patents

一种医药异物高光谱分类检测方法 Download PDF

Info

Publication number
CN113095305B
CN113095305B CN202110634697.8A CN202110634697A CN113095305B CN 113095305 B CN113095305 B CN 113095305B CN 202110634697 A CN202110634697 A CN 202110634697A CN 113095305 B CN113095305 B CN 113095305B
Authority
CN
China
Prior art keywords
spectral
image
hyperspectral
pca
foreign matter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110634697.8A
Other languages
English (en)
Other versions
CN113095305A (zh
Inventor
王耀南
李亚萍
朱青
张辉
周显恩
尹阿婷
毛建旭
刘敏
谭浩然
吴成中
史雅兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202110634697.8A priority Critical patent/CN113095305B/zh
Publication of CN113095305A publication Critical patent/CN113095305A/zh
Application granted granted Critical
Publication of CN113095305B publication Critical patent/CN113095305B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N21/88Investigating the presence of flaws or contamination
    • G01N21/90Investigating the presence of flaws or contamination in a container or its contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种医药异物高光谱分类检测方法,首先输入医药异物高光谱图像;其次提出多项式平滑滤波的异物高光谱去噪方法,抑制光谱噪声干扰;再次提出异物光谱波段聚类分组PCA降维与半监督LDA结合的特征提取方法,先采用波段聚类分组PCA降维对预处理后图像进行降维处理,并通过半监督LDA提取光谱特征,随后利用二维Gabor滤波器提取空间特征,将上述特征联合作为图像的分类特征;最后采用支持向量机实现医药异物检测并输出异物类别。本发明提出了PCA和LDA二次降维的方法,以便提取出更有利于后续分类操作的光谱特征;同时,引入半监督LDA降低对标签数据的依赖,实现少量标签数据样本下异物的高准确率检测。

Description

一种医药异物高光谱分类检测方法
技术领域
本发明涉及图像处理技术领域,特别是涉及一种医药异物高光谱分类检测方法。
背景技术
近年来我国医药市场发展迅速,市场规模由2015年的12207亿元增加至2019年的16330亿元,年复合增长率为7.5%,预期2020年至2021年将进一步以6.8%的年复合增长率保持增长,并且2021年达到13057亿元。与此同时,医药安全作为医药工业发展的基石和人民群众健康的重要保障,也越发受到行业内外的关注。在医药生产过程中,常出现玻璃、屑石块、毛发、橡胶屑等种类多样且微弱的异物,为医药安全带来了潜在危险,因此医药异物检测成为制药过程中不可避免的一项工作。传统的人工检测法难以保证检测的可靠性和效率,愈发无法满足日益严格的检测标准。由于高光谱技术可以根据每种物质在同一光学环境下出现的独特的光谱信息快捷地实现对物质地检测和分类问题,其已被应用到真伪鉴定、药材鉴别、产地溯源、含量测定等多种医药检测用途中。目前高光谱检测主要存在以下问题:
(1)高光谱数据包含成百上千个波段,直接使用高维数据不但存储、传输成本很高,数据挖掘效率低,而且随着数据维数的增加,数据计算过程中运算量会呈指数倍增长,在实际应用中产生“维数灾难”问题。数据降维以牺牲一部分信息为代价,通过寻找有效、简单的数据表示方式,在保留高维数据的有效信息、保持数据的分类结果不变的前提下,降低数据表示复杂度,实现对数据由高维空间到低维空间的转换,能够有效解决“维数灾难”问题。PCA(Principal Component Analysis,主成分分析)作为应用最广泛的无监督降维方法之一,主要是选择样本点投影具有最大方差的方向,以保存尽可能多的原始信息为目的,导致所提取的光谱特征可能存在可区分性不强而不利于后续的分类操作的问题;LDA(LatentDirichlet Allocation,隐含狄利克雷分布)作为一种有监督降维方式则通过寻求投影后不同类别之间数据点距离更大化以及同一类别数据点距离最小化来选择分类性能最好的方向,但存在数据可能过渡拟合的问题。
(2)在医药异物检测场景中,某些异物比较微小且形状不规则,标注难度较大,导致带标签的样本相对较少,致使检测性能更好的有监督方法无法达到很好的效果。因此,利用有限的标记样本提取可区分的重要特征以提高分类性能的研究一直是一个热点。目前主要通过两种方式解决该问题,第一种方法是增强训练样本的数量和质量,《HyperspectralImage Classification Using Deep Pixel-Pair Features》(Li W, Wu G, Zhang F, etal. Hyperspectral image classification using deep pixel-pair features[J].IEEE Transactions on Geoscience and Remote Sensing, 2016, 55(2): 844-853)通过在有限的标签样本中构建像素对来增加训练样本的数量,但是没有充分利用无标签数据丰富的内在分布规律;第二种方法通过设计无监督训练框架消除标记样本的依赖性,《Unsupervised Feature Extraction in Hyperspectral Images Based on WassersteinGenerative Adversarial Network》(Zhang M, Gong M, Mao Y, et al. Unsupervisedfeature extraction in hyperspectral images based on wasserstein generativeadversarial network[J]. IEEE Transactions on Geoscience and Remote Sensing,2018, 57(5): 2669-2688)提出一种改进的生成式对抗网络显著降低了对标注训练样本的要求并保持了良好的特征质量,《Symmetric All Convolutional Neural-Network-BasedUnsupervised Feature Extraction for Hyperspectral Images Classification》(Zhang M, Gong M, He H, et al. Symmetric All Convolutional Neural-Network-Based Unsupervised Feature Extraction for Hyperspectral Images Classification[J]. IEEE Transactions on Cybernetics, 2020)基于编解码器结构设计了一种新型的端到端训练框架,此类方法由于没有用到任何标记先验信息,在分类精度上通常难以达到满意的结果。
发明内容
有鉴于此,本发明提出一种医药异物高光谱分类检测方法,该方法基于波段聚类分组PCA降维+半监督LDA光谱特征提取,以解决现有PCA算法无法提取可分性更强特征的问题,同时半监督LDA算法的提出解决了标签样本比较少的问题。
一方面,本发明提供了一种医药异物高光谱分类检测方法,包括以下步骤:
S1、输入医药异物高光谱图像;
S2、预处理:提出多项式平滑滤波的异物光谱去噪方法,并基于其对步骤S1中的医药异物高光谱图像进行预处理,抑制光谱噪声干扰;
S3、提出基于异物光谱波段聚类分组PCA降维与半监督LDA结合的光谱特征提取方法,并与二维Gabor滤波器提取的空间特征相融合,实现异物特征提取;
所述步骤S3具体表现为:
S31、利用波段聚类分组PCA降维算法对步骤S2预处理后图像进行降维处理,并通过半监督LDA算法提取光谱特征;
S32、利用PCA降维算法将步骤S2预处理后图像降至三维,然后利用二维Gabor滤波器提取空间特征;
S33、将光谱特征和空间特征联合并归一化,作为后续操作的分类特征,实现异物特征提取;
S4、采用支持向量机对步骤S3提取的异物特征进行医药异物的检测识别,
并输出异物类别。
进一步地,所述步骤S31中光谱特征提取具体步骤如下:
S311、给定三维高光谱图像数据集
Figure DEST_PATH_IMAGE001
,M、N、L分别代表预处理后图像矩阵的行数、列数和波段数,R表示矩阵,将三维高光谱图像数据集X转换为二维图像数据集
Figure DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
表示第i个样本的光谱向量,
Figure DEST_PATH_IMAGE004
S312、利用Kmeans算法进行波段聚类,将原有的L个波段分成m个波段子集,目标函数为:
Figure DEST_PATH_IMAGE005
其中,
Figure DEST_PATH_IMAGE006
为聚类后的结果,
Figure DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE008
表示波段子集,
Figure DEST_PATH_IMAGE009
Figure DEST_PATH_IMAGE010
的聚类中心,
Figure DEST_PATH_IMAGE011
表示波段子集
Figure DEST_PATH_IMAGE012
中的某一个波段,
Figure DEST_PATH_IMAGE013
表示一个距离度量,用来衡量波段与其所分配到的聚类中心之间的相似性;
S313、分别对每个波段子集
Figure 143154DEST_PATH_IMAGE012
进行PCA一次降维,设置阈值
Figure DEST_PATH_IMAGE014
,提取各个波段子集内贡献率最高的前k个成分,得到新的波段子集
Figure DEST_PATH_IMAGE015
,其中,前k个成分贡献率之和大等于阈值
Figure 591453DEST_PATH_IMAGE014
S314、联合新的波段子集
Figure 964666DEST_PATH_IMAGE015
,获得波段聚类分组降维后的数据
Figure DEST_PATH_IMAGE016
,其中,
Figure DEST_PATH_IMAGE017
为降维后的光谱向量维度;
S315、将给定三维高光谱图像数据集X输入已训练好的网络模型中,生成伪标签
Figure DEST_PATH_IMAGE018
S316、基于
Figure DEST_PATH_IMAGE019
运用LDA算法提取光谱特征
Figure DEST_PATH_IMAGE020
,其中,
Figure DEST_PATH_IMAGE021
为最终提取的光谱特征维度。
进一步地,所述步骤S315中用来生成伪标签
Figure DEST_PATH_IMAGE022
的网络模型为卷积自编码神经网络,其训练过程如下:
步骤a:从医药以及各类异物样本中选择少量带标签样本
Figure DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE024
表示第i个样本的光谱向量,
Figure DEST_PATH_IMAGE025
表示第i个样本的分类结果;
步骤b:构建卷积自编码网络模型
Figure DEST_PATH_IMAGE026
,该模型由编码器和解码器组成,解码器的输出为样本重建
Figure DEST_PATH_IMAGE027
,编码器输出的中间特征经过softmax分类器得到样本的预测标签
Figure DEST_PATH_IMAGE028
步骤c:训练网络以更新权值,加权损失函数为:
Figure DEST_PATH_IMAGE029
其中,
Figure DEST_PATH_IMAGE030
为交叉熵,
Figure DEST_PATH_IMAGE031
为均方误差,
Figure DEST_PATH_IMAGE032
为第i个样本的预测标签、
Figure DEST_PATH_IMAGE033
为第i个样本的真实标签,
Figure DEST_PATH_IMAGE034
为第i个样本的重建光谱向量,
Figure DEST_PATH_IMAGE035
为第i个样本的光谱向量,
Figure DEST_PATH_IMAGE036
为权重值,其大小在0-1之间。
进一步地,所述步骤S32中的空间特征提取具体步骤如下:
S321、对给定三维高光谱图像数据X进行PCA降维,提取前三个主成分得到三通道的图像数据
Figure DEST_PATH_IMAGE037
S322、将步骤S321降维后的图像数据
Figure DEST_PATH_IMAGE038
转化为灰度图
Figure DEST_PATH_IMAGE039
S323、通过设置不同的波长
Figure DEST_PATH_IMAGE040
和方向
Figure DEST_PATH_IMAGE041
构建Gabor滤波器组,总共包含
Figure DEST_PATH_IMAGE042
个不同的Gabor滤波器:
Figure DEST_PATH_IMAGE043
式中,x表示像素沿X轴方向上的坐标,y表示像素沿Y轴方向上坐标,
Figure DEST_PATH_IMAGE044
表示高斯函数的标准差,
Figure DEST_PATH_IMAGE045
表示相位偏移量,
Figure DEST_PATH_IMAGE046
表示长宽比;
S324、用步骤S323中Gabor滤波器依次与灰度图作卷积提取出特征图像f(x,y),得到初始空间特征S(x,y):
Figure DEST_PATH_IMAGE047
其中,
Figure DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE049
分别为Gabor滤波器实部和虚部,
Figure DEST_PATH_IMAGE050
表示从第三个维度上合并图像矩阵;
S325、对S(x,y)归一化得到最终的空间特征
Figure DEST_PATH_IMAGE051
Figure DEST_PATH_IMAGE052
为最终提取的空间特征维度。
故此,首先输入医药异物高光谱图像;其次,提出多项式平滑滤波的异物高光谱去噪方法,抑制光谱噪声干扰;再次,提出异物光谱波段聚类分组PCA降维与半监督LDA结合的特征提取方法,先采用波段聚类分组PCA降维对预处理后图像进行降维处理,并通过半监督LDA提取光谱特征,随后利用二维Gabor滤波器提取空间特征,将上述特征联合作为图像的分类特征;最后,采用支持向量机实现医药异物检测并输出异物类别。本发明针对PCA传统降维方法下的特征可区分性不高的局限性,提出了PCA和LDA二次降维的方法,以便提取出更有利于后续分类操作的光谱特征;同时,引入半监督LDA降低对标签数据的依赖,克服高光谱数据标注难的问题,实现少量标签数据样本下异物的高准确率检测,具有分类检测识别率高的优点。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种医药异物高光谱分类检测方法的流程图;
图2是本发明实施例的原始高光谱图像;
图3是本发明实施例的单个样本滤波前后的光谱曲线图,其中,(a)为滤波前的光谱曲线,(b)为滤波后的光谱曲线;
图4为本发明实施例的光谱特征提取流程图;
图5为光谱特征散点图,(a)为仅使用PCA降维之后的光谱特征散点图,(b)为使用本发明方法之后的光谱特征散点图;
图6为本发明实施例的空间特征结果图;
图7为本发明实施例的分类结果图,(a)为预测图,(b)为真实图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是根据本发明实施例提供的一种医药异物高光谱分类检测方法,包括以下步骤:
S1、输入医药异物高光谱图像;
S2、预处理:提出多项式平滑滤波的异物光谱去噪方法,并基于其对步骤S1中的医药异物高光谱图像进行预处理,抑制光谱噪声干扰;
S3、提出基于异物光谱波段聚类分组PCA降维与半监督LDA结合的光谱特征提取方法,并与二维Gabor(加博尔)滤波器提取的空间特征相融合,实现异物特征提取;
所述步骤S3具体表现为:
S31、利用波段聚类分组PCA降维算法对步骤S2预处理后图像进行降维处理,并通过半监督LDA算法提取光谱特征;
S32、利用PCA降维算法将步骤S2预处理后图像降至三维,然后利用二维Gabor滤波器提取空间特征;
S33、将光谱特征和空间特征联合并归一化,作为后续操作的分类特征,实现异物特征提取;
S4、采用支持向量机(Support Vector Machine, SVM)对步骤S3提取的异物特征进行医药异物的检测识别,并输出异物类别。
需要说明的是,步骤S31中波段聚类分组PCA降维算法是先用聚类算法将波段分成了若干组,然后各组再进行PCA降维,而步骤S32中PCA降维算法是不需要先用聚类算法直接进行PCA降维,即步骤S32的PCA降维仅视为步骤S31中波段聚类分组PCA降维算法的其中一个步骤。
本发明,首先输入医药异物高光谱图像;其次,提出多项式平滑滤波的异物高光谱去噪方法,抑制光谱噪声干扰;再次,提出异物光谱波段聚类分组PCA降维与半监督LDA结合的特征提取方法,先采用波段聚类分组PCA降维对预处理后图像进行降维处理,并通过半监督LDA提取光谱特征,随后利用二维Gabor滤波器提取空间特征,将上述特征联合作为图像的分类特征;最后,采用支持向量机实现医药异物检测并输出异物类别。本发明针对PCA传统降维方法下的特征可区分性不高的局限性,提出了PCA和LDA二次降维的方法,以便提取出更有利于后续分类操作的光谱特征;同时,引入半监督LDA降低对标签数据的依赖,克服高光谱数据标注难的问题,实现少量标签数据样本下异物的高准确率检测,具有分类检测识别率高的优点。
下面进一步阐述各个步骤的具体实现方式。
一种医药异物高光谱分类检测方法,具体包括以下步骤:
S1、输入医药异物高光谱图像;图2即为输入的原始高光谱图像。
S2、预处理:提出多项式平滑滤波的异物光谱去噪方法,并基于其对步骤S1中的医药异物高光谱图像进行预处理,抑制光谱噪声干扰;图3是本发明实施例的单个样本滤波前后的光谱曲线图,其中,(a)为滤波前的光谱曲线,(b)为滤波后的光谱曲线,从中可以看出预处理平滑滤波,能够有效抑制光谱噪声的干扰。
S3、提出基于异物光谱波段聚类分组PCA降维与半监督LDA结合的光谱特征提取方法,并与二维Gabor滤波器提取的空间特征相融合,实现异物特征提取;
该步骤的具体实施例包括如下过程:
(1)光谱特征提取,如图4所示:
S311、给定三维高光谱图像数据集
Figure 543896DEST_PATH_IMAGE001
,M、N、L分别代表预处理后图像矩阵的行数、列数和波段数,R表示矩阵,将三维高光谱图像数据集X转换为二维图像数据集
Figure 827110DEST_PATH_IMAGE002
Figure 243048DEST_PATH_IMAGE003
表示第i个样本的光谱向量,
Figure 713343DEST_PATH_IMAGE004
S312、利用Kmeans算法(K-平均或者K-均值,是一种聚类算法)进行波段聚类,将原有的L个波段分成m个波段子集,目标函数为:
Figure 505719DEST_PATH_IMAGE005
其中,
Figure 643439DEST_PATH_IMAGE006
为聚类后的结果,
Figure 230278DEST_PATH_IMAGE007
Figure 453449DEST_PATH_IMAGE008
表示波段子集,
Figure 49515DEST_PATH_IMAGE009
Figure 41742DEST_PATH_IMAGE010
的聚类中心,
Figure 65062DEST_PATH_IMAGE011
表示波段子集
Figure 775529DEST_PATH_IMAGE012
中的某一个波段,
Figure 378549DEST_PATH_IMAGE013
表示一个距离度量,用来衡量波段与其所分配到的聚类中心之间的相似性;
S313、分别对每个波段子集
Figure DEST_PATH_IMAGE053
进行PCA一次降维,设置阈值
Figure 84336DEST_PATH_IMAGE014
,提取各个波段子集内贡献率最高的前k个成分,得到新的波段子集
Figure 888344DEST_PATH_IMAGE015
,其中,前k个成分贡献率之和大等于阈值
Figure 210741DEST_PATH_IMAGE014
S314、联合新的波段子集
Figure 758397DEST_PATH_IMAGE015
,获得波段聚类分组降维后的数据
Figure 849850DEST_PATH_IMAGE016
,其中,
Figure 949393DEST_PATH_IMAGE017
为降维后的光谱向量维度;
S315、将给定三维高光谱图像数据集X输入已训练好的网络模型中,生成伪标签
Figure 368873DEST_PATH_IMAGE018
S316、基于
Figure 844854DEST_PATH_IMAGE019
运用LDA算法提取光谱特征
Figure 666179DEST_PATH_IMAGE020
,其中,
Figure 202203DEST_PATH_IMAGE021
为最终提取的光谱特征维度。
如图5所示,其中,(a)为仅使用传统的PCA降维之后的光谱特征散点图,(b)为使用本发明方法之后的光谱特征散点图,从中可知,相比于传统的PCA光谱特征提取方法,本发明所用方法所得到的光谱特征呈现出更强的同类聚集性。
(2)空间特征提取
S321、对给定三维高光谱图像数据X进行PCA降维,提取前三个主成分得到三通道的图像数据
Figure 843400DEST_PATH_IMAGE037
S322、将步骤S321降维后的图像数据
Figure 857492DEST_PATH_IMAGE038
转化为灰度图
Figure 798903DEST_PATH_IMAGE039
S323、通过设置不同的波长
Figure 240249DEST_PATH_IMAGE040
和方向
Figure 493376DEST_PATH_IMAGE041
构建Gabor滤波器组,总共包含
Figure 186525DEST_PATH_IMAGE042
个不同的Gabor滤波器:
Figure 841498DEST_PATH_IMAGE043
式中,x表示像素沿X轴方向上的坐标,y表示像素沿Y轴方向上坐标,
Figure 453745DEST_PATH_IMAGE044
表示高斯函数的标准差,
Figure 335113DEST_PATH_IMAGE045
表示相位偏移量,
Figure 691008DEST_PATH_IMAGE046
表示长宽比;
S324、用步骤S323中Gabor滤波器依次与灰度图作卷积提取出特征图像f(x,y),得到初始空间特征S(x,y):
Figure 341432DEST_PATH_IMAGE047
其中,
Figure 124580DEST_PATH_IMAGE048
Figure 493245DEST_PATH_IMAGE049
分别为Gabor滤波器实部和虚部,
Figure 387251DEST_PATH_IMAGE050
表示从第三个维度上合并图像矩阵;
S325、对S(x,y)归一化得到最终的空间特征
Figure 282395DEST_PATH_IMAGE051
Figure 846232DEST_PATH_IMAGE052
为最终提取的空间特征维度。
在该实施例中设定λ=(10,15,20)和θ=(0,45°,90°,135°),则构建如下12组不同波长和方向的Gabor滤波器:
Figure DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE055
Figure 240476DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE056
Figure 875857DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE057
Figure 422245DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE058
Figure DEST_PATH_IMAGE059
Figure 78354DEST_PATH_IMAGE055
Figure 15086DEST_PATH_IMAGE059
Figure 516475DEST_PATH_IMAGE056
Figure 730418DEST_PATH_IMAGE059
Figure 291850DEST_PATH_IMAGE057
Figure 715878DEST_PATH_IMAGE059
Figure 630744DEST_PATH_IMAGE058
Figure DEST_PATH_IMAGE060
Figure 417304DEST_PATH_IMAGE055
Figure 759423DEST_PATH_IMAGE060
Figure 264223DEST_PATH_IMAGE056
Figure 982780DEST_PATH_IMAGE060
Figure 561529DEST_PATH_IMAGE057
Figure 340129DEST_PATH_IMAGE060
Figure 738749DEST_PATH_IMAGE058
,则图6中(a)-(l)依次为上述12组Gabor滤波器最终所提取的空间特征图。
(3)联合光谱特征与空间特征
S33、将光谱特征和空间特征联合并归一化,具体地,将光谱特征和空间特征从第三维度合并,作为后续操作的分类特征,实现异物特征提取;
S4、采用支持向量机对步骤S3提取的异物特征进行医药异物的检测识别,并输出异物类别。
图7为本发明实施例的分类结果图,其中,(a)为预测图,(b)为真实图,从中可知,通过本发明获得的分类结果图与真实的分类结果图基本一致,分类识别率高。
需要说明的是,本发明中用来生成伪标签
Figure DEST_PATH_IMAGE061
的网络模型为卷积自编码神经网络,其结构如表1所示,其训练过程如下:
步骤a:从医药以及各类异物样本中选择少量带标签样本
Figure DEST_PATH_IMAGE062
Figure DEST_PATH_IMAGE063
表示第i个样本的光谱向量,
Figure DEST_PATH_IMAGE064
表示第i个样本的分类结果;
步骤b:构建卷积自编码网络模型
Figure 385631DEST_PATH_IMAGE026
,如图4上半部分所示,该模型由编码器和解码器组成,解码器的输出为样本重建
Figure DEST_PATH_IMAGE065
,编码器输出的中间特征经过softmax分类器得到样本的预测标签
Figure DEST_PATH_IMAGE066
步骤c:训练网络以更新权值,加权损失函数为:
Figure 881204DEST_PATH_IMAGE029
其中,
Figure DEST_PATH_IMAGE067
为交叉熵,
Figure DEST_PATH_IMAGE068
为均方误差,
Figure DEST_PATH_IMAGE069
为第i个样本的预测标签、
Figure 220918DEST_PATH_IMAGE064
为第i个样本的真实标签,
Figure 106834DEST_PATH_IMAGE065
为第i个样本的重建光谱向量,
Figure 432774DEST_PATH_IMAGE063
为第i个样本的光谱向量,
Figure DEST_PATH_IMAGE070
为权重值,其大小在0-1之间。
表1 卷积自编码网络模型结构
Figure DEST_PATH_IMAGE071
表1中编码器包括Conv1d卷积层、MaxPool1d池化层、ReLU激活层、BatchNorm1d归一化层,其中,K、S、p分别表示卷积核大小、卷积步长、输入的每一条边补充0的层数。编码过程为:输入的样本光谱向量依次经过9个参数设置相同的“卷积-池化-ReLU激活-归一化”模块进行特征的提取,每个模块的输出特征尺寸减半,最后一个模块输出的中间特征经过“Linear全连接层+softmax分类层”编码器输出层输出样本的预测标签
Figure DEST_PATH_IMAGE072
。解码器包括ConvTranspose1d转置卷积层、ReLU激活层、BatchNorm1d归一化层,K、S、p、o分别表示卷积核大小、卷积步长、输入的每一条边补充0的层数、输出的每一条边补充0的层数。解码过程为:由编码器最后一个模块得到的中间特征经过5个参数设置相同的“转置卷积-转置卷积-ReLU激活-归一化”模块和1个参数设置不同的“转置卷积-转置卷积-ReLU激活-归一化”模块进行光谱特征的重建,最后一个模块的输出经过“Linear全连接层”解码器输出层输出样本的重建光谱向量
Figure DEST_PATH_IMAGE073
与现有技术相比,本发明的优点在于:
(1)避免“维数灾难”问题,光谱特征可区分性更强
光谱特征的提取效果对于后续的分类操作十分重要,而现有的PCA算法以保存尽可能多的原始信息为目的,所提取的光谱特征可分性不强,不利于后续的分类操作。本发明提出的一种医药异物高光谱分类检测方法采用“波段聚类PCA分组降维+半监督LDA”光谱特征提取算法,首先利用波段聚类分组PCA降维算法对图像进行降维处理,然后通过半监督LDA算法来最大化类间距离以及最小化类内距离,因此所提取的光谱特征可区分性更强。
(2)通过半监督方法降低对标注数据的依赖性
本发明提出的一种医药异物高光谱分类检测方法采用半监督LDA算法,首先基于编解码结构构建伪标签生成网络,并通过有标签数据的预测与无标签数据的重建构建加权损失函数进行训练,既利用一定的先验信息又考虑到无标签数据的内在分布规律,因此在标签样本少的情况下也能达到比较好的检测效果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种医药异物高光谱分类检测方法,其特征在于,包括以下步骤:
S1、输入医药异物高光谱图像;
S2、预处理:提出多项式平滑滤波的异物光谱去噪方法,并基于其对步骤S1中的医药异物高光谱图像进行预处理,抑制光谱噪声干扰;
S3、提出基于异物光谱波段聚类分组PCA降维与半监督LDA结合的光谱特征提取方法,并与二维Gabor滤波器提取的空间特征相融合,实现异物特征提取;
所述步骤S3具体表现为:
S31、利用波段聚类分组PCA降维算法对步骤S2预处理后图像进行降维处理,并通过半监督LDA算法提取光谱特征,所述波段聚类分组PCA降维算法是先用聚类算法将波段分成了若干组,然后各组再进行PCA降维,该步骤S31具体包括:
S311、给定三维高光谱图像数据集
Figure 413944DEST_PATH_IMAGE001
,M、N、L分别代表预处理后图像矩阵的行数、列数和波段数,R表示矩阵,将三维高光谱图像数据集X转换为二维图像数据集
Figure 271042DEST_PATH_IMAGE002
Figure 808071DEST_PATH_IMAGE003
表示第i个样本的光谱向量,
Figure 194053DEST_PATH_IMAGE004
S312、利用Kmeans算法进行波段聚类,将原有的L个波段分成m个波段子集,目标函数为:
Figure 567266DEST_PATH_IMAGE005
其中,
Figure 431317DEST_PATH_IMAGE006
为聚类后的结果,
Figure 589897DEST_PATH_IMAGE007
Figure 615621DEST_PATH_IMAGE008
表示波段子集,
Figure 476130DEST_PATH_IMAGE009
Figure 143872DEST_PATH_IMAGE010
的聚类中心,
Figure 655493DEST_PATH_IMAGE011
表示波段子集
Figure 117699DEST_PATH_IMAGE012
中的某一个波段,
Figure 465504DEST_PATH_IMAGE013
表示一个距离度量,用来衡量波段与其所分配到的聚类中心之间的相似性;
S313、分别对每个波段子集
Figure 671357DEST_PATH_IMAGE012
进行PCA一次降维,设置阈值
Figure 460321DEST_PATH_IMAGE014
,提取各个波段子集内贡献率最高的前k个成分,得到新的波段子集
Figure 234373DEST_PATH_IMAGE015
,其中,前k个成分贡献率之和大等于阈值
Figure 944840DEST_PATH_IMAGE014
S314、联合新的波段子集
Figure 813439DEST_PATH_IMAGE015
,获得波段聚类分组降维后的数据
Figure 925752DEST_PATH_IMAGE016
,其中,
Figure 127099DEST_PATH_IMAGE017
为降维后的光谱向量维度;
S315、将给定三维高光谱图像数据集X输入已训练好的网络模型中,生成伪标签
Figure 324862DEST_PATH_IMAGE018
S316、基于
Figure 731572DEST_PATH_IMAGE019
运用LDA算法提取光谱特征
Figure 698391DEST_PATH_IMAGE020
,其中,
Figure 814246DEST_PATH_IMAGE021
为最终提取的光谱特征维度;
S32、利用PCA降维算法将步骤S2预处理后图像降至三维,然后利用二维Gabor滤波器提取空间特征;
S33、将光谱特征和空间特征联合并归一化,作为后续操作的分类特征,实现异物特征提取;
S4、采用支持向量机对步骤S3提取的异物特征进行医药异物的检测识别,并输出异物类别。
2.根据权利要求1所述的医药异物高光谱分类检测方法,其特征在于,所述步骤S315中用来生成伪标签
Figure 233726DEST_PATH_IMAGE022
的网络模型为卷积自编码神经网络,其训练过程如下:
步骤a:从医药以及各类异物样本中选择少量带标签样本
Figure 709707DEST_PATH_IMAGE023
Figure 531032DEST_PATH_IMAGE024
表示第i个样本的光谱向量,
Figure 739160DEST_PATH_IMAGE025
表示第i个样本的分类结果;
步骤b:构建卷积自编码网络模型
Figure 19837DEST_PATH_IMAGE026
,该模型由编码器和解码器组成,解码器的输出为样本重建
Figure 909296DEST_PATH_IMAGE027
,编码器输出的中间特征经过softmax分类器得到样本的预测标签
Figure 975341DEST_PATH_IMAGE028
步骤c:训练网络以更新权值,加权损失函数为:
Figure 557632DEST_PATH_IMAGE029
其中,
Figure 827070DEST_PATH_IMAGE030
为交叉熵,
Figure 520220DEST_PATH_IMAGE031
为均方误差,
Figure 175192DEST_PATH_IMAGE032
为第i个样本的预测标签、
Figure 928384DEST_PATH_IMAGE033
为第i个样本的真实标签,
Figure 183654DEST_PATH_IMAGE034
为第i个样本的重建光谱向量,
Figure 680495DEST_PATH_IMAGE035
为第i个样本的光谱向量,
Figure 455553DEST_PATH_IMAGE036
为权重值,其大小在0-1之间。
3.根据权利要求1所述的医药异物高光谱分类检测方法,其特征在于,所述步骤S32中的空间特征提取具体步骤如下:
S321、对给定三维高光谱图像数据X进行PCA降维,提取前三个主成分得到三通道的图像数据
Figure 114067DEST_PATH_IMAGE037
S322、将步骤S321降维后的图像数据
Figure 358098DEST_PATH_IMAGE038
转化为灰度图
Figure 127470DEST_PATH_IMAGE039
S323、通过设置不同的波长
Figure 288193DEST_PATH_IMAGE040
和方向
Figure 852030DEST_PATH_IMAGE041
构建Gabor滤波器组,总共包含
Figure 81892DEST_PATH_IMAGE042
个不同的Gabor滤波器:
Figure 920535DEST_PATH_IMAGE043
式中,x表示像素沿X轴方向上的坐标,y表示像素沿Y轴方向上坐标,
Figure 404606DEST_PATH_IMAGE044
表示高斯函数的标准差,
Figure 670502DEST_PATH_IMAGE045
表示相位偏移量,
Figure 623546DEST_PATH_IMAGE046
表示长宽比;
S324、用步骤S323中Gabor滤波器依次与灰度图作卷积提取出特征图像f(x,y),得到初始空间特征S(x,y):
Figure 62617DEST_PATH_IMAGE047
其中,
Figure 542140DEST_PATH_IMAGE048
Figure 103572DEST_PATH_IMAGE049
分别为Gabor滤波器实部和虚部,
Figure 668545DEST_PATH_IMAGE050
表示从第三个维度上合并图像矩阵;
S325、对S(x,y)归一化得到最终的空间特征
Figure 222892DEST_PATH_IMAGE051
Figure 291342DEST_PATH_IMAGE052
为最终提取的空间特征维度。
CN202110634697.8A 2021-06-08 2021-06-08 一种医药异物高光谱分类检测方法 Active CN113095305B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110634697.8A CN113095305B (zh) 2021-06-08 2021-06-08 一种医药异物高光谱分类检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110634697.8A CN113095305B (zh) 2021-06-08 2021-06-08 一种医药异物高光谱分类检测方法

Publications (2)

Publication Number Publication Date
CN113095305A CN113095305A (zh) 2021-07-09
CN113095305B true CN113095305B (zh) 2021-09-07

Family

ID=76664456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110634697.8A Active CN113095305B (zh) 2021-06-08 2021-06-08 一种医药异物高光谱分类检测方法

Country Status (1)

Country Link
CN (1) CN113095305B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269196B (zh) * 2021-07-19 2021-09-28 湖南大学 一种图卷积神经网络高光谱医药成分分析的实现方法
CN114004960B (zh) * 2021-11-17 2024-06-18 湖南大学 一种医药检测的高光谱双模成像系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930533A (zh) * 2012-10-09 2013-02-13 河海大学 一种基于改进k-均值聚类的半监督高光谱影像降维方法
CN106022358A (zh) * 2016-05-11 2016-10-12 湖南大学 一种高光谱图像分类方法和装置
CN109492593A (zh) * 2018-11-16 2019-03-19 西安电子科技大学 基于主成分分析网络和空间坐标的高光谱图像分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8320637B2 (en) * 2009-08-04 2012-11-27 Chemimage Corporation System and method for hyperspectral imaging of treated fingerprints

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930533A (zh) * 2012-10-09 2013-02-13 河海大学 一种基于改进k-均值聚类的半监督高光谱影像降维方法
CN106022358A (zh) * 2016-05-11 2016-10-12 湖南大学 一种高光谱图像分类方法和装置
CN109492593A (zh) * 2018-11-16 2019-03-19 西安电子科技大学 基于主成分分析网络和空间坐标的高光谱图像分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Categorization of pork quality using Gabor filter-based hyperspectral imaging technology;L. Liu 等;《Journal of Food Engineering》;20100312;第284–293页 *
一种自动编码机与K-means相结合的高光谱图像聚类方法;刘柏森 等;《黑龙江工程学院学报》;20201231;第34卷(第6期);全文 *
基于Gabor特征与局部保护降维的高光谱图像分类算法;叶珍 等;《光学学报》;20161031;第36卷(第10期);全文 *
面向高光谱图像分类的局部Gabor卷积神经网络;王燕 等;《计算机科学》;20200630;第47卷(第6期);全文 *

Also Published As

Publication number Publication date
CN113095305A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
Rida et al. Palmprint recognition with an efficient data driven ensemble classifier
Yadav et al. Multiresolution local binary pattern variants based texture feature extraction techniques for efficient classification of microscopic images of hardwood species
CN113095305B (zh) 一种医药异物高光谱分类检测方法
Singh et al. Gender and ethnicity classification of iris images using deep class-encoder
CN109241813B (zh) 基于判别稀疏保持嵌入的非约束人脸图像降维方法
CN105989597B (zh) 基于像素选择过程的高光谱图像异常目标检测方法
Huang et al. Hyperspectral image classification via discriminant Gabor ensemble filter
CN108664941B (zh) 基于测地映射分析的核稀疏描述人脸识别方法
Rehman Light microscopic iris classification using ensemble multi‐class support vector machine
Zhang et al. Deep eigen-filters for face recognition: Feature representation via unsupervised multi-structure filter learning
CN110399814B (zh) 一种基于局部线性表示领域适应度量的人脸识别方法
Dalal et al. IDA: Improving distribution analysis for reducing data complexity and dimensionality in hyperspectral images
CN111325275A (zh) 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置
Hariri et al. Recognition of 3D emotional facial expression based on handcrafted and deep feature combination
Wazirali et al. Hybrid Feature Extractions and CNN for Enhanced Periocular Identification During Covid-19.
CN112560949A (zh) 基于多级统计学特征提取的高光谱分类方法
Mukherjee et al. FuseKin: Weighted image fusion based kinship verification under unconstrained age group
Roy et al. Unconstrained texture classification using efficient jet texton learning
Chen et al. Spectral-spatial classification based on affinity scoring for hyperspectral imagery
Hou et al. An unsupervised deep-learning method for fingerprint classification: the ccae network and the hybrid clustering strategy
Huang et al. A one-class feature extraction method based on space decomposition
Qi et al. Multiple kernel boosting framework based on information measure for classification
Johnson et al. A study on eye fixation prediction and salient object detection in supervised saliency
Zeng et al. Hyper-graph regularized kernel subspace clustering for band selection of hyperspectral image
Wang et al. Self-supervised deep multi-level representation learning fusion-based maximum entropy subspace clustering for hyperspectral band selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant