CN113095305A - 一种医药异物高光谱分类检测方法 - Google Patents

一种医药异物高光谱分类检测方法 Download PDF

Info

Publication number
CN113095305A
CN113095305A CN202110634697.8A CN202110634697A CN113095305A CN 113095305 A CN113095305 A CN 113095305A CN 202110634697 A CN202110634697 A CN 202110634697A CN 113095305 A CN113095305 A CN 113095305A
Authority
CN
China
Prior art keywords
spectral
image
hyperspectral
medical
foreign matter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110634697.8A
Other languages
English (en)
Other versions
CN113095305B (zh
Inventor
王耀南
李亚萍
朱青
张辉
周显恩
尹阿婷
毛建旭
刘敏
谭浩然
吴成中
史雅兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202110634697.8A priority Critical patent/CN113095305B/zh
Publication of CN113095305A publication Critical patent/CN113095305A/zh
Application granted granted Critical
Publication of CN113095305B publication Critical patent/CN113095305B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N21/88Investigating the presence of flaws or contamination
    • G01N21/90Investigating the presence of flaws or contamination in a container or its contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biochemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种医药异物高光谱分类检测方法,首先输入医药异物高光谱图像;其次提出多项式平滑滤波的异物高光谱去噪方法,抑制光谱噪声干扰;再次提出异物光谱波段聚类分组PCA降维与半监督LDA结合的特征提取方法,先采用波段聚类分组PCA降维对预处理后图像进行降维处理,并通过半监督LDA提取光谱特征,随后利用二维Gabor滤波器提取空间特征,将上述特征联合作为图像的分类特征;最后采用支持向量机实现医药异物检测并输出异物类别。本发明提出了PCA和LDA二次降维的方法,以便提取出更有利于后续分类操作的光谱特征;同时,引入半监督LDA降低对标签数据的依赖,实现少量标签数据样本下异物的高准确率检测。

Description

一种医药异物高光谱分类检测方法
技术领域
本发明涉及图像处理技术领域,特别是涉及一种医药异物高光谱分类检测方法。
背景技术
近年来我国医药市场发展迅速,市场规模由2015年的12207亿元增加至2019年的16330亿元,年复合增长率为7.5%,预期2020年至2021年将进一步以6.8%的年复合增长率保持增长,并且2021年达到13057亿元。与此同时,医药安全作为医药工业发展的基石和人民群众健康的重要保障,也越发受到行业内外的关注。在医药生产过程中,常出现玻璃、屑石块、毛发、橡胶屑等种类多样且微弱的异物,为医药安全带来了潜在危险,因此医药异物检测成为制药过程中不可避免的一项工作。传统的人工检测法难以保证检测的可靠性和效率,愈发无法满足日益严格的检测标准。由于高光谱技术可以根据每种物质在同一光学环境下出现的独特的光谱信息快捷地实现对物质地检测和分类问题,其已被应用到真伪鉴定、药材鉴别、产地溯源、含量测定等多种医药检测用途中。目前高光谱检测主要存在以下问题:
(1)高光谱数据包含成百上千个波段,直接使用高维数据不但存储、传输成本很高,数据挖掘效率低,而且随着数据维数的增加,数据计算过程中运算量会呈指数倍增长,在实际应用中产生“维数灾难”问题。数据降维以牺牲一部分信息为代价,通过寻找有效、简单的数据表示方式,在保留高维数据的有效信息、保持数据的分类结果不变的前提下,降低数据表示复杂度,实现对数据由高维空间到低维空间的转换,能够有效解决“维数灾难”问题。PCA(Principal Component Analysis,主成分分析)作为应用最广泛的无监督降维方法之一,主要是选择样本点投影具有最大方差的方向,以保存尽可能多的原始信息为目的,导致所提取的光谱特征可能存在可区分性不强而不利于后续的分类操作的问题;LDA(LatentDirichlet Allocation,隐含狄利克雷分布)作为一种有监督降维方式则通过寻求投影后不同类别之间数据点距离更大化以及同一类别数据点距离最小化来选择分类性能最好的方向,但存在数据可能过渡拟合的问题。
(2)在医药异物检测场景中,某些异物比较微小且形状不规则,标注难度较大,导致带标签的样本相对较少,致使检测性能更好的有监督方法无法达到很好的效果。因此,利用有限的标记样本提取可区分的重要特征以提高分类性能的研究一直是一个热点。目前主要通过两种方式解决该问题,第一种方法是增强训练样本的数量和质量,《HyperspectralImage Classification Using Deep Pixel-Pair Features》(Li W, Wu G, Zhang F, etal. Hyperspectral image classification using deep pixel-pair features[J].IEEE Transactions on Geoscience and Remote Sensing, 2016, 55(2): 844-853)通过在有限的标签样本中构建像素对来增加训练样本的数量,但是没有充分利用无标签数据丰富的内在分布规律;第二种方法通过设计无监督训练框架消除标记样本的依赖性,《Unsupervised Feature Extraction in Hyperspectral Images Based on WassersteinGenerative Adversarial Network》(Zhang M, Gong M, Mao Y, et al. Unsupervisedfeature extraction in hyperspectral images based on wasserstein generativeadversarial network[J]. IEEE Transactions on Geoscience and Remote Sensing,2018, 57(5): 2669-2688)提出一种改进的生成式对抗网络显著降低了对标注训练样本的要求并保持了良好的特征质量,《Symmetric All Convolutional Neural-Network-BasedUnsupervised Feature Extraction for Hyperspectral Images Classification》(Zhang M, Gong M, He H, et al. Symmetric All Convolutional Neural-Network-Based Unsupervised Feature Extraction for Hyperspectral Images Classification[J]. IEEE Transactions on Cybernetics, 2020)基于编解码器结构设计了一种新型的端到端训练框架,此类方法由于没有用到任何标记先验信息,在分类精度上通常难以达到满意的结果。
发明内容
有鉴于此,本发明提出一种医药异物高光谱分类检测方法,该方法基于波段聚类分组PCA降维+半监督LDA光谱特征提取,以解决现有PCA算法无法提取可分性更强特征的问题,同时半监督LDA算法的提出解决了标签样本比较少的问题。
一方面,本发明提供了一种医药异物高光谱分类检测方法,包括以下步骤:
S1、输入医药异物高光谱图像;
S2、预处理:提出多项式平滑滤波的异物光谱去噪方法,并基于其对步骤S1中的医药异物高光谱图像进行预处理,抑制光谱噪声干扰;
S3、提出基于异物光谱波段聚类分组PCA降维与半监督LDA结合的光谱特征提取方法,并与二维Gabor滤波器提取的空间特征相融合,实现异物特征提取;
所述步骤S3具体表现为:
S31、利用波段聚类分组PCA降维算法对步骤S2预处理后图像进行降维处理,并通过半监督LDA算法提取光谱特征;
S32、利用PCA降维算法将步骤S2预处理后图像降至三维,然后利用二维Gabor滤波器提取空间特征;
S33、将光谱特征和空间特征联合并归一化,作为后续操作的分类特征,实现异物特征提取;
S4、采用支持向量机对步骤S3提取的异物特征进行医药异物的检测识别,
并输出异物类别。
进一步地,所述步骤S31中光谱特征提取具体步骤如下:
S311、给定三维高光谱图像数据集
Figure 287170DEST_PATH_IMAGE001
,M、N、L分别代表预处理后图像矩阵的行数、列数和波段数,R表示矩阵,将三维高光谱图像数据集X转换为二维图像数据集
Figure 550397DEST_PATH_IMAGE002
Figure 86552DEST_PATH_IMAGE003
表示第i个样本的光谱向量,
Figure 166503DEST_PATH_IMAGE004
S312、利用Kmeans算法进行波段聚类,将原有的L个波段分成m个波段子集,目标函数为:
Figure 661070DEST_PATH_IMAGE005
其中,
Figure 131365DEST_PATH_IMAGE006
为聚类后的结果,
Figure 595845DEST_PATH_IMAGE007
Figure 671248DEST_PATH_IMAGE008
表示波段子集,
Figure 461350DEST_PATH_IMAGE009
Figure 356624DEST_PATH_IMAGE010
的聚类中心,
Figure 624795DEST_PATH_IMAGE011
表示波段子集
Figure 554705DEST_PATH_IMAGE012
中的某一个波段,
Figure 250128DEST_PATH_IMAGE013
表示一个距离度量,用来衡量波段与其所分配到的聚类中心之间的相似性;
S313、分别对每个波段子集
Figure 898278DEST_PATH_IMAGE012
进行PCA一次降维,设置阈值
Figure 970140DEST_PATH_IMAGE014
,提取各个波段子集内贡献率最高的前k个成分,得到新的波段子集
Figure 548364DEST_PATH_IMAGE015
,其中,前k个成分贡献率之和大等于阈值
Figure 555634DEST_PATH_IMAGE014
S314、联合新的波段子集
Figure 550135DEST_PATH_IMAGE015
,获得波段聚类分组降维后的数据
Figure 301053DEST_PATH_IMAGE016
,其中,
Figure 330189DEST_PATH_IMAGE017
为降维后的光谱向量维度;
S315、将给定三维高光谱图像数据集X输入已训练好的网络模型中,生成伪标签
Figure 242782DEST_PATH_IMAGE018
S316、基于
Figure 990158DEST_PATH_IMAGE019
运用LDA算法提取光谱特征
Figure 279188DEST_PATH_IMAGE020
,其中,
Figure 162830DEST_PATH_IMAGE021
为最终提取的光谱特征维度。
进一步地,所述步骤S315中用来生成伪标签
Figure 980744DEST_PATH_IMAGE022
的网络模型为卷积自编码神经网络,其训练过程如下:
步骤a:从医药以及各类异物样本中选择少量带标签样本
Figure 949838DEST_PATH_IMAGE023
Figure 42558DEST_PATH_IMAGE024
表示第i个样本的光谱向量,
Figure 452811DEST_PATH_IMAGE025
表示第i个样本的分类结果;
步骤b:构建卷积自编码网络模型
Figure 97419DEST_PATH_IMAGE026
,该模型由编码器和解码器组成,解码器的输出为样本重建
Figure 166525DEST_PATH_IMAGE027
,编码器输出的中间特征经过softmax分类器得到样本的预测标签
Figure 921991DEST_PATH_IMAGE028
步骤c:训练网络以更新权值,加权损失函数为:
Figure 655592DEST_PATH_IMAGE029
其中,
Figure 471101DEST_PATH_IMAGE030
为交叉熵,
Figure 24574DEST_PATH_IMAGE031
为均方误差,
Figure 583731DEST_PATH_IMAGE032
为第i个样本的预测标签、
Figure 171838DEST_PATH_IMAGE033
为第i个样本的真实标签,
Figure 158249DEST_PATH_IMAGE034
为第i个样本的重建光谱向量,
Figure 261334DEST_PATH_IMAGE035
为第i个样本的光谱向量,
Figure 233969DEST_PATH_IMAGE036
为权重值,其大小在0-1之间。
进一步地,所述步骤S32中的空间特征提取具体步骤如下:
S321、对给定三维高光谱图像数据X进行PCA降维,提取前三个主成分得到三通道的图像数据
Figure 801217DEST_PATH_IMAGE037
S322、将步骤S321降维后的图像数据
Figure 833895DEST_PATH_IMAGE038
转化为灰度图
Figure 221014DEST_PATH_IMAGE039
S323、通过设置不同的波长
Figure 997340DEST_PATH_IMAGE040
和方向
Figure 684673DEST_PATH_IMAGE041
构建Gabor滤波器组,总共包含
Figure 885323DEST_PATH_IMAGE042
个不同的Gabor滤波器:
Figure 25317DEST_PATH_IMAGE043
式中,x表示像素沿X轴方向上的坐标,y表示像素沿Y轴方向上坐标,
Figure 339755DEST_PATH_IMAGE044
表示高斯函数的标准差,
Figure 881595DEST_PATH_IMAGE045
表示相位偏移量,
Figure 256076DEST_PATH_IMAGE046
表示长宽比;
S324、用步骤S323中Gabor滤波器依次与灰度图作卷积提取出特征图像f(x,y),得到初始空间特征S(x,y):
Figure 555470DEST_PATH_IMAGE047
其中,
Figure 798232DEST_PATH_IMAGE048
Figure 335524DEST_PATH_IMAGE049
分别为Gabor滤波器实部和虚部,
Figure 5540DEST_PATH_IMAGE050
表示从第三个维度上合并图像矩阵;
S325、对S(x,y)归一化得到最终的空间特征
Figure 729913DEST_PATH_IMAGE051
Figure 510787DEST_PATH_IMAGE052
为最终提取的空间特征维度。
故此,首先输入医药异物高光谱图像;其次,提出多项式平滑滤波的异物高光谱去噪方法,抑制光谱噪声干扰;再次,提出异物光谱波段聚类分组PCA降维与半监督LDA结合的特征提取方法,先采用波段聚类分组PCA降维对预处理后图像进行降维处理,并通过半监督LDA提取光谱特征,随后利用二维Gabor滤波器提取空间特征,将上述特征联合作为图像的分类特征;最后,采用支持向量机实现医药异物检测并输出异物类别。本发明针对PCA传统降维方法下的特征可区分性不高的局限性,提出了PCA和LDA二次降维的方法,以便提取出更有利于后续分类操作的光谱特征;同时,引入半监督LDA降低对标签数据的依赖,克服高光谱数据标注难的问题,实现少量标签数据样本下异物的高准确率检测,具有分类检测识别率高的优点。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种医药异物高光谱分类检测方法的流程图;
图2是本发明实施例的原始高光谱图像;
图3是本发明实施例的单个样本滤波前后的光谱曲线图,其中,(a)为滤波前的光谱曲线,(b)为滤波后的光谱曲线;
图4为本发明实施例的光谱特征提取流程图;
图5为光谱特征散点图,(a)为仅使用PCA降维之后的光谱特征散点图,(b)为使用本发明方法之后的光谱特征散点图;
图6为本发明实施例的空间特征结果图;
图7为本发明实施例的分类结果图,(a)为预测图,(b)为真实图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是根据本发明实施例提供的一种医药异物高光谱分类检测方法,包括以下步骤:
S1、输入医药异物高光谱图像;
S2、预处理:提出多项式平滑滤波的异物光谱去噪方法,并基于其对步骤S1中的医药异物高光谱图像进行预处理,抑制光谱噪声干扰;
S3、提出基于异物光谱波段聚类分组PCA降维与半监督LDA结合的光谱特征提取方法,并与二维Gabor(加博尔)滤波器提取的空间特征相融合,实现异物特征提取;
所述步骤S3具体表现为:
S31、利用波段聚类分组PCA降维算法对步骤S2预处理后图像进行降维处理,并通过半监督LDA算法提取光谱特征;
S32、利用PCA降维算法将步骤S2预处理后图像降至三维,然后利用二维Gabor滤波器提取空间特征;
S33、将光谱特征和空间特征联合并归一化,作为后续操作的分类特征,实现异物特征提取;
S4、采用支持向量机(Support Vector Machine, SVM)对步骤S3提取的异物特征进行医药异物的检测识别,并输出异物类别。
需要说明的是,步骤S31中波段聚类分组PCA降维算法是先用聚类算法将波段分成了若干组,然后各组再进行PCA降维,而步骤S32中PCA降维算法是不需要先用聚类算法直接进行PCA降维,即步骤S32的PCA降维仅视为步骤S31中波段聚类分组PCA降维算法的其中一个步骤。
本发明,首先输入医药异物高光谱图像;其次,提出多项式平滑滤波的异物高光谱去噪方法,抑制光谱噪声干扰;再次,提出异物光谱波段聚类分组PCA降维与半监督LDA结合的特征提取方法,先采用波段聚类分组PCA降维对预处理后图像进行降维处理,并通过半监督LDA提取光谱特征,随后利用二维Gabor滤波器提取空间特征,将上述特征联合作为图像的分类特征;最后,采用支持向量机实现医药异物检测并输出异物类别。本发明针对PCA传统降维方法下的特征可区分性不高的局限性,提出了PCA和LDA二次降维的方法,以便提取出更有利于后续分类操作的光谱特征;同时,引入半监督LDA降低对标签数据的依赖,克服高光谱数据标注难的问题,实现少量标签数据样本下异物的高准确率检测,具有分类检测识别率高的优点。
下面进一步阐述各个步骤的具体实现方式。
一种医药异物高光谱分类检测方法,具体包括以下步骤:
S1、输入医药异物高光谱图像;图2即为输入的原始高光谱图像。
S2、预处理:提出多项式平滑滤波的异物光谱去噪方法,并基于其对步骤S1中的医药异物高光谱图像进行预处理,抑制光谱噪声干扰;图3是本发明实施例的单个样本滤波前后的光谱曲线图,其中,(a)为滤波前的光谱曲线,(b)为滤波后的光谱曲线,从中可以看出预处理平滑滤波,能够有效抑制光谱噪声的干扰。
S3、提出基于异物光谱波段聚类分组PCA降维与半监督LDA结合的光谱特征提取方法,并与二维Gabor滤波器提取的空间特征相融合,实现异物特征提取;
该步骤的具体实施例包括如下过程:
(1)光谱特征提取,如图4所示:
S311、给定三维高光谱图像数据集
Figure 902586DEST_PATH_IMAGE001
,M、N、L分别代表预处理后图像矩阵的行数、列数和波段数,R表示矩阵,将三维高光谱图像数据集X转换为二维图像数据集
Figure 743503DEST_PATH_IMAGE002
Figure 955172DEST_PATH_IMAGE003
表示第i个样本的光谱向量,
Figure 539737DEST_PATH_IMAGE004
S312、利用Kmeans算法(K-平均或者K-均值,是一种聚类算法)进行波段聚类,将原有的L个波段分成m个波段子集,目标函数为:
Figure 573991DEST_PATH_IMAGE005
其中,
Figure 195596DEST_PATH_IMAGE006
为聚类后的结果,
Figure 956879DEST_PATH_IMAGE007
Figure 79556DEST_PATH_IMAGE008
表示波段子集,
Figure 445946DEST_PATH_IMAGE009
Figure 628666DEST_PATH_IMAGE010
的聚类中心,
Figure 549348DEST_PATH_IMAGE011
表示波段子集
Figure 475716DEST_PATH_IMAGE012
中的某一个波段,
Figure 696613DEST_PATH_IMAGE013
表示一个距离度量,用来衡量波段与其所分配到的聚类中心之间的相似性;
S313、分别对每个波段子集
Figure 50234DEST_PATH_IMAGE053
进行PCA一次降维,设置阈值
Figure 723792DEST_PATH_IMAGE014
,提取各个波段子集内贡献率最高的前k个成分,得到新的波段子集
Figure 453850DEST_PATH_IMAGE015
,其中,前k个成分贡献率之和大等于阈值
Figure 325991DEST_PATH_IMAGE014
S314、联合新的波段子集
Figure 722950DEST_PATH_IMAGE015
,获得波段聚类分组降维后的数据
Figure 8438DEST_PATH_IMAGE016
,其中,
Figure 417554DEST_PATH_IMAGE017
为降维后的光谱向量维度;
S315、将给定三维高光谱图像数据集X输入已训练好的网络模型中,生成伪标签
Figure 472097DEST_PATH_IMAGE018
S316、基于
Figure 42887DEST_PATH_IMAGE019
运用LDA算法提取光谱特征
Figure 815671DEST_PATH_IMAGE020
,其中,
Figure 497319DEST_PATH_IMAGE021
为最终提取的光谱特征维度。
如图5所示,其中,(a)为仅使用传统的PCA降维之后的光谱特征散点图,(b)为使用本发明方法之后的光谱特征散点图,从中可知,相比于传统的PCA光谱特征提取方法,本发明所用方法所得到的光谱特征呈现出更强的同类聚集性。
(2)空间特征提取
S321、对给定三维高光谱图像数据X进行PCA降维,提取前三个主成分得到三通道的图像数据
Figure 406369DEST_PATH_IMAGE037
S322、将步骤S321降维后的图像数据
Figure 413640DEST_PATH_IMAGE038
转化为灰度图
Figure 80244DEST_PATH_IMAGE039
S323、通过设置不同的波长
Figure 955796DEST_PATH_IMAGE040
和方向
Figure 594719DEST_PATH_IMAGE041
构建Gabor滤波器组,总共包含
Figure 897525DEST_PATH_IMAGE042
个不同的Gabor滤波器:
Figure 989109DEST_PATH_IMAGE043
式中,x表示像素沿X轴方向上的坐标,y表示像素沿Y轴方向上坐标,
Figure 402772DEST_PATH_IMAGE044
表示高斯函数的标准差,
Figure 164711DEST_PATH_IMAGE045
表示相位偏移量,
Figure 638417DEST_PATH_IMAGE046
表示长宽比;
S324、用步骤S323中Gabor滤波器依次与灰度图作卷积提取出特征图像f(x,y),得到初始空间特征S(x,y):
Figure 482877DEST_PATH_IMAGE047
其中,
Figure 700231DEST_PATH_IMAGE048
Figure 313746DEST_PATH_IMAGE049
分别为Gabor滤波器实部和虚部,
Figure 630458DEST_PATH_IMAGE050
表示从第三个维度上合并图像矩阵;
S325、对S(x,y)归一化得到最终的空间特征
Figure 86847DEST_PATH_IMAGE051
Figure 717680DEST_PATH_IMAGE052
为最终提取的空间特征维度。
在该实施例中设定λ=(10,15,20)和θ=(0,45°,90°,135°),则构建如下12组不同波长和方向的Gabor滤波器:
Figure 575915DEST_PATH_IMAGE054
Figure 735632DEST_PATH_IMAGE055
Figure 679317DEST_PATH_IMAGE054
Figure 910578DEST_PATH_IMAGE056
Figure 498685DEST_PATH_IMAGE054
Figure 485096DEST_PATH_IMAGE057
Figure 257355DEST_PATH_IMAGE054
Figure 354624DEST_PATH_IMAGE058
Figure 62817DEST_PATH_IMAGE059
Figure 220129DEST_PATH_IMAGE055
Figure 748194DEST_PATH_IMAGE059
Figure 321257DEST_PATH_IMAGE056
Figure 8591DEST_PATH_IMAGE059
Figure 212170DEST_PATH_IMAGE057
Figure 352164DEST_PATH_IMAGE059
Figure 666602DEST_PATH_IMAGE058
Figure 208442DEST_PATH_IMAGE060
Figure 582923DEST_PATH_IMAGE055
Figure 210213DEST_PATH_IMAGE060
Figure 328342DEST_PATH_IMAGE056
Figure 724688DEST_PATH_IMAGE060
Figure 19139DEST_PATH_IMAGE057
Figure 133726DEST_PATH_IMAGE060
Figure 55545DEST_PATH_IMAGE058
,则图6中(a)-(l)依次为上述12组Gabor滤波器最终所提取的空间特征图。
(3)联合光谱特征与空间特征
S33、将光谱特征和空间特征联合并归一化,具体地,将光谱特征和空间特征从第三维度合并,作为后续操作的分类特征,实现异物特征提取;
S4、采用支持向量机对步骤S3提取的异物特征进行医药异物的检测识别,并输出异物类别。
图7为本发明实施例的分类结果图,其中,(a)为预测图,(b)为真实图,从中可知,通过本发明获得的分类结果图与真实的分类结果图基本一致,分类识别率高。
需要说明的是,本发明中用来生成伪标签
Figure 306398DEST_PATH_IMAGE061
的网络模型为卷积自编码神经网络,其结构如表1所示,其训练过程如下:
步骤a:从医药以及各类异物样本中选择少量带标签样本
Figure 819419DEST_PATH_IMAGE062
Figure 296668DEST_PATH_IMAGE063
表示第i个样本的光谱向量,
Figure 881233DEST_PATH_IMAGE064
表示第i个样本的分类结果;
步骤b:构建卷积自编码网络模型
Figure 127538DEST_PATH_IMAGE026
,如图4上半部分所示,该模型由编码器和解码器组成,解码器的输出为样本重建
Figure 139356DEST_PATH_IMAGE065
,编码器输出的中间特征经过softmax分类器得到样本的预测标签
Figure 103901DEST_PATH_IMAGE066
步骤c:训练网络以更新权值,加权损失函数为:
Figure 960999DEST_PATH_IMAGE029
其中,
Figure 61810DEST_PATH_IMAGE067
为交叉熵,
Figure 510109DEST_PATH_IMAGE068
为均方误差,
Figure 696370DEST_PATH_IMAGE069
为第i个样本的预测标签、
Figure 622738DEST_PATH_IMAGE064
为第i个样本的真实标签,
Figure 840705DEST_PATH_IMAGE065
为第i个样本的重建光谱向量,
Figure 194326DEST_PATH_IMAGE063
为第i个样本的光谱向量,
Figure 867884DEST_PATH_IMAGE070
为权重值,其大小在0-1之间。
表1 卷积自编码网络模型结构
Figure 597943DEST_PATH_IMAGE071
表1中编码器包括Conv1d卷积层、MaxPool1d池化层、ReLU激活层、BatchNorm1d归一化层,其中,K、S、p分别表示卷积核大小、卷积步长、输入的每一条边补充0的层数。编码过程为:输入的样本光谱向量依次经过9个参数设置相同的“卷积-池化-ReLU激活-归一化”模块进行特征的提取,每个模块的输出特征尺寸减半,最后一个模块输出的中间特征经过“Linear全连接层+softmax分类层”编码器输出层输出样本的预测标签
Figure 673346DEST_PATH_IMAGE072
。解码器包括ConvTranspose1d转置卷积层、、ReLU激活层、BatchNorm1d归一化层,K、S、p、o分别表示卷积核大小、卷积步长、输入的每一条边补充0的层数、输出的每一条边补充0的层数。解码过程为:由编码器最后一个模块得到的中间特征经过5个参数设置相同的“转置卷积-转置卷积-ReLU激活-归一化”模块和1个参数设置不同的“转置卷积-转置卷积-ReLU激活-归一化”模块进行光谱特征的重建,最后一个模块的输出经过“Linear全连接层”解码器输出层输出样本的重建光谱向量
Figure 197868DEST_PATH_IMAGE073
与现有技术相比,本发明的优点在于:
(1)避免“维数灾难”问题,光谱特征可区分性更强
光谱特征的提取效果对于后续的分类操作十分重要,而现有的PCA算法以保存尽可能多的原始信息为目的,所提取的光谱特征可分性不强,不利于后续的分类操作。本发明提出的一种医药异物高光谱分类检测方法采用“波段聚类PCA分组降维+半监督LDA”光谱特征提取算法,首先利用波段聚类分组PCA降维算法对图像进行降维处理,然后通过半监督LDA算法来最大化类间距离以及最小化类内距离,因此所提取的光谱特征可区分性更强。
(2)通过半监督方法降低对标注数据的依赖性
本发明提出的一种医药异物高光谱分类检测方法采用半监督LDA算法,首先基于编解码结构构建伪标签生成网络,并通过有标签数据的预测与无标签数据的重建构建加权损失函数进行训练,既利用一定的先验信息又考虑到无标签数据的内在分布规律,因此在标签样本少的情况下也能达到比较好的检测效果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种医药异物高光谱分类检测方法,其特征在于,包括以下步骤:
S1、输入医药异物高光谱图像;
S2、预处理:提出多项式平滑滤波的异物光谱去噪方法,并基于其对步骤S1中的医药异物高光谱图像进行预处理,抑制光谱噪声干扰;
S3、提出基于异物光谱波段聚类分组PCA降维与半监督LDA结合的光谱特征提取方法,并与二维Gabor滤波器提取的空间特征相融合,实现异物特征提取;
所述步骤S3具体表现为:
S31、利用波段聚类分组PCA降维算法对步骤S2预处理后图像进行降维处理,并通过半监督LDA算法提取光谱特征;
S32、利用PCA降维算法将步骤S2预处理后图像降至三维,然后利用二维Gabor滤波器提取空间特征;
S33、将光谱特征和空间特征联合并归一化,作为后续操作的分类特征,实现异物特征提取;
S4、采用支持向量机对步骤S3提取的异物特征进行医药异物的检测识别,并输出异物类别。
2.根据权利要求1所述的医药异物高光谱分类检测方法,其特征在于,所述步骤S31中光谱特征提取具体步骤如下:
S311、给定三维高光谱图像数据集
Figure 807450DEST_PATH_IMAGE001
,M、N、L分别代表预处理后图像矩阵的行数、列数和波段数,R表示矩阵,将三维高光谱图像数据集X转换为二维图像数据集
Figure 557231DEST_PATH_IMAGE002
Figure 261882DEST_PATH_IMAGE003
表示第i个样本的光谱向量,
Figure 475825DEST_PATH_IMAGE004
S312、利用Kmeans算法进行波段聚类,将原有的L个波段分成m个波段子集,目标函数为:
Figure 584727DEST_PATH_IMAGE005
其中,
Figure 212017DEST_PATH_IMAGE006
为聚类后的结果,
Figure 126884DEST_PATH_IMAGE007
Figure 398596DEST_PATH_IMAGE008
表示波段子集,
Figure 68612DEST_PATH_IMAGE009
Figure 49776DEST_PATH_IMAGE010
的聚类中心,
Figure 565071DEST_PATH_IMAGE011
表示波段子集
Figure 956869DEST_PATH_IMAGE012
中的某一个波段,
Figure 469890DEST_PATH_IMAGE013
表示一个距离度量,用来衡量波段与其所分配到的聚类中心之间的相似性;
S313、分别对每个波段子集
Figure 71772DEST_PATH_IMAGE012
进行PCA一次降维,设置阈值
Figure 531704DEST_PATH_IMAGE014
,提取各个波段子集内贡献率最高的前k个成分,得到新的波段子集
Figure 902642DEST_PATH_IMAGE015
,其中,前k个成分贡献率之和大等于阈值
Figure 789827DEST_PATH_IMAGE014
S314、联合新的波段子集
Figure 347847DEST_PATH_IMAGE015
,获得波段聚类分组降维后的数据
Figure 611469DEST_PATH_IMAGE016
,其中,
Figure 509018DEST_PATH_IMAGE017
为降维后的光谱向量维度;
S315、将给定三维高光谱图像数据集X输入已训练好的网络模型中,生成伪标签
Figure 691738DEST_PATH_IMAGE018
S316、基于
Figure 143579DEST_PATH_IMAGE019
运用LDA算法提取光谱特征
Figure 69947DEST_PATH_IMAGE020
,其中,
Figure 756755DEST_PATH_IMAGE021
为最终提取的光谱特征维度。
3.根据权利要求2所述的医药异物高光谱分类检测方法,其特征在于,所述步骤S315中用来生成伪标签
Figure 375955DEST_PATH_IMAGE022
的网络模型为卷积自编码神经网络,其训练过程如下:
步骤a:从医药以及各类异物样本中选择少量带标签样本
Figure 49513DEST_PATH_IMAGE023
Figure 779572DEST_PATH_IMAGE024
表示第i个样本的光谱向量,
Figure 589396DEST_PATH_IMAGE025
表示第i个样本的分类结果;
步骤b:构建卷积自编码网络模型
Figure 51602DEST_PATH_IMAGE026
,该模型由编码器和解码器组成,解码器的输出为样本重建
Figure 337089DEST_PATH_IMAGE027
,编码器输出的中间特征经过softmax分类器得到样本的预测标签
Figure 480626DEST_PATH_IMAGE028
步骤c:训练网络以更新权值,加权损失函数为:
Figure 535170DEST_PATH_IMAGE029
其中,
Figure 371539DEST_PATH_IMAGE030
为交叉熵,
Figure 613164DEST_PATH_IMAGE031
为均方误差,
Figure 560391DEST_PATH_IMAGE032
为第i个样本的预测标签、
Figure 735021DEST_PATH_IMAGE033
为第i个样本的真实标签,
Figure 476712DEST_PATH_IMAGE034
为第i个样本的重建光谱向量,
Figure 736792DEST_PATH_IMAGE035
为第i个样本的光谱向量,
Figure 21798DEST_PATH_IMAGE036
为权重值,其大小在0-1之间。
4.根据权利要求1所述的医药异物高光谱分类检测方法,其特征在于,所述步骤S32中的空间特征提取具体步骤如下:
S321、对给定三维高光谱图像数据X进行PCA降维,提取前三个主成分得到三通道的图像数据
Figure 926300DEST_PATH_IMAGE037
S322、将步骤S321降维后的图像数据
Figure 963527DEST_PATH_IMAGE038
转化为灰度图
Figure 586269DEST_PATH_IMAGE039
S323、通过设置不同的波长
Figure 999933DEST_PATH_IMAGE040
和方向
Figure 493362DEST_PATH_IMAGE041
构建Gabor滤波器组,总共包含
Figure 967069DEST_PATH_IMAGE042
个不同的Gabor滤波器:
Figure 811528DEST_PATH_IMAGE043
式中,x表示像素沿X轴方向上的坐标,y表示像素沿Y轴方向上坐标,
Figure 763304DEST_PATH_IMAGE044
表示高斯函数的标准差,
Figure 439135DEST_PATH_IMAGE045
表示相位偏移量,
Figure 693530DEST_PATH_IMAGE046
表示长宽比;
S324、用步骤S323中Gabor滤波器依次与灰度图作卷积提取出特征图像f(x,y),得到初始空间特征S(x,y):
Figure 884340DEST_PATH_IMAGE047
其中,
Figure 515173DEST_PATH_IMAGE048
Figure 42582DEST_PATH_IMAGE049
分别为Gabor滤波器实部和虚部,
Figure 858091DEST_PATH_IMAGE050
表示从第三个维度上合并图像矩阵;
S325、对S(x,y)归一化得到最终的空间特征
Figure 411563DEST_PATH_IMAGE051
Figure 705141DEST_PATH_IMAGE052
为最终提取的空间特征维度。
CN202110634697.8A 2021-06-08 2021-06-08 一种医药异物高光谱分类检测方法 Active CN113095305B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110634697.8A CN113095305B (zh) 2021-06-08 2021-06-08 一种医药异物高光谱分类检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110634697.8A CN113095305B (zh) 2021-06-08 2021-06-08 一种医药异物高光谱分类检测方法

Publications (2)

Publication Number Publication Date
CN113095305A true CN113095305A (zh) 2021-07-09
CN113095305B CN113095305B (zh) 2021-09-07

Family

ID=76664456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110634697.8A Active CN113095305B (zh) 2021-06-08 2021-06-08 一种医药异物高光谱分类检测方法

Country Status (1)

Country Link
CN (1) CN113095305B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269196A (zh) * 2021-07-19 2021-08-17 湖南大学 一种图卷积神经网络高光谱医药成分分析的实现方法
CN114004960A (zh) * 2021-11-17 2022-02-01 湖南大学 一种医药检测的高光谱双模成像系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110033082A1 (en) * 2009-08-04 2011-02-10 Chemimage Corporation System and method for improved forensic analysis
CN102930533A (zh) * 2012-10-09 2013-02-13 河海大学 一种基于改进k-均值聚类的半监督高光谱影像降维方法
CN106022358A (zh) * 2016-05-11 2016-10-12 湖南大学 一种高光谱图像分类方法和装置
CN109492593A (zh) * 2018-11-16 2019-03-19 西安电子科技大学 基于主成分分析网络和空间坐标的高光谱图像分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110033082A1 (en) * 2009-08-04 2011-02-10 Chemimage Corporation System and method for improved forensic analysis
CN102930533A (zh) * 2012-10-09 2013-02-13 河海大学 一种基于改进k-均值聚类的半监督高光谱影像降维方法
CN106022358A (zh) * 2016-05-11 2016-10-12 湖南大学 一种高光谱图像分类方法和装置
CN109492593A (zh) * 2018-11-16 2019-03-19 西安电子科技大学 基于主成分分析网络和空间坐标的高光谱图像分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
L. LIU 等: "Categorization of pork quality using Gabor filter-based hyperspectral imaging technology", 《JOURNAL OF FOOD ENGINEERING》 *
刘柏森 等: "一种自动编码机与K-means相结合的高光谱图像聚类方法", 《黑龙江工程学院学报》 *
叶珍 等: "基于Gabor特征与局部保护降维的高光谱图像分类算法", 《光学学报》 *
王燕 等: "面向高光谱图像分类的局部Gabor卷积神经网络", 《计算机科学》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269196A (zh) * 2021-07-19 2021-08-17 湖南大学 一种图卷积神经网络高光谱医药成分分析的实现方法
CN113269196B (zh) * 2021-07-19 2021-09-28 湖南大学 一种图卷积神经网络高光谱医药成分分析的实现方法
CN114004960A (zh) * 2021-11-17 2022-02-01 湖南大学 一种医药检测的高光谱双模成像系统及方法

Also Published As

Publication number Publication date
CN113095305B (zh) 2021-09-07

Similar Documents

Publication Publication Date Title
Rida et al. Palmprint identification using an ensemble of sparse representations
Yadav et al. Multiresolution local binary pattern variants based texture feature extraction techniques for efficient classification of microscopic images of hardwood species
Lee et al. Collaborative expression representation using peak expression and intra class variation face images for practical subject-independent emotion recognition in videos
Schwartz et al. Visual material traits: Recognizing per-pixel material context
CN109241813B (zh) 基于判别稀疏保持嵌入的非约束人脸图像降维方法
CN113095305B (zh) 一种医药异物高光谱分类检测方法
Huang et al. Hyperspectral image classification via discriminant Gabor ensemble filter
Lee et al. Face image retrieval using sparse representation classifier with gabor-lbp histogram
Wei et al. Visual descriptors for scene categorization: experimental evaluation
CN108664941B (zh) 基于测地映射分析的核稀疏描述人脸识别方法
CN105868711B (zh) 一种基于稀疏低秩的人体行为识别方法
Zuobin et al. Feature regrouping for cca-based feature fusion and extraction through normalized cut
CN110399814B (zh) 一种基于局部线性表示领域适应度量的人脸识别方法
Ling et al. A constrained sparse-representation-based binary hypothesis model for target detection in hyperspectral imagery
Zhang et al. Deep eigen-filters for face recognition: Feature representation via unsupervised multi-structure filter learning
Dalal et al. IDA: Improving distribution analysis for reducing data complexity and dimensionality in hyperspectral images
CN111325275A (zh) 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置
Hariri et al. Recognition of 3D emotional facial expression based on handcrafted and deep feature combination
Sheng et al. Action recognition using direction-dependent feature pairs and non-negative low rank sparse model
CN112966649A (zh) 基于核扩展字典稀疏表示的遮挡人脸识别方法
Khan et al. Feature selection based on co-clustering for effective facial expression recognition
Ma et al. Multiscale multidirection binary pattern learning for discriminant palmprint identification
CN112560949A (zh) 基于多级统计学特征提取的高光谱分类方法
Chen et al. Spectral-spatial classification based on affinity scoring for hyperspectral imagery
Chen et al. More about covariance descriptors for image set coding: Log-euclidean framework based kernel matrix representation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant