CN111275131A - 基于红外光谱的化学图像分类识别方法 - Google Patents
基于红外光谱的化学图像分类识别方法 Download PDFInfo
- Publication number
- CN111275131A CN111275131A CN202010109050.9A CN202010109050A CN111275131A CN 111275131 A CN111275131 A CN 111275131A CN 202010109050 A CN202010109050 A CN 202010109050A CN 111275131 A CN111275131 A CN 111275131A
- Authority
- CN
- China
- Prior art keywords
- sample
- image
- infrared spectrum
- classification
- chemical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000000126 substance Substances 0.000 title claims abstract description 51
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 42
- 238000001228 spectrum Methods 0.000 claims abstract description 39
- 230000001360 synchronised effect Effects 0.000 claims abstract description 22
- 230000008569 process Effects 0.000 claims description 12
- 238000013145 classification model Methods 0.000 claims description 8
- 238000013526 transfer learning Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000010183 spectrum analysis Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 abstract description 15
- 239000004753 textile Substances 0.000 description 30
- 238000012549 training Methods 0.000 description 20
- 210000000085 cashmere Anatomy 0.000 description 19
- 230000003595 spectral effect Effects 0.000 description 15
- 210000002268 wool Anatomy 0.000 description 15
- 229920000742 Cotton Polymers 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000012795 verification Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000013508 migration Methods 0.000 description 6
- 230000005012 migration Effects 0.000 description 6
- 238000004566 IR spectroscopy Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000004744 fabric Substances 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012567 pattern recognition method Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000012569 chemometric method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000012844 infrared spectroscopy analysis Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000007431 microscopic evaluation Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供了基于红外光谱的化学图像分类识别方法,通过对待分类样品施加外部扰动,采集样品随扰动产生的动态红外光谱;通过融合同步和异步二维光谱图,将样品的多张动态光谱转化为一张化学图像,运用基于深度卷积网络学习的图像识别方法对待分类样品进行识别分类。本发明的分类识别方法能够对形态复杂和组成高度相似的不同类样品进行有效的识别和分类。
Description
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种基于红外光谱的化学图像 分类识别方法。
背景技术
红外光谱(包括中红外和近红外)主要产生于分子振动对光的吸收,可从 分子水平上反映物质组成与结构的指纹信息。随着仪器技术的发展,无论样品 为液体还是固体等形态,快速测量其红外光谱都很方便,是一种理想的分析信 号。红外光谱结合化学计量学方法可以实现快速的物质定性分析和多种性质定 量分析。
红外光谱判别分析过程包括光谱预处理,特征提取和模式识别等步骤,通 过比较待测样品到已知不同类别样品的光谱距离进行分类识别。对于在光谱上 具有明显差异的不同类样品,红外光谱检测识别方法是有效的,已被广泛用于 诸多领域。
红外光谱过程分析对象多为复杂物质。样品形态和环境变化会影响光谱测 量精度、样品中多组分光谱之间存在着严重重叠、共存组分光谱信息和光谱噪 声等因素,均对被测组分光谱有干扰,使其偏离光谱定量分析理论--比尔定律。 另外,使用传统的光谱模式识别方法判别组成高度相近的不同类样品的难度较 大,主要原因应是不同类样品光谱间差异信息量不足。
因此,目前传统的红外光谱分析手段对于形态复杂和组成高度相似的不同 类样品不能有效识别和分类。
发明内容
本发明的目的是提供一种基于红外光谱的化学图像分类识别方法,解决目 前传统的红外光谱分析手段对于形态复杂和组成高度相似的不同类样品不能有 效识别和分类的技术问题。
为了达到上述目的,本发明提供如下技术方案:
基于红外光谱的化学图像分类识别方法,通过对待分类样品施加外部扰动, 采集样品随扰动产生的动态红外光谱,以扩大不同类样品间光谱差异;通过融 合同步和异步二维光谱图,将样品的多张动态光谱(一个样品对应多个信号) 转化为一张化学图像(样品与信号一一对应),运用基于深度卷积网络学习的图 像识别方法对待分类样品进行识别分类。
进一步地,具体包括如下步骤:
S1、首先对待分类样品施加外部扰动,采集样品随扰动产生的一系列动态 红外光谱;
S2、对每个样品系列动态红外光谱进行二维相关光谱分析,得到同步二维 相关光谱图和异步二维相关光谱图,将同步二维相关光谱图和异步二维相关光 谱图进行融合,构造一张化学图像;
S3、将基于深度学习的GoogLeNet图像识别模型与迁移学习算法结合,使 用所有样品的化学图像,建立图像分类模型,实现对待分类样品的识别与分类。
进一步地,所述外部扰动包括湿度、温度、pH、压力、电压或磁场。
进一步地,S3中,将化学图像数仅对GoogLeNet网络最后4层结构进行训 练,并且保留其它层结构不变。
进一步地,S4中,对GoogLeNet图像识别模型的迁移学习过程中,第141 Dropout层的输入元素以65%的概率随机设置为零,以防止过拟合。
进一步地,S4中,对GoogLeNet图像识别模型的迁移学习过程中,第142 全链接层和第144分类输出层包含了将网络提取的特征组合为类概率、损失值 和预测类别的信息,调整全连接层的滤波数量和分类层的分类数等于当前化学 图像的种类数,同时增大全连接层的学习率因子以获得更快的学习速率。
本发明基于红外光谱的化学图像分类识别方法,针对光谱过程分析领域中 尚未解决的形态复杂和组成高度相近的不同类样品分类难题,提出对样品施加 外部扰动,采集其动态光谱,以扩大不同类样品间光谱差异。通过融合同步和 异步二维相关光谱图,将多张动态光谱(一个样品对应多个信号)转化为一张 化学图像(样品与信号一一对应)。运用基于深度卷积网络学习的图像识别方法 对其分类。使用小样本数据和学习迁移方法,使GoogleNet中通过大数据样本训 练获得的成熟图像分类模型(涵盖了1000种实际图像)。
本发明旨在突破红外光谱识别组成高度相似的不同类样本时遇到的信息量 和特征不足的局限,提出采用GoogLeNet对化学图像数据进行分类与识别。采 用同时具有自动特征提取与分类功能的深度卷积神经网络CNN方法,建立光谱 化学图像数据分类方法。针对图像识别领域中较为成熟和先进的CNN深度网络 结构是由实际的大数据样本训练得到的,而小样本的化学图像数据满足不了其 网络训练要求,提出采用化学图像小样本数据和迁移学习方法,使实际成熟的 CNN图像知识库能够适应于红外光谱识别组成高度相似的不同类样本,从而建 立一种全新的光谱化学图像分类与识别方法,以期解决红外光谱过程分析中遇 到的共性判别难题。因此,本发明提出将GoogLeNet已有的图像识别模型(在 1000类图像大数据库中学习到的特征提取能力)向化学图像数据识别迁移。使 用小样本的化学图像数仅对GoogLeNet网络最后4层结构进行训练,并且保留 其它层结构不变,使迁移后的GoogLeNet适应当前的特定任务,从而实现化学 组成高度相近的不同类样品的红外光谱识别。
本发明提出使用学习迁移方法使通过大数据样本训练获得的成熟图像分类 模型适应化学领域光谱分类(小样本),为人工智能领域中先进技术用于解决化 学问题提供了一个成功示范。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述 中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为羊绒纺织品近红外光谱;
图2为羊绒-羊毛混纺织物近红外光谱;
图3为纯棉纺织品近红外光谱;
图4为丝光棉纺织品近红外光谱;
图5为光谱图;其中,A1-D1为同步二维相关光谱图;A2-D2为异步二维 相关光谱图;A3-D3为同步二维相关光谱图和异步二维相关光谱图的融合图谱;
图6为GoogLeNet网络结构图;
图7为山羊绒纺织品与山羊绒+羊毛混纺及纯羊毛纺织品分类模型的训练和 验证过程;
图8为纯棉纺织品与丝光棉分类模型的训练和验证过程;
图9为本发明实施例的识别方法流程图。
具体实施方式
下面将结合本发明的附图,对本发明的技术方案进行清楚、完整地描述, 显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基 于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获 得的所有其他实施例,都属于本发明保护的范围。
本发明的基于红外光谱的化学图像分类识别方法,具体包括如下步骤:
S1、首先对待分类样品施加外部扰动,采集样品随扰动产生的多个动态红 外光谱;
S2、对待分类样品的多个红外光谱进行二维相关光谱分析,得到各样品的 同步二维相关光谱图和异步二维相关光谱图,将同步二维相关光谱图和异步二 维相关光谱图进行融合得到待分类样品的化学图像;
S3、根据迁移学习方法,将GoogLeNet图像识别模型进行迁移,由S2中待 分类样品的化学图像获得图像分类模型,实现对待分类样品的识别与分类。
以羊绒纺织品与羊毛纺织品的分类与识别为例,对本发明的技术方案作进 一步的解释说明。
对于化学组成高度相近的不同类样品,如羊绒纺织品与羊毛纺织品,其近 红外光谱差异较小,而且也容易受样品形态和环境等因素影响,因此,仅依靠 处于“静止”状态样品光谱所包含的信息量和特征,不足以将它们区分开来。 基于羊绒和羊毛纤维在吸水性上存在着差异现象,对样品施加外部(水分)变 化扰动,采集其随外部扰动产生的系列“动态”光谱。这些不同类样本在组成 上的微小差异及在物理结构上的差异,它们与水分子作用程度也不同,获得相 应的动态光谱也有不同。
本发明使用两个组分高度相近的不同类样品分类与识别案例为研究对象:(1)山羊绒纺织品与山羊绒-羊毛混纺及纯羊毛纺织品的识别,(2)纯棉纺织品 和丝光棉纺织品的识别。从中国几个省份的纺织品生产企业和市场共收集了234 个纺织品实际样品。其中,64个为山羊绒,20个纯羊毛,50个山羊绒+羊毛混 纺(羊毛含量为51.5%-96.2%(w/w)),50个纯棉和50个丝光棉。它们在厚度, 颜色和质地(机织或针织)上各不相同。每个样品的类别由显微镜分析法确定。 其中,混纺样品中羊毛含量采用国标方法GBT 2910.4-2009测得。根据样品的 近红外光谱,采用Kennard-Stone方法对每类样品分集,其中训练集占80%,剩余样品作为验证模型判别能力的测试集,具体结果如表1所示。
表1
纺织品样品 | 总数 | 训练集 | 测试集 |
山羊绒 | 64 | 51 | 13 |
羊绒-羊毛混纺 | 70 | 56 | 14 |
纯棉 | 50 | 40 | 10 |
丝光棉 | 50 | 40 | 10 |
首先将样品在105℃真空烘箱中连续烘干3小时得到干燥样品,然后把干燥 样品放入相对湿度(RH)100%、恒温20℃的密室中,样品进行吸潮。在不同 吸附时间取出样品,制备不同含水量的样品。采用精确度为0.1mg的分析天平 对样品称重,并根据公式1在标准条件(25℃和RH 65%)下测定样品的回潮率 (含水量):
回潮率=(Wc-Wd)/Wd*100%………………式(1)
其中Wc和Wd分别是样品吸水后的重量和干重。根据国标GB/T 9994-2018,样品的最大回潮率设定为16.3%。每个样品制备了4个不同的含水 量,包括0、5.4、11.2和16.3(%,w/w),共得到936个不同含水量的样品。
光谱采集
使用配备有积分球附件的FT-NIR光谱仪在恒温恒湿的条件下采集样品的漫 反射近红外光谱。内置的金箔用于采集背景光谱。把每块大小约0.5m2的样品折 叠成4-6层,然后直接放置在积分球的窗口上并用铁块压住使其与窗口表面紧密 接触,光谱采集的参数为:分辨率4cm-1,扫描数32,光谱范围10,000-4000cm -1。每次光谱采集大约需要1分钟,每个样品重复采集3张光谱,计算平均光谱 作为该样品光谱。
同步采集水分含量为5.4%、11.2%、16.3%的样品的近红外光谱。从每类样 品中随机选一个样品,它们在不同水含量下的“动态”光谱如图1-4所示。可以 看出,与干燥样品相比,潮湿样品的近红外光谱图中均出现了两个较宽的水峰。 其中,7100-6800cm-1波段归属于ν1+ν3band(ν1是对称伸缩,ν3属于非对 称伸缩模式),吸光度变化最大的5150-4950cm-1波段归属于ν2+ν3band(ν2 是弯曲振动模式)。根据文献,ν2+ν3波段可以反映潮湿纺织品基体中氢键的 状态,包含样品吸水模式的丰富信息。由此可见,水分扰动显著地增加了光谱 数据量和信息量,放大了不同类样品之间的近红外光谱差异。
化学图像
二维相关光谱分析是一种提取扰动光谱变化信息的有力方法,广泛用于分 析复杂体系。为此,对不同类纺织品的水分扰动光谱进行二维相关分析,得到 它们同步(synchronous)二维相关光谱图(图5A1-D1)和异步(asynchronous) 二维相关光谱图(图5A2-D2)。可以看出,同步二维相关光谱图是关于主对角 线对称,反映了与水分扰动同相位的光谱变化信息。异步二维相关光谱图是关 于主对角线反对称的,反映了与水分扰动有相位差(asynchronous)的光谱变化 信息。可以看出,在视觉上,与近红外光谱相比,二维相关光谱图更加明显地 反映了组成高度相近的不同纺织品的光谱信息差异。
由于二维相关光谱图具有对称性,表明synchronous 2DCOS图(图5A1-D1) 和asynchronous 2DCS图(图5A2-D2)存在着冗余信息。为此,对同一个样品, 取其synchronous 2DCS主对角线上半部分和asynchronous 2DCS主对角线下半 部分,合成一张既反映同步相关变化,又包含异步相关变化的光谱化学信息图 像,如图5A3至图5D3所示。可以看出,与近红外光谱图像相比,在视觉上, 化学图像能更直观地和更明显地反映山羊绒与山羊绒-羊毛混纺及纯羊毛纺织品 的光谱差异。
从信息量角度看,上述化学图像数据更有利于组成高度相似样品的分类鉴 别。但是,常用的光谱(向量)模式识别方法,并不适合直接处理化学图像(矩 阵)数据。近年来,基于深度卷积神经网络的图像识别方法研究方兴未艾。其 中,GoogLeNet是一种代表性的深度卷积神经网络架构,其图像识别模型涵盖 了1000种类型实际图像,是当前最为成熟的深度学习图像识别方法之一。 GoogLeNet图像识别模型通过大数据训练获得的,而这里纺织品样品数量属于 小样本,不足以完成对GoogLeNet网络的训练。因此,本文提出通过迁移学习 方法将GoogLeNet图像识别模型进行迁移,使其适合组成高度相近不同类纺织 品化学图像的分类与识别。根据迁移学习理论,对最后4层网络参数进行了微 调并使用新数据重新训练,如图6所示。其中第141 Dropout层的输入元素随机 设置为零,以防止过拟合。将随机概率调整为65%。第142全链接层和第144 分类输出层包含了将网络提取的特征组合为类概率、损失值和预测类别的信息。 调整全连接层的滤波数量和分类层的分类数等于当前化学图像的种类数2,同时 增大全连接层的学习率因子(learning rate factor)以获得更快的学习速率。因为 Sigmoid激活函数比Softmax激活函数更适用于二分类问题,故在Output层前 采用Sigmoid激活函数。需要注意的是,GoogLeNet Image input层限定了输入图 像的大小为224*224*3pixels,因此,在输入训练模型前,把化学图像转化为对 应大小的RGB(Red-Green-Blue)三色域图像。
构造化学图像
对任何一个样本施加水分扰动,即逐步增加样品含水量。每次改变水含量 时采集一张近红外光谱x。对应于m个不同水含量采集的系列动态光谱构成光 谱矩阵Xm*n,其中n表示波长点数。通过对Xm*n进行二维相关分析处理,分 别得到一张同步二维相关光谱图Φ和一张异步二维相关光谱图Ψ,其计算公式 如下:
由于同步图和异步图分别关于主对角线对称和反对称,即含有一半冗余信 息。同步图和异步图的维数相同。为此,提取同步图的上三角部分和异步图的 下三角部分拼成一张融合的二维相关光谱图(Fusion map),得到该样品消除冗 余信息后的化学信息图像,在维数上与同步图或异步图相同。需要注意的是, 同步图的主对角线数据(通常称为功率谱)是有物理意义的,因此,它被保留 在了融合相关图中,异步图主对角线上的数据是无物理意义的,因而被舍弃。
GoogLeNet模型迁移及训练(fine-tuning)
GoogLeNet通过前面部分的深度卷积层向图像数据学习,自动提取图像分 类特征,输出分类特征(一维向量),然后被输入至后面全连接的神经元进行计 算,随后由分类层通过sigmoid函数计算样品归属于每一类的概率,最后输出最 终的判别结果。
目前GoogLeNet深度卷积层已经通过1000类真实图像大数据库学习获得了 非常优秀的图像特征提取能力(即权重),本发明提出保留它的深度卷积层不动, 使用小样本化学图像数据只对后面的全连接层和分类层部分进行训练。其中, 调整全连接层的滤波数量和分类层分类数等于当前化学图像的种类数。连接层 和分类层的权重可采用反向传播算法通过迭代过程学习确定。目标函数为采用 均方误差(MSE)的最小化损失函数,采用L2范数进行正则化,公式如下:
其中,全连接层的激活函数为ReLu函数,采用批量标准化(BN)加速再 训练过程,反向传播算法结合Sgdm优化器发现局部最小值,避免过模型拟合。
模型评价指标为验证正确率,即:
RC=NA/NT×100%…………………式(7)
其中,NA和NT分别是正确识别个数和验证样品总个数。
通过trial-and-error方法确定神经网络训练过程中的各种超参数 (ultra-parameters)。其中,InitialLearnRate指定了在损失函数的负梯度方向上的 初始步长,MiniBatchSize是在每次迭代中使用的训练集子集的大小,MaxEpochs 表示用于训练的最大epoch数。InitialLearnRate,1e-4,MiniBatchSize,15, MaxEpochs,20。使用训练集样品训练模型,然后通过用fine-tuned GoogLenet模 型预测验证集样品来评估模型的性能。山羊绒纺织品与山羊绒+羊毛混纺及纯羊 毛纺织品,和棉纺织品与丝光棉纺织分类模型的训练和验证过程分别如图7和8 所示,随着epoch增大,训练集交互验证正确率不断上升,10个epoch后稳定 在90%左右;而损失函数的误差值不断减小。经过20个epoch的迭代训练后,在验证集上,山羊绒纺织品与山羊绒+羊毛混纺及纯羊毛纺织品的判别正确率为 92.59%,如图9所示,棉-丝光棉纺织品的正确率为94.62%,具有了实际应用的 价值。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到 变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应 所述以权利要求的保护范围为准。
Claims (6)
1.基于红外光谱的化学图像分类识别方法,其特征在于:通过对待分类样品施加外部扰动,采集样品随扰动产生的动态红外光谱;通过融合同步和异步二维光谱图,将样品的多张动态光谱转化为一张化学图像,运用基于深度卷积网络学习的图像识别方法对待分类样品进行识别分类。
2.根据权利要求1所述的基于红外光谱的化学图像分类识别方法,其特征在于:具体包括如下步骤:
S1、首先对待分类样品施加外部扰动,采集样品随扰动产生的一系列动态红外光谱;
S2、对每个样品系列动态红外光谱进行二维相关光谱分析,得到同步二维相关光谱图和异步二维相关光谱图,将同步二维相关光谱图和异步二维相关光谱图进行融合,构造一张化学图像;
S3、将基于深度学习的GoogLeNet图像识别模型与迁移学习算法结合,使用所有样品的化学图像,建立图像分类模型,实现对待分类样品的识别与分类。
3.根据权利要求1或2所述的基于红外光谱的化学图像分类识别方法,其特征在于:所述外部扰动包括湿度、温度、pH、压力、电压或磁场。
4.根据权利要求2所述的基于红外光谱的化学图像分类识别方法,其特征在于:S3中,将化学图像数仅对GoogLeNet网络最后4层结构进行训练,并且保留其它层结构不变。
5.根据权利要求2所述的基于红外光谱的化学图像分类识别方法,其特征在于:S4中,对GoogLeNet图像识别模型的迁移学习过程中,第141Dropout层的输入元素以65%的概率随机设置为零,以防止过拟合。
6.根据权利要求2所述的基于红外光谱的化学图像分类识别方法,其特征在于:S4中,对GoogLeNet图像识别模型的迁移学习过程中,第142全链接层和第144分类输出层包含了将网络提取的特征组合为类概率、损失值和预测类别的信息,调整全连接层的滤波数量和分类层的分类数等于当前化学图像的种类数,同时增大全连接层的学习率因子以获得更快的学习速率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010109050.9A CN111275131A (zh) | 2020-02-21 | 2020-02-21 | 基于红外光谱的化学图像分类识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010109050.9A CN111275131A (zh) | 2020-02-21 | 2020-02-21 | 基于红外光谱的化学图像分类识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111275131A true CN111275131A (zh) | 2020-06-12 |
Family
ID=71003643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010109050.9A Pending CN111275131A (zh) | 2020-02-21 | 2020-02-21 | 基于红外光谱的化学图像分类识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111275131A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364979A (zh) * | 2020-11-05 | 2021-02-12 | 哈尔滨工业大学 | 一种基于GoogLeNet的红外图像识别方法 |
CN113607684A (zh) * | 2021-08-18 | 2021-11-05 | 燕山大学 | 基于gaf图像和四元数卷积的光谱定性建模方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104316491A (zh) * | 2014-11-12 | 2015-01-28 | 天津农学院 | 基于同步-异步二维近红外相关谱检测牛奶掺尿素的方法 |
CN105158194A (zh) * | 2015-09-23 | 2015-12-16 | 中国人民解放军第二军医大学 | 一种鉴定减肥类中药或保健品中是否添加麻黄碱与/或伪麻黄碱的方法 |
CN105608433A (zh) * | 2015-12-23 | 2016-05-25 | 北京化工大学 | 一种基于核协同表达的高光谱图像分类方法 |
CN105842186A (zh) * | 2016-03-23 | 2016-08-10 | 浙江大学 | 基于二维相关红外光谱的掺杂肉糜定性定量检测方法 |
CN107561031A (zh) * | 2017-08-29 | 2018-01-09 | 天津农学院 | 基于二维近红外、中红外相关谱信息融合的芝麻油中掺入玉米油的检测方法 |
CN109932319A (zh) * | 2019-04-11 | 2019-06-25 | 山东农业大学 | 一种果园土壤速效钾含量获取方法、系统及装置 |
CN110070004A (zh) * | 2019-04-02 | 2019-07-30 | 杭州电子科技大学 | 一种应用于深度学习的近地高光谱数据扩展方法 |
-
2020
- 2020-02-21 CN CN202010109050.9A patent/CN111275131A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104316491A (zh) * | 2014-11-12 | 2015-01-28 | 天津农学院 | 基于同步-异步二维近红外相关谱检测牛奶掺尿素的方法 |
CN105158194A (zh) * | 2015-09-23 | 2015-12-16 | 中国人民解放军第二军医大学 | 一种鉴定减肥类中药或保健品中是否添加麻黄碱与/或伪麻黄碱的方法 |
CN105608433A (zh) * | 2015-12-23 | 2016-05-25 | 北京化工大学 | 一种基于核协同表达的高光谱图像分类方法 |
CN105842186A (zh) * | 2016-03-23 | 2016-08-10 | 浙江大学 | 基于二维相关红外光谱的掺杂肉糜定性定量检测方法 |
CN107561031A (zh) * | 2017-08-29 | 2018-01-09 | 天津农学院 | 基于二维近红外、中红外相关谱信息融合的芝麻油中掺入玉米油的检测方法 |
CN110070004A (zh) * | 2019-04-02 | 2019-07-30 | 杭州电子科技大学 | 一种应用于深度学习的近地高光谱数据扩展方法 |
CN109932319A (zh) * | 2019-04-11 | 2019-06-25 | 山东农业大学 | 一种果园土壤速效钾含量获取方法、系统及装置 |
Non-Patent Citations (3)
Title |
---|
NODA: "Generalized Two-Dimensional Correlation Method Applicable to Infrared, Raman, and Other Types of Spectroscopy", 《OSA》 * |
XITING SUN 等: "A novel deep learning-based chemical image identification method of infrared spectroscopy using external perturbation", 《ANALYTICAL METHODS》 * |
冯旸赫等著: "《在线半监督学习理论及方法》", 31 January 2019, 国防工业出版社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364979A (zh) * | 2020-11-05 | 2021-02-12 | 哈尔滨工业大学 | 一种基于GoogLeNet的红外图像识别方法 |
CN112364979B (zh) * | 2020-11-05 | 2022-07-12 | 哈尔滨工业大学 | 一种基于GoogLeNet的红外图像识别方法 |
CN113607684A (zh) * | 2021-08-18 | 2021-11-05 | 燕山大学 | 基于gaf图像和四元数卷积的光谱定性建模方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111369500A (zh) | 基于红外光谱检测技术的纺织品分类识别方法 | |
CN110717368A (zh) | 一种纺织品定性分类方法 | |
Zhang et al. | Classification modeling method for near‐infrared spectroscopy of tobacco based on multimodal convolution neural networks | |
CN105740912B (zh) | 基于核范数正则化的低秩图像特征提取的识别方法及系统 | |
Fang et al. | Confident learning-based domain adaptation for hyperspectral image classification | |
CN113392931B (zh) | 基于自监督学习及多任务学习的高光谱开放集分类方法 | |
CN111126575A (zh) | 基于机器学习的气体传感器阵列混合气体检测方法及装置 | |
CN109993236A (zh) | 基于one-shot Siamese卷积神经网络的少样本满文匹配方法 | |
CN112613536A (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
CN111275131A (zh) | 基于红外光谱的化学图像分类识别方法 | |
CN110378374A (zh) | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 | |
CN112949391B (zh) | 一种基于深度学习谐波信号分析的智能安检方法 | |
CN114399674A (zh) | 一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统 | |
Wu et al. | A CS-AdaBoost-BP model for product quality inspection | |
CN115406852A (zh) | 基于多标签卷积神经网络的织物纤维成分定性方法 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN113408616A (zh) | 基于pca-uve-elm的光谱分类方法 | |
CN113970532A (zh) | 基于近红外光谱的织物纤维成分检测系统和预测方法 | |
CN109447009B (zh) | 基于子空间核范数正则化回归模型的高光谱图像分类方法 | |
CN117290716A (zh) | 一种基于KPCA-TCN-Attention的光伏阵列故障诊断方法 | |
Bi et al. | Apple grading method based on ordered partition neural network | |
CN115876794A (zh) | 基于取样布及分层思想的绝缘子污秽度识别方法 | |
Li et al. | Early drought plant stress detection with bi-directional long-term memory networks | |
Li et al. | SVM-based apple classification of soluble solids content by near-infrared spectroscopy | |
Yang et al. | Fisher’s tobacco leaf grading method based on image multi-features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200612 |
|
RJ01 | Rejection of invention patent application after publication |