CN113344051A - 一种基于太赫兹数据的神经网络分类方法 - Google Patents

一种基于太赫兹数据的神经网络分类方法 Download PDF

Info

Publication number
CN113344051A
CN113344051A CN202110591153.8A CN202110591153A CN113344051A CN 113344051 A CN113344051 A CN 113344051A CN 202110591153 A CN202110591153 A CN 202110591153A CN 113344051 A CN113344051 A CN 113344051A
Authority
CN
China
Prior art keywords
data
neural network
layer
training
terahertz
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110591153.8A
Other languages
English (en)
Inventor
朱新勇
宋田
王博
刘虎
初文怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Qingyuan Fengda Terahertz Technology Co ltd
Original Assignee
Qingdao Qingyuan Fengda Terahertz Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Qingyuan Fengda Terahertz Technology Co ltd filed Critical Qingdao Qingyuan Fengda Terahertz Technology Co ltd
Priority to CN202110591153.8A priority Critical patent/CN113344051A/zh
Publication of CN113344051A publication Critical patent/CN113344051A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Optimization (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种基于太赫兹数据的神经网络分类方法,首先采集太赫兹时域信号,将提取物质的时域信号转换成频谱数据和吸收率数据,截取相同长度的频谱数据和吸收率合并两个特征作为网络输入数据,将处理好的数据送入神经网络进行训练,对训练的结果进行不断测试,根据结果进行参数调优和训练策略调整,调优训练充分后的结果完全进行物质识别区分,将训练好的模型移植到上位机中,直接实现物质分类。本发明发明提出了基于物质频谱数据和吸收率数据作为两大合并作为物质鉴别的特征,并通过优化的神经网络算法进行物质分类鉴别,提高了鉴别的准确率。

Description

一种基于太赫兹数据的神经网络分类方法
技术领域:
本发明属于太赫兹光谱和成像技术领域,具体涉及一种基于太赫兹数据的神经网络分类方法。
背景技术:
太赫兹波是一种波长介于红外线和微波之间的电磁波,由于处于光子学到电子学的过渡区域,其具有很多独特的属性,如指纹光谱性、低能性、特殊穿透性等。太赫兹波与性材料作用会产生独特的吸收谱-指纹普。极性分子,如水分子,非极性分子,如二氧化碳分子,对太赫兹波的吸收有着非常明显的区别,因此太赫兹吸收谱对检验分子特性也有着重要价值。时域太赫兹光谱扫描技术利用高精度延时线将飞秒脉冲的采样时间延长至几十皮秒,并通过硬件预处理来降低噪声。由其产生的时域信号经傅里叶变换得到被检测物质的特征吸收谱,其谱宽可达5THz以上,动态范围可达70dB以上。这种频谱性能可满足绝大多数化合物的检测需求,从而为太赫兹时域光谱扫描提供了大量的应用场景。
鉴于太赫兹吸收光谱的指纹特性,对于物质识别分类具有重要应用。目前常用的机器学习算法已经应用于太赫兹物质识别,如主成分分析与线性回归判别,但是传统的机器学习算法不能做到对相似性很高的物质进行太赫兹物质识别,常用的svm算法对太赫兹物质鉴别效果不佳。
发明内容:
本发明目的在于克服现有技术存在的缺点,寻求设计一种基于太赫兹数据的神经网络分类方法,解决了现有机器学习算法分类准确度低的问题。
为了实现上述目的,本发明涉及的一种基于太赫兹数据的神经网络分类方法,具体包括以下步骤:
步骤1:采集太赫兹时域信号,并将数据保存至本地;
步骤2:将提取物质的时域信号转换成频谱数据和吸收率数据;
步骤3:截取相同长度的频谱数据和吸收率合并两个特征作为网络输入数据;
步骤4:将处理好的数据送入神经网络进行训练;
步骤5:神经网络结构应用卷积层首先对输入数据进行特征提取和降维,一维太赫兹数据经过20个卷积核之后变成了20个一维组合数据,在卷积层的输出输入BN层,对数据做了归一化处理,BN层的输出再输入到池化层,池化层的输出根据前面三层网络结构再重复一遍卷积层、BN层和池化层,然后再进入全连接层分别为256和128个神经元的全连接,卷积层和两个全连接层使用的激活函数为ReLU激活函数,最后一层使用softmax激活函数的6个神经元作为物质分类输出;
步骤6:对训练的结果进行不断测试,根据结果进行参数调优和训练策略调整;
步骤7:调优训练充分后的结果完全进行物质识别区分;
步骤8:将训练好的模型移植到上位机中,直接实现物质分类。
神经网络算法应用卷积神经网络对特征进行提取,卷积神经网络已经在图像处理方面得到深一层次的应用而且取得了重大突破,对于太赫兹一维时域光谱卷积神经网络同样适合,本发明应用卷积神经网络提取特征,并应用池化层进行数据降维,并且还加入了BN层对数据进行归一化处理并大大加速模型收敛与防止过拟合,可以说BN层的加入使得本发明神经网络算法在性能准确率上提升很大。最后神经网络加入了全连接层起到物质判别作用。
本发明与现有技术相比具有以下有益效果:
(1)本发明发明提出了基于物质频谱数据和吸收率数据作为两大合并作为物质鉴别的特征,并通过优化的神经网络算法进行物质分类鉴别,提高了鉴别的准确率,能够鉴别似性极高的材料。
(2)本发明通过python实现了物质频谱与吸收率计算提取与神经网络算法,可将代码集成到太赫兹光谱仪的上位机中,从而作为物质鉴别的实现方法。
附图说明:
图1为L亮氨酸物质在透射式系统中截取0.1thz到2thz的频谱曲线图。
图2为L亮氨酸物质在透射式系统中截取0.1thz到2thz的吸收率曲线图。
图3为频谱数据计算公式。
图4为吸收率数据计算公式。
具体实施方式:
下面通过具体实施例并结合附图对本发明作进一步说明。
实施例1:
本实施例鉴别的物质有:DL酪氨酸,L酪氨酸,L亮氨酸,L缬氨酸,无水硫酸钠,无水碳酸钠。这些物质中有相似的四种氨基酸,还有相似性极高的无水硫酸法与无水碳酸钠。
本实施例搭建的太赫兹时域系统属于透射式太赫兹时域系统,物质经过制作压片后在太赫兹时域系统中进行数据采集,采集到物质的时域光谱数据。采集的数据维度有时间、参考信号和样品信号。时间包含采集的起始时间直到结束时间以0.002ps为间隔,一共采集90ps的数据;参考信号为不放入样品时太赫兹时域光谱系统采集的空载信号数据;样品信号为放入样品后太赫兹时域光谱系统采集到的信号数据。采集完数据后并在上位机中导出采集的数据,数据以Excel形式保存包含时间、参考信号与样品信号。
在数据处理上,将采集到的物质时域光谱数据进行傅里叶变换获取到每种物质的频谱数据,频谱数据的计算详细见图3公式。并通过物质吸收率计算公式图4获取物质的吸收率数据。频谱的计算是样品时域信号做傅里叶变换后得到频域信号并进行归一化处理得到,吸收率的计算根据样品时域信号的傅里叶变换除以参考时域信号的傅里叶变换,然后对比值进行获取幅值和相位,再根据折射率和消光系数的计算公式得到折射率和消光系数,最后通过吸收率公式计算得到吸收率图。样品的频谱数据和吸收率数据两大特征合并作为进行物质鉴别。在神经网络算法上本发明应用卷积神经网络对频谱和吸收率两大特征进行特征提取,卷积神经网络具有提取局部特征、参数共享等优点,只需要将最重要的特征从频谱与吸收率中提取出来。卷积神经网络在图像处理特征提取十分有用,同时将卷积神经网络应用于一维太赫兹数据处理特征提取同样适用。并且本发明加入了池化层、BN层和全连接层进行物质分类。
基于太赫兹数据的神经网络分类方法,具体包括以下步骤:
步骤1:采集太赫兹时域信号,并将数据保存至本地。
步骤2:将提取物质的时域信号转换成频谱数据和吸收率数据。频谱图和吸收率图分别见图1和图2。频谱数据可以作为物质分类的特征,根据频谱图的不同太赫兹波段的向下峰来进行物质识别,可以说频谱图是物质鉴别的重要依据之一。不同物质在不同的太赫兹波段有不同的吸收峰,反应在吸收率图上为向上突起的吸收峰,吸收率图相当于每个物质的指纹谱,具有唯一性。吸收峰的位置与吸收率曲线的变化趋势都是物质鉴别的重要依据。
频谱数据和吸收率数据计算公式分别见图3和图4。
图3公式中,x为样品时域信号,lengthxf为信号长度。公式先将时域信号进行傅里叶变换得到频域数据,傅里叶变换的作用是将时域信号转换为频谱信号,在转换为频域信号后再进行去绝对值,因为傅里叶变换后的数据是复数值,所以本发明提取绝对值并做归一化处理得到频谱图。
图4公式中,Eref(t)是采集的参考时域信号,Eref(ω)是经过傅里叶变换后得到的参考频域信号,Esamp(t)是采集的样品时域信号,Esamp(ω)是经过傅里叶变换后得到的样品频域信号,公式中的φ(ω)是样品信号与参考信号傅里叶变换后的比值取相位,ρ(ω)是样品信号与参考信号傅里叶变换后的比值取模,c是真空中的光速,ω是角频率,d是样品厚度,n(ω)为折射率,k(ω)为消光系数,α(ω)为吸收率。
步骤3:截取频谱数据0.1thz到2thz,截取吸收率0.1thz到2thz,合并两个特征作为网络输入数据。
步骤4:将处理好的数据送入神经网络进行训练。
步骤5:神经网络结构应用卷积层首先对输入数据进行特征提取和降维,一维太赫兹数据经过20个卷积核之后变成了20个一维组合数据,一方面对局部特征进行提取,另一方面也做到了降维处理。在卷积之后加入了BN层,对数据做了归一化处理,加速了网络收敛速度网络,并一定程度提高了模型准确率。BN层虽然对数据做了归一化处理,但是还不够,本发明又进一步对数据做了池化降维,进一步降低数据维数。并根据前面三层网络结构再重复一遍卷积层、BN层和池化层,然后再进入全连接层分别为256和128个神经元的全连接,卷积层和两个全连接层使用的激活函数为ReLU激活函数,最后一层使用softmax激活函数的6个神经元作为物质分类输出。结构见表1。
表1
Figure BDA0003089354020000041
步骤6:对训练的结果进行不断测试,根据结果进行参数调优和训练策略调整。使用ReLU激活函数和SGD的训练策略,训练结果见表2。
表2
损失函数值 准确率
训练集 5.1393e-06 1.0000
验证集 2.1089e-05 1.0000
测试集 1.1481e-05 1.0000
步骤7:调优训练充分后的结果完全进行物质识别区分。
步骤8:将训练好的模型移植到上位机中,上位机功能可直接实现物质分类。
本专利的创新点首先在于:提出了基于物质频谱与吸收率共同作为特征输入到神经网络结构中进行分类,提高了物质鉴别准确率的有效手段。将物质频谱和吸收率共同作为物质鉴别的特征,提高了物质鉴别的准确率,同时改进神经网络结构算法,对于优化后的神经网络算法运算速度快,准确率高,实时性也得到保证。
本专利的创新点还在于:通过python实现了物质分类算法,可将代码集成到太赫兹光谱仪的上位机中,从而作为物质分类算法的处理方法。

Claims (1)

1.一种基于太赫兹数据的神经网络分类方法,其特征在于,包括以下步骤:
步骤1:采集太赫兹时域信号,并将数据保存至本地;
步骤2:将提取物质的时域信号转换成频谱数据和吸收率数据;
步骤3:截取相同长度的频谱数据和吸收率合并两个特征作为网络输入数据;
步骤4:将处理好的数据送入神经网络进行训练;
步骤5:神经网络结构应用卷积层首先对输入数据进行特征提取和降维,一维太赫兹数据经过20个卷积核之后变成了20个一维组合数据,在卷积层的输出输入BN层,对数据做了归一化处理,BN层的输出再输入到池化层,池化层的输出根据前面三层网络结构再重复一遍卷积层、BN层和池化层,然后再进入全连接层分别为256和128个神经元的全连接,卷积层和两个全连接层使用的激活函数为ReLU激活函数,最后一层使用softmax激活函数的6个神经元作为物质分类输出;
步骤6:对训练的结果进行不断测试,根据结果进行参数调优和训练策略调整;
步骤7:调优训练充分后的结果完全进行物质识别区分;
步骤8:将训练好的模型移植到上位机中,直接实现物质分类。
CN202110591153.8A 2021-05-28 2021-05-28 一种基于太赫兹数据的神经网络分类方法 Pending CN113344051A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110591153.8A CN113344051A (zh) 2021-05-28 2021-05-28 一种基于太赫兹数据的神经网络分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110591153.8A CN113344051A (zh) 2021-05-28 2021-05-28 一种基于太赫兹数据的神经网络分类方法

Publications (1)

Publication Number Publication Date
CN113344051A true CN113344051A (zh) 2021-09-03

Family

ID=77472013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110591153.8A Pending CN113344051A (zh) 2021-05-28 2021-05-28 一种基于太赫兹数据的神经网络分类方法

Country Status (1)

Country Link
CN (1) CN113344051A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241937A (zh) * 2018-09-26 2019-01-18 武汉夏宇信息技术有限公司 基于太赫兹波的识别方法、装置及存储介质
CN109632693A (zh) * 2018-12-10 2019-04-16 昆明理工大学 一种基于blstm-rnn的太赫兹光谱识别方法
CN111428585A (zh) * 2020-03-09 2020-07-17 北京航空航天大学 一种基于深度学习的超材料太赫兹谱学识别方法
CN111812058A (zh) * 2020-05-30 2020-10-23 浙江大学山东工业技术研究院 基于太赫兹成像技术的香椿中农残的定性检测方法
CN111982855A (zh) * 2020-08-12 2020-11-24 广东工业大学 一种通过光谱信号进行物质识别的方法及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241937A (zh) * 2018-09-26 2019-01-18 武汉夏宇信息技术有限公司 基于太赫兹波的识别方法、装置及存储介质
CN109632693A (zh) * 2018-12-10 2019-04-16 昆明理工大学 一种基于blstm-rnn的太赫兹光谱识别方法
CN111428585A (zh) * 2020-03-09 2020-07-17 北京航空航天大学 一种基于深度学习的超材料太赫兹谱学识别方法
CN111812058A (zh) * 2020-05-30 2020-10-23 浙江大学山东工业技术研究院 基于太赫兹成像技术的香椿中农残的定性检测方法
CN111982855A (zh) * 2020-08-12 2020-11-24 广东工业大学 一种通过光谱信号进行物质识别的方法及其应用

Similar Documents

Publication Publication Date Title
CN103364362B (zh) 一种利用THz-TDS结合化学计量学鉴定中草药的方法
CN107219188B (zh) 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法
CN110068544B (zh) 物质识别网络模型训练方法及太赫兹光谱物质识别方法
CN101915744A (zh) 物质成分含量的近红外光谱无损检测方法及装置
CN108489929B (zh) 人参、三七和西洋参三种法定基源人参属多糖的鉴别方法
CN106408012A (zh) 一种模糊鉴别聚类的茶叶红外光谱分类方法
CN112067574A (zh) 不等光程法太赫兹光谱测量方法及其系统
CN104020128A (zh) 一种快速鉴别蜂胶胶源的方法
CN110208211B (zh) 一种用于农药残留检测的近红外光谱降噪方法
Wang et al. Wood species identification using terahertz time-domain spectroscopy
CN115420726A (zh) 一种利用重构sers光谱快速识别目标物的方法
CN109883990A (zh) 一种药用真菌近红外光谱分析方法
CN112782148B (zh) 阿拉比卡和罗伯斯塔两种咖啡豆的快速鉴别方法
CN109670531A (zh) 一种基于Hodrick-Prescott滤波器的近红外光谱信号的去噪方法
CN114112983A (zh) 一种基于Python数据融合的藏药全缘叶绿绒蒿产地判别方法
CN113344051A (zh) 一种基于太赫兹数据的神经网络分类方法
CN108489917B (zh) 一种去除太赫兹吸收光谱中低频误差和高频噪声的方法
CN116380835A (zh) 一种基于透射式太赫兹时域光谱的煤矸识别系统及识别方法
CN102880861A (zh) 基于线性预测倒谱系数的高光谱图像分类方法
Wan et al. BO-densenet: A bilinear one-dimensional densenet network based on multi-scale feature fusion for wood NIR classification
Zhan et al. Determination of SSC and TA content of pear by Vis-NIR spectroscopy combined CARS and RF algorithm
Jian-hua Near-infrared spectrum detection of fish oil DHA content based on empirical mode decomposition and independent component analysis
CN111982856B (zh) 一种基于太赫兹波的物质无标志检测识别方法
Tao et al. Discriminant analysis of red wines from different aging ways by information fusion of NIR and MIR spectra
Hu et al. Application of Vis-NIR hyperspectral imaging in agricultural products detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210903

RJ01 Rejection of invention patent application after publication