CN106706551B - 基于差分进化的组氨酸太赫兹吸收谱波长选择方法及装置 - Google Patents
基于差分进化的组氨酸太赫兹吸收谱波长选择方法及装置 Download PDFInfo
- Publication number
- CN106706551B CN106706551B CN201611103973.3A CN201611103973A CN106706551B CN 106706551 B CN106706551 B CN 106706551B CN 201611103973 A CN201611103973 A CN 201611103973A CN 106706551 B CN106706551 B CN 106706551B
- Authority
- CN
- China
- Prior art keywords
- population
- histidine
- absorption spectrum
- cross
- individual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 title claims abstract description 87
- 238000000862 absorption spectrum Methods 0.000 title claims abstract description 75
- 238000010187 selection method Methods 0.000 title claims description 8
- 238000000034 method Methods 0.000 claims abstract description 17
- 238000004445 quantitative analysis Methods 0.000 claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000035772 mutation Effects 0.000 claims description 8
- 230000000694 effects Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- WJCNZQLZVWNLKY-UHFFFAOYSA-N thiabendazole Chemical compound S1C=NC(C=2NC3=CC=CC=C3N=2)=C1 WJCNZQLZVWNLKY-UHFFFAOYSA-N 0.000 description 1
- 229960004546 thiabendazole Drugs 0.000 description 1
- 235000010296 thiabendazole Nutrition 0.000 description 1
- 239000004308 thiabendazole Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3581—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biochemistry (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Toxicology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种基于差分进化的组氨酸太赫兹吸收谱波长选择方法及装置。本发明首先对初始种群进行基于差分的变异操作和交叉操作,以得到交叉种群;然后分别利用初始种群和交叉种群从组氨酸样品的太赫兹吸收谱中进行选取,利用所构造的适应度函数分别计算初始种群和交叉种群中每个个体的适应度;并将适应度值较大的个体保留下来,从而得到新一代种群;最后将新一代种群作为新的初始种群进行进化迭代,直至进化代数达到设定阈值,并将最终代种群中适应度值最高的个体作为所选择的组氨酸太赫兹吸收谱波长的最优解。本发明通过对组氨酸样品的太赫兹吸收谱进行逐点深度选择,挑选有用信息,从而显著提高了定量分析的精度,取得了良好的应用效果。
Description
技术领域
本发明涉及一种基于差分进化的组氨酸太赫兹吸收谱波长选择方法及装置,属于太赫兹光谱检测技术领域。
背景技术
在对组氨酸样品进行太赫兹吸收谱定量分析中,通过实验得到的组氨酸样品的原始太赫兹吸收谱通常涵盖一段较宽的频段,包含大量的波长点数据,其中不仅包括信噪比较高的有用数据,也包含信噪比较低的噪声数据以及不属于任一组分特征的冗余数据,若直接将原始吸收谱用于定量分析势必导致较高误差,因此需要进行适当选择。由于吸收谱是由一系列波长点数据组成的,对吸收谱数据的选择实际上就是对波长的选择,因而在光谱学中被定义为波长选择(Wavelength selection)。对于太赫兹光谱定量分析领域而言,波长选择对定量分析的准确度至关重要,若选择不恰当,会导致较大误差。但是目前在太赫兹光谱定量分析中,波长选择常用的做法是人为地依据经验从原始光谱中选取某一波段数据用于定量计算,而对太赫兹光谱波长选择的机理及方法缺乏系统性的深入研究。
中国计量学院的王强教授等人分别利用偏最小二乘法(partial least squares,PLS)、区间偏最小二乘法(interval PLS,iPLS)、向后区间偏最小二乘法(backward iPLS,biPLS)以及移动窗口偏最小二乘法(moving window PLS,mwPLS)对噻苯咪唑位于0.3-1.6THz频段内的太赫兹特征光谱进行了波长选择,并对四种算法的性能进行了细致的比较。桂林电子科技大学的陈涛等人就太赫兹光谱定量分析中的特征谱区筛选进行了相关研究。除上述王强等人提出的波长选择方法外,又采用了联合区间偏最小二乘法(siPLS)并进行了一系列对比。但是基于偏最小二乘的波长选择方法,是通过将原始光谱分割成若干区间加以筛选,难免会将部分无意义数据含入其中,甚至将一些有意义数据错误地抛弃,以至于所选择的波长不合适,从而导致定量分析的误差比较大。
发明内容
本发明的目的是提供一种基于差分进化的组氨酸太赫兹吸收谱波长选择方法,以解决目前组氨酸太赫兹吸收谱波长选择不合适而导致定量分析的误差比较大的问题。同时本发明还提供了一种基于差分进化的组氨酸太赫兹吸收谱波长选择装置。
本发明为解决上述技术问题而提供一种基于差分进化的组氨酸太赫兹吸收谱波长选择方法,该选择方法包括以下步骤:
1)随机生成一个大小为S的初始种群X;
2)对初始种群X进行基于差分的变异操作,以得到变异种群V,并对变异种群V进行交叉操作,以得到交叉种群U;
3)分别利用初始种群X和交叉种群U从组氨酸样品的太赫兹吸收谱中进行选取,以得到初始种群X和交叉种群U中每个个体相对应的经过波长选择的组氨酸样品的重构太赫兹吸收谱;
4)构建适应度函数,利用所构造的适应度函数分别计算初始种群X和交叉种群U中每个个体的适应度;
5)对初始种群X和交叉种群U中相对应个体的适应度值进行比较,将适应度值较大的个体保留下来,从而得到新一代种群Xnext;
6)将新一代种群Xnext作为新的初始种群,重复步骤2)-5),直至进化代数达到设定阈值,并将最终代种群中适应度值最高的个体作为所选择的组氨酸太赫兹吸收谱波长的最优解。
进一步地,所述步骤2)中的变异操作如下::
i=1,2,…,S
j=1,2,…,L
其中Vi,j表示变异种群V中第i个个体的第j个二进制元素,Xi,a、Xi,b和Xi,c分别表示初始种群X中第i个个体的第a,b和c个二进制元素,并且a,b和c是3个互不相同的正整数。
进一步地,所述步骤2)中的交叉操作为:
其中Ui,j表示交叉种群U中第i个个体的第j个二进制元素,rand为0至1区间内的随机数,CR为预先设定的交叉概率,jrand为1至L区间内的随机整数,Xi,j表示初始种群X中第i个个体的第j个二进制元素。
进一步地,所述步骤1)中的初始种群X由S个长度为L的二进制字符串组成,该二进制字符串与组氨酸样品的太赫兹吸收谱中的L个频率点一一对应。
进一步地,所述步骤3)中的波长选择过程如下:
对于初始种群X中的各个个体,若其某个二进制元素为“1”,则对应组氨酸太赫兹吸收谱的频率点数据被保留,否则该频率点数据则被抛弃,将所有保留下的频率点数据整合在一起,组成经过波长选择的组氨酸样品的重构太赫兹吸收谱;对于交叉种群U中的各个个体,若其某个二进制元素为“1”,则对应组氨酸太赫兹吸收谱的频率点数据被保留,否则该频率点数据则被抛弃,将所有保留下的频率点数据整合在一起,组成经过波长选择的组氨酸样品的重构太赫兹吸收谱。
进一步地,所述步骤4)中构建的适应度函数为:
其中F是适应度值,m是校正集中组氨酸样品的总数量,qe是每个组氨酸样品对应的定量分析误差,n代表校正集中组氨酸样品的某一个,其中ccal和creal分别是组氨酸样品的计算浓度和真实浓度。
进一步地,所述新一代种群Xnext满足下式
本发明还提供了一种基于差分进化的组氨酸太赫兹吸收谱波长选择装置,该选择装置包括初始种群生成模块、变异交叉操作模块、太赫兹吸收谱重构模块、适应度计算模块、比较模块和选择模块,
所述初始种群生成模块用于随机生成一个大小为S的初始种群X;
所述的变异交叉操作模块用于对初始种群X进行基于差分的变异操作,以得到变异种群V,并对变异种群V进行交叉操作,以得到交叉种群U;
所述的太赫兹吸收谱重构模块用于分别利用初始种群X和交叉种群U从组氨酸样品的太赫兹吸收谱中进行选取,以得到初始种群X和交叉种群U中每个个体相对应的经过波长选择的组氨酸样品的重构太赫兹吸收谱;
所述的适应度计算模块用于构建适应度函数,并利用所构造的适应度函数分别计算初始种群X和交叉种群U中每个个体的适应度;
所述的比较模块用于对初始种群X和交叉种群U中相对应个体的适应度值进行比较,将适应度值较大的个体保留下来,从而得到新一代种群Xnext;
所述的选择模块用于将新一代种群Xnext作为新的初始种群,重复执行变异交叉操作模块、选取模块、适应度计算模块和比较模块,直至进化代数达到设定阈值,并将最终代种群中适应度值最高的个体作为所选择的组氨酸太赫兹吸收谱波长的最优解。
进一步地,所述变异交叉操作模块所采用变异操作如下:
i=1,2,…,S
j=1,2,…,L
其中Vi,j表示变异种群V中第i个个体的第j个二进制元素,Xi,a、Xi,b和Xi,c分别表示初始种群X中第i个个体的第a,b和c个二进制元素,并且a,b和c是3个互不相同的正整数。
进一步地,所述变异交叉操作模块所采用交叉操作如下:
其中Ui,j表示交叉种群U中第i个个体的第j个二进制元素,rand为0至1区间内的随机数,CR为预先设定的交叉概率,jrand为1至L区间内的随机整数,Xi,j表示初始种群X中第i个个体的第j个二进制元素。
本发明的有益效果是:本发明首先对初始种群X进行基于差分的变异操作和交叉操作,以得到交叉种群U;然后分别利用初始种群X和交叉种群U从组氨酸样品的太赫兹吸收谱中进行选取,利用所构造的适应度函数分别计算初始种群X和交叉种群U中每个个体的适应度;并将适应度值较大的个体保留下来,从而得到新一代种群Xnext;最后将新一代种群Xnext作为新的初始种群进行进化迭代,直至进化代数达到设定阈值,并将最终代种群中适应度值最高的个体作为所选择的组氨酸太赫兹吸收谱波长的最优解。本发明通过对组氨酸样品的太赫兹吸收谱进行逐点深度选择,挑选有用信息,从而显著提高了定量分析的精度,取得了良好的应用效果。
附图说明
图1是基于差分进化的组氨酸太赫兹吸收谱波长选择方法的流程图;
图2是未经波长选择的组氨酸样品的太赫兹吸收谱图;
图3是波长选择后的重构组氨酸太赫兹吸收谱图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步的说明。
本发明基于差分进化的组氨酸太赫兹吸收谱波长选择方法的实施例
本发明首先对初始种群X进行基于差分的变异操作和交叉操作,以得到交叉种群U;然后分别利用初始种群X和交叉种群U从组氨酸样品的太赫兹吸收谱中进行选取,利用所构造的适应度函数分别计算初始种群X和交叉种群U中每个个体的适应度;并将适应度值较大的个体保留下来,从而得到新一代种群Xnext;最后将新一代种群Xnext作为新的初始种群进行进化迭代,直至进化代数达到设定阈值,并将最终代种群中适应度值最高的个体作为所选择的组氨酸太赫兹吸收谱波长的最优解。该方法的流程如图1所示,具体实施过程如下。
1.随机生成一个大小为S的初始种群X。
本实施例中生成的初始种群X由S个长度为L的二进制字符串组成,该二进制字符串与组氨酸样品的太赫兹吸收谱中的L个频率点一一对应。
2.对初始种群x执行基于差分思想的变异操作,从而得到变异种群V。
本实施例中的变异操作后得到的种群V为:
其中Vi,j表示变异种群V中第i个个体的第j个二进制元素,Xi,a、Xi,b和Xi,c分别表示初始种群X中第i个个体的第a,b和c个二进制元素,并且a,b和c是3个互不相同的正整数。
3.对变异种群进行交叉操作,得到交叉种群U。
交叉操作得到的交叉种群U为:
其中Ui,j表示交叉种群U中第i个个体的第j个二进制元素,rand为0至1区间内的随机数,CR为预先设定的交叉概率,jrand为1至L区间内的随机整数,Xi,j表示初始种群X中第i个个体的第j个二进制元素。
4.分别利用初始种群X和交叉种群U中的个体对组氨酸太赫兹吸收谱进行波长选择,得到重构吸收谱。
波长选择通过以下方式进行,对于初始种群X中的各个个体,若其某个二进制元素为“1”,则对应组氨酸太赫兹吸收谱的频率点数据被保留,否则该频率点数据则被抛弃,然后将所有保留下的频率点数据整合在一起,组成经过波长选择的组氨酸样品的重构太赫兹吸收谱;;对于交叉种群U中的各个个体,若其某个二进制元素为“1”,则对应组氨酸太赫兹吸收谱的频率点数据被保留,否则该频率点数据则被抛弃,然后将所有保留下的频率点数据整合在一起,组成经过波长选择的组氨酸样品的重构太赫兹吸收谱。
5.构建适应度函数F。
构建的适应度函数用下列公式表示:
其中F是适应度值,m是校正集中组氨酸样品的总数量(校正集是由若干个成分浓度信息已知的组氨酸样品组成的),qe是每个组氨酸样品对应的定量分析误差,n代表校正集中组氨酸样品的某一个:
其中ccal和creal分别是组氨酸样品的计算浓度和真实浓度;组氨酸样品的计算浓度ccal是利用经过波长选择后的重构太赫兹吸收谱,通过最小二乘线性回归得到,组氨酸样品的真实浓度creal是预先配制的。
6.利用构建的适应度函数F分别对初始种群X和交叉种群U中的个体进行评价,得到它们各自的适应度值。
这里的适应度值是分别利用初始种群X和交叉种群U中的各个个体对组氨酸样品的太赫兹吸收谱进行波长选择,而后通过适应度函数计算种群中各个个体的适应度值。
7.对初始种群X和交叉种群U中相对应个体的适应度值进行比较,将适应度值较大的个体保留下来,从而得到新一代种群Xnext。
本实施例中新一代种群Xnext需满足下式:
8.将新一代种群Xnext作为新的初始种群,重复步骤2至7,直至进化代数达到上限G,终止进化,并将最终代种群中适应度值最高的个体作为问题的最优解输出。
本发明基于差分进化的组氨酸太赫兹吸收谱波长选择装置的实施例
本实施例中的选择装置包括初始种群生成模块、变异交叉操作模块、太赫兹吸收谱重构模块、适应度计算模块、比较模块和选择模块;初始种群生成模块用于随机生成一个大小为S的初始种群X;变异交叉操作模块用于对初始种群X进行基于差分的变异操作,以得到变异种群V,并对变异种群V进行交叉操作,以得到交叉种群U;太赫兹吸收谱重构模块用于分别利用初始种群X和交叉种群U从组氨酸样品的太赫兹吸收谱中进行选取,以得到初始种群X和交叉种群U中每个个体相对应的经过波长选择的组氨酸样品的重构太赫兹吸收谱;适应度计算模块用于构建适应度函数,并利用所构造的适应度函数分别计算初始种群X和交叉种群U中每个个体的适应度;比较模块用于对初始种群X和交叉种群U中相对应个体的适应度值进行比较,将适应度值较大的个体保留下来,从而得到新一代种群Xnext;选择模块用于将新一代种群Xnext作为新的初始种群,重复执行变异交叉操作模块、选取模块、适应度计算模块和比较模块,直至进化代数达到设定阈值,并将最终代种群中适应度值最高的个体作为所选择的组氨酸太赫兹吸收谱波长的最优解。
这里的波长选择装置可以采用单片机、DSP、PLC或MCU等实现,波长选择装置执行有上述六个模块,这里的模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域已知的任何其他形式的存储介质,可以将该存储介质耦接至波长选择装置,使波长选择装置能够从该存储介质读取信息,或者该存储介质可以是波长选择装置的组成部分。各模块的具体实现手段已在方法的实施例中进行了详细说明,这里不再赘述。
为了验证本发明的效果,下面设计了一系列定量分析的实验。实验选取了9个不同含量的组氨酸样品的太赫兹吸收谱(其中前6个为校正集,后3个为验证集),分别利用不经选择的组氨酸全吸收谱以及经过本发明提出的波长选择方法选择后的组氨酸重构太赫兹吸收谱对组氨酸样品进行定量分析,组氨酸样品含量以及定量分析的误差如表1所示。本实验中,组氨酸样品(具体包括谷氨酸和组氨酸)的原始太赫兹吸收谱范围为0.3-3THz,分辨率约为4.5GHz,共有590个频率点,所以种群中二进制字符串个体的长度为590,种群大小为100,交叉概率为0.9,进化代数上限为30000。
表1
未经波长选择的组氨酸样品的太赫兹吸收谱如图2所示,经本发明波长选择后的重构组氨酸太赫兹吸收谱如图3所示,可见利用本发明提出的波长选择方法,能够有效降低对组氨酸样品太赫兹吸收谱进行定量分析的误差,误差大致在3%以下,取得了优异的效果。
Claims (2)
1.一种基于差分进化的组氨酸太赫兹吸收谱波长选择方法,其特征在于,该选择方法包括以下步骤:
1)随机生成一个大小为S的初始种群X;
2)对初始种群X进行基于差分的变异操作,以得到变异种群V,并对变异种群V进行交叉操作,以得到交叉种群U;
3)分别利用初始种群X和交叉种群U从组氨酸样品的太赫兹吸收谱中进行选取,以得到初始种群X和交叉种群U中每个个体相对应的经过波长选择的组氨酸样品的重构太赫兹吸收谱;
4)构建适应度函数,利用所构造的适应度函数分别计算初始种群X和交叉种群U中每个个体的适应度;
5)对初始种群X和交叉种群U中相对应个体的适应度值进行比较,将适应度值较大的个体保留下来,从而得到新一代种群Xnext;
6)将新一代种群Xnext作为新的初始种群,重复步骤2)-5),直至进化代数达到设定阈值,并将最终代种群中适应度值最高的个体作为所选择的组氨酸太赫兹吸收谱波长的最优解;
所述步骤2)中的变异操作如下:
其中Vi,j表示变异种群V中第i个个体的第j个二进制元素;Xi,a、Xi,b和Xi,c分别表示初始种群X中第i个个体的第a,b和c个二进制元素,并且a,b和c是3个互不相同的正整数;
所述步骤2)中的交叉操作为:
其中Ui,j表示交叉种群U中第i个个体的第j个二进制元素,rand为0至1区间内的随机数,CR为预先设定的交叉概率,jrand为1至L区间内的随机整数,Xi,j表示初始种群X中第i个个体的第j个二进制元素;Vi,j表示变异种群V中第i个个体的第j个二进制元素;
所述步骤1)中的初始种群X由S个长度为L的二进制字符串组成,该二进制字符串与组氨酸样品的太赫兹吸收谱中的L个频率点一一对应;
所述步骤3)中的波长选择过程如下:
对于初始种群X中的各个个体,若其某个二进制元素为“1”,则对应组氨酸太赫兹吸收谱的频率点数据被保留,否则该频率点数据则被抛弃,将所有保留下的频率点数据整合在一起,组成经过波长选择的组氨酸样品的重构太赫兹吸收谱;对于交叉种群U中的各个个体,若其某个二进制元素为“1”,则对应组氨酸太赫兹吸收谱的频率点数据被保留,否则该频率点数据则被抛弃,将所有保留下的频率点数据整合在一起,组成经过波长选择的组氨酸样品的重构太赫兹吸收谱;
所述步骤4)中构建的适应度函数为:
其中F是适应度值,m是校正集中组氨酸样品的总数量,qe是每个组氨酸样品对应的定量分析误差,n代表校正集中组氨酸样品的某一个,其中ccal和creal分别是组氨酸样品的计算浓度和真实浓度;
所述新一代种群Xnext满足下式
其中Xi next为新一代种群Xnext的第i个个体,F(Ui)为交叉种群U中第i个个体的适应度值,F(Xi)为初始种群X中第i个个体的适应度值。
2.一种基于差分进化的组氨酸太赫兹吸收谱波长选择装置,其特征在于,该选择装置包括初始种群生成模块、变异交叉操作模块、太赫兹吸收谱重构模块、适应度计算模块、比较模块和选择模块,
所述初始种群生成模块用于随机生成一个大小为S的初始种群X;
所述的变异交叉操作模块用于对初始种群X进行基于差分的变异操作,以得到变异种群V,并对变异种群V进行交叉操作,以得到交叉种群U;
所述的太赫兹吸收谱重构模块用于分别利用初始种群X和交叉种群U从组氨酸样品的太赫兹吸收谱中进行选取,以得到初始种群X和交叉种群U中每个个体相对应的经过波长选择的组氨酸样品的重构太赫兹吸收谱;
所述的适应度计算模块用于构建适应度函数,并利用所构造的适应度函数分别计算初始种群X和交叉种群U中每个个体的适应度;
所述的比较模块用于对初始种群X和交叉种群U中相对应个体的适应度值进行比较,将适应度值较大的个体保留下来,从而得到新一代种群Xnext;
所述的选择模块用于将新一代种群Xnext作为新的初始种群,重复执行变异交叉操作模块、选取模块、适应度计算模块和比较模块,直至进化代数达到设定阈值,并将最终代种群中适应度值最高的个体作为所选择的组氨酸太赫兹吸收谱波长的最优解;
所述变异交叉操作模块所采用变异操作如下:
其中Vi,j表示变异种群V中第i个个体的第j个二进制元素;Xi,a、Xi,b和Xi,c分别表示初始种群X中第i个个体的第a,b和c个二进制元素,并且a,b和c是3个互不相同的正整数;
所述变异交叉操作模块所采用交叉操作如下:
其中Ui,j表示交叉种群U中第i个个体的第j个二进制元素,rand为0至1区间内的随机数,CR为预先设定的交叉概率,jrand为1至L区间内的随机整数,Xi,j表示初始种群X中第i个个体的第j个二进制元素;Vi,j表示变异种群V中第i个个体的第j个二进制元素;
构建的适应度函数为:
其中F是适应度值,m是校正集中组氨酸样品的总数量,qe是每个组氨酸样品对应的定量分析误差,n代表校正集中组氨酸样品的某一个,其中ccal和creal分别是组氨酸样品的计算浓度和真实浓度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611103973.3A CN106706551B (zh) | 2016-12-05 | 2016-12-05 | 基于差分进化的组氨酸太赫兹吸收谱波长选择方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611103973.3A CN106706551B (zh) | 2016-12-05 | 2016-12-05 | 基于差分进化的组氨酸太赫兹吸收谱波长选择方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106706551A CN106706551A (zh) | 2017-05-24 |
CN106706551B true CN106706551B (zh) | 2020-03-24 |
Family
ID=58934745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611103973.3A Active CN106706551B (zh) | 2016-12-05 | 2016-12-05 | 基于差分进化的组氨酸太赫兹吸收谱波长选择方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106706551B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111175243B (zh) * | 2019-12-31 | 2023-03-31 | 汉谷云智(武汉)科技有限公司 | 一种光谱区间快速选择方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7434216B1 (en) * | 2002-11-25 | 2008-10-07 | Hewlett-Packard Development Company, L.P. | Update package generator that employs genetic evolution to determine bank order |
CN102279390A (zh) * | 2011-05-06 | 2011-12-14 | 西南交通大学 | 一种低信噪比雷达辐射源信号脉内调制识别方法 |
CN102325089A (zh) * | 2011-09-19 | 2012-01-18 | 西安电子科技大学 | 基于差分进化和捕食搜索策略的胖树型片上网络映射方法 |
CN104102956A (zh) * | 2014-07-23 | 2014-10-15 | 杭州中威智能科技有限公司 | 一种基于策略自适应差分进化的配电网络扩展规划方法 |
CN104990888A (zh) * | 2015-06-24 | 2015-10-21 | 河南工业大学 | 利用太赫兹成像技术检测储备粮食粒内虫害的方法 |
CN105136714A (zh) * | 2015-09-06 | 2015-12-09 | 河南工业大学 | 一种基于遗传算法的太赫兹光谱波长选择方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7725409B2 (en) * | 2007-06-05 | 2010-05-25 | Motorola, Inc. | Gene expression programming based on Hidden Markov Models |
-
2016
- 2016-12-05 CN CN201611103973.3A patent/CN106706551B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7434216B1 (en) * | 2002-11-25 | 2008-10-07 | Hewlett-Packard Development Company, L.P. | Update package generator that employs genetic evolution to determine bank order |
CN102279390A (zh) * | 2011-05-06 | 2011-12-14 | 西南交通大学 | 一种低信噪比雷达辐射源信号脉内调制识别方法 |
CN102325089A (zh) * | 2011-09-19 | 2012-01-18 | 西安电子科技大学 | 基于差分进化和捕食搜索策略的胖树型片上网络映射方法 |
CN104102956A (zh) * | 2014-07-23 | 2014-10-15 | 杭州中威智能科技有限公司 | 一种基于策略自适应差分进化的配电网络扩展规划方法 |
CN104990888A (zh) * | 2015-06-24 | 2015-10-21 | 河南工业大学 | 利用太赫兹成像技术检测储备粮食粒内虫害的方法 |
CN105136714A (zh) * | 2015-09-06 | 2015-12-09 | 河南工业大学 | 一种基于遗传算法的太赫兹光谱波长选择方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106706551A (zh) | 2017-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105630743B (zh) | 一种光谱波数的选择方法 | |
Deng et al. | A new method for wavelength interval selection that intelligently optimizes the locations, widths and combinations of the intervals | |
Jiang et al. | Comparison of algorithms for wavelength variables selection from near-infrared (NIR) spectra for quantitative monitoring of yeast (Saccharomyces cerevisiae) cultivations | |
CN105136714B (zh) | 一种基于遗传算法的太赫兹光谱波长选择方法 | |
CN1657907A (zh) | 基于间隔偏最小二乘法的农产品、食品近红外光谱谱区选择方法 | |
CN101825567A (zh) | 一种近红外光谱和拉曼光谱波长的筛选方法 | |
CN111965140B (zh) | 基于特征峰的波长点重组方法 | |
Lin et al. | Discrimination of Radix Pseudostellariae according to geographical origins using NIR spectroscopy and support vector data description | |
CN100351623C (zh) | 基于支持向量机的多组分气体浓度定量分析仪 | |
CN113049507A (zh) | 多模型融合的光谱波长选择方法 | |
CN106706551B (zh) | 基于差分进化的组氨酸太赫兹吸收谱波长选择方法及装置 | |
CN106769992B (zh) | 基于差分进化的谷氨酰胺太赫兹谱波长选择方法及装置 | |
CN105138834A (zh) | 基于近红外光谱波数k均值聚类的烟草化学值定量方法 | |
CN105067550B (zh) | 一种基于分块稀疏贝叶斯优化的红外光谱波长选择方法 | |
CN104964943B (zh) | 一种基于自适应Group Lasso的红外光谱波长选择方法 | |
CN109001148B (zh) | 一种近红外光谱典型相关分析融合的茶籽油多元掺伪检测方法 | |
CN116380869A (zh) | 一种基于自适应稀疏分解的拉曼光谱去噪方法 | |
CN108120694A (zh) | 用于晒红烟化学成分分析的多元校正方法及系统 | |
CN114062306B (zh) | 一种近红外光谱数据分段预处理方法 | |
CN115598162A (zh) | 基于堆叠式模型的土壤重金属含量检测方法 | |
CN112326574B (zh) | 一种基于贝叶斯分类的光谱波长选择方法 | |
Morisawa | Analysis Using a Multivariable Statistical Method | |
CN109630091B (zh) | 一种碳氧比测井中优化数值模拟能谱的方法 | |
CN106442392A (zh) | 一种谷氨酰胺的太赫兹吸收谱波长选择方法及装置 | |
Fuller et al. | Alcoholic Fermentation Monitoring and PH Prediction in Red and White Wine by Combining Spontaneous Raman Spectroscopy and Machine Learning Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |