CN116881705B - 一种锦灯笼宿萼的近红外光谱数据处理系统 - Google Patents
一种锦灯笼宿萼的近红外光谱数据处理系统 Download PDFInfo
- Publication number
- CN116881705B CN116881705B CN202311147002.9A CN202311147002A CN116881705B CN 116881705 B CN116881705 B CN 116881705B CN 202311147002 A CN202311147002 A CN 202311147002A CN 116881705 B CN116881705 B CN 116881705B
- Authority
- CN
- China
- Prior art keywords
- sample
- target
- component
- matching
- calyx
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241001164374 Calyx Species 0.000 title claims abstract description 78
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 22
- 244000064622 Physalis edulis Species 0.000 title claims abstract description 21
- 238000010521 absorption reaction Methods 0.000 claims abstract description 50
- 238000001228 spectrum Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims description 41
- 239000000126 substance Substances 0.000 claims description 23
- 238000002835 absorbance Methods 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 7
- 238000012880 independent component analysis Methods 0.000 claims description 6
- 241001106044 Physalis Species 0.000 claims description 4
- 238000001514 detection method Methods 0.000 abstract description 4
- 238000000862 absorption spectrum Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000005648 plant growth regulator Substances 0.000 description 1
- 150000008442 polyphenolic compounds Chemical class 0.000 description 1
- 235000013824 polyphenols Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2134—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及光谱数据检测技术领域,具体涉及一种锦灯笼宿萼的近红外光谱数据处理系统。该系统包括:获取样本的数据曲线;选取目标样本、匹配样本及噪声目标样本;获取每个样本的独立分量;获取目标分量,根据目标分量和匹配样本的独立分量的光谱数据之间的关系获取两者的匹配程度;根据匹配程度获取目标分量的匹配分量;获取若干区间,根据同一区间内噪声目标样本的目标分量与匹配分量的吸收率差异获取噪声目标样本与匹配样本的差异性;获取最优方差,高群觉最优方差获取目标样本在每个区间内加入的高斯噪声方差;根据每个区间内加入的高斯噪声方差对锦灯笼宿萼进行分类。本发明避免了由于波段重叠而导致的光谱数据相差较小。
Description
技术领域
本发明涉及光谱数据检测技术领域,具体涉及一种锦灯笼宿萼的近红外光谱数据处理系统。
背景技术
近红外光谱是一种应用于分析和检测的光谱技术,主要用于研究和分析物质的结构、成分和性质,在农业领域其可用于农产品质量检测和农作物病害诊断等。利用近红外光谱对锦灯笼宿萼进行检测,可以在不破坏植物的情况下采集光谱,进行长期监测和非破坏性分析,而不影响样品的完整性和可重复性,通过各物质的化学键和分子结构与光谱特征之间的关系,提供关于锦灯笼宿萼样品中多个成分的信息。由于在锦灯笼宿萼中,其成分含量会受到品种、生长环境、采集条件等多方面因素的影响,故而利用光谱数据对其进行分类对品质评估和选取适合特定用途的锦灯笼宿萼具有指导意义。
通过对锦灯笼宿萼进行分类,可以鉴别不同成分含量的样品,而在利用近红外光谱对锦灯笼宿萼的化学成分进行分析时,不同化学成分在近红外光谱范围内的吸收特性可能会有重叠的情况,使得不同成分的吸收峰无法直观地分离和区分,会对后续各不同样品进行分类处理时造成较大的影响。
发明内容
为了解决不同化学成分在红外光谱不同波段吸收率会重叠的技术问题,本发明提供一种锦灯笼宿萼的近红外光谱数据处理系统,所采用的技术方案具体如下:
本发明提出了一种锦灯笼宿萼的近红外光谱数据处理系统,系统包括以下模块:
数据采集模块,用于采集每个锦灯笼宿萼样本的光谱数据,根据光谱数据获取每个锦灯笼宿萼样本的数据曲线;
独立分量获取模块,用于将所有锦灯笼宿萼样本中任意一个样本记为目标样本,将所有锦灯笼宿萼样本中的非目标样本记为匹配样本,对目标样本添加初始高斯噪声获取噪声目标样本;获取每个锦灯笼宿萼样本的独立分量;
匹配分量获取模块,用于根据独立分量获取目标分量,根据目标分量和每个匹配样本的独立分量的光谱数据之间的关系获取目标分量与每个匹配样本的独立分量的匹配程度;将目标分量和每个匹配样本中匹配程度最大的独立分量记为目标分量与每个匹配样本的匹配分量;
差异性获取模块,用于对所有样本的独立分量进行区间划分获取若干区间,根据目标分量在每个区间的吸收率、初始高斯噪声以及噪声目标样本的目标分量与匹配样本的匹配分量在同一区间上的吸收率差异获取噪声目标样本与匹配样本在每个区间的差异性;
高斯噪声获取模块,用于获取目标噪声样本与匹配样本在同一区间的最大差异性,所述最大差异性对应加入的高斯噪声方差作为匹配样本的最优方差,根据匹配样本的最优方差以及目标样本与匹配样本在同一区间内的相关性获取目标样本在每个区间应加入的高斯噪声方差;
数据处理模块,用于根据目标样本在每个区间内加入的高斯噪声方差对锦灯笼宿萼进行分类。
优选的,所述根据光谱数据获取每个锦灯笼宿萼样本的数据曲线的方法为:
每个样本的光谱数据对应一条数据曲线,所述光谱数据为每个波段对应的吸收率,所述数据曲线的横坐标为波段,纵坐标为吸收率。
优选的,所述对目标样本添加初始高斯噪声获取噪声目标样本的方法为:
获取多组预设方差,将多组预设方差下的高斯噪声加入到目标样本中获取多个噪声目标样本。
优选的,所述获取每个锦灯笼宿萼样本的独立分量的方法为:
对于每个样本的数据曲线使用独立成分分析法获取预设数量的独立分量,所述独立分量在每个波段中对应一个吸收率。
优选的,所述获取目标分量,根据目标分量和每个匹配样本的独立分量的光谱数据之间的关系获取目标分量与每个匹配样本的独立分量的匹配程度的方法为:
将目标样本和噪声目标样本中任意一个独立分量记为目标分量,将目标分量与匹配样本的独立分量在相同波段下的吸收率比值记为第一吸收率相似度,将匹配样本的独立分量与目标分量在相同波段下的吸收率比值记为第二吸收率相似度,根据目标分量与匹配样本的独立分量在相邻波段下的第一吸收率相似度的差异和第二吸收率相似度的差异获取目标分量与匹配样本的独立分量的匹配程度。
优选的,所述根据目标分量与匹配样本的独立分量在相邻波段下的第一吸收率相似度的差异和第二吸收率相似度的差异获取目标分量与匹配样本的独立分量的匹配程度的方法为:
式中,表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第一吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第一吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第二吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第二吸收率相似度,/>表示方差函数,N表示独立分量中波段的数量,/>表示目标样本第p个目标分量/>与匹配样本中第q个独立分量/>的匹配程度。
优选的,所述根据目标分量在每个区间的吸收率、初始高斯噪声以及噪声目标样本的目标分量与匹配样本的匹配分量在同一区间上的吸收率差异获取噪声目标样本与匹配样本在每个区间的差异性的方法为:
计算目标样本的每个目标分量在每个区间内吸收率的标准差,获取噪声目标样本的每个目标分量与匹配样本对应的匹配分量在每个波段处的第一吸收率相似度A,根据目标样本的目标分量在区间内标准差以及第一吸收率相似度A获取噪声目标样本与匹配样本在每个区间下的差异性。
优选的,所述根据目标样本的目标分量在区间内标准差以及第一吸收率相似度A获取噪声目标样本与匹配样本在每个区间下的差异性为:
式中,表示目标样本X的第/>个目标分量在区间z中吸收率的标准差,/>表示目标样本加入的第i个高斯噪声的方差,/>表示加入第i个高斯噪声方差后的噪声目标样本,/>表示第j个匹配样本,/>表示第i个噪声目标样本的第/>个目标分量与第j个匹配样本的匹配分量在区间z上的第/>个波段处的第一吸收率相似度,记为第一吸收率相似度A,/>表示区间内波段个数,/>表示线性归一化函数,/>表示每个样本独立分量的数量,/>表示以自然常数为底的指数函数,/>表示第i个噪声目标样本与第j个匹配样本在区间z下的差异性。
优选的,所述根据匹配样本的最优方差以及目标样本与匹配样本在同一区间内的相关性获取目标样本在每个区间应加入的高斯噪声方差的方法为:
计算目标样本和其每个匹配样本在同一区间内吸收率的皮尔逊相关系数,令皮尔逊相关系数取相反数后归一化,将归一化的值与匹配样本在该区间内最优方差的乘积记为第一乘积,将目标样本与其所有匹配样本的第一乘积的均值作为目标样本在该区间内应该加入的高斯噪声方差。
优选的,所述根据目标样本在每个区间内加入的高斯噪声方差对锦灯笼宿萼进行分类的方法为:
将目标样本在每个区间内应该加入的高斯噪声方差记为方差B,将方差B的高斯噪声加入到每个区间内的目标样本中,得到最终噪声目标样本,将锦灯笼宿萼的所有物质元素进行最大最小值归一化后相乘,将乘积与预设阈值比较,将所有锦灯笼宿萼分为三类,对每个最终噪声目标样本进行标号,所述标号为锦灯笼宿萼的类别,将所有最终噪声目标样本及其标签作为数据集;
将新采集的所有目标样本计算最终噪声目标样本,并作为输入,输入到训练好的网络中得到锦灯笼宿萼的类别。
本发明具有如下有益效果:本发明利用独立成分分析分解的思想,将各样本对应光谱数据分解为多个独立分量来代表不同物质的吸收光谱,利用相同物质吸收光谱对应波段相同的性质,确定了各独立分量之间的对应关系,进而通过各独立分量之间的差异,来体现不同样本对应物质含量的差距,通过对目标样本添加噪声,来放大目标样本与其余样本之间不同物质含量的差异性,进而通过对神经网络进行训练以提高分类模型的精度,在一定程度避免了由于波段重叠而导致的光谱数据相差较小,而实际物质含量不同的现象。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种锦灯笼宿萼的近红外光谱数据处理系统流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种锦灯笼宿萼的近红外光谱数据处理系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
一种锦灯笼宿萼的近红外光谱数据处理系统实施例:
下面结合附图具体的说明本发明所提供的一种锦灯笼宿萼的近红外光谱数据处理系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种锦灯笼宿萼的近红外光谱数据处理系统流程图,该系统包括以下模块:
数据采集模块,对于多个锦灯笼宿萼使用近红外光谱分析仪采集其光谱数据,将采集的所有光谱数据作为训练样本,其中每个光谱数据在每个波段中存在一个吸收率,因此每个光谱数据对应一条数据曲线,数据曲线的横坐标为波段,纵坐标为吸收率,将每个光谱数据记为一个样本。
至此,采集到了每个样本的数据曲线。
独立分量获取模块,在获取了诸多锦灯笼宿萼样本对应的光谱数据之后,由于锦灯笼宿萼中包含的物质元素的多样性,其对应近红外光谱数据中可能出现各样本中不同物质的吸收波段重叠的现象,故考虑利用ICA独立成分分析的方法对所得各样本数据进行分解,利用各独立分量来代表各物质成分的吸收光谱数据。
选取任意一个样本作为目标样本,对于目标样本加入方差不同的高斯噪声得到若干加入高斯噪声后的目标样本记为噪声目标样本,其中加入的方差为,其中i为正整数,在本实施例中i最大取10,即加入的高斯噪声方差最大为1。将除了目标样本之外的样本记为匹配样本。
对于每个样本使用独立成分分析法获取每个样本的若干独立分量,在本实施例中令独立分量的数量为5,在此使用独立成分分析法是将近红外光谱数据分解为多个独立分量,每个分量可以在一定程度上代表原信号的独立部分,例如表示水份、糖类、蛋白质、多酚类等物质元素,对于每个独立分量进行分析可以更准确获取应当加入的高斯噪声的程度。
至此,获取了每个样本的若干独立分量。
匹配分量获取模块,由于独立分量之间,其匹配关系是未知的,每个独立分量可能代表的是该样本对应的水分的吸收光谱,也可能代表的是其他的物质的吸收光谱;而独立成分分析法仅仅是从数据的角度进行获取的,并不知道独立分量分别对应那种物质,如此不同独立分量之间的对应关系也是未知的,但若不同样本数据对应的各分量是匹配的,即表征的是同一成分在不同样本中的含量。由于不同物质在光谱不同波段的吸收效率不同,同一种物质在相同的波段范围内出现较大的重叠情况,基于此可以获取独立分量之间的匹配程度。
将目标样本的任意一个独立分量记为目标分量,将目标分量与其余样本的独立分量在相同波段下的吸收率比值记为第一吸收率相似度,将其余样本的独立分量与目标分量在相同波段下的吸收率比值记为第二吸收率相似度,根据波段吸收率相似度和相邻波段吸收率相似度的差异获取目标分量与其余独立分量的匹配程度,公式如下:
式中,表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第一吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第一吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第二吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第二吸收率相似度,/>表示方差函数,N表示独立分量中波段的数量,/>表示目标样本第p个目标分量/>与匹配样本中第q个独立分量/>的匹配程度。
其中,若两个独立分量的匹配程度较高,则两个独立分量之间的吸收率应该相近,因此获取吸收率的比值,而对于每个独立分量对应的物质,其在不同波段下吸收率变化较大,而相邻波段之间的吸收率相似,因此计算相邻波段的比值之差,而计算两者互相的比值,是为了防止其中一方的比值过大影响结果,之后计算方差,若方差越小则说明两个独立向量的匹配程度越高,因此以方差的倒数作为两个独立分量的匹配程度。
计算目标样本的每个目标分量与每个样本的独立分量的匹配程度,将每个样本的独立分量中最大匹配程度对应的独立分量作为独立分量的匹配分量;并且对于目标样本加入方差后计算不同的噪声目标样本的每个目标分量与不同样本之间的匹配分量。
至此,获取了目标分量的匹配分量。
差异性获取模块,获取目标样本以及加入噪声后的噪声目标样本的目标分量的匹配分量后,为了使目标样本加入噪声后与其余样本的差异达到最大,则其加入的噪声的大小取决于分量之间的差异性。对获取的每个样本里的数据曲线进行区间划分,由于每个样本的独立分量也为一条曲线,长度和数据曲线相同,因此相当于对每个独立分量进行区间划分,从独立分量第一个数据点开始,以长度为的窗口对独立分量进行区间划分,每个窗口对应一个区间,若最后一个区间长度没有/>,则只计算此区间内的数据点,其中长度/>就表示区间内存在/>个数据点,每个数据点对应一个波段,在本实施例中,令/>。
首先计算目标样本每个独立分量在每个区间内的吸收率的标准差,在加入高斯噪声方差后获取噪声目标样本每个独立分量在每个区间内的吸收率的标准差,令未加噪声获取的标准差与加噪声后的标准差的比值记为第一比值,获取噪声目标分量与其匹配分量在相同波段处的第一吸收率相似度。
为了计算在加入噪声之后的样本与其余样本之间的差异性,即判断各个样本对应独立分量之间的差异性,故利用1与对应各点的相似性作差,利用高斯函数的思想,对二者比值趋近于1的值,相似程度会取到最大,此时差异性取到最小;而后利用各独立分量的均值来表示两个样本在区间内的平均差异,但由于加入方差后的样本差异性的影响,可能存在部分区间的波动受到噪声干扰过大的情况发生,进而导致所得到的差异性与原始数据关联性较小,故应当考虑目标样本在该区间内的独立分量的吸收率的标准差与所加噪声标准差之间的关系。得到如下公式:
式中,表示目标样本X的第/>个目标分量在区间z中吸收率的标准差,/>表示目标样本加入的第i个高斯噪声的方差,/>表示加入第i个高斯噪声方差后的噪声目标样本,/>表示第j个匹配样本,/>表示第i个噪声目标样本的第/>个目标分量与第j个匹配样本的匹配分量在区间z上的第/>个波段处的第一吸收率相似度,记为第一吸收率相似度A,/>表示区间内波段个数,/>表示线性归一化函数,/>表示每个样本独立分量的数量,/>表示以自然常数为底的指数函数,/>表示第i个噪声目标样本与第j个匹配样本在区间z下的差异性。
至此,获取了目标噪声样本与匹配样本的差异性。
高斯噪声获取模块,对于每个匹配样本,在每个区间中,将每个目标噪声样本与匹配样本的差异性取最大值作为匹配样本在每个区间内的最优方差,而目标样本和匹配样本每个区域的相关系数越大,其差异性置信度越低,反之若两样本在原始数据中差异较大,则认为该差异性置信度较高,因此计算目标样本和每个匹配样本在每个区间的皮尔逊相关系数,将所有匹配样本在不同区间内的最优方差求均值得到目标样本在区间内应该加入的高斯噪声方差,公式如下:
式中,表示目标样本的第z个区间,/>表示第j个匹配样本的第z个区间,表示计算/>和/>内所有吸收率的皮尔逊相关系数,/>表示第j个匹配样本在第z个区间内的最优方差,/>表示线性归一化函数,/>表示匹配样本的数量,/>表示目标样本第z个区间应该加入的高斯噪声方差。
数据处理模块,将目标样本在每个区间内应该加入的高斯噪声方差记为方差B,将方差B的高斯噪声加入到目标样本的每个区间内中,得到最终噪声目标样本;对于目标样本所包含的物质元素,对于每个物质元素的含量进行最大最小值归一化,将所有物质元素的含量归一化后相乘,将大于0.8分为第一类,将大于0.5分为第二类,将大于0.3分为第三类;将最终噪声目标样本根据上述分类进行标号,所述标号为锦灯笼宿萼的类别,将所有最终噪声目标样本及其标签作为数据集,利用数据集训练神经网络,所使用的损失函数为交叉熵损失函数;将新采集的目标样本获取最终噪声目标样本,记为新的最终噪声目标样本,将新的最终噪声目标样本的输入到训练好的神经网络得到新采集的目标样本对应的锦灯笼宿萼的类别。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (5)
1.一种锦灯笼宿萼的近红外光谱数据处理系统,其特征在于,所述系统包括以下模块:
数据采集模块,用于采集每个锦灯笼宿萼样本的光谱数据,根据光谱数据获取每个锦灯笼宿萼样本的数据曲线;
独立分量获取模块,用于将所有锦灯笼宿萼样本中任意一个样本记为目标样本,将所有锦灯笼宿萼样本中的非目标样本记为匹配样本,对目标样本添加初始高斯噪声获取噪声目标样本;获取每个锦灯笼宿萼样本的独立分量;
匹配分量获取模块,用于根据独立分量获取目标分量,根据目标分量和每个匹配样本的独立分量的光谱数据之间的关系获取目标分量与每个匹配样本的独立分量的匹配程度;将目标分量和每个匹配样本中匹配程度最大的独立分量记为目标分量与每个匹配样本的匹配分量;
差异性获取模块,用于对所有样本的独立分量进行区间划分获取若干区间,根据目标分量在每个区间的吸收率、初始高斯噪声以及噪声目标样本的目标分量与匹配样本的匹配分量在同一区间上的吸收率差异获取噪声目标样本与匹配样本在每个区间的差异性;
高斯噪声获取模块,用于获取目标噪声样本与匹配样本在同一区间的最大差异性,所述最大差异性对应加入的高斯噪声方差作为匹配样本的最优方差,根据匹配样本的最优方差以及目标样本与匹配样本在同一区间内的相关性获取目标样本在每个区间应加入的高斯噪声方差;
数据处理模块,用于根据目标样本在每个区间内加入的高斯噪声方差对锦灯笼宿萼进行分类;
所述对目标样本添加初始高斯噪声获取噪声目标样本的方法为:
获取多组预设方差,将多组预设方差下的高斯噪声加入到目标样本中获取多个噪声目标样本;
所述根据独立分量获取目标分量,根据目标分量和每个匹配样本的独立分量的光谱数据之间的关系获取目标分量与每个匹配样本的独立分量的匹配程度的方法为:
将目标样本和噪声目标样本中任意一个独立分量记为目标分量,将目标分量与匹配样本的独立分量在相同波段下的吸收率比值记为第一吸收率相似度,将匹配样本的独立分量与目标分量在相同波段下的吸收率比值记为第二吸收率相似度,根据目标分量与匹配样本的独立分量在相邻波段下的第一吸收率相似度的差异和第二吸收率相似度的差异获取目标分量与匹配样本的独立分量的匹配程度;
所述根据目标分量与匹配样本的独立分量在相邻波段下的第一吸收率相似度的差异和第二吸收率相似度的差异获取目标分量与匹配样本的独立分量的匹配程度的方法为:
式中,表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第一吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第一吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第二吸收率相似度,/>表示目标样本第p个目标分量与匹配样本中第q个独立分量在第/>波段下的第二吸收率相似度,表示方差函数,N表示独立分量中波段的数量,/>表示目标样本第p个目标分量/>与匹配样本中第q个独立分量/>的匹配程度;
所述根据目标分量在每个区间的吸收率、初始高斯噪声以及噪声目标样本的目标分量与匹配样本的匹配分量在同一区间上的吸收率差异获取噪声目标样本与匹配样本在每个区间的差异性的方法为:
计算目标样本的每个目标分量在每个区间内吸收率的标准差,获取噪声目标样本的每个目标分量与匹配样本对应的匹配分量在每个波段处的第一吸收率相似度A,根据目标样本的目标分量在区间内标准差以及第一吸收率相似度A获取噪声目标样本与匹配样本在每个区间下的差异性;
所述根据目标样本的目标分量在区间内标准差以及第一吸收率相似度A获取噪声目标样本与匹配样本在每个区间下的差异性的方法为:
式中,表示目标样本X的第/>个目标分量在区间z中吸收率的标准差,/>表示目标样本加入的第i个高斯噪声的方差,/>表示加入第i个高斯噪声方差后的噪声目标样本,/>表示第j个匹配样本,/>表示第i个噪声目标样本的第/>个目标分量与第j个匹配样本的匹配分量在区间z上的第/>个波段处的第一吸收率相似度,记为第一吸收率相似度A,/>表示区间内波段个数,/>表示线性归一化函数,/>表示每个样本独立分量的数量,/>表示以自然常数为底的指数函数,/>表示第i个噪声目标样本与第j个匹配样本在区间z下的差异性。
2.如权利要求1所述的一种锦灯笼宿萼的近红外光谱数据处理系统,其特征在于,所述根据光谱数据获取每个锦灯笼宿萼样本的数据曲线的方法为:
每个锦灯笼宿萼样本的光谱数据对应一条数据曲线,所述光谱数据为每个波段对应的吸收率,所述数据曲线的横坐标为波段,纵坐标为吸收率。
3.如权利要求1所述的一种锦灯笼宿萼的近红外光谱数据处理系统,其特征在于,所述获取每个锦灯笼宿萼样本的独立分量的方法为:
对于每个样本的数据曲线使用独立成分分析法获取预设数量的独立分量,所述独立分量在每个波段中对应一个吸收率。
4.如权利要求1所述的一种锦灯笼宿萼的近红外光谱数据处理系统,其特征在于,所述根据匹配样本的最优方差以及目标样本与匹配样本在同一区间内的相关性获取目标样本在每个区间应加入的高斯噪声方差的方法为:
计算目标样本和其每个匹配样本在同一区间内吸收率的皮尔逊相关系数,令皮尔逊相关系数取相反数后归一化,将归一化的值与匹配样本在该区间内最优方差的乘积记为第一乘积,将目标样本与其所有匹配样本的第一乘积的均值作为目标样本在该区间内应该加入的高斯噪声方差。
5.如权利要求1所述的一种锦灯笼宿萼的近红外光谱数据处理系统,其特征在于,所述根据目标样本在每个区间内加入的高斯噪声方差对锦灯笼宿萼进行分类的方法为:
将目标样本在每个区间内应该加入的高斯噪声方差记为方差B,将方差B的高斯噪声加入到每个区间内的目标样本中,得到最终噪声目标样本,将锦灯笼宿萼的所有物质元素进行最大最小值归一化后相乘,将乘积与预设阈值比较,将所有锦灯笼宿萼分为三类,对每个最终噪声目标样本进行标号,所述标号为锦灯笼宿萼的类别,将所有最终噪声目标样本及其标签作为数据集;
将新采集的所有目标样本计算最终噪声目标样本,并作为输入,输入到训练好的网络中得到锦灯笼宿萼的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311147002.9A CN116881705B (zh) | 2023-09-07 | 2023-09-07 | 一种锦灯笼宿萼的近红外光谱数据处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311147002.9A CN116881705B (zh) | 2023-09-07 | 2023-09-07 | 一种锦灯笼宿萼的近红外光谱数据处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116881705A CN116881705A (zh) | 2023-10-13 |
CN116881705B true CN116881705B (zh) | 2023-11-21 |
Family
ID=88259111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311147002.9A Active CN116881705B (zh) | 2023-09-07 | 2023-09-07 | 一种锦灯笼宿萼的近红外光谱数据处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116881705B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117194902B (zh) * | 2023-11-08 | 2024-02-06 | 昆山尚瑞智能科技有限公司 | 一种光谱测量过程中噪声数据滤除方法 |
CN117540220B (zh) * | 2024-01-09 | 2024-04-05 | 巨洋神州科技集团有限公司 | 一种近零碳园区源网荷匹配方法及系统 |
CN117589741B (zh) * | 2024-01-18 | 2024-04-05 | 天津博霆光电技术有限公司 | 基于光学特征的吲哚菁绿智能检测方法 |
CN118051862B (zh) * | 2024-04-16 | 2024-06-21 | 洛阳禾安工程技术服务有限公司 | 一种建筑涂料的检测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020232959A1 (zh) * | 2019-05-22 | 2020-11-26 | 安徽大学 | 基于函数性主元分析的近红外光谱特征提取方法和系统 |
CN112884035A (zh) * | 2021-02-07 | 2021-06-01 | 山东科技大学 | 一种噪声鲁棒的高光谱图像波段选择方法 |
CN113661381A (zh) * | 2019-01-31 | 2021-11-16 | 南加州大学 | 高光谱成像系统 |
CN116432051A (zh) * | 2023-05-18 | 2023-07-14 | 云南中烟工业有限责任公司 | 一种近红外光谱数据微弱差异信号的评价方法 |
CN116660198A (zh) * | 2023-08-02 | 2023-08-29 | 中珀(北京)新材料科技有限公司 | 基于光谱分析的碳纳米材料浆料性能测试方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7092832B2 (en) * | 2003-12-11 | 2006-08-15 | Inlight Solutions, Inc. | Adaptive compensation for measurement distortions in spectroscopy |
-
2023
- 2023-09-07 CN CN202311147002.9A patent/CN116881705B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113661381A (zh) * | 2019-01-31 | 2021-11-16 | 南加州大学 | 高光谱成像系统 |
WO2020232959A1 (zh) * | 2019-05-22 | 2020-11-26 | 安徽大学 | 基于函数性主元分析的近红外光谱特征提取方法和系统 |
CN112884035A (zh) * | 2021-02-07 | 2021-06-01 | 山东科技大学 | 一种噪声鲁棒的高光谱图像波段选择方法 |
CN116432051A (zh) * | 2023-05-18 | 2023-07-14 | 云南中烟工业有限责任公司 | 一种近红外光谱数据微弱差异信号的评价方法 |
CN116660198A (zh) * | 2023-08-02 | 2023-08-29 | 中珀(北京)新材料科技有限公司 | 基于光谱分析的碳纳米材料浆料性能测试方法 |
Non-Patent Citations (2)
Title |
---|
基于带参考信号独立分量分析的高光谱图像目标探测;金硕;王斌;夏威;;红外与毫米波学报(02);全文 * |
红外高光谱数据鉴别技术研究;张晟;李宇海;;光电技术应用(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116881705A (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116881705B (zh) | 一种锦灯笼宿萼的近红外光谱数据处理系统 | |
Moghadam et al. | Plant disease detection using hyperspectral imaging | |
Yang et al. | Classification of blueberry fruit and leaves based on spectral signatures | |
CN104374738A (zh) | 一种基于近红外提高鉴别结果的定性分析方法 | |
US20220390374A1 (en) | Method for extracting raman characteristic peaks employing improved principal component analysis | |
CN104374739A (zh) | 一种基于近红外定性分析的种子品种真实性鉴别方法 | |
Lu et al. | Nondestructive testing of pear based on Fourier near-infrared spectroscopy | |
Khalid et al. | Detection of tomato leaf disease using deep convolutional neural networks | |
CN116597204A (zh) | 基于Transformer网络的草地多时相高光谱分类方法 | |
Uoc et al. | A novel automatic detecting system for cucumber disease based on the convolution neural network algorithm | |
Fan et al. | Non-destructive detection of single-seed viability in maize using hyperspectral imaging technology and multi-scale 3D convolutional neural network | |
CN113406030A (zh) | 一种基于卷积神经网络的哈密瓜农药残留鉴别方法 | |
Wu et al. | Characterization of Pepper Ripeness in the Field Using Hyperspectral Imaging (HSI) with Back Propagation (BP) Neural Network and Kernel Based Extreme Learning Machine (KELM) Models | |
CN114354571B (zh) | 一种基于半峰宽与峰高的易制毒化学品拉曼特征峰识别方法 | |
CN113761790B (zh) | 一种基于Stacking集成学习的果树叶片氮含量估算方法 | |
CN104374737A (zh) | 一种近红外定性鉴别方法 | |
CN114324195A (zh) | 一种多通道农产品无损检测方法 | |
CN115082797A (zh) | 一种大田环境下早期小麦赤霉病监测预警方法及系统 | |
CN112801173A (zh) | 一种qr模糊鉴别分析的生菜近红外光谱分类方法 | |
Tang et al. | Determining the content of nitrogen in rubber trees by the method of NIR spectroscopy | |
CN110108661B (zh) | 一种模糊极大熵聚类的茶叶近红外光谱分类方法 | |
Selvi et al. | Deep learning in agriculture as a computer vision system | |
Dan et al. | A new L 1-LRC based model for oranges origin identification with near infrared spectra data | |
CN109781728A (zh) | 一种无损伤测量植物叶绿素的方法 | |
CN117929356B (zh) | 一种基于高斯过程回归的libs定量分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |