CN114692719B - 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法 - Google Patents

一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法 Download PDF

Info

Publication number
CN114692719B
CN114692719B CN202210171811.2A CN202210171811A CN114692719B CN 114692719 B CN114692719 B CN 114692719B CN 202210171811 A CN202210171811 A CN 202210171811A CN 114692719 B CN114692719 B CN 114692719B
Authority
CN
China
Prior art keywords
sample
data
classification
space
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210171811.2A
Other languages
English (en)
Other versions
CN114692719A (zh
Inventor
李福生
马骞
赵彦春
杨婉琪
鲁欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202210171811.2A priority Critical patent/CN114692719B/zh
Publication of CN114692719A publication Critical patent/CN114692719A/zh
Application granted granted Critical
Publication of CN114692719B publication Critical patent/CN114692719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/22Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material
    • G01N23/223Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material by irradiating the sample with X-rays or gamma-rays and by measuring X-ray fluorescence
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本发明的目的在于提供一种基于svm‑Tradboost模型迁移的XRF小样本元素分类方法,属于X荧光光谱元素检测技术领域。该方法针对待分析的小样本目标,选择另一种数据量较多且与目标样本理化性质和元素组成相似的样本作为辅助样本,根据拥有的辅助样本数据建立分析模型,并从中筛选有效数据,通过Boosting方法建立权重调整机制,增加有效数据权重,降低无效数据权重;在分类算法实施的过程中,过滤掉与目标样本不匹配的辅助样本数据,使得元素分类朝正确的方向进行,进而实现在原有的大量辅助样本模型的基础上迁移至目标样本元素分类,并实现分类准确性保持在90%以上。

Description

一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法
技术领域
本发明属于X荧光光谱元素检测分析技术领域,具体涉及一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法。
背景技术
X射线荧光光谱法(X-ray fluorescence spectrometry,XRF)是用于对物质中元素成分和含量进行定性、定量以及试样物理特征分析的一种方法,该方法具有操作简单、检测效率高、样品预处理简单、非破坏性以及测定迅速等特点,适合于土壤、中药、矿石等领域的分析与研究。当通过XRF获取到元素成分时,对微量元素进行分类,传统的分类方法有判别分析、模糊聚类分析法、卷积神经网络分析法等。在实验样本充足的条件下,这些传统的分类方法也能够达到很好的效果;但是传统的机器学习分类方法通常建立在训练集和测试集服从相同的数据分布的基础上,但在实际情况下,这种条件并不一定能够满足。
在此之前,研究人员对光谱变化时分析方法的研究集中于在仪器、环境等测量条件发生改变时如何修正分析模型,但是当样品的物理性质以及化学成分的变化,即样品种类发生改变,也会导致样品光谱的差异;同时,原有的分析模型不包含这些由于变化而产生的新信息,故用原有的模型预测这化学、物理性质发生改变的样品,其预测误差将增大。为了保证结果的可靠性,往往需要重新设计分析模型,但是重新设计新的模型同样非常繁琐、耗时,造成大量样品数据的浪费,且不具有普遍性;同时,由于一些标准样品稀少、价格昂贵,如果使用大量检测样品的方法来建立新的分析模型,会产生成本大幅度提高甚至难以实现的问题。
发明内容
针对背景技术所存在的问题,本发明的目的在于提供一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法。该方法基于与目标样本具有关联性的另一种样本的现有结果,通过模型迁移获取目标样本的分类模型,优化了目标样本待分析元素在小样本条件下使用已有的简单分类算法无法准确得到分类结果的缺点,同时使得原有的方法应用在其它种类的样本建立分类模型时,仍能将分类的准确性保持在90%以上。
更具体地,针对待分析的小样本目标,选择另一种数据量较多且与目标样本理化性质和元素组成相似的样本作为辅助样本,根据拥有的辅助样本数据建立分析模型,并从中筛选有效数据,通过Boosting方法建立权重调整机制,增加有效数据权重,降低无效数据权重;在分类算法实施的过程中,过滤掉与目标样本不匹配的辅助样本数据,使得元素分类朝正确的方向进行,进而实现在原有的大量辅助样本模型的基础上迁移至目标样本元素分类,并能够准确地预测。
为实现上述目的,本发明的技术方案如下:
一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法,包括以下步骤:
步骤1:通过XRF荧光光谱仪获取目标样本待分类元素的峰值数据,构成源样例空间数据集Xb,同时获取若干个与目标样本元素组成相似的辅助样本的峰值数据,构成辅助样例空间数据集Xa,同时对源样例空间数据集和辅助样例空间数据集中的峰值数据进行预处理;
步骤2:选定训练集X和测试集S,其中,将源样例空间数据集Xb随机划分为两个子数据集Xb1和Xb2,所述训练集X包含源样例空间子数据集Xb1和为辅助样例空间Xa中的所有数据,测试集S为源样例空间子数据集Xb2
步骤3:设定类别空间,按照预设分类条件构建类别空间矩阵Y;
步骤4:基于训练集X与类别空间矩阵Y构造最终训练数据集T,具体构造形式为,T∈{(X=Xb1∪Xa)×Y};
步骤5:初始化权重向量W1、权重分布Pt与迭代次数N;其中,
Figure BDA0003518480110000021
Figure BDA0003518480110000022
其中,n为辅助样例空间数据集的大小,即与目标样本不同分布的数据集Xa中所含数据的个数;m为源样例空间子数据集的大小,即与目标样本同分布的子数据集Xb1中所含数据的个数;
权重分布表达式为:
Figure BDA0003518480110000023
当t=1时,Wt=W1
Figure BDA0003518480110000024
基于初始化权重向量W1对最终训练数据集T中每个峰值数据的权重进行归一化处理;
步骤6:定义svm分类算法中的高斯核函数及相关参数;
定义高斯核函数为,
K(Xu,Xv)=exp(-γ||Xu-Xv||2),
其中,K为核函数,Xu,Xv为训练集X中每一个数据的特征内积,γ为超参参数,需要进行调参;
根据测试集S、步骤4得到的训练数据集T,以及T上的权重分布Pt,基于svm算法,得到一个在测试集S上的弱分类器ht:X→Y;
步骤7:计算弱分类器ht在源样例空间子数据集Xb1上的错误率εt,具体计算公式为:
Figure BDA0003518480110000031
其中,c(xi)为布尔函数,即从X到Y的映射,xi为训练集X中的第i个数据;
步骤8:设置新的权重向量
Figure BDA0003518480110000032
根据步骤7中错误率εt的结果调整权重,对分类没有用的数据降低权重,有用的提升权重,从而使分类准确率上升,具体为:
Figure BDA0003518480110000033
其中,β与βt分别为辅助样例空间数据集Xa与源样例空间子数据集Xb1权重调整的速率;
步骤9:重复步骤5至步骤8,直至达到迭代次数N,即可得到最终分类器hf(x),,
Figure BDA0003518480110000034
步骤10:将测试集S中待分类的目标样本XRF元素峰值数据输入到步骤9得到的最终分类器hf(x),即可得到目标样本待测数据的分类结果。
进一步地,步骤1中的预处理包括去噪、去除本底等操作。
进一步地,步骤1中辅助样本与目标样本元素组成相似即辅助样本与目标样本至少含有8中相同元素,且应含有与目标样本待分类元素相同的元素;辅助样本峰值数据数量至少应大于目标样本数据数量。
进一步地,步骤2中测试集S为源样例空间子数据集Xb2,具体为:
Figure BDA0003518480110000035
j=1,2,…,k,k为测试集S中包含的数据数量,t=1,…,N,N为迭代次数。
进一步地,步骤3中设定类别空间即按照分类条件,设Z={-1,1}为类别空间,若大于分类条件阈值,则标记为1,小于或等于阈值,则标记为-1;对训练集中的所有数据都进行标记,从而得到类别空间矩阵Y。
进一步地,步骤6中相关参数还包括惩罚系数C,惩罚系数C为大于0的实数;γ为正实数。
进一步地,步骤7中的错误率εt的值应小于1/2。
进一步地,步骤8中,辅助样例空间数据集Xa的权重调整速率β具体为,
Figure BDA0003518480110000041
源样例空间子数据集Xb1的权重调整速率βt具体为,βt=εt/(1-εt)。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明可以有效利用已有关联性辅助样本数据来分类未知且只具有少量样本的待分类目标数据。当一个辅助训练的数据被误分类,那么这个数据可能和待测目标的训练数据是矛盾的,那么就降低这个数据的权重;在若干次迭代以后,辅助样本数据中符合目标样本数据特征的数据会拥有更高的权重,而不符合目标样本数据的权重会降低。因此可以针对少量样本的情况,利用原本不具有相同分布的其它数据进行分析,达到快速分类的目的。本发明方法增强了XRF分类模型的通用性,即当光谱发生变化、样品种类发生改变时,减少了建立新模型需要大量的测试数据带来的样本材料和成本浪费;同时解决了少量样本模型建立困难的问题。本发明方法可以扩展至大多数的样本XRF分类检测领域,具普遍意义和通用性。
附图说明
图1为本发明元素分类方法的流程示意图。
图2为本发明实施例1的训练数据集图。
图3为本发明实施例1的最终分类结果图。
图4为对比例1仅使用svm算法的分类结果图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合实施方式和附图,对本发明作进一步地详细描述。
一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法,包括以下步骤:
步骤1:通过XRF荧光光谱仪获取目标样本待分类元素峰值数据,构成源样例空间数据集Xb,同时获取若干个与目标样本元素组成相似的辅助样本峰值数据,构成辅助样例空间数据集Xa,同时对源样例空间数据集和辅助样例空间数据集中的光谱峰值数据进行预处理;
步骤2:选定训练集X和测试集S,其中,将源样例空间数据集Xb随机划分为两个子数据集Xb1和Xb2,所述训练集X包含源样例空间子数据集Xb1和为辅助样例空间Xa中的所有数据,测试集S为源样例空间子数据集Xb2
步骤3:设定类别空间,按照预设分类条件构建类别空间矩阵Y;
步骤4:基于训练集X与类别空间矩阵Y构造最终训练数据集T,具体构造形式为,T∈{(X=Xb1∪Xa)×Y};
步骤5:初始化权重向量W1、权重分布Pt与迭代次数N;其中,
Figure BDA0003518480110000051
Figure BDA0003518480110000052
其中,n为辅助样例空间数据集的大小,即与目标样本不同分布的数据集Xa中所含数据的个数;m为源样例空间子数据集的大小,即与目标样本同分布的子数据集Xb1中所含数据的个数;
权重分布表达式为:
Figure BDA0003518480110000053
当t=1时,Wt=W1
Figure BDA0003518480110000054
基于初始化权重向量W1对最终训练数据集T中每个峰值数据的权重进行归一化处理;
步骤6:定义svm分类算法中的高斯核函数及相关参数;
定义高斯核函数为,
K(Xu,Xv)=exp(-γ||Xu-Xv||2),
其中,K为核函数,Xu,Xv为训练集X中每一个数据的特征内积,γ为超参参数,需要进行调参;
根据测试集S、步骤4得到的训练数据集T,以及T上的权重分布Pt,基于svm算法,得到一个在测试集S上的弱分类器ht:X→Y;
步骤7:计算弱分类器ht在源样例空间子数据集Xb1上的错误率εt,具体计算公式为:
Figure BDA0003518480110000061
其中,c(xi)为布尔函数,即从X到Y的映射,xi为训练集X中的第i个峰值数据;
步骤8:设置新的权重向量
Figure BDA0003518480110000062
根据步骤7中错误率εt的结果调整权重,对分类没有用的数据降低权重,有用的提升权重,从而使分类准确率上升,具体为:
Figure BDA0003518480110000063
其中,β与βt分别为辅助样例空间数据集Xa与源样例空间子数据集Xb1权重调整的速率;
Figure BDA0003518480110000064
βt=εt/(1-εt);
步骤9:重复步骤5至步骤8,直至达到迭代次数N,即可得到最终分类器hf(x),
Figure BDA0003518480110000065
步骤10:将测试集S中待分类的目标样本XRF元素峰值数据输入到步骤9得到的最终分类器hf(x),即可得到目标样本待测数据的分类结果。
实施例1
本实施例根据已拥有的大量土壤样本数据的分析模型与少量中药样本数据,从原土壤样本数据中,筛选有效数据,过滤掉与目标中药样本不匹配的数据,通过Boosting方法建立权重调整机制,增加有效数据权重,降低无效数据权重,使得分类朝正确的方向进行,进而实现在原有的土壤模型的基础上迁移至中药重金属元素分类并能够准确地预测。
一种检测中药中重金属元素Pb是否超标的分类方法,元素定性分类方法的流程示意图如图1所示,具体步骤如下:
步骤1:通过XRF荧光光谱仪获取25份中药金银花样本中待分类的重金属Pb元素的峰值数据,构成源样例空间数据集Xb,同时获取59份土壤辅助样本峰值数据,构成辅助样例空间数据集Xa,同时对源样例空间数据集和辅助样例空间数据集中的光谱数据进行预处理,具体地,对采集到的元素峰值谱图进行去除本底信息,得到Pb元素的峰值信息;
步骤2:选定训练集X和测试集S,其中,将源样例空间数据集Xb随机划分为两个子数据集Xb1和Xb2,所述训练集X包含源样例空间子数据集Xb1和为辅助样例空间Xa中的所有数据,测试集S为源样例空间子数据集Xb2;具体为:
Figure BDA0003518480110000071
j=1,2,…,k,k为测试集S中包含的数据数量,t=1,…,N,N为迭代次数;
其中,源样例空间子数据集Xb1作为同分布的少量训练数据集,辅助样例空间Xa为不同分布的训练数据集,所有训练集数据如图2所示;
步骤3:设定类别空间,按照预设分类条件构建类别空间矩阵Y,具体过程为:设定类别空间即按照分类条件,设Z={-1,1}为类别空间,对训练集X中的所有数据进行类别标记,若Pb元素超标,则标记为1,否则标记为-1;
步骤4:基于训练集X与类别空间矩阵Y构造最终训练数据集T,具体构造形式为,T∈{(X=Xb1∪Xa)×Y};
步骤5:初始化权重向量W1、权重分布Pt与迭代次数N;其中,
Figure BDA0003518480110000072
Figure BDA0003518480110000073
其中,n为辅助样例空间数据集的大小,即与目标样本不同分布的数据集Xa中所含数据的个数;m为源样例空间子数据集的大小,即与目标样本同分布的子数据集Xb1中所含数据的个数;
权重分布表达式为:
Figure BDA0003518480110000074
当t=1时,Wt=W1
Figure BDA0003518480110000075
基于初始化权重向量W1对最终训练数据集T中每个峰值数据的权重进行归一化处理;
步骤6:定义svm分类算法中的高斯核函数及相关参数;
定义高斯核函数为,
K(Xu,Xv)=exp(-γ||Xu-Xv||2),
其中,K为核函数,Xu,Xv为训练集X中每一个数据的特征内积,γ为超参参数,需要进行调参,并定义惩罚系数C;具体地,C=200,γ=0.6,迭代次数N=50;
根据测试集S、步骤4得到的训练数据集T,以及T上的权重分布Pt,基于svm算法,得到一个在测试集S上的弱分类器ht:X→Y;
步骤7:计算弱分类器ht在源样例空间子数据集Xb1上的错误率εt,具体计算公式为:
Figure BDA0003518480110000081
其中,c(xi)为布尔函数,即从X到Y的映射,xi为训练集X中的第i个峰值数据;
步骤8:设置新的权重向量
Figure BDA0003518480110000082
根据步骤7中错误率εt的结果调整权重,对分类没有用的数据降低权重,有用的提升权重,从而使分类准确率上升,具体为:
Figure BDA0003518480110000083
其中,β与βt分别为辅助样例空间数据集Xa与源样例空间子数据集Xb1权重调整的速率;
Figure BDA0003518480110000084
βt=εt/(1-εt);
步骤9:重复步骤5至步骤8,直至达到迭代次数N,即可得到最终分类器hf(x),,
Figure BDA0003518480110000085
步骤10:将测试集S中待分类的金银花样本XRF元素峰值数据输入到步骤9得到的最终分类器hf(x),即可得到待测金银花样本的分类结果。
本实施例得到的金银花中Pb元素是否超标的分类结果如图3所示。
对比例1
仅采用svm算法对相同待测金银花样本进行Pb元素是否超标进行分类。
本对比例的分类结果如图4所示。
图2为本发明实施例1的训练数据集图。从图中可以看出,十字形标记代表辅助样例空间即土壤样本,圆圈标记代表源样例空间,即中药样本。从图中可以看出,两种物质具有不同的样本分布。
图3为本发明实施例1的最终分类结果图。从图中可以看出,圆圈中有十字标记代表分类错误,没有标记代表分类正确,明显看出图3相对于图4,其分类错误的样本更少。本发明方法分类的准确率可达96%。图4为对比例1仅使用svm算法的分类结果图,可以看出,仅使用svm算法进行分类的准确率仅为84%,相较于本发明低了12个百分点。
因此,本发明基于svm-Tradboost算法能够实现使用与待测样本不同分布的其他大量有效数据进行模型迁移训练,提高了小样本分类模型的准确预测,证明了实施例的有效性。
以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合。

Claims (8)

1.一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法,其特征在于,包括以下步骤:
步骤1:通过XRF荧光光谱仪获取目标样本待分类元素的峰值数据,构成源样例空间数据集Xb,同时获取若干个与目标样本元素组成相似的辅助样本的峰值数据,构成辅助样例空间数据集Xa,同时对源样例空间数据集和辅助样例空间数据集中的峰值数据进行预处理;
步骤2:选定训练集X和测试集S,其中,将源样例空间数据集Xb随机划分为两个子数据集Xb1和Xb2,所述训练集X包含源样例空间子数据集Xb1和为辅助样例空间Xa中的所有数据,测试集S为源样例空间子数据集Xb2
步骤3:设定类别空间,按照预设分类条件构建类别空间矩阵Y;
步骤4:基于训练集X与类别空间矩阵Y构造最终训练数据集T,具体构造形式为,T∈{(X=Xb1∪Xa)×Y};
步骤5:初始化权重向量W1、权重分布Pt与迭代次数N;其中,
其中,n为辅助样例空间数据集的大小,即与目标样本不同分布的数据集Xa中所含数据的个数;m为源样例空间子数据集的大小,即与目标样本同分布的子数据集Xb1中所含数据的个数;
权重分布表达式为:
当t=1时,Wt=W1
基于初始化权重向量W1对最终训练数据集T中每个峰值数据的权重进行归一化处理;
步骤6:定义svm分类算法中的高斯核函数及相关参数;
定义高斯核函数为,
K(Xu,Xv)=exp(-γ||Xu-Xv||2),
其中,K为核函数,Xu,Xv为训练集X中每一个数据的特征内积,γ为超参参数,需要进行调参;
根据测试集S、步骤4得到的训练数据集T,以及T上的权重分布Pt,基于svm算法,得到一个在测试集S上的弱分类器ht:X→Y;
步骤7:计算弱分类器ht在源样例空间子数据集Xb1上的错误率εt,具体计算公式为:
其中,c(xi)为布尔函数,即从X到Y的映射,xi为训练集X中的第i个数据;
步骤8:设置新的权重向量根据步骤7中错误率εt的结果调整权重,对分类没有用的数据降低权重,有用的提升权重,从而使分类准确率上升,具体为:
其中,β与βt分别为辅助样例空间数据集Xa与源样例空间子数据集Xb1权重调整的速率;
步骤9:重复步骤5至步骤8,直至达到迭代次数N,即可得到最终分类器hf(x),
步骤10:将测试集S中目标样本待分类的XRF元素峰值数据输入到步骤9得到的最终分类器hf(x),即可得到目标样本待分类数据的分类结果。
2.如权利要求1所述的XRF小样本元素分类方法,其特征在于,步骤1中的预处理包括去噪和去除本底操作。
3.如权利要求1所述的XRF小样本元素分类方法,其特征在于,步骤1中辅助样本与目标样本元素组成相似即辅助样本与目标样本至少含有8中相同元素,且应含有与目标样本待分类元素相同的元素;辅助样本峰值数据数量至少应大于目标样本数据数量。
4.如权利要求1所述的XRF小样本元素分类方法,其特征在于,步骤2中测试集S为源样例空间子数据集Xb2,具体为:k为测试集S中包含的数据数量,t=1,…,N,N为迭代次数。
5.如权利要求1所述的XRF小样本元素分类方法,其特征在于,步骤3中设定类别空间即按照分类条件,设Z={-1,1}为类别空间,若大于分类条件阈值,则标记为1,小于或等于阈值,则标记为-1;对训练集中的所有数据都进行标记,从而得到类别空间矩阵Y。
6.如权利要求1所述的XRF小样本元素分类方法,其特征在于,步骤6中相关参数还包括惩罚系数C,惩罚系数C为大于0的实数;γ为正实数。
7.如权利要求1所述的XRF小样本元素分类方法,其特征在于,步骤7中的错误率εt的值应小于1/2。
8.如权利要求1所述的XRF小样本元素分类方法,其特征在于,步骤8中,辅助样例空间数据集Xa的权重调整速率β具体为,源样例空间子数据集Xb1的权重调整速率βt具体为,βt=εt/(1-εt)。
CN202210171811.2A 2022-02-24 2022-02-24 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法 Active CN114692719B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210171811.2A CN114692719B (zh) 2022-02-24 2022-02-24 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210171811.2A CN114692719B (zh) 2022-02-24 2022-02-24 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法

Publications (2)

Publication Number Publication Date
CN114692719A CN114692719A (zh) 2022-07-01
CN114692719B true CN114692719B (zh) 2023-04-07

Family

ID=82137759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210171811.2A Active CN114692719B (zh) 2022-02-24 2022-02-24 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法

Country Status (1)

Country Link
CN (1) CN114692719B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239907A (zh) * 2014-07-16 2014-12-24 华南理工大学 面向变化场景的远红外行人检测方法
CN104697965A (zh) * 2015-03-10 2015-06-10 西北大学 一种基于最小二乘支持向量机结合激光诱导击穿光谱识别炉渣种类的方法
CN107430705A (zh) * 2015-03-17 2017-12-01 高通股份有限公司 用于重新训练分类器的样本选择
CN107688829A (zh) * 2017-08-29 2018-02-13 湖南财政经济学院 一种基于支持向量机的识别系统及识别方法
CN108681696A (zh) * 2018-04-28 2018-10-19 河海大学 融合多特征降维和迁移学习的红外目标稳健性识别方法
CN108805206A (zh) * 2018-06-13 2018-11-13 南京工业大学 一种用于模拟电路故障分类的改进型lssvm建立方法
CN110084261A (zh) * 2018-01-26 2019-08-02 唯亚威通讯技术有限公司 用于光谱分类的减少的误报识别
CN112231621A (zh) * 2020-10-13 2021-01-15 电子科技大学 基于BP-adaboost降低元素检出限的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239907A (zh) * 2014-07-16 2014-12-24 华南理工大学 面向变化场景的远红外行人检测方法
CN104697965A (zh) * 2015-03-10 2015-06-10 西北大学 一种基于最小二乘支持向量机结合激光诱导击穿光谱识别炉渣种类的方法
CN107430705A (zh) * 2015-03-17 2017-12-01 高通股份有限公司 用于重新训练分类器的样本选择
CN107688829A (zh) * 2017-08-29 2018-02-13 湖南财政经济学院 一种基于支持向量机的识别系统及识别方法
CN110084261A (zh) * 2018-01-26 2019-08-02 唯亚威通讯技术有限公司 用于光谱分类的减少的误报识别
CN108681696A (zh) * 2018-04-28 2018-10-19 河海大学 融合多特征降维和迁移学习的红外目标稳健性识别方法
CN108805206A (zh) * 2018-06-13 2018-11-13 南京工业大学 一种用于模拟电路故障分类的改进型lssvm建立方法
CN112231621A (zh) * 2020-10-13 2021-01-15 电子科技大学 基于BP-adaboost降低元素检出限的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Huizhu Cheng 等.Genetic algorithm-optimized BP neural network model for prediction of soil heavy metal content in XRF.2020 International Conference on Intelligent Computing, Automation and Systems (ICICAS).2021,327-331. *
刘万军 等.基于Fisher准则和TrAdaboost的高光谱相似样本分类算法.国土资源遥感.2018,第30卷(第04期),41-48. *
邱仁博 等.一种改进的带参数AdaBoost算法.计算机工程.2016,第42卷(第07期),199-202+208. *
马骞.基于机器学习和XRF光谱仪的中药材品质分析研究.中国优秀硕士学位论文全文数据库 基础科学辑.2023,(第01期),A005-201. *

Also Published As

Publication number Publication date
CN114692719A (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
Chatzidakis et al. Towards calibration-invariant spectroscopy using deep learning
Ball et al. Morphometric analysis of phytoliths: recommendations towards standardization from the International Committee for Phytolith Morphometrics
Feilhauer et al. Multi-method ensemble selection of spectral bands related to leaf biochemistry
Neto et al. Plant species identification using Elliptic Fourier leaf shape analysis
Karpievitch et al. Normalization and missing value imputation for label-free LC-MS analysis
Wu et al. Practicability investigation of using near-infrared hyperspectral imaging to detect rice kernels infected with rice false smut in different conditions
Zadora et al. Evaluation of glass samples for forensic purposes—An application of likelihood ratios and an information–theoretical approach
US20190034518A1 (en) Target class feature model
Cai et al. Baseline correction for Raman spectra using penalized spline smoothing based on vector transformation
CN111524181B (zh) 一种基于扫描电镜图像分割的多孔材料孔洞自动测量方法
CN108596246A (zh) 基于深度神经网络的土壤重金属含量检测模型的建立方法
Ramos et al. Information-theoretical feature selection using data obtained by Scanning Electron Microscopy coupled with and Energy Dispersive X-ray spectrometer for the classification of glass traces
CN116523320B (zh) 基于互联网大数据的知识产权风险智能分析方法
Burfield et al. Review and application of functional data analysis to chemical data—The example of the comparison, classification, and database search of forensic ink chromatograms
Hu et al. Soil phosphorus and potassium estimation by reflectance spectroscopy
CN114813709A (zh) 土壤成分检测方法、设备及系统
Huang et al. A novel PCA-based calibration algorithm for classification of challenging laser-induced breakdown spectroscopy soil sample data
CN114692719B (zh) 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法
CN114611582A (zh) 一种基于近红外光谱技术分析物质浓度的方法及系统
US20080095428A1 (en) Method for training of supervised prototype neural gas networks and their use in mass spectrometry
CN107346549B (zh) 一种利用遥感影像多特征的多类别变化动态阈值检测方法
Képeš et al. Interpreting convolutional neural network classifiers applied to laser-induced breakdown optical emission spectra
CN116858822A (zh) 一种基于机器学习和拉曼光谱的水体中磺胺嘧啶定量分析方法
Hosseinpour-Zarnaq et al. A CNN model for predicting soil properties using VIS–NIR spectral data
CN111125629A (zh) 一种域自适应的pls回归模型建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant