CN110781906B - 一种基于半监督支持向量机的n-γ甄别方法 - Google Patents

一种基于半监督支持向量机的n-γ甄别方法 Download PDF

Info

Publication number
CN110781906B
CN110781906B CN201810857700.0A CN201810857700A CN110781906B CN 110781906 B CN110781906 B CN 110781906B CN 201810857700 A CN201810857700 A CN 201810857700A CN 110781906 B CN110781906 B CN 110781906B
Authority
CN
China
Prior art keywords
data set
vector machine
support vector
pulse
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810857700.0A
Other languages
English (en)
Other versions
CN110781906A (zh
Inventor
刘寅宇
刘利芳
代刚
邢占强
李顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Electronic Engineering of CAEP
Original Assignee
Institute of Electronic Engineering of CAEP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Electronic Engineering of CAEP filed Critical Institute of Electronic Engineering of CAEP
Priority to CN201810857700.0A priority Critical patent/CN110781906B/zh
Publication of CN110781906A publication Critical patent/CN110781906A/zh
Application granted granted Critical
Publication of CN110781906B publication Critical patent/CN110781906B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01TMEASUREMENT OF NUCLEAR OR X-RADIATION
    • G01T3/00Measuring neutron radiation
    • G01T3/06Measuring neutron radiation with scintillation detectors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E30/00Energy generation of nuclear origin
    • Y02E30/30Nuclear fission reactors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Measurement Of Radiation (AREA)

Abstract

本发明属于本发明涉及中子探测技术领域,具体涉及一种基于半监督支持向量机的n‑γ甄别方法,其特征在于包括如下步骤:a)利用模拟数字变换器对探测器输出脉冲信号进行模数变换,收集数字化的探测器脉冲信号,形成训练数据集;利用训练数据集结合半监督的学习方法训练出一个支持向量机,得到一个最优分类超平面;b)对新探测得到的脉冲进行数字化,并进行特征提取预处理:提取脉冲信号的重要特征信息;c)将提取到的特征信息输入到支持向量机中,利用上述分类超平面结合上述提取特征进行对新探测到的脉冲样本进行分类预测。

Description

一种基于半监督支持向量机的n-γ甄别方法
技术领域
本发明涉及中子探测技术领域,具体涉及一种基于半监督支持向量机的n-γ甄别方法。
背景技术
由于中子与周围环境的非弹性散射、慢化中子的辐射俘获等原因,存在中子的场合几乎都伴随着大量的γ射线本底;随着中子探测技术在测井、违禁物品检测、环境辐射检测、医学及军用领域的广泛应用,n-γ甄别(中子与伽马射线甄别)技术逐渐成为中子探测中的关键技术。目前常用的n-γ甄别技术有上升时间法、电荷比较法、神经网络法、脉冲梯度法、小波变换法;而这些方法仅仅利用了脉冲信号的一种或者两种特征信息进行n-γ甄别。
典型探测器由闪烁体、光导、光电倍增管、分压管和射极跟随器构成,如图1所示。
不同质量与电荷的射线粒子在探测器的闪烁体中激发的光脉冲信号含有不同衰减时间成分,因此探测器闪烁体输出的中子和γ射线光脉冲信号中的快、慢成分强度比不同;当探测器光电倍增管正常工作时(即工作于线性范围时),从探测器光电倍增管的阳极或者某一个倍增极引出的电流脉冲形状反映了探测器闪烁体发射的光脉冲形状。该电流脉冲可表示为:
Figure BDA0001748943190000011
其中τf、τs及If(ρ)、Is(ρ)分别是快慢成分的衰减时间及电流脉冲最大值。目前常见的电荷脉冲甄别方法原理及步骤如下:
1)对探测器输出的电流脉冲进行积分,可得电荷脉冲如下:
Figure BDA0001748943190000012
2)由1)可知,积分后的电荷脉冲也是由快、慢两部分组成,因此通过对探测器输出脉冲进行积分得到的中子和γ射线的电荷脉冲信号的Qf(ρ)/Qs(ρ)、Q(ρ)/Qs(ρ)或Q(ρ)/Qf(ρ)都不一样。
3)对探测器输出电流脉冲信号进行积分可通过两种方法进行:在模拟型甄别装置中利用专门的电流积分回路进行积分;在数字型装置中通过计算电流脉冲面积获得积分结果。此处以数字型装置为例,对于图2所示的电流脉冲信号,其全峰面积S便是脉冲的总电荷量Q(ρ),而从t0(t0≈τf)时刻至峰尾的面积
Figure BDA0001748943190000021
便为脉冲信号慢成分电荷量Qs(ρ)。
4)以S/St作为特征空间,利用探测器对混合辐射场中通过探测器测量得到的大量的中子和γ射线进行统计,得到如图3所示统计结果;中子和γ射线在该特征空间中均服从高斯分布:图中左边为γ射线统计分布(Gamma Distribution),右边为中子统计分布(NeutronDistribution)。
5)对于探测器每一次测量得到的射线粒子,利用S/St作为特征信息可结合上图统计结果进行n-γ甄别:对于S/St小于γ接受边界BoundaryG(BoundaryG=un-3σn,un为中子分布期望,σn中子分布标准差)的认为是γ射线,S/St大于n接受边界BoundaryN(BoundaryN=uγ+3σγ)的认为是n射线,而对于S/St在BoundaryG与BoundaryN之间(如图3中阴影区域)的无法准确甄别。
目前的n-γ甄别技术,在甄别过程中仅利用了探测器输出脉冲信号的一维或者二维特征信息。上升时间法仅利用了探测器输出中子和γ射线脉冲的上升时间有所差异这一特征;电荷比较法仅利用了中子和γ射线产生的光脉冲的快、慢成分的比例不同这一特征;脉冲梯度法仅利用了中子和γ射线的脉冲衰减时间不同这一特征;小波变换法利用了中子和γ射线产生脉冲在频域上特征信息进行甄别。对于绝大部分n-γ甄别探测器而言,这种利用一维特征信息进行n-γ甄别的方法其甄别效果不理想:在特征空间中存在无法准确甄别的区域。
此外,目前在n-γ甄别中采用过神经网络方法。但是由于计算量和复杂度方面的计算,该方法仅仅使用了脉冲波峰后的20~40nS之间的样本点作为特征信息。同时,神经网络法具有以下两方面缺点:一是该方法结构复杂、网络庞大;二是该方法需要大量已知类别的中子和γ射线在探测器中产生的脉冲信号数据集作为标准样本用于训练,在实际环境中几乎无法获取到足够的这样的标准样本。
发明内容
针对上述现有技术中的不足,本发明提供了一种基于半监督支持向量机的n-γ甄别方法。
本发明的发明目的如下:
1.本方法核心目标是通过利用探测器输出脉冲信号的多维度特征信息(例如,脉冲信号上升时间、下降时间、脉冲幅度、脉冲总电荷量和脉冲慢成分电荷量等)来提升n-γ甄别效果,以实现对现有技术中无法甄别的脉冲信号样本进行甄别分类。
2.本方法通过特征提取预处理提取了脉冲信号中比较重要的几种特征信息,而不是单纯利用脉冲信号的全部原始数据进行向量机训练及甄别,这种方法有效降低了方法的复杂度和方法对训练样本规模的需求。
3.本方法结合传统甄别方法与半监督学习,摆脱了支持向量机训练过程对于标准样本的依赖。
一种基于半监督支持向量机的n-γ甄别方法,其特征在于包括如下步骤:
a)利用模拟数字变换器对探测器输出脉冲信号进行模数变换,收集数字化的探测器脉冲信号,形成训练数据集;利用训练数据集结合半监督的学习方法训练出一个支持向量机,得到一个最优分类超平面;
b)对新探测得到的脉冲进行数字化,并进行特征提取预处理:提取脉冲信号的重要特征信息;
c)将提取到的特征信息输入到支持向量机中,利用上述分类超平面结合上述提取特征进行对新探测到的脉冲样本进行分类预测。
所述步骤a)的详细步骤为利用模拟数字变换器对探测器输出的模拟脉冲信号进行变换和收集,形成一定数量规模(记数据规模为N)的未带标记(即未进行n-γ甄别,每一个脉冲信号所属粒子种类未知)的脉冲信号数据集U1
所述b)的详细步骤为对脉冲信号数据集U1中每一个脉冲信号u1(i)其中(0<i≤N)进行特征信息提取预处理:提取脉冲总电荷量(脉冲全面积)、慢成分电荷量(脉冲t0时刻至峰尾的面积)、上升时间、下降时间及脉冲幅度,即图2所示脉冲信号的全面积S、慢成分电荷面积
Figure BDA0001748943190000041
上升时间TR、下降时间TF和脉冲幅度Amp。并将数据集U1进行特征信息预处理得到的特征信息数据集记为U2,特征数据集中每一条数据记录都包含了S、/>
Figure BDA0001748943190000042
TR、TF和Amp五维特征信息即/>
Figure BDA0001748943190000043
所述特征数据集U2由电荷比较法进行甄别分类,并对数据集U2中电荷比较法能够进行准确甄别的数据记录u2(i)添加相应的类别标签L(i),收集数据集U2中所有带类别标签的数据记录形成带标签数据集U3,数据集中每一条数据记录u3(i)={u2(i),L(i)};剩余无法甄别数据记录形成未带标签数据集U4
所述向量机半监督训练详细步骤为:利用带标签数据集U3训练出一个能够对数据集中数据进行准确分类的支持向量机SVM1,在数据集U3中,寻找到一个划分超平面,将两种类别的样本分开,划分超平面由如下公式(1)得到:ωTu2+b=0,其中ω为寻找的划分超平面的法向量,b为超平面偏移项,u2代表输入特征空间;支持向量机训练过程由如下公式(2)得到:
Figure BDA0001748943190000044
s.t.L(i)(ωTu2(i)+b)≥1-ξii≥0,i=1,2,…,M.,其中M为数据集U3的数据规模,ξi为松弛变量,C>0为一个常数。
所述未带标签数据集U4经过上述步骤中得到的支持向量机SVM1进行分类,并将数据集U4中每一条样本u4(i)的SVM1分类结果作为伪标记PL(i)赋予该样本,从而形成带伪标记的样本数据集U5,该数据集中每一条数据记录u5(i)={u4(i),PL(i)};结合带伪标签的数据集U5和带标签的数据集U3重新训练一个支持向量机SVM2,在训练过程中对数据集U5中要对两个伪标记指派为异类且很可能发生错误的样本进行标记交换。
所述向量机训练过程详细步骤如下:在利用伪标记样本数据集U5重新训练支持向量机的过程中,对公式(2)的训练过程中添加约束项得到新的公式(3):
Figure BDA0001748943190000051
s.t.L(i)(ωTu2(i)+b)≥1-ξi,i=1,2,…,M.
PL(i)(ωTu2(i)+b)≥1-ξi,i=M+1,M+2,…,N.
ξi≥0,i=1,2,…,N.其中CP代表伪标记样本在训练过程中的影响权重,设置0<CP<C,将SVM1代入公式(3)并对数据集U5进行预测,找到两个标记指派为异类并且可能发生错误的伪标记样本,交互其标记;重新基于公式(3)求解超平面,再找出两个标记指派为异类并且可能发生错误的伪标记样本,直至标记指派完成;逐渐增大CP,开始新一轮的训练,直至CP=C;完成训练后得到的SVM即目标SVM。
本发明的有益效果:
1.本发明所涉及到的方法对脉冲进行分类甄别时利用了脉冲的多维度特征信息。
2.本发明利用了支持向量机寻找一个最优划分超平面,以实现数据集在高纬度特征空间中高效分类。
3.本发明支持向量机在半监督学习训练过程中利用了传统n-γ甄别方法的甄别结果作为训练样本。而不是利用模拟得到的脉冲数据集作为训练样本集,最大程度保证了训练数据集与实际应用待甄别数据的一致性。
4.本发明支持向量机在进行向量机训练之前对训练样本数据集进行了特征提取预处理。而不是将原始的全部脉冲信息作为特征进行向量机训练,降低了支持向量机训练阶段的时间和计算能力开销。
5.本发明提出的基于半监督支持向量机的n-γ甄别方法,在对脉冲进行分类甄别时利用了脉冲的多维度特征信息,而不是传统方法的一维特征信息;利用更多维度的特征信息可提高甄别精度,实现对传统甄别方法中存在的无法甄别区域进行甄别。
6.本发明提出的基于半监督支持向量机的n-γ甄别方法,利用传统甄别方法能够进行准确甄别分类的样本子集作为支持向量机的训练数据集,这种方案最大程度保证了训练数据集与实际待甄别分类数据的一致性,同时摆脱了训练过程中对模拟数据集的依赖。
7.本发明提出的基于半监督支持向量机的n-γ甄别方法,在支持向量机训练和利用向量机对未标记样本进行分类预测之前进行了特征提取预处理,提取了脉冲信号幅度、脉冲信号总电荷量、慢成分电荷量、脉冲上升时间和脉冲下降时间作为脉冲信号特征矩阵,这种方案降低了支持向量机在训练过程中的时间和计算性能消耗,同时降低了对训练数据集规模的需求。
附图说明
图1为现有技术中辐射探测器结构示意;
图2为现有技术中探测器输出电流脉冲示意图;
图3为现有技术中中子和γ射线在S/St特征空间中的统计分布示意图;
图4为本发明中涉及基于半监督支持向量机的n-γ甄别方法的流程图;
图5为本发明中支持向量机半监督训练过程的流程图;
图6为本发明中利用数据集U5和U3训练支持向量机的流程图。
具体实施方式
实施例1:
一种基于半监督支持向量机的n-γ甄别方法,其特征在于包括如下步骤:
a)利用模拟数字变换器对探测器输出脉冲信号进行模数变换,收集数字化的探测器脉冲信号,形成训练数据集;利用训练数据集结合半监督的学习方法训练出一个支持向量机,得到一个最优分类超平面;
b)对新探测得到的脉冲进行数字化,并进行特征提取预处理:提取脉冲信号的重要特征信息;
c)将提取到的特征信息输入到支持向量机中,利用上述分类超平面结合上述提取特征进行对新探测到的脉冲样本进行分类预测。
所述步骤a)的详细步骤为利用模拟数字变换器对探测器输出的模拟脉冲信号进行变换和收集,形成一定数量规模(记数据规模为N)的未带标记(即未进行n-γ甄别,每一个脉冲信号所属粒子种类未知)的脉冲信号数据集U1
所述b)的详细步骤为对脉冲信号数据集U1中每一个脉冲信号u1(i)其中(0<i≤N)进行特征信息提取预处理:提取脉冲总电荷量(脉冲全面积)、慢成分电荷量(脉冲t0时刻至峰尾的面积)、上升时间、下降时间及脉冲幅度,即图2所示脉冲信号的全面积S、慢成分电荷面积
Figure BDA0001748943190000071
上升时间TR、下降时间TF和脉冲幅度Amp。并将数据集U1进行特征信息预处理得到的特征信息数据集记为U2,特征数据集中每一条数据记录都包含了S、/>
Figure BDA0001748943190000072
TR、TF和Amp五维特征信息即/>
Figure BDA0001748943190000073
所述特征数据集U2由电荷比较法进行甄别分类,并对数据集U2中电荷比较法能够进行准确甄别的数据记录u2(i)添加相应的类别标签L(i),收集数据集U2中所有带类别标签的数据记录形成带标签数据集U3,数据集中每一条数据记录u3(i)={u2(i),L(i)};剩余无法甄别数据记录形成未带标签数据集U4
所述向量机半监督训练详细步骤为:利用带标签数据集U3训练出一个能够对数据集中数据进行准确分类的支持向量机SVM1,在数据集U3中,寻找到一个划分超平面,将两种类别的样本分开,划分超平面由如下公式(1)得到:ωTu2+b=0,其中ω为寻找的划分超平面的法向量,b为超平面偏移项,u2代表输入特征空间;支持向量机训练过程由如下公式(2)得到:
Figure BDA0001748943190000081
s.t.L(i)(ωTu2(i)+b)≥1-ξii≥0,i=1,2,…,M.,其中M为数据集U3的数据规模,ξi为松弛变量,C>0为一个常数。
实施例2:
一种基于半监督支持向量机的n-γ甄别方法,其特征在于包括如下步骤:
a)利用模拟数字变换器对探测器输出脉冲信号进行模数变换,收集数字化的探测器脉冲信号,形成训练数据集;利用训练数据集结合半监督的学习方法训练出一个支持向量机,得到一个最优分类超平面;
b)对新探测得到的脉冲进行数字化,并进行特征提取预处理:提取脉冲信号的重要特征信息;
c)将提取到的特征信息输入到支持向量机中,利用上述分类超平面结合上述提取特征进行对新探测到的脉冲样本进行分类预测。
所述步骤a)的详细步骤为利用模拟数字变换器对探测器输出的模拟脉冲信号进行变换和收集,形成一定数量规模(记数据规模为N)的未带标记(即未进行n-γ甄别,每一个脉冲信号所属粒子种类未知)的脉冲信号数据集U1
所述b)的详细步骤为对脉冲信号数据集U1中每一个脉冲信号u1(i)其中(0<i≤N)进行特征信息提取预处理:提取脉冲总电荷量(脉冲全面积)、慢成分电荷量(脉冲t0时刻至峰尾的面积)、上升时间、下降时间及脉冲幅度,即图2所示脉冲信号的全面积S、慢成分电荷面积
Figure BDA0001748943190000082
上升时间TR、下降时间TF和脉冲幅度Amp。并将数据集U1进行特征信息预处理得到的特征信息数据集记为U2,特征数据集中每一条数据记录都包含了S、/>
Figure BDA0001748943190000083
TR、TF和Amp五维特征信息即/>
Figure BDA0001748943190000084
实施例3:
一种基于半监督支持向量机的n-γ甄别方法,其特征在于包括如下步骤:
a)利用模拟数字变换器对探测器输出脉冲信号进行模数变换,收集数字化的探测器脉冲信号,形成训练数据集;利用训练数据集结合半监督的学习方法训练出一个支持向量机,得到一个最优分类超平面;
b)对新探测得到的脉冲进行数字化,并进行特征提取预处理:提取脉冲信号的重要特征信息;
c)将提取到的特征信息输入到支持向量机中,利用上述分类超平面结合上述提取特征进行对新探测到的脉冲样本进行分类预测。
所述步骤a)的详细步骤为利用模拟数字变换器对探测器输出的模拟脉冲信号进行变换和收集,形成一定数量规模(记数据规模为N)的未带标记(即未进行n-γ甄别,每一个脉冲信号所属粒子种类未知)的脉冲信号数据集U1
所述b)的详细步骤为对脉冲信号数据集U1中每一个脉冲信号u1(i)其中(0<i≤N)进行特征信息提取预处理:提取脉冲总电荷量(脉冲全面积)、慢成分电荷量(脉冲t0时刻至峰尾的面积)、上升时间、下降时间及脉冲幅度,即图2所示脉冲信号的全面积S、慢成分电荷面积
Figure BDA0001748943190000091
上升时间TR、下降时间TF和脉冲幅度Amp。并将数据集U1进行特征信息预处理得到的特征信息数据集记为U2,特征数据集中每一条数据记录都包含了S、/>
Figure BDA0001748943190000092
TR、TF和Amp五维特征信息即/>
Figure BDA0001748943190000093
所述特征数据集U2由电荷比较法进行甄别分类,并对数据集U2中电荷比较法能够进行准确甄别的数据记录u2(i)添加相应的类别标签L(i),收集数据集U2中所有带类别标签的数据记录形成带标签数据集U3,数据集中每一条数据记录u3(i)={u2(i),L(i)};剩余无法甄别数据记录形成未带标签数据集U4
实施例4:
一种基于半监督支持向量机的n-γ甄别方法,其特征在于包括如下步骤:
a)利用模拟数字变换器对探测器输出脉冲信号进行模数变换,收集数字化的探测器脉冲信号,形成训练数据集;利用训练数据集结合半监督的学习方法训练出一个支持向量机,得到一个最优分类超平面;
b)对新探测得到的脉冲进行数字化,并进行特征提取预处理:提取脉冲信号的重要特征信息;
c)将提取到的特征信息输入到支持向量机中,利用上述分类超平面结合上述提取特征进行对新探测到的脉冲样本进行分类预测。
所述步骤a)的详细步骤为利用模拟数字变换器对探测器输出的模拟脉冲信号进行变换和收集,形成一定数量规模(记数据规模为N)的未带标记(即未进行n-γ甄别,每一个脉冲信号所属粒子种类未知)的脉冲信号数据集U1
所述b)的详细步骤为对脉冲信号数据集U1中每一个脉冲信号u1(i)其中(0<i≤N)进行特征信息提取预处理:提取脉冲总电荷量(脉冲全面积)、慢成分电荷量(脉冲t0时刻至峰尾的面积)、上升时间、下降时间及脉冲幅度,即图2所示脉冲信号的全面积S、慢成分电荷面积
Figure BDA0001748943190000101
上升时间TR、下降时间TF和脉冲幅度Amp。并将数据集U1进行特征信息预处理得到的特征信息数据集记为U2,特征数据集中每一条数据记录都包含了S、/>
Figure BDA0001748943190000102
TR、TF和Amp五维特征信息即/>
Figure BDA0001748943190000103
所述特征数据集U2由电荷比较法进行甄别分类,并对数据集U2中电荷比较法能够进行准确甄别的数据记录u2(i)添加相应的类别标签L(i),收集数据集U2中所有带类别标签的数据记录形成带标签数据集U3,数据集中每一条数据记录u3(i)={u2(i),L(i)};剩余无法甄别数据记录形成未带标签数据集U4
所述向量机半监督训练详细步骤为:利用带标签数据集U3训练出一个能够对数据集中数据进行准确分类的支持向量机SVM1,在数据集U3中,寻找到一个划分超平面,将两种类别的样本分开,划分超平面由如下公式(1)得到:ωTu2+b=0,其中ω为寻找的划分超平面的法向量,b为超平面偏移项,u2代表输入特征空间;支持向量机训练过程由如下公式(2)得到:
Figure BDA0001748943190000111
s.t.L(i)(ωTu2(i)+b)≥1-ξii≥0,i=1,2,…,M.,其中M为数据集U3的数据规模,ξi为松弛变量,C>0为一个常数。
所述未带标签数据集U4经过上述步骤中得到的支持向量机SVM1进行分类,并将数据集U4中每一条样本u4(i)的SVM1分类结果作为伪标记PL(i)赋予该样本,从而形成带伪标记的样本数据集U5,该数据集中每一条数据记录u5(i)={u4(i),PL(i)};结合带伪标签的数据集U5和带标签的数据集U3重新训练一个支持向量机SVM2,在训练过程中对数据集U5中要对两个伪标记指派为异类且很可能发生错误的样本进行标记交换。
实施例5:
一种基于半监督支持向量机的n-γ甄别方法,其特征在于包括如下步骤:
a)利用模拟数字变换器对探测器输出脉冲信号进行模数变换,收集数字化的探测器脉冲信号,形成训练数据集;利用训练数据集结合半监督的学习方法训练出一个支持向量机,得到一个最优分类超平面;
b)对新探测得到的脉冲进行数字化,并进行特征提取预处理:提取脉冲信号的重要特征信息;
c)将提取到的特征信息输入到支持向量机中,利用上述分类超平面结合上述提取特征进行对新探测到的脉冲样本进行分类预测。
所述步骤a)的详细步骤为利用模拟数字变换器对探测器输出的模拟脉冲信号进行变换和收集,形成一定数量规模(记数据规模为N)的未带标记(即未进行n-γ甄别,每一个脉冲信号所属粒子种类未知)的脉冲信号数据集U1
所述b)的详细步骤为对脉冲信号数据集U1中每一个脉冲信号u1(i)其中(0<i≤N)进行特征信息提取预处理:提取脉冲总电荷量(脉冲全面积)、慢成分电荷量(脉冲t0时刻至峰尾的面积)、上升时间、下降时间及脉冲幅度,即图2所示脉冲信号的全面积S、慢成分电荷面积
Figure BDA0001748943190000121
上升时间TR、下降时间TF和脉冲幅度Amp。并将数据集U1进行特征信息预处理得到的特征信息数据集记为U2,特征数据集中每一条数据记录都包含了S、/>
Figure BDA0001748943190000122
TR、TF和Amp五维特征信息即/>
Figure BDA0001748943190000124
所述特征数据集U2由电荷比较法进行甄别分类,并对数据集U2中电荷比较法能够进行准确甄别的数据记录u2(i)添加相应的类别标签L(i),收集数据集U2中所有带类别标签的数据记录形成带标签数据集U3,数据集中每一条数据记录u3(i)={u2(i),L(i)};剩余无法甄别数据记录形成未带标签数据集U4
所述向量机半监督训练详细步骤为:利用带标签数据集U3训练出一个能够对数据集中数据进行准确分类的支持向量机SVM1,在数据集U3中,寻找到一个划分超平面,将两种类别的样本分开,划分超平面由如下公式(1)得到:ωTu2+b=0,其中ω为寻找的划分超平面的法向量,b为超平面偏移项,u2代表输入特征空间;支持向量机训练过程由如下公式(2)得到:
Figure BDA0001748943190000123
s.t.L(i)(ωTu2(i)+b)≥1-ξii≥0,i=1,2,…,M.,其中M为数据集U3的数据规模,ξi为松弛变量,C>0为一个常数。
所述未带标签数据集U4经过上述步骤中得到的支持向量机SVM1进行分类,并将数据集U4中每一条样本u4(i)的SVM1分类结果作为伪标记PL(i)赋予该样本,从而形成带伪标记的样本数据集U5,该数据集中每一条数据记录u5(i)={u4(i),PL(i)};结合带伪标签的数据集U5和带标签的数据集U3重新训练一个支持向量机SVM2,在训练过程中对数据集U5中要对两个伪标记指派为异类且很可能发生错误的样本进行标记交换。
所述向量机训练过程详细步骤如下:在利用伪标记样本数据集U5重新训练支持向量机的过程中,对公式(2)的训练过程中添加约束项得到新的公式(3):
Figure BDA0001748943190000131
s.t.L(i)(ωTu2(i)+b)≥1-ξi,i=1,2,…,M.
PL(i)(ωTu2(i)+b)≥1-ξi,i=M+1,M+2,…,N.
ξi≥0,i=1,2,…,N.其中CP代表伪标记样本在训练过程中的影响权重,设置0<CP<C,将SVM1代入公式(3)并对数据集U5进行预测,找到两个标记指派为异类并且可能发生错误的伪标记样本,交互其标记;重新基于公式(3)求解超平面,再找出两个标记指派为异类并且可能发生错误的伪标记样本,直至标记指派完成;逐渐增大CP,开始新一轮的训练,直至CP=C;完成训练后得到的SVM即目标SVM。

Claims (2)

1.一种基于半监督支持向量机的n-γ甄别方法,其特征在于包括如下步骤:
a)利用模拟数字变换器对探测器输出脉冲信号进行模数变换,收集数字化的探测器脉冲信号,形成一定数量规模的未带标记的脉冲信号数据集U1,所述数量规模设定为N,其中,0<i≤N;利用训练数据集结合半监督的学习方法训练出一个支持向量机,得到一个最优分类超平面;
b)对新探测得到的脉冲进行数字化,并进对脉冲信号数据集U1中每一个脉冲信号u1(i)进行特征信息提取预处理:提取脉冲信号的全面积S、慢成分电荷面积
Figure QLYQS_1
上升时间TR、下降时间TF和脉冲幅度Amp,并将脉冲信号数据集U1进行特征信息预处理得到的特征信息数据集记为U2,特征信息数据集中每一条数据记录都包含了S、/>
Figure QLYQS_2
TR、TF和Amp五维特征信息即
Figure QLYQS_3
c)将提取到的特征信息输入到支持向量机中,利用上述分类超平面结合上述提取特征进行对新探测到的脉冲样本进行分类预测;
所述特征信息数据集U2由电荷比较法进行甄别分类,并对数据集U2中电荷比较法能够进行准确甄别的数据记录u2(i)添加相应的类别标签L(i),收集数据集U2中所有带类别标签的数据记录形成带标签数据集U3,数据集中每一条数据记录u3(i)={u2(i),L(i)};剩余无法甄别数据记录形成未带标签数据集U4
向量机半监督训练详细步骤为:利用带标签数据集U3训练出一个能够对数据集中数据进行准确分类的支持向量机SVM1,在数据集U3中,寻找到一个划分超平面,将两种类别的样本分开,划分超平面由如下公式(1)得到:
ωTu2+b=0 (1)
其中,ω为寻找的划分超平面的法向量,b为超平面偏移项,u2代表输入特征空间;
支持向量机训练过程由如下公式(2)得到:
Figure QLYQS_4
其中,M为数据集U3的数据规模,ξi为松弛变量;C>0,C为一个常数;所述未带标签数据集U4经过上述步骤中得到的支持向量机SVM1进行分类,并将数据集U4中每一条样本u4(i)的SVM1分类结果作为伪标记PL(i)赋予该样本,从而形成带伪标记的样本数据集U5,该数据集中每一条数据记录u5(i)={u4(i),PL(i)};结合带伪标签的数据集U5和带标签的数据集U3重新训练一个支持向量机SVM2,在训练过程中对数据集U5中要对两个伪标记指派为异类且很可能发生错误的样本进行标记交换。
2.根据权利要求1所述一种基于半监督支持向量机的n-γ甄别方法,其特征在于:所述向量机训练过程详细步骤如下:在利用伪标记样本数据集U5重新训练支持向量机的过程中,对公式(2)的训练过程中添加约束项得到新的公式(3):
Figure QLYQS_5
s.t.L(i)(ωTu2(i)+b)≥1-ξi,i=1,2,…,M
PL(i)(ωTu2(i)+b)≥1-ξi,i=M+1,M+2,…,N
ξi≥0,i=1,2,…,N (3)
其中:CP代表伪标记样本在训练过程中的影响权重;
设置0<CP<C,将SVM1代入公式(3)并对数据集U5进行预测,找到两个标记指派为异类并且可能发生错误的伪标记样本,交互其标记;重新基于公式(3)求解超平面,再找出两个标记指派为异类并且可能发生错误的伪标记样本,直至标记指派完成;逐渐增大CP,开始新一轮的训练,直至CP=C;完成训练后得到的SVM即目标SVM。
CN201810857700.0A 2018-07-31 2018-07-31 一种基于半监督支持向量机的n-γ甄别方法 Active CN110781906B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810857700.0A CN110781906B (zh) 2018-07-31 2018-07-31 一种基于半监督支持向量机的n-γ甄别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810857700.0A CN110781906B (zh) 2018-07-31 2018-07-31 一种基于半监督支持向量机的n-γ甄别方法

Publications (2)

Publication Number Publication Date
CN110781906A CN110781906A (zh) 2020-02-11
CN110781906B true CN110781906B (zh) 2023-05-30

Family

ID=69383132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810857700.0A Active CN110781906B (zh) 2018-07-31 2018-07-31 一种基于半监督支持向量机的n-γ甄别方法

Country Status (1)

Country Link
CN (1) CN110781906B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023166592A1 (ja) * 2022-03-02 2023-09-07 三菱電機株式会社 学習装置および中性子計測装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999057622A2 (en) * 1998-05-01 1999-11-11 Barnhill Technologies, Llc Pre-processing and post-processing for enhancing knowledge discovery using support vector machines
CN104598813A (zh) * 2014-12-09 2015-05-06 西安电子科技大学 一种基于集成学习和半监督svm的计算机入侵检测方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8173970B2 (en) * 2005-02-04 2012-05-08 Dan Inbar Detection of nuclear materials
US7388206B2 (en) * 2006-06-16 2008-06-17 Ge Homeland Protection, Inc. Pulse shape discrimination method and apparatus for high-sensitivity radioisotope identification with an integrated neutron-gamma radiation detector
US9029784B1 (en) * 2011-09-28 2015-05-12 The United States Of America As Represented By The Secretary Of The Navy Spectrally resolved pulse height analysis for neutron-gamma discrimination
JP6083637B2 (ja) * 2012-07-17 2017-02-22 国立研究開発法人日本原子力研究開発機構 シンチレータを用いた中性子検出器及び中性子イメージ検出器
JP2014026455A (ja) * 2012-07-26 2014-02-06 Nippon Telegr & Teleph Corp <Ntt> メディアデータ解析装置、方法、及びプログラム
US9435755B2 (en) * 2012-09-20 2016-09-06 Rhombus Holdings Llc Scalable and tunable neutron detection instrument
CN103150578A (zh) * 2013-04-09 2013-06-12 山东师范大学 一种基于半监督学习的支持向量机分类器训练方法
CN104536032B (zh) * 2014-12-23 2017-05-17 四川大学 基于支持向量机的液体闪烁体探测器n/γ射线甄别方法
CN105989331B (zh) * 2015-02-11 2019-10-08 佳能株式会社 脸部特征提取装置、脸部特征提取方法、图像处理设备和图像处理方法
CN106908346B (zh) * 2017-02-23 2018-07-13 中国地质大学(武汉) 一种土体含水率的快速原位测试试验装置和方法
CN107272049B (zh) * 2017-07-13 2019-01-08 成都理工大学 基于脉冲宽度的数字n-γ甄别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999057622A2 (en) * 1998-05-01 1999-11-11 Barnhill Technologies, Llc Pre-processing and post-processing for enhancing knowledge discovery using support vector machines
CN104598813A (zh) * 2014-12-09 2015-05-06 西安电子科技大学 一种基于集成学习和半监督svm的计算机入侵检测方法

Also Published As

Publication number Publication date
CN110781906A (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
Liu et al. A digital method for the discrimination of neutrons and $\gamma $ rays with organic scintillation detectors using frequency gradient analysis
CN104536032B (zh) 基于支持向量机的液体闪烁体探测器n/γ射线甄别方法
CN109063741A (zh) 一种基于希尔伯特曲线变换与深度学习的能谱分析方法
CN107390259A (zh) 一种基于svd和svm的核素识别方法
Wurtz et al. Methodology and performance comparison of statistical learning pulse shape classifiers as demonstrated with organic liquid scintillator
CN110187378A (zh) 用于鉴别中子和伽马的中子探测器及数据处理方法
Nakhostin A general-purpose digital pulse shape discrimination algorithm
CN110781906B (zh) 一种基于半监督支持向量机的n-γ甄别方法
Woldegiorgis et al. ResNet and CycleGAN for pulse shape discrimination of He-4 detector pulses: Recovering pulses conventional algorithms fail to label unanimously
Wang Gd-containing scintillators for thermal neutron detection via graph-based particle discrimination
Tambouratzis et al. A comparison of artificial neural network performance: The case of neutron/gamma pulse shape discrimination
CN105005068A (zh) 一种脉冲分类的方法与系统
Ma et al. Comparison of artificial intelligence algorithms and traditional algorithms in detector Neutron/Gamma discrimination
Jung et al. Pulse shape discrimination using a convolutional neural network for organic liquid scintillator signals
Saleh et al. Pulse shape discrimination techniques based on cross-correlation and principal component analysis
Van Chuan et al. A composite method for improving the pulse shape discrimination efficiency of a scintillation detector using EJ-301 liquid
EP3676640B1 (en) Methods and systems for calibration of particle detectors
Wurtz Consistent principles for particle identification by pulse shape discriminating systems
Friesen et al. A functional form for liquid scintillator pulse shapes
Altayeb et al. TinyML gamma radiation classifier
Chandhran et al. Neutron and gamma ray discrimination for CLYC using normalized cross correlation analysis
Zhang et al. Isotope Identification Using Artificial Neural Network Ensembles and Bin-Ratios
Pollastrone et al. A clustering algorithm for scintillator signals applied to neutron and gamma patterns identification
Wurtz Consistent Principles for Particle Identification by PSD Systems
Reva et al. Computer methods of recognition and analysis of X-ray and gamma radiation parameters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant