CN110598760B - 一种变压器振动数据无监督特征选择方法 - Google Patents

一种变压器振动数据无监督特征选择方法 Download PDF

Info

Publication number
CN110598760B
CN110598760B CN201910788573.8A CN201910788573A CN110598760B CN 110598760 B CN110598760 B CN 110598760B CN 201910788573 A CN201910788573 A CN 201910788573A CN 110598760 B CN110598760 B CN 110598760B
Authority
CN
China
Prior art keywords
feature
subset
transformer
features
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910788573.8A
Other languages
English (en)
Other versions
CN110598760A (zh
Inventor
李中
景阳
张铁峰
张卫华
张珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN201910788573.8A priority Critical patent/CN110598760B/zh
Publication of CN110598760A publication Critical patent/CN110598760A/zh
Application granted granted Critical
Publication of CN110598760B publication Critical patent/CN110598760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明提出了一种变压器振动数据无监督特征选择方法。在缺乏故障类别等先验知识的条件下,完成变压器振动数据的特征提取:首先基于互信息分析特征与振动数据之间的相关性、以及特征与已选特征之间的冗余性,然后计算特征的潜在信息增益,最后根据信息增益惩罚因子完成变压器振动数据的特征选择。本发明综合考虑待选特征所能带来的新信息和冗余信息的多少进行选择,因而能够准确和高效提取变压器振动数据特征。

Description

一种变压器振动数据无监督特征选择方法
技术领域
本发明属于电力领域,尤其涉及一种变压器振动数据无监督特征选择方法。
背景技术
变压器是电力系统的关键设备之一,基于振动分析评价变压器运行状态意义重大。在变压器振动在线监测过程中,从高维振动数据中选择一个规模较小有效表征变压器运行状态的特征子集,是实现振动法分析评价变压器运行状态的关键。高维振动数据中有些特征是冗余的甚至不相关的,这些特征会降低变压器在线监测的效率和性能。通过特征选择来降低数据特征维数,是一种提高变压器在线监测水平的有效方法。
根据是否已知待处理数据的类别信息,特征选择问题可以划分为两类。一类是有监督的特征选择,即在已知数据类别信息条件下进行特征选择;另一类是无监督的特征选择,由于缺少类别信息等先验知识,给选择潜在类别相关的特征带来了困难。目前,大量振动在线监测数据是变压器正常运行条件下的正常数据,没有故障类别信息,其特征选择属于无监督特征选择。
发明内容
在大数据时代,各个行业在发展的过程中产生大量数据,这些高维数据具有类型多,数量大,数据分析难的特点。因此,对大量高维数据必须采用科学的数据分析方法,从而提高数据的利用率。在变压器振动在线监测过程中也会产生大量高维数据,需要利用特征选择对大量高维数据进行分析处理。现有针对高维振动数据基于信息论的特征选择方法,往往将特征的相关性与冗余性分割考虑,没有综合考虑特征对已选特征子集带来的新信息和冗余信息的多少,无法提取精准表征变压器运行状态的振动特征。
为了能提取精准表征变压器运行状态的振动特征,本发明提出了一种变压器振动数据无监督特征选择方法,具体地,可以是一种变压器在线监测过程中基于信息增益的无监督特征选择方法,即在缺乏故障类别等先验知识的条件下,综合考虑特征对已选特征子集带来的新信息与冗余信息的多少,从信息增益分析的角度,提出一种变压器在线监测过程中基于信息增益的无监督特征选择方法,有效提取表征变压器运行状态的振动信号特征。该方法基于互信息分析特征与原始数据之间的相关性、以及特征与已选特征之间的冗余性,进而计算分析特征的潜在信息增益,最后根据信息增益惩罚因子完成变压器振动高维振动数据的特征选择。本发明综合考虑待选特征所能带来的新信息和冗余信息的多少进行选择,因而能够准确和高效提取变压器振动数据特征。
本发明提出的一种变压器振动数据无监督特征选择方法,所述方法包括:
a:D={f1,f2,f3,...,fn}为变压器在线监测过程中得到的所述高维振动数据的原始特征集合,每维特征fi为一个N维列向量,N为样本总数,n为特征维数,U为已选特征子集,初始为空集,初始状态下待选集合为原始特征全集。
b:根据互信息理论将原始特征集合D中各维特征fi进行离散化得到离散化矩阵DL
c:计算DL中特征之间的互信息I(fi;fj),得到互信息矩阵I;其具体的计算方法是:
其中xi为特征f中可能的取值,p(xi)是特征f为不同可能取值时的概率。
I(fa;fb)=H(fa)-H(fa|fb)=I(fb;fa)
其中fa={x1,x2,x3,...,xn},fb={y1,y2,y3,...,yn},p(xi)是特征fa为不同可能取值时的概率,p(yi)是特征fb为不同可能取值时的概率。
d:计算待选特征fi的特征相关度Rel(fi),其具体方法为:原始数据为D={f1,f2,f3…,fn},则其中某一特征fi的特征相关度为:
上式中H(fi)为特征fi中所含的信息量。H(fi)的值越大,那么特征fi中所含有的信息量就越多。指的是特征fi与其他特征所共有的信息量。
e:选择计算后特征相关度最大值对应的特征作为第一个特征入选特征子集U,则待选特征集合D=D-U;
f:计算待选特征fi的特征冗余度Red(fi);其具体方法为:
设已选特征子集U={u1,u2,u3,…,ut},待选特征fi的特征冗余度为
式中I(fi;uk)是指待选特征fi与已选特征集合U中每一个特征uk的互信息;
g:计算待选特征fi的潜在信息增益G,其具体方法是:
式中fk为待选特征集合中的其他特征。
h:将步骤g中计算的潜在信息增益G进行比较,选择潜在信息增益最大值对应的特征加入特征子集;
i:计算步骤h中新加入特征子集的特征的增益惩罚因子C,其具体公式如下:
式中指的是已选特征子集中的所有特征fj的特征冗余度之和。
将计算得到的新加入特征子集的特征的增益惩罚因子C与预设的阈值Cd进行比较,判断该待选特征是否加入特征子集U,当C>Cd时,该待选特征加入特征子集U中,当C<Cd时,该待选特征不加入特征子集U中,其中预设的阈值Cd可以根据实际情况随时调整。
j:重复执行步骤f至i,直到步骤i中计算的增益惩罚因子C值小于给预设的阈值Cd,从而终止重复步骤f至i,得到最终的特征子集S,所述特征子集S能够精确表征变压器运行状态的振动特征。
在上述特征选择过程中,综合考虑特征与原始数据之间的相关性以及特征与特征之间的冗余性,从高维振动数据的原始特征集合中选择一个规模较小的特征子集,在有效降低数据维度的基础上优于原始数据的分类精度,所以得到的特征子集能够准确表征变压器运行状态的振动特征。
可见,本发明应用于变压器高维振动数据的特征选择,特别是在缺乏故障类别等先验知识的条件下,计算简便、速度快,是一种提高变压器在线监测水平的有效方法。本发明方法基于互信息分析特征与原始数据之间的相关性以及特征与已选特征之间的冗余性,由此计算特征的潜在信息增益,根据潜在信息增益对特征进行排序,再利用增益惩罚因子完成变压器振动高维数据的特征选择。针对高维振动数据在特征选择过程中,综合考虑特征与原始数据之间的相关性以及特征与特征之间的冗余性,从原始高维振动数据中选择一个规模较小的特征子集,在有效降低数据维度的基础上优于原始数据的分类精度,所以能够提取准确表征变压器运行状态的振动特征。
附图说明
图1是本发明提出的变压器振动数据无监督特征选择方法的流程图。
具体实施方式
在大数据时代,各个行业在发展的过程中产生大量数据,这些高维数据具有类型多,数量大,数据分析难的特点。因此,对大量高维数据必须采用科学的数据分析方法,从而提高数据的利用率。在变压器振动在线监测过程中,也会产生大量高维数据,需要利用特征选择对大量高维数据进行分析处理。现有针对高维振动数据基于信息论的特征选择方法,往往将特征的相关性与冗余性分割考虑,没有综合考虑特征带来的相关信息和对已选特征子集带来的冗余信息的多少,无法提取精准表征变压器运行状态的振动特征。
为了能提取精准表征变压器运行状态的振动特征,本发明提出了一种变压器振动数据无监督特征选择方法,具体地,可以是一种变压器在线监测过程中基于信息增益的无监督特征选择方法,即在缺乏故障类别等先验知识的条件下,综合考虑特征对已选特征子集带来的相关信息与冗余信息的多少,从信息增益分析的角度,提出一种变压器在线监测过程中基于信息增益的无监督特征选择方法,有效提取表征变压器运行状态的振动信号特征。该方法基于互信息分析特征与原始数据之间的相关性、以及特征与已选特征之间的冗余性,进而计算分析特征的潜在信息增益,最后根据信息增益惩罚因子完成变压器振动高维振动数据的特征选择。本发明综合考虑待选特征所能带来的新信息和冗余信息的多少进行选择,因而能够准确和高效提取变压器振动数据特征。
一种变压器振动数据无监督特征选择方法,具体地,可以说是一种变压器在线监测过程中基于信息增益的无监督特征选择方法,该方法的过程如下:
a:D={f1,f2,f3,...,fn}为变压器在线监测过程中得到的所述高维振动数据的原始特征集合,每维特征fi为一个N维列向量,N为样本总数,n为特征维数,U为已选特征子集,初始为空集,初始状态下待选集合为原始特征全集。
b:根据互信息理论将原始特征集合D中各维特征fi进行离散化得到离散化矩阵DL
c:计算DL中特征之间的互信息I(fi;fj),得到互信息矩阵I;其具体的计算方法是:
其中xi为特征f中可能的取值,p(xi)是特征f为不同可能取值时的概率。
I(fa;fb)=H(fa)-H(fa|fb)=I(fb;fa)
其中fa={x1,x2,x3,...,xn},fb={y1,y2,y3,...,yn},p(xi)是特征fa为不同可能取值时的概率,p(yi)是特征fb为不同可能取值时的概率。
d:计算待选特征fi的特征相关度Rel(fi),其具体方法为:原始数据为D={f1,f2,f3…,fn},则其中某一特征fi的特征相关度为:
上式中H(fi)为特征fi中所含的信息量。H(fi)的值越大,那么特征fi中所含有的信息量就越多。指的是特征fi与其他特征所共有的信息量。
e:选择计算后特征相关度最大值对应的特征作为第一个特征入选特征子集U,则待选特征集合D=D-U;
f:计算待选特征fi的特征冗余度Red(fi);其具体方法为:
设已选特征子集U={u1,u2,u3,…,ut},待选特征fi的特征冗余度为
式中I(fi;uk)是指待选特征fi与已选特征集合U中每一个特征uk的互信息;
g:计算待选特征fi的潜在信息增益G,其具体方法是:
式中fk为待选特征集合中的其他特征。
h:将步骤g中计算的潜在信息增益G进行比较,选择潜在信息增益最大值对应的特征加入特征子集;
i:计算步骤h中新加入特征子集的特征的增益惩罚因子C,其具体公式如下:
式中指的是已选特征子集中的所有特征的特征冗余度之和。
将计算得到的新加入特征子集的特征的增益惩罚因子C与预设的阈值Cd进行比较,判断该待选特征是否加入特征子集U,当C>Cd时,该待选特征加入特征子集U中,当C<Cd时,该待选特征不加入特征子集U中,其中预设的阈值Cd可以根据实际情况随时调整。
j:重复执行步骤f至i,直到步骤i中计算的增益惩罚因子C值小于给预设的阈值Cd,从而终止重复步骤f至i,得到最终的特征子集S。
可见,本发明提供一种基于信息增益的无监督特征选择方法,应用于变压器在线监测过程中的数据处理。首先基于互信息技术分析计算待选特征的特征相关度以及特征冗余度,再计算待选特征入选后带来的潜在信息增益,根据潜在信息增益对特征进行排序,最后利用增益惩罚因子进行特征选择,确定特征选择过程中特征维数,得到一组合理的特征子集。
上述基于互信息技术分析计算待选特征的特征相关度以及特征冗余度的步骤是:将原始数据进行离散化,计算各特征所含有的信息量,基于互信息理论计算待选特征的特征相关度与特征冗余度。本发明将某特征的特征相关度定义为该特征所含有的信息量和该特征与其他特征所共有的信息量,并将特征冗余度定义为待选特征如果加入到已选特征集合中,对已选特征集合带来的冗余信息,即待选特征与已选特征集合共有的信息量。
上述计算待选特征入选后带来的潜在信息增益,对特征进行排序的步骤是:计算待选特征集合中特征的潜在信息增益,然后按照其值的大小选择最大的潜在信息增益所对应的特征进行排序。
上述利用增益惩罚因子进行特征选择,确定特征选择过程中特征维数,得到一组合理的特征子集的步骤是:计算新加入特征子集的特征的增益惩罚因子,并利用阈值确定最终是否加入到特征子集中,根据阈值得到一组合理的特征子集。
本发明应用于变压器高维振动数据的特征选择,特别是在缺乏故障类别等先验知识的条件下,计算简便、速度快,是一种提高变压器在线监测水平的有效方法。本发明方法基于互信息分析特征与原始数据之间的相关性以及特征与已选特征之间的冗余性,由此计算特征的潜在信息增益,根据潜在信息增益对特征进行排序,再利用增益惩罚因子完成变压器振动高维数据的特征选择。在特征选择过程中,综合考虑特征与原始数据之间的相关性以及特征与特征之间的冗余性,从原始数据中选择一个规模较小的特征子集,在有效降低数据维度的基础上优于原始数据的分类精度。
本发明针对变压器高维振动数据,提供了一种基于信息增益的无监督特征选择方法,在先验知识缺乏的情况下,提取准确有效的变压器振动信号特征,提取的振动信号特征能够精准描述变压器运行状态,可用于基于振动法的变压器状态评价和智能诊断。其步骤是,首先按照一定的离散化方法分别对每维特征数据进行离散化,将离散化后的各维特征基于互信息理论计算特征之间的互信息,在特征选择过程中,计算每个待选特征的特征相关度与特征冗余度,进而计算该待选特征的潜在信息增益,比较特征的潜在信息增益,选择最大值对应的特征,在计算该特征的增益惩罚因子,与给定的阈值进行比较,当增益惩罚因子大于已经给定的阈值时,该待选特征入选特征子集;当增益惩罚因子小于已经给定的阈值时,舍去该待选特征,并且特征选择方法终止,已选特征集合即为所选择的特征子集,该特征子集是从原始数据中选择的一个规模较小的特征子集,该特征子集在有效降低数据维度的基础上优于原始数据的分类精度。
在此基础上,上述方法还进一步包括:
k:基于特征子集S,对变压器进行在线状态评价和智能诊断,得到变压器的运行状态评价和智能诊断结果。
因为该特征子集在有效降低数据维度的基础上优于原始数据的分类精度,所以该特征子集能够精准有效表征变压器运行状态,因此基于该特征子集进行的在线状态评价和智能诊断,能够进一步提高变压器在线状态评价和智能诊断结果的准确性,即进一步提高变压器的在线监测水平。
本发明应用于变压器高维振动数据的特征选择,特别是在缺乏故障类别等先验知识的条件下,计算简便、速度快,是一种提高变压器在线监测水平的有效方法。
本说明书中各个部分采用递进的方式描述,每个部分重点说明的都是与其他部分的不同之处,各个部分之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本申请所示的实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。

Claims (1)

1.一种变压器振动数据无监督特征选择方法,其特征在于,所述方法包括:
a:D={f1,f2,f3,...,fn}为变压器在线监测过程中得到的高维振动数据的原始特征集合,每维特征fi为一个N维列向量,N为样本总数,n为特征维数,U为已选特征子集,初始为空集,初始状态下待选集合为原始特征全集;
b:根据互信息理论将原始特征集合D中各维特征fi进行离散化得到离散化矩阵DL
c:计算DL中特征之间的互信息I(fi;fj),得到互信息矩阵I;其具体的计算方法是:
其中xi为特征f中可能的取值,p(xi)是特征f为不同可能取值时的概率;
I(fa;fb)=H(fa)-H(fa|fb)=I(fb;fa)
其中fa={x1,x2,x3,...,xn},fb={y1,y2,y3,...,yn},p(yi)是特征fb为不同可能取值时的概率;
d:计算待选特征fi的特征相关度Rel(fi),其具体方法为:原始数据为D={f1,f2,f3…,fn},则其中某一特征fi的特征相关度为:
上式中H(fi)为特征fi中所含的信息量,H(fi)的值越大,那么特征fi中所含有的信息量就越多;指的是特征fi与其他特征所共有的信息量;
e:选择计算后特征相关度最大值对应的特征作为第一个特征入选特征子集U,则待选特征集合D=D-U;
f:计算待选特征fi的特征冗余度Red(fi);其具体方法为:
设已选特征子集U={u1,u2,u3,…,ut},待选特征fi的特征冗余度为
式中I(fi;uk)是指待选特征fi与已选特征集合U中每一个特征uk的互信息;
g:计算待选特征fi的潜在信息增益G,其具体方法是:
式中fk为待选特征集合中的其他特征;
h:将步骤g中计算的潜在信息增益G进行比较,选择潜在信息增益最大值对应的特征加入特征子集;
i:计算步骤h中新加入特征子集的特征的增益惩罚因子C,其具体公式如下:
式中指的是已选特征子集中的所有特征fj的特征冗余度之和;
将计算得到的新加入特征子集的特征的增益惩罚因子C与预设的阈值Cd进行比较,判断该待选特征是否加入特征子集U,当C>Cd时,该待选特征加入特征子集U中,当C<Cd时,该待选特征不加入特征子集U中,其中预设的阈值Cd可以根据实际情况随时调整;
j:重复执行步骤f至i,直到步骤i中计算的增益惩罚因子C值小于给预设的阈值Cd,从而终止重复步骤f至i,得到最终的特征子集S,所述特征子集S能够精确表征变压器运行状态的振动特征;
在上述特征选择过程中,综合考虑特征与原始数据之间的相关性以及特征与特征之间的冗余性,从高维振动数据的原始特征集合中选择一个规模较小的特征子集,在有效降低数据维度的基础上优于原始数据的分类精度,所以得到的特征子集能够准确表征变压器运行状态的振动特征。
CN201910788573.8A 2019-08-26 2019-08-26 一种变压器振动数据无监督特征选择方法 Active CN110598760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910788573.8A CN110598760B (zh) 2019-08-26 2019-08-26 一种变压器振动数据无监督特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910788573.8A CN110598760B (zh) 2019-08-26 2019-08-26 一种变压器振动数据无监督特征选择方法

Publications (2)

Publication Number Publication Date
CN110598760A CN110598760A (zh) 2019-12-20
CN110598760B true CN110598760B (zh) 2023-10-24

Family

ID=68855498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910788573.8A Active CN110598760B (zh) 2019-08-26 2019-08-26 一种变压器振动数据无监督特征选择方法

Country Status (1)

Country Link
CN (1) CN110598760B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050242A (zh) * 2014-05-27 2014-09-17 哈尔滨理工大学 基于最大信息系数的特征选择、分类方法及其装置
CN108875795A (zh) * 2018-05-28 2018-11-23 哈尔滨工程大学 一种基于Relief和互信息的特征选择算法
WO2018228667A1 (en) * 2017-06-12 2018-12-20 Huawei Technologies Co., Ltd. Automatic feature selection in machine learning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050242A (zh) * 2014-05-27 2014-09-17 哈尔滨理工大学 基于最大信息系数的特征选择、分类方法及其装置
WO2018228667A1 (en) * 2017-06-12 2018-12-20 Huawei Technologies Co., Ltd. Automatic feature selection in machine learning
CN108875795A (zh) * 2018-05-28 2018-11-23 哈尔滨工程大学 一种基于Relief和互信息的特征选择算法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Unsupervised Feature Selection algorithm Based on Information Gain;Zhong Li et al.;《Advances in Computer Science Research》;第第94卷卷;第63页第Ⅱ节至第65页第Ⅲ节 *
一种改进的动态流特征选择算法;郭磊;王亚弟;陈庶樵;朱珂;伊鹏;;计算机工程与应用(第18期);全文 *
基于信息增益的特征选择算法在语音识别系统中的应用;孙赢;;科技通报(第12期);全文 *

Also Published As

Publication number Publication date
CN110598760A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
Zhang et al. Discovering new intents with deep aligned clustering
CN110287983B (zh) 基于最大相关熵深度神经网络单分类器异常检测方法
CN109948125B (zh) 改进的Simhash算法在文本去重中的方法及系统
JP7024515B2 (ja) 学習プログラム、学習方法および学習装置
CN110134777B (zh) 问题去重方法、装置、电子设备和计算机可读存储介质
CN109871749B (zh) 一种基于深度哈希的行人重识别方法和装置、计算机系统
CN114117213A (zh) 一种推荐模型训练、推荐方法、装置、介质和设备
CN112036476A (zh) 基于二分类业务的数据特征选择方法、装置及计算机设备
CN114139634A (zh) 一种基于成对标签权重的多标签特征选择方法
CN114328106A (zh) 日志数据处理方法、装置、设备及存储介质
CN110598760B (zh) 一种变压器振动数据无监督特征选择方法
CN116028936B (zh) 一种基于神经网络的恶意代码检测方法、介质及设备
CN110941542A (zh) 基于弹性网络的序列集成高维数据异常检测系统及方法
Letteri et al. Dataset Optimization Strategies for MalwareTraffic Detection
CN113159181B (zh) 基于改进的深度森林的工业控制系统异常检测方法和系统
CN111428510B (zh) 一种基于口碑的p2p平台风险分析方法
JP7302229B2 (ja) データ管理システム、データ管理方法、およびデータ管理プログラム
CN114187966A (zh) 一种基于生成对抗网络的单细胞rna序列缺失值填补方法
CN111108516B (zh) 使用深度学习算法来评价输入数据
CN113657441A (zh) 基于加权皮尔逊相关系数并结合特征筛选的分类算法
CN112231706A (zh) 基于投票机制的安全漏洞报告数据集构建方法
CN111382273A (zh) 一种基于吸引因子的特征选择的文本分类方法
CN116304749B (zh) 基于图卷积的长文本匹配方法
JP2008071214A (ja) 文字認識辞書作成方法及びその装置及び文字認識方法及びその装置及びプログラムを格納した記憶媒体
CN112364629A (zh) 基于去冗余互信息特征选择的文本分类系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant