CN108154186A - 一种模式识别方法和装置 - Google Patents
一种模式识别方法和装置 Download PDFInfo
- Publication number
- CN108154186A CN108154186A CN201711477788.5A CN201711477788A CN108154186A CN 108154186 A CN108154186 A CN 108154186A CN 201711477788 A CN201711477788 A CN 201711477788A CN 108154186 A CN108154186 A CN 108154186A
- Authority
- CN
- China
- Prior art keywords
- reference model
- feature vector
- cluster centre
- cluster
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种模式识别方法和装置,该模式识别方法包括:对输入的训练数据进行特征提取,通过自适应核可能性模糊C均值聚类算法进行聚类分析后建立参考模型并保存至参考模型数据库;对输入的测试数据进行相同特征提取后得到测试特征向量,将测试特征向量与所述参考模型数据库中各参考模型执行模式匹配,得到模式识别结果。模式识别装置包括:训练单元和识别单元。本实施例的方案通过自适应核可能性模糊C均值聚类算法(AKPFCM)进行聚类分析后建立参考模型,能够根据特征数据的分布状况自适应调整核函数的参数,实现对特征数据更优的聚类,有效提高聚类性能。
Description
技术领域
本发明涉及模式识别技术领域,特别涉及一种模式识别方法和装置。
背景技术
随着信息技术的发展,模式识别有着越来越广泛的需求。在提取出信号的特征后,需要通过合适的模式匹配方法进行可靠地识别。常用的模式识别方法主要有:模板匹配,矢量量化(Vector Quantization,简称VQ),概率统计模型法,人工神经网络以及支持向量机(Support Vector Machine,简称SVM)。其中,VQ通过对从待识别信号中提取的特征向量进行聚类分析,而形成可以表征该模式的码本。聚类分析是一种无监督模式识别中的重要方法,已广泛应用于数据挖掘、图像处理、计算机视觉领域。聚类算法能将分布未知的数据进行分类,寻找出隐藏在数据中的结构,并按照某种相似程度的度量,使具有相同性质的数据尽可能归于同一类。
传统的VQ是一种硬划分过程,不能对特征的分布进行准确地描述。目前,基于传统的VQ衍生了各种改进的方法,如模糊C均值(Fuzzy C-Means,简称,FCM)、可能性C均值(Possibility C-Means,简称PCM)等。这些方法在改进了VQ方法的同时也有自身的一些局限性。例如,FCM对噪声比较敏感,识别率易受噪声的影响;PCM虽然弥补了FCM易受噪声影响的缺陷,但收敛速度慢,而且对初始值敏感,容易陷入一致性聚类。有一种可能性模糊C均值(Possibility Fuzzy C-Means,简称PFCM)算法则结合了FCM和PCM的优点。
为了进一步提高性能,核函数的概念又被引入可能性模糊C均值(PFCM)算法中,形成了基于核的聚类算法,如核可能性模糊C均值(Kernel Possibility Fuzzy C-Means,简称KPFCM)聚类算法,这种聚类算法是通过运用核函数将原始空间中的数据映射到高维的特征空间中,在高维的特征空间中进行聚类分析,从而得到原始空间的聚类划分。核可能性模糊C均值聚类算法的出现,一定程度上克服了FCM、PCM以及相关改进算法的缺陷,但仍存在收敛效果差和识别准确率低的问题。
发明内容
本发明提供了一种模式识别方法和装置,以解决现有技术核可能性模糊C均值聚类算法收敛效果差和识别准确率低的问题。
根据本申请的一个方面,提供了一种模式识别方法,该模式识别方法包括:
对输入的训练数据进行特征提取,通过自适应核可能性模糊C均值聚类算法进行聚类分析后建立参考模型并保存至参考模型数据库;
对输入的测试数据进行相同特征提取后得到测试特征向量,将测试特征向量与所述参考模型数据库中各参考模型执行模式匹配,得到模式识别结果。
根据本申请的另一个方面,提供了一种模式识别装置,该模式识别装置包括:
训练单元,用于对输入的训练数据进行特征提取,通过自适应核可能性模糊C均值聚类算法进行聚类分析后,建立参考模型并保存至参考模型数据库;
识别单元,用于对输入的测试数据进行相同特征提取后得到测试特征向量,将测试特征向量与所述参考模型数据库中各参考模型执行模式匹配,得到模式识别结果。
本发明的有益效果是:本发明实施例的模式识别方法和装置,对输入的训练数据进行特征提取,通过自适应核可能性模糊C均值聚类算法进行聚类分析后建立参考模型,从而针对核可能性模糊C均值(KPFCM)算法存在的核函数的参数设置固定,不能充分利用特征数据自身的分布特点,聚类结果很难达到最优的缺陷,提出了自适应的核可能性模糊C均值聚类算法(Adaptive Kernel Possibility Fuzzy C-Means,AKPFCM),这样能够根据特征数据的分布状况自适应调整核函数的参数,实现对特征数据更优的聚类,有效提高聚类性能。
附图说明
图1为本发明一个实施例的模式识别方法的流程图;
图2为本发明一个实施例的模式识别原理图;
图3为本发明一个实施例的AKPFCM算法流程图;
图4为本发明一个实施例的模式识别装置的框图;
图5为本发明一个实施例的电子设备的结构示意图。
具体实施方式
本发明的技术构思是针对改进VQ算法,如,KPFCM(核可能性模糊C均值,KernelPossibility Fuzzy C-Means)聚类算法存在的问题提出一种解决方案。本申请的发明人发现:虽然相比传统方法,KPFCM有了很大的进步,但KPFCM聚类算法核函数的参数取值固定,不能准确反映特征数据本身的离散情况,收敛结果容易陷入局部最优,限制了聚类的性能。
为此,对于KPFCM算法的核函数的参数设置固定,不能充分利用特征数据自身的分布特点,聚类结果很难达到最优这个缺陷,本实施例提出了自适应的核可能性模糊C均值聚类算法(Adaptive Kernel Possibility Fuzzy C-Means,简称AKPFCM),有效提高了聚类的性能。而在进一步的模式匹配中,提出了高维特征空间中的可能性模糊最近邻分类器,通过计算出高维特征空间中的平均量化失真,作为测试向量序列与参考模型之间的距离,相比传统的通过欧式距离计算失真,可以实现更可靠的判决决策,提高模式识别的正确率。
图1为本发明一个实施例的模式识别方法的流程图,参见图1,本实施例的模式识别方法包括下列步骤:
步骤S101,对输入的训练数据进行特征提取,通过自适应核可能性模糊C均值聚类算法进行聚类分析后建立参考模型并保存至参考模型数据库;
步骤S102,对输入的测试数据进行相同特征提取后得到测试特征向量,将测试特征向量与所述参考模型数据库中各参考模型执行模式匹配,得到模式识别结果。
由图1所示可知,本实施例的模式识别方法,在训练部分,通过自适应核可能性模糊C均值聚类算法(AKPFCM)进行聚类分析后建立参考模型,AKPFCM聚类算法克服了FCM算法对噪声的敏感,以及PCM算法对初始化聚类中心敏感、易导致一致性聚类的缺点。另一方面,AKPFCM算法通过使用核函数,将数据特征映射到高维特征空间,能够较好地分辨、提取并放大有用的特征,扩大了模式类之间的差异,提高识别性能。
同时,根据数据集的离散程度自适应选择高斯核的宽度,不需要通过大量的实验去确定合适的值。而且,在每次的聚类迭代过程中,根据当前聚类中心的分布情况自适应更新高斯核宽度,使得特征数据在高维空间中具有不同的伸缩能力,有利于找到更优的聚类中心,避免陷入局部最优值,改善了聚类效果。
图2为本发明一个实施例的模式识别原理图,参见图2,模式识别主要包括特征提取、模式匹配和判决三个部分。执行过程包括了模式的训练和测试两个环节。其中,在训练环节,对输入的训练数据经过特征提取后通过聚类分析建立参考模型,并将得到的参考模型保存到参考模型数据库里;在测试环节,对输入的测试数据经过相同的特征提取后得到测试特征向量,然后与参考模型数据库里的各个参考模型执行模式匹配,根据匹配结果进行判决决策,得到识别结果。
需要说明的是,实际应用时,图2中的训练数据和测试数据是相同类型的数据,可以都是语音数据或者都是图像数据等。也就是说,对语音识别或对图像识别等。
如图2所示,本实施例的参考模型数据库里包括多个参考模型,图2示意了参考模型1、参考模型2和参考模型Q,而每一个参考模型都可以看作一种模式。
以下结合图3对图2中的各个部分进行具体说明。
(一)特征提取
特征提取是从输入信号中提取一组能够描述信号本质属性的特征参数。特征提取不仅能够实现对输入信号的数据压缩,而且能够提取出反映不同模式之间差异的特征,为进一步的识别提供基础。特征提取可以采用现有可行技术手段实现,这里不作过多说明。
这里对输入信号经过特征提取后,得到包含N个特征向量的集合{xk},k=1,…,N,其中xk为M维向量。
(二)训练建立参考模型
提取出输入信号的特征向量序列后,可以通过本发明一个实施例提出的自适应核可能性模糊C均值聚类算法(AKPFCM)进行聚类分析,生成码本,建立参考模型。
本实施例中,聚类所要解决的问题是把特征向量集合{xk},k=1,…,N(其中xk为M维向量)划分为C个子集(1<C<N),求出每个子集的聚类中心,使得如下的目标函数最小化:
且满足下列约束条件一和二:
条件一,条件二,这里的条件二可以理解为以及
上述公式(1)中,uik∈U表示第k个特征向量对第i类的隶属度;tik∈T表示集合xk属于第i类的可能性,即典型值;m,η>1为模糊加权指数;a,b>0为权重系数;vi∈V为聚类中心;γi为大于0的系数。
通过拉格朗日乘数法最小化目标函数可求得隶属度、典型值和聚类中心。
参见图3,本实施例的AKPFCM聚类算法通过下降的循环迭代方式,直至找到符合终止条件的U、T和V,此时的U、T和V都是最优解。
算法流程开始,首先是初始化参数,例如,初始化给定参数C,N,a,b,m,η,允许的最大误差ε以及最大迭代次数tmax。
接着,利用LBG算法或FCM等传统算法得到初始的聚类中心V0。LBG算法是由Linde,Buzo,Gray三人在1980年提出的。LBG算法通过训练矢量集和一定的迭代算法来逼近最优的再生码本。
然后,参见图3,计算初始V0,即计算初始的聚类中心V0,之后执行下列步骤S1至S8,
步骤S1,计算σ
即,根据公式(2)和(3)计算高斯核函数的带宽参数σ:
公式(2)中的
本实施例中,是将输入样本向量集的标准差σ作为高斯核函数的带宽参数,所以计算输入样本向量集的标准差的过程即为这里计算高斯核函数的带宽参数σ的过程。
步骤S2,计算γi;
这里根据下列预定公式计算γi:
其中,K(·)为引入的高斯核函数,即
其中σ为高斯带宽参数。选择高斯核函数最重要的是对带宽参数的选择,选择的带宽过小,则导致过学习,而选择的带宽过大,又会导致过平滑。本实施例将给定输入样本向量集的标准差作为高斯核函数的带宽参数σ,标准差能够代表数据的离散程度。
步骤S3,令t=1;
步骤S4,计算σt;
根据公式(4)和(5),计算在第t次迭代时高斯核函数的带宽参数σt;
公式(4)中的
如果在每次的聚类迭代过程中,根据当前计算的聚类中心,按照公式(4)求出聚类中心的标准差作为新的高斯带宽参数σt,如果σt较小,那么聚类中心较接近,则在高维空间中增加数据的离散程度,反之亦然。这是因为在高维空间中的两个数据点间的距离范数为:
||Φ(xk)-Φ(vi))||2=2(1-K(xk,vi))
又根据可知,当σt较小时,则在高维空间中的距离将被放大,这样通过σt就自适应地控制了高维空间中的数据离散程度。即,根据当前的聚类中心分布情况,赋予特征数据在高维空间中不同的伸缩能力,有利于找到更优的聚类中心,一定程度上避免了陷入局部最优值。
步骤S5,计算Ut,Tt,Vt
根据第t-1次的聚类中心Vt-1和下列公式(6)计算第t次第k个特征向量对第i类的隶属度Ut:
根据第t-1次的聚类中心Vt-1和下列公式(7)计算第t次集合xk属于第i类的典型值Tt:
根据第t-1次的聚类中心Vt-1和Ut、Tt、下列公式(8)计算第t次的聚类中心Vt:
步骤S6,是否满足终止条件;
判断当||Ut-Ut-1||≤ε或者||Vt-Vt-1||≤ε时,终止迭代并输出对应的Ut、Tt、Vt;其中,ε为预设的最大误差;
步骤S7,t=t+1,即将t+1赋值给t。
步骤S8,是否t>tmax;
判断当赋值后的t大于最大迭代次数tmax时,终止迭代并输出对应的Ut、Tt、Vt;否则,返回步骤S4继续执行直至终止迭代。
迭代终止输出U、V、T。其中,V即为聚类中心,也就是对输入信号的特征向量序列训练出来的码本,将码本作为该模式的参考模型。
经过图3所示的步骤,将训练出来的多个模式的参考模型保存到参考模型数据库中以用于进一步的模式识别。
至此,训练环节结束。由上可知,本实施例利用新的自适应核可能性模糊C均值聚类算法(AKPFCM),根据特征数据的分布状况自适应调整核函数的参数,实现了对特征数据更优的聚类。
接下来介绍模式匹配和判决部分。
(三)模式匹配和判决
本发明实施例模式识别部分是:分别利用各参考模型的码本对测试特征向量进行量化,计算平均量化误差,将得到的平均量化误差作为测试特征向量与各参考模型之间的距离,这里的码本是训练各参考模型过程中得到的聚类中心的值;比较测试特征向量与各参考模型的平均量化误差的大小,将平均量化误差最小值所对应的参考模型作为模式匹配结果。
也就是采用高维特征空间中的可能性模糊最近邻分类器,通过计算出高维特征空间中的平均量化失真,作为测试向量序列与参考模型之间的距离,可以实现更可靠的判决决策,提高系统的识别率。
具体的,例如,对待测试输入信号同样进行特征提取后得到包含N个特征向量组成的序列X={x1,x2,…,xN},其中xk为M维向量。设参考模型数据库中有Q个模式,对于其中的模式q经训练出来的参考模型码本为V(q)={v1(q),v2(q),…,vC(q)},q=1,2,…,Q。其中C为每个模式的码本中包含码字的个数,每个码字向量vi(q)的维数为M。设模式q对应的隶属度函数矩阵为U(q),典型值矩阵为T(q),典型值代表的是可能性。
在高维特征空间中,采用模式q的码本对待测试特征向量X进行量化,并通过如下公式计算平均量化误差:
将这一高维特征空间中的平均量化误差作为测试特征向量与模式q之间的距离,根据该平均量化误差对模式进行判决。
具体的,在分别计算出测试特征向量与参考模型数据库中的Q个参考模型之间的平均量化误差之后,将平均量化误差最小的码本所对应的模式作为识别结果,即:
由上可知,本实施例在经过聚类分析得到参考模型后,高维特征空间中的可能性模糊最近邻分类器实现更可靠的模式匹配,提高了系统的识别率。
本发明实施例还提供了一种模式识别装置,图4为本发明一个实施例的模式识别装置的框图,参见图4,模式识别装置400包括:
训练单元401,用于对输入的训练数据进行特征提取,通过自适应核可能性模糊C均值聚类算法进行聚类分析后,建立参考模型并保存至参考模型数据库;
识别单元402,用于对输入的测试数据进行相同特征提取后得到测试特征向量,将测试特征向量与所述参考模型数据库中各参考模型执行模式匹配,得到模式识别结果。
在一个实施例中,训练单元401用于,将得到的包含N个训练特征向量的集合{xk}划分为C个子集,其中,k=1,…,N,xk为M维向量,1<C<N,
并求出每个子集的聚类中心,使得下列目标函数最小:
且满足下列约束条件一和二:
条件一,条件二,
其中,uik∈U表示第k个特征向量对第i类的隶属度;tik∈T表示集合xk属于第i类的典型值;m,η>1为模糊加权指数;a,b>0为权重系数;vi∈V为聚类中心;系数γi>0。这里的典型值即为可能性。
在一个实施例中,训练单元401具体用于,在得到初始的聚类中心V0之后,执行下列步骤:
步骤S1,根据公式(2)和(3)计算高斯核函数的带宽参数σ:
步骤S2,根据预定公式计算γi;
这里的预定公式是指下列公式:
其中,K(·)为引入的高斯核函数,即
步骤S3,令t=1;
步骤S4,根据公式(4)和(5),计算在第t次迭代时高斯核函数的带宽参数σt;
步骤S5,根据第t-1次的聚类中心Vt-1和下列公式(6)计算第t次第k个特征向量对第i类的隶属度Ut:
根据第t-1次的聚类中心Vt-1和下列公式(7)计算第t次集合xk属于第i类的典型值Tt:
根据第t-1次的聚类中心Vt-1和Ut、Tt、下列公式(8)计算第t次的聚类中心Vt:
即,在步骤S5中计算Ut,Tt,Vt
步骤S6,是否满足终止条件,即,判断当||Ut-Ut-1||≤ε或者||Vt-Vt-1||≤ε时,终止迭代并输出对应的Ut、Tt、Vt;其中,ε为预设的最大误差;
步骤S7,令t=t+1,
步骤S8,判断当赋值后的t大于最大迭代次数tmax时,终止迭代并输出对应的Ut、Tt、Vt;否则,返回步骤S4继续执行直至终止迭代。
在一个实施例中,识别单元402,用于分别利用各参考模型的码本对测试特征向量进行量化,计算平均量化误差,将得到的平均量化误差作为测试特征向量与各参考模型之间的距离,所述码本为训练各参考模型过程中得到的聚类中心的值;比较测试特征向量与各参考模型的平均量化误差的大小,将平均量化误差最小值所对应的参考模型作为模式匹配结果。
需要说明的是,本实施例的模式识别装置的工作过程是和前述模式识别方法的实现步骤对应的,因此本实施例中没有描述的部分可以参见前述实施例中的说明,在此不再赘述。
图5为本发明一个实施例的电子设备的结构示意图。如图5所示,该电子设备包括存储器502和处理器501,存储器502和处理器501之间通过内部总线503通讯连接,存储器502存储有能够被处理器501执行的程序指令,程序指令被处理器501执行时能够实现上述的模式识别方法。
此外,上述的存储器502中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明的另一个实施例提供一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令使所述计算机执行上述的模式识别方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的装置。
需要说明的是术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
以上所述,仅为本发明的具体实施方式,在本发明的上述教导下,本领域技术人员可以在上述实施例的基础上进行其他的改进或变形。本领域技术人员应该明白,上述的具体描述只是更好的解释本发明的目的,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种模式识别方法,其特征在于,该模式识别方法包括:
对输入的训练数据进行特征提取,通过自适应核可能性模糊C均值聚类算法进行聚类分析后建立参考模型并保存至参考模型数据库;
对输入的测试数据进行相同特征提取后得到测试特征向量,将测试特征向量与所述参考模型数据库中各参考模型模式匹配,得到模式识别结果。
2.根据权利要求1所述的模式识别方法,其特征在于,通过自适应核可能性模糊C均值聚类算法进行聚类分析后建立参考模型包括:
将得到的包含N个训练特征向量的集合{xk}划分为C个子集,其中,k=1,…,N,xk为M维向量,1<C<N,
求出每个子集的聚类中心,使得下列目标函数最小:
且满足下列约束条件一和二:
条件一,条件二,
其中,uik∈U表示第k个特征向量对第i类的隶属度;tik∈T表示集合xk属于第i类的典型值;m,η>1为模糊加权指数;a,b>0为权重系数;vi∈V为聚类中心;系数γi>0。
3.根据权利要求2所述的模式识别方法,其特征在于,通过自适应核可能性模糊C均值聚类算法进行聚类分析后建立参考模型具体包括:
在执行步骤S0,计算初始聚类中心V0之后,执行下列步骤:
步骤S1,根据公式(2)和(3)计算高斯核函数的带宽参数σ:
步骤S2,根据预定公式计算γi;
步骤S3,令t=1;
步骤S4,根据公式(4)和(5),计算在第t次迭代时高斯核函数的带宽参数σt:
步骤S5,根据第t-1次的聚类中心Vt-1和下列公式(6)计算第t次第k个特征向量对第i类的隶属度Ut:
根据第t-1次的聚类中心Vt-1和下列公式(7)计算第t次集合xk属于第i类的典型值Tt:
根据第t-1次的聚类中心Vt-1和Ut、Tt、下列公式(8)计算第t次的聚类中心Vt:
步骤S6,判断当||Ut-Ut-1||≤ε或者||Vt-Vt-1||≤ε时,终止迭代并输出对应的Ut、Tt、Vt;其中,ε为预设的最大误差;
步骤S7,令t=t+1,
步骤S8,判断当赋值后的t大于最大迭代次数时,终止迭代并输出对应的Ut、Tt、Vt;否则,返回步骤S4继续执行直至终止迭代。
4.根据权利要求1所述的模式识别方法,其特征在于,将测试特征向量与所述参考模型数据库中各参考模型执行模式匹配包括:
分别利用各参考模型的码本对测试特征向量进行量化,计算平均量化误差,将得到的平均量化误差作为测试特征向量与各参考模型之间的距离,所述码本为训练各参考模型过程中得到的聚类中心的值;
比较测试特征向量与各参考模型的平均量化误差的大小,将平均量化误差最小值所对应的参考模型作为模式匹配结果。
5.根据权利要求1所述的模式识别方法,其特征在于,所述训练数据和测试数据为相同类型的语音数据或者图像数据。
6.一种模式识别装置,其特征在于,该模式识别装置包括:
训练单元,用于对输入的训练数据进行特征提取,通过自适应核可能性模糊C均值聚类算法进行聚类分析后,建立参考模型并保存至参考模型数据库;
识别单元,用于对输入的测试数据进行相同特征提取后得到测试特征向量,将测试特征向量与所述参考模型数据库中各参考模型执行模式匹配,得到模式识别结果。
7.根据权利要求6所述的模式识别装置,其特征在于,所述训练单元用于,将得到的包含N个训练特征向量的集合{xk}划分为C个子集,其中,k=1,…,N,xk为M维向量,1<C<N,
并求出每个子集的聚类中心,使得下列目标函数最小:
且满足下列约束条件一和二:
条件一,条件二,
其中,uik∈U表示第k个特征向量对第i类的隶属度;tik∈T表示集合xk属于第i类的典型值;m,η>1为模糊加权指数;a,b>0为权重系数;vi∈V为聚类中心;系数γi>0。
8.根据权利要求7所述的模式识别装置,其特征在于,所述训练单元具体用于,在步骤S0,计算初始聚类中心V0之后,执行下列步骤:
步骤S1,根据公式(2)和(3)计算高斯核函数的带宽参数σ:
步骤S2,根据预定公式计算γi;
步骤S3,令t=1;
步骤S4,根据公式(4)和(5),计算在第t次迭代时高斯核函数的带宽参数σt;
步骤S5,根据第t-1次的聚类中心Vt-1和下列公式(6)计算第t次第k个特征向量对第i类的隶属度Ut:
根据第t-1次的聚类中心Vt-1和下列公式(7)计算第t次集合xk属于第i类的典型值Tt:
根据第t-1次的聚类中心Vt-1和Ut、Tt、下列公式(8)计算第t次的聚类中心Vt:
步骤S6,判断当||Ut-Ut-1||≤ε或者||Vt-Vt-1||≤ε时,终止迭代并输出对应的Ut、Tt、Vt;其中,ε为预设的最大误差;
步骤S7,令t=t+1,
步骤S8,并判断当赋值后的t大于最大迭代次数时,终止迭代并输出对应的Ut、Tt、Vt;否则,返回步骤S4继续执行直至终止迭代。
9.根据权利要求6所述的模式识别装置,其特征在于,
所述识别单元,用于分别利用各参考模型的码本对测试特征向量进行量化,计算平均量化误差,将得到的平均量化误差作为测试特征向量与各参考模型之间的距离,所述码本为训练各参考模型过程中得到的聚类中心的值;比较测试特征向量与各参考模型的平均量化误差的大小,将平均量化误差最小值所对应的参考模型作为模式匹配结果。
10.一种电子设备,其特征在于,所述电子设备包括:存储器和处理器,所述存储器和所述处理器之间通过内部总线通讯连接,所述存储器存储有能够被所述处理器执行的程序指令,所述程序指令被所述处理器执行时能够实现权利要求1-5任一项所述的模式识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711477788.5A CN108154186B (zh) | 2017-12-29 | 2017-12-29 | 一种模式识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711477788.5A CN108154186B (zh) | 2017-12-29 | 2017-12-29 | 一种模式识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108154186A true CN108154186A (zh) | 2018-06-12 |
CN108154186B CN108154186B (zh) | 2020-11-13 |
Family
ID=62460133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711477788.5A Active CN108154186B (zh) | 2017-12-29 | 2017-12-29 | 一种模式识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108154186B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109150307A (zh) * | 2018-07-17 | 2019-01-04 | 北京邮电大学 | 一种可见光通信中的通信数据的获取方法、装置和设备 |
CN110008914A (zh) * | 2019-04-11 | 2019-07-12 | 杨勇 | 一种基于神经网络的模式识别系统及识别方法 |
US20210232104A1 (en) * | 2018-04-27 | 2021-07-29 | Joint Stock Company "Rotec" | Method and system for identifying and forecasting the development of faults in equipment |
CN114880995A (zh) * | 2022-06-30 | 2022-08-09 | 浙江大华技术股份有限公司 | 算法方案部署方法及相关装置、设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120048366A (ko) * | 2010-11-05 | 2012-05-15 | 목포대학교산학협력단 | Knn과 pfcm 군집화 기반의 혼합된 무선 실내 측위 방법 |
CN102663432A (zh) * | 2012-04-18 | 2012-09-12 | 电子科技大学 | 结合支持向量机二次识别的模糊核聚类语音情感识别方法 |
CN104794482A (zh) * | 2015-03-24 | 2015-07-22 | 江南大学 | 基于改进型核模糊c均值类间极大化聚类算法 |
CN105894024A (zh) * | 2016-03-29 | 2016-08-24 | 合肥工业大学 | 多重核的可能性模糊聚类算法 |
CN107247969A (zh) * | 2017-06-02 | 2017-10-13 | 常州工学院 | 基于Gauss诱导核的模糊c均值聚类算法 |
-
2017
- 2017-12-29 CN CN201711477788.5A patent/CN108154186B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120048366A (ko) * | 2010-11-05 | 2012-05-15 | 목포대학교산학협력단 | Knn과 pfcm 군집화 기반의 혼합된 무선 실내 측위 방법 |
CN102663432A (zh) * | 2012-04-18 | 2012-09-12 | 电子科技大学 | 结合支持向量机二次识别的模糊核聚类语音情感识别方法 |
CN104794482A (zh) * | 2015-03-24 | 2015-07-22 | 江南大学 | 基于改进型核模糊c均值类间极大化聚类算法 |
CN105894024A (zh) * | 2016-03-29 | 2016-08-24 | 合肥工业大学 | 多重核的可能性模糊聚类算法 |
CN107247969A (zh) * | 2017-06-02 | 2017-10-13 | 常州工学院 | 基于Gauss诱导核的模糊c均值聚类算法 |
Non-Patent Citations (2)
Title |
---|
JEONGHWAN GWAK等: "An Improved Kernel-induced Possibilistic Fuzzy C-Means Clustering Algorithm based on Dispersion Control", 《THE 2014 INTERNATIONAL CONFERENCE ON CONTROL, AUTOMATION AND INFORMATION SCIENCES (ICCAIS 2014)》 * |
MEENA TUSHIR等: "A new Kernelized hybrid c-mean clustering model with optimized parameters", 《APPLIED SOFT COMPUTING》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210232104A1 (en) * | 2018-04-27 | 2021-07-29 | Joint Stock Company "Rotec" | Method and system for identifying and forecasting the development of faults in equipment |
CN109150307A (zh) * | 2018-07-17 | 2019-01-04 | 北京邮电大学 | 一种可见光通信中的通信数据的获取方法、装置和设备 |
CN109150307B (zh) * | 2018-07-17 | 2020-07-31 | 北京邮电大学 | 一种可见光通信中的通信数据的获取方法、装置和设备 |
CN110008914A (zh) * | 2019-04-11 | 2019-07-12 | 杨勇 | 一种基于神经网络的模式识别系统及识别方法 |
CN114880995A (zh) * | 2022-06-30 | 2022-08-09 | 浙江大华技术股份有限公司 | 算法方案部署方法及相关装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108154186B (zh) | 2020-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | An enhanced deep feature representation for person re-identification | |
CN108154186A (zh) | 一种模式识别方法和装置 | |
CN107578007A (zh) | 一种基于多特征融合的深度学习人脸识别方法 | |
Chen et al. | Fisher vector encoded deep convolutional features for unconstrained face verification | |
CN108281146A (zh) | 一种短语音说话人识别方法和装置 | |
CN108229298A (zh) | 神经网络的训练和人脸识别方法及装置、设备、存储介质 | |
CN102968626B (zh) | 一种人脸图像匹配的方法 | |
CN108564129A (zh) | 一种基于生成对抗网络的轨迹数据分类方法 | |
Khalil-Hani et al. | A convolutional neural network approach for face verification | |
JP6798614B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラム | |
CN109389074A (zh) | 一种基于人脸特征点提取的表情识别方法 | |
CN106295694A (zh) | 一种迭代重约束组稀疏表示分类的人脸识别方法 | |
CN104392253B (zh) | 一种草图数据集的交互式类别标注方法 | |
CN106709528A (zh) | 基于多目标函数深度学习的车辆重识别方法及装置 | |
CN106682606A (zh) | 一种人脸确认方法及安全认证装置 | |
CN109344856B (zh) | 一种基于多层判别式特征学习的脱机签名鉴别方法 | |
CN113239839B (zh) | 基于dca人脸特征融合的表情识别方法 | |
CN110532946A (zh) | 一种基于卷积神经网络识别绿通车车辆轴型的方法 | |
CN114469120B (zh) | 一种基于相似度阈值迁移的多尺度Dtw-BiLstm-Gan心电信号生成方法 | |
CN109598671A (zh) | 图像生成方法、装置、设备及介质 | |
CN110009051A (zh) | 特征提取单元及方法、dcnn模型、识别方法及介质 | |
CN106548134A (zh) | Ga优化svm和归一化相结合的掌纹与掌静脉融合识别方法 | |
CN109543637A (zh) | 一种人脸识别方法、装置、设备以及可读存储介质 | |
CN110399814B (zh) | 一种基于局部线性表示领域适应度量的人脸识别方法 | |
CN106204749A (zh) | 稀疏低秩特征表达的三维模型共分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191114 Address after: 266104 Laoshan Qingdao District North House Street investment service center room, Room 308, Shandong Applicant after: GEER TECHNOLOGY CO., LTD. Address before: 266061, No. 3, building 18, Qinling Mountains Road, Laoshan District, Shandong, Qingdao 401 Applicant before: Qingdao real time Technology Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |