CN110119776A - 基于多核学习k-svd的识别方法及其系统 - Google Patents
基于多核学习k-svd的识别方法及其系统 Download PDFInfo
- Publication number
- CN110119776A CN110119776A CN201910387408.1A CN201910387408A CN110119776A CN 110119776 A CN110119776 A CN 110119776A CN 201910387408 A CN201910387408 A CN 201910387408A CN 110119776 A CN110119776 A CN 110119776A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- module
- svd
- kernel function
- residual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000006870 function Effects 0.000 claims abstract description 158
- 238000012549 training Methods 0.000 claims abstract description 55
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000000903 blocking effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 abstract description 2
- 238000013507 mapping Methods 0.000 description 16
- 230000008901 benefit Effects 0.000 description 7
- 238000000354 decomposition reaction Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000035699 permeability Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于多核学习K‑SVD的识别方法及其系统,方法包括:将经验图像训练转化为列向量形成字典D;通过多核函数将字典D分类训练得到字典D';将字典D'通过K‑SVD进行字典更新,得到字典D”;将待识别图像与字典D”进行冗余计算,得到残差值集合;获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;若最小残差值在预设的阈值范围内,则完成图像识别匹配。通过将多核函数引入K‑SVD字典学习,通过对所有样本进行分类训练字典,得到一个过完备字典,该字典可以为每个信号原子提供最佳表示,可以有效地解决待处理图像分类不完备的问题,为训练得到的字典的稀疏性提供保障;对处理识别图像时,识别准确率高。
Description
技术领域
本发明涉及识别技术领域,尤其涉及基于多核学习K-SVD的识别方法及其系统。
背景技术
识别技术是当前特别火的技术领域之一,其具有非接触性、友好、方便、不易察觉等特点,易于为用户所接受。
识别技术中大多应用在图片以及图像识别上,其中,应用最广的是人脸识别。但是,现有的识别技术中,大多是采用单一的K-SVD训练得到字典,例如:CN201310181012.4就公开了一种基于稀疏表示的寄生虫虫卵识别方法,其中就是利用K-SVD训练得到字典进行识别。
采用单一的K-SVD训练得到的字典存在字典残缺,分类不准确等问题,所以在识别过程中识别率较低,误差较大。
发明内容
有鉴于此,本发明的基于多核学习K-SVD的识别方法及其系统,本方法通过多核学习以及K-SVD训练得到的字典更加稀疏,识别率更高。
一种基于多核学习K-SVD的识别方法,方法包括:
S1.将经验图像训练转化为列向量形成字典D;
S2.通过多核函数将字典D分类训练得到字典D';
S3.将字典D'通过K-SVD进行字典更新,得到字典D”;
S4.将待识别图像与字典D”进行冗余计算,得到残差值集合;
S5.获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;
S6.若最小残差值在预设的阈值范围内,则完成图像识别匹配。
优选地,所述步骤S2后,步骤S3前还包括:将字典D'每一列归一单元化,使其具有单位范数。
优选地,所述步骤S3后,步骤S4前还包括:根据字典D”计算L2范数最小化以及稀疏系数。
优选地,所述步骤S6具体为:
若最小残差值在预设的阈值范围内,则将待识别图像归入最小残差值对应字典D”的分类中,完成图像识别匹配。
优选地,若步骤S5中判断最小残差值不在预设的阈值范围内时,则图像识别显示不匹配。
所述核函数为线性核函数、多项式核函数、高斯核函数以及sigmod核函数中的至少两种。
一种基于多核学习K-SVD的识别系统,系统包括:转化模块、多核训练模块、K-SVD更新模块、残差计算模块、残差判断模块以及识别匹配模块;所述转化模块、多核训练模块、K-SVD更新模块、残差计算模块、残差判断模块以及识别匹配模块依次连接,其中:
转化模块,用于将经验图像训练转化为列向量形成字典D;
多核训练模块,用于通过多核函数将字典D分类训练得到字典D';
K-SVD更新模块,用于将字典D'通过K-SVD进行字典更新,得到字典D”;
残差计算模块,用于将待识别图像与字典D”进行冗余计算,得到残差值集合;
残差判断模块,用于获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;
识别匹配模块,用于若最小残差值在预设的阈值范围内,则完成图像识别匹配。
优选地,还包括归一单元模块,所述归一单元模块连接于多核训练模块以及K-SVD更新模块,所述归一单元模块用于将字典D'每一列归一单元化,使其具有单位范数。
优选地,还包括范数计算模块,所述范数计算模块连接于K-SVD更新模块以及残差计算模块,所述范数计算模块用于根据字典D”计算L2范数最小化以及稀疏系数。
优选地,所述识别匹配模块具体用于:所述残差判断模块判断出最小残差值在预设的阈值范围内时,所述识别匹配模块将待识别图像归入最小残差值对应字典D”的分类中,完成图像识别匹配。
优选地,还包括不匹配显示模块,所述不匹配显示模块与残差判断模块连接,当残差判断模块判断出最小残差值不在预设的阈值范围内时,所述不匹配显示模块对图像识别显示为不匹配。
本发明的有益效果在于:本发明提出了基于多核学习K-SVD的识别方法及其系统,通过将多核函数引入K-SVD字典学习,通过对所有样本进行分类训练字典,得到一个过完备字典,该字典可以为每个信号原子提供最佳表示,可以有效地解决待处理图像分类不完备的问题,为训练得到的字典的稀疏性提供保障;对处理识别图像时,识别准确率高,优势明显。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种基于多核学习K-SVD的识别方法的流程图;
图2为一种基于多核学习K-SVD的识别系统的示意图;
图3为一种基于多核学习K-SVD的识别方法的另一流程图;
图4为一种基于多核学习K-SVD的识别系统的另一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参看图1,一种基于多核学习K-SVD的识别方法,方法包括:
S11.将经验图像训练转化为列向量形成字典D;将全部的经验图像,即训练数据转化为列向量组成字典D,其中,D=[D1,D2,…,Dk]=[v1,1,v1,2,…,vk,nk]∈Rm×N,测试样本y∈Rm,最小误差ε>0,通过下式进行约束,得到字典D。
S12.通过多核函数将字典D分类训练得到字典D';引入多核函数,通过多核函数将字典D分类训练得到字典D';其中,利用多核函数对字典D进行分类训练时,会涉及核函数的选择问题,譬如线性核函数、多项式核函数、高斯核函数以及sigmod核函数等等,且采用其中的至少两种核函数。一般地,会采用多种核函数,多核即为融合几种不同的核来训练,这是因为多核模型比单个核函数具有更高的灵活性。在多核映射的背景下,高维空间成为由多个特征空间组合而成的组合空间,由于组合空间充分发挥了各个基本核的不同特征映射能力,能够将异构数据的不同特征分量分别通过相应的核函数得到解决。把具有不同特性的多个核函数进行组合,就会得到包含各个单核函数的总体特性的多核函数。多核函数形成的方式本身就使得多核函数具有更加准确、更加强大的映射能力或者分类能力,特别是对于实际应用中样本数据具有比较复杂分布结构的分类、回归等学习问题,把具有不同特性的多个核函数进行组合,就会得到包含各个单核函数的总体特性的多核函数。多核函数形成的方式本身就使得多核函数具有更加准确、更加强大的映射能力或者分类能力,特别是对于实际应用中样本数据具有比较复杂分布结构的分类、回归等学习问题,多核学习的优点非常明显。
实际选择时,一般采用线性核函数、多项式核函数以及高斯核函数三种函数进行混合使用,组成多核函数对字典进行训练。线性核函数具有较低的计算复杂度,多项式核是一种非标准核函数,它非常适合于正交归一化后的数据,高斯核函数对于数据中的噪音有着较好的抗干扰能力,选择这三种核组成多核函数,是因为它们具有核函数本身的优化分类特性,在保证足够稳定的情况下满足了分类功能。其中,线性核函数、多项式核函数以及高斯核函数如下表达式:
根据上述的多核函数,可以将字典D根据不同类别进行分类,训练得到字典D'。
S13.将字典D'通过K-SVD进行字典更新,得到字典D”;将字典D'通过K-SVD进行字典训练,依据误差最小原则,对误差项进行SVD分解,选择使误差最小的分解项作为更新的字典原子和对应的原子系数,经过不断的迭代从而得到优化的解,重新得到字典D”,构建新的字典D”对数据进行稀疏表示。即按照每一列k=1,2,…,K,不断更新D′P-1:
不断进行更新,即可得到新的字典D”。
S14.将待识别图像与字典D”进行冗余计算,得到残差值集合;将待识别图像y与字典D”进行冗余计算,如下公式:
γi(y)=||y-D′iVi(x)||2
其中i=1,2,…,k,为字典D”第i类的系数矢量。
根据上式可计算出若干残差值,即可形成残差值集合。
S15.获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;由于残差值集合都是大小不一的,而残差值集合中最小的残差值则代表待识别图像y与字典D”的某一样本最相近。但是,由于最相近并不代表待识别图像与字典D”的某一样本一致,所以在设定时,设定一阈值,只有当残差值集合中的最小值小于预设的阈值时,才可以认为待识别图像y与字典D”的某一样本完成了识别匹配。例如:残差值集合中的最小值为2,阈值范围为小于3,则可以说待识别图像y与字典D”的某一样本完成了识别匹配;残差值集合中的最小值为4时,则待识别图像y与字典D”不匹配。
S16.若最小残差值在预设的阈值范围内,则完成图像识别匹配;例如:残差值集合中的最小值为2,阈值范围为小于3,则可以说待识别图像y与字典D”的某一样本完成了识别匹配。
请参看图2,一种基于多核学习K-SVD的识别系统,系统包括:转化模块21、多核训练模块22、K-SVD更新模块23、残差计算模块24、残差判断模块25以及识别匹配模块26;转化模块21、多核训练模块22、K-SVD更新模块23、残差计算模块24、残差判断模块25以及识别匹配模块26依次连接,其中:
转化模块21,用于将经验图像训练转化为列向量形成字典D;将全部的经验图像,即训练数据转化为列向量组成字典D,其中,测试样本y∈Rm,最小误差ε>0,通过下式进行约束:
即可以得到字典D。
多核训练模块22,用于通过多核函数将字典D分类训练得到字典D';引入多核函数,通过多核函数将字典D分类训练得到字典D';其中,利用多核函数对字典D进行分类训练时,会涉及核函数的选择问题,譬如线性核函数、多项式核函数、高斯核函数以及sigmod核函数等等,且采用其中的至少一种核函数。一般地,会采用多种核函数,多核即为融合几种不同的核来训练,这是因为多核模型比单个核函数具有更高的灵活性。在多核映射的背景下,高维空间成为由多个特征空间组合而成的组合空间,由于组合空间充分发挥了各个基本核的不同特征映射能力,能够将异构数据的不同特征分量分别通过相应的核函数得到解决。把具有不同特性的多个核函数进行组合,就会得到包含各个单核函数的总体特性的多核函数。多核函数形成的方式本身就使得多核函数具有更加准确、更加强大的映射能力或者分类能力,特别是对于实际应用中样本数据具有比较复杂分布结构的分类、回归等学习问题,把具有不同特性的多个核函数进行组合,就会得到包含各个单核函数的总体特性的多核函数。多核函数形成的方式本身就使得多核函数具有更加准确、更加强大的映射能力或者分类能力,特别是对于实际应用中样本数据具有比较复杂分布结构的分类、回归等学习问题,多核学习的优点非常明显。
实际选择时,一般采用线性核函数、多项式核函数以及高斯核函数三种函数进行混合使用,组成多核函数对字典进行训练。线性核函数具有较低的计算复杂度,多项式核是一种非标准核函数,它非常适合于正交归一化后的数据,高斯核函数对于数据中的噪音有着较好的抗干扰能力,选择这三种核组成多核函数,是因为它们具有核函数本身的优化分类特性,在保证足够稳定的情况下满足了分类功能。其中,线性核函数、多项式核函数以及高斯核函数如下表达式:
根据上述的多核函数,可以将字典D根据不同类别进行分类,训练得到字典D'。
K-SVD更新模块23,用于将字典D'通过K-SVD进行字典更新,得到字典D”;将字典D'通过K-SVD进行字典训练,依据误差最小原则,对误差项进行SVD分解,选择使误差最小的分解项作为更新的字典原子和对应的原子系数,经过不断的迭代从而得到优化的解,重新得到字典D”,构建新的字典D”对数据进行稀疏表示。即按照每一列k=1,2,…,K,不断更新D′P-1:
不断进行更新,即可得到新的字典D”。
残差计算模块24,用于将待识别图像与字典D”进行冗余计算,得到残差值集合;将待识别图像y与字典D”进行冗余计算,如下公式:
γi(y)=||y-D′iVi(x)||2
其中i=1,2,…,k,为字典D”第i类的系数矢量。
根据上式可计算出若干残差值,即可形成残差值集合。
残差判断模块25,用于获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;由于残差值集合都是大小不一的,而残差值集合中最小的残差值则代表待识别图像y与字典D”的某一样本最相近。但是,由于最相近并不代表待识别图像与字典D”的某一样本一致,所以在设定时,设定一阈值,只有当残差值集合中的最小值小于预设的阈值时,才可以认为待识别图像y与字典D”的某一样本完成了识别匹配。例如:残差值集合中的最小值为2,阈值范围为小于3,则可以说待识别图像y与字典D”的某一样本完成了识别匹配;残差值集合中的最小值为4时,则待识别图像y与字典D”不匹配。
识别匹配模块26,用于若最小残差值在预设的阈值范围内,则完成图像识别匹配;例如:残差值集合中的最小值为2,阈值范围为小于3,则可以说待识别图像y与字典D”的某一样本完成了识别匹配。
请参看图3,一种基于多核学习K-SVD的识别方法,方法包括:
S31.将经验图像训练转化为列向量形成字典D;将全部的经验图像,即训练数据转化为列向量组成字典D,其中,测试样本y∈Rm,最小误差ε>0,通过下式进行约束,得到字典D。
S32.通过多核函数将字典D分类训练得到字典D';引入多核函数,通过多核函数将字典D分类训练得到字典D';其中,利用多核函数对字典D进行分类训练时,会涉及核函数的选择问题,譬如线性核函数、多项式核函数、高斯核函数以及sigmod核函数等等,且采用其中的至少一种核函数。一般地,会采用多种核函数,多核即为融合几种不同的核来训练,这是因为多核模型比单个核函数具有更高的灵活性。在多核映射的背景下,高维空间成为由多个特征空间组合而成的组合空间,由于组合空间充分发挥了各个基本核的不同特征映射能力,能够将异构数据的不同特征分量分别通过相应的核函数得到解决。把具有不同特性的多个核函数进行组合,就会得到包含各个单核函数的总体特性的多核函数。多核函数形成的方式本身就使得多核函数具有更加准确、更加强大的映射能力或者分类能力,特别是对于实际应用中样本数据具有比较复杂分布结构的分类、回归等学习问题,把具有不同特性的多个核函数进行组合,就会得到包含各个单核函数的总体特性的多核函数。多核函数形成的方式本身就使得多核函数具有更加准确、更加强大的映射能力或者分类能力,特别是对于实际应用中样本数据具有比较复杂分布结构的分类、回归等学习问题,多核学习的优点非常明显。
实际选择时,一般采用线性核函数、多项式核函数以及高斯核函数三种函数进行混合使用,组成多核函数对字典进行训练。线性核函数具有较低的计算复杂度,多项式核是一种非标准核函数,它非常适合于正交归一化后的数据,高斯核函数对于数据中的噪音有着较好的抗干扰能力,选择这三种核组成多核函数,是因为它们具有核函数本身的优化分类特性,在保证足够稳定的情况下满足了分类功能。其中,线性核函数、多项式核函数以及高斯核函数如下表达式:
根据上述的多核函数,可以将字典D根据不同类别进行分类,训练得到字典D'。
S33.将字典D'每一列归一单元化,使其具有单位范数;设置P=1,用任意追踪算法计算稀疏系数向量x,对字典D'每个样本y,有以下计算公式:
使得字典D'中的数据尽量稀疏。
S34.将字典D'通过K-SVD进行字典更新,得到字典D”;将字典D'通过K-SVD进行字典训练,依据误差最小原则,对误差项进行SVD分解,选择使误差最小的分解项作为更新的字典原子和对应的原子系数,经过不断的迭代从而得到优化的解,重新得到字典D”,构建新的字典D”对数据进行稀疏表示。即按照每一列k=1,2,…,K,不断更新D′P-1:
不断进行更新,即可得到新的字典D”。
S35.根据字典D”计算L2范数最小化以及稀疏系数;在字典D”下,根据公式:
min||c||2s.t.||y-D′x||2≤ε
计算出L2范数最小化以及稀疏系数c。
S36.将待识别图像与字典D”进行冗余计算,得到残差值集合;将待识别图像y与字典D”进行冗余计算,如下公式:
γi(y)=||y-D′iVi(x)||2
其中i=1,2,…,k,为字典D”第i类的系数矢量
根据上式可计算出若干残差值,即可形成残差值集合。
S37.获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;由于残差值集合都是大小不一的,而残差值集合中最小的残差值则代表待识别图像y与字典D”的某一样本最相近。但是,由于最相近并不代表待识别图像与字典D”的某一样本一致,所以在设定时,设定一阈值,只有当残差值集合中的最小值小于预设的阈值时,才可以认为待识别图像y与字典D”的某一样本完成了识别匹配。例如:残差值集合中的最小值为2,阈值范围为小于3,则可以说待识别图像y与字典D”的某一样本完成了识别匹配;残差值集合中的最小值为4时,则待识别图像y与字典D”不匹配。
S38.若最小残差值在预设的阈值范围内,则完成图像识别匹配;例如:残差值集合中的最小值为2,阈值范围为小于3,则可以说待识别图像y与字典D”的某一样本完成了识别匹配;在识别匹配时,将待识别图像归入最小残差值对应字典D”的分类中,即将待识别图像分类至字典D”的分类中,达到精确图像识别匹配,特别是在人脸识别时,识别准确率更高,优势更加明显。
S39.若判断最小残差值不在预设的阈值范围内时,则图像识别显示不匹配。当最小残差值不在预设的阈值范围内时,例如:残差值集合中的最小值为4,阈值范围为小于3;则待识别图像与字典D”中的样本不识别匹配,或者说匹配不了,并显示给用户。
请参看图4,一种基于多核学习K-SVD的识别系统,系统包括:转化模块41、多核训练模块42、归一单元模块43、K-SVD更新模块44、范数计算模块45、残差计算模块46、残差判断模块47、识别匹配模块48以及不匹配显示模块49,转化模块41、多核训练模块42、归一单元模块43、K-SVD更新模块44、范数计算模块45、残差计算模块46、残差判断模块47以及识别匹配模块48依次连接,不匹配显示模块49连接于残差判断模块47,其中:
转化模块41、用于将经验图像训练转化为列向量形成字典D;将全部的经验图像,即训练数据转化为列向量组成字典D,其中,D=[D1,D2,…,Dk]=[v1,1,v1,2,…,vk,nk]∈Rm×N,测试样本y∈Rm,最小误差ε>0,通过下式进行约束:
得到字典D。
多核训练模块42,用于通过多核函数将字典D分类训练得到字典D';引入多核函数,通过多核函数将字典D分类训练得到字典D';其中,利用多核函数对字典D进行分类训练时,会涉及核函数的选择问题,譬如线性核函数、多项式核函数、高斯核函数以及sigmod核函数等等,且采用其中的至少一种核函数。一般地,会采用多种核函数,多核即为融合几种不同的核来训练,这是因为多核模型比单个核函数具有更高的灵活性。在多核映射的背景下,高维空间成为由多个特征空间组合而成的组合空间,由于组合空间充分发挥了各个基本核的不同特征映射能力,能够将异构数据的不同特征分量分别通过相应的核函数得到解决。把具有不同特性的多个核函数进行组合,就会得到包含各个单核函数的总体特性的多核函数。多核函数形成的方式本身就使得多核函数具有更加准确、更加强大的映射能力或者分类能力,特别是对于实际应用中样本数据具有比较复杂分布结构的分类、回归等学习问题,把具有不同特性的多个核函数进行组合,就会得到包含各个单核函数的总体特性的多核函数。多核函数形成的方式本身就使得多核函数具有更加准确、更加强大的映射能力或者分类能力,特别是对于实际应用中样本数据具有比较复杂分布结构的分类、回归等学习问题,多核学习的优点非常明显。
实际选择时,一般采用线性核函数、多项式核函数以及高斯核函数三种函数进行混合使用,组成多核函数对字典进行训练。线性核函数具有较低的计算复杂度,多项式核是一种非标准核函数,它非常适合于正交归一化后的数据,高斯核函数对于数据中的噪音有着较好的抗干扰能力,选择这三种核组成多核函数,是因为它们具有核函数本身的优化分类特性,在保证足够稳定的情况下满足了分类功能。其中,线性核函数、多项式核函数以及高斯核函数如下表达式:
根据上述的多核函数,可以将字典D根据不同类别进行分类,训练得到字典D'。
归一单元模块43,用于将字典D'每一列归一单元化,使其具有单位范数;设置P=1,用任意追踪算法计算稀疏系数向量x,对字典D'每个样本y,有以下计算公式:
使得字典D'中的数据尽量稀疏。
K-SVD更新模块44,用于将字典D'通过K-SVD进行字典更新,得到字典D”;将字典D'通过K-SVD进行字典训练,依据误差最小原则,对误差项进行SVD分解,选择使误差最小的分解项作为更新的字典原子和对应的原子系数,经过不断的迭代从而得到优化的解,重新得到字典D”,构建新的字典D”对数据进行稀疏表示。即按照每一列k=1,2,…,K,不断更新D′P-1:
不断进行更新,即可得到新的字典D”。
范数计算模块45,用于根据字典D”计算L2范数最小化以及稀疏系数;在字典D”下,根据公式:
min||c||2s.t.||y-D′x||2≤ε
计算出L2范数最小化以及稀疏系数c。
残差计算模块46,用于将待识别图像与字典D”进行冗余计算,得到残差值集合;将待识别图像y与字典D”进行冗余计算,如下公式:
γi(y)=||y-D′iVi(x)||2
其中i=1,2,…,k,为字典D”第i类的系数矢量
根据上式可计算出若干残差值,即可形成残差值集合。
残差判断模块47,用于获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;由于残差值集合都是大小不一的,而残差值集合中最小的残差值则代表待识别图像y与字典D”的某一样本最相近。但是,由于最相近并不代表待识别图像与字典D”的某一样本一致,所以在设定时,设定一阈值,只有当残差值集合中的最小值小于预设的阈值时,才可以认为待识别图像y与字典D”的某一样本完成了识别匹配。例如:残差值集合中的最小值为2,阈值范围为小于3,则可以说待识别图像y与字典D”的某一样本完成了识别匹配;残差值集合中的最小值为4时,则待识别图像y与字典D”不匹配。
识别匹配模块48,用于若最小残差值在预设的阈值范围内,则完成图像识别匹配;例如:残差值集合中的最小值为2,阈值范围为小于3,则可以说待识别图像y与字典D”的某一样本完成了识别匹配;在识别匹配时,将待识别图像归入最小残差值对应字典D”的分类中,即将待识别图像分类至字典D”的分类中,达到精确图像识别匹配,特别是在人脸识别时,识别准确率更高,优势更加明显。
不匹配显示模块49,用于若判断最小残差值不在预设的阈值范围内时,则图像识别显示不匹配。当最小残差值不在预设的阈值范围内时,例如:残差值集合中的最小值为4,阈值范围为小于3;则待识别图像与字典D”中的样本不识别匹配,或者说匹配不了,并显示给用户。
本发明实施例可以根据实际需要进行顺序调整、合并和删减。
实施例对本方案进行了详细的介绍,本文中应用了具体个例对本发明的结构原理及实施方式进行了阐述,以上实施例只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于多核学习K-SVD的识别方法,其特征在于,方法包括:
S1.将经验图像训练转化为列向量形成字典D;
S2.通过多核函数将字典D分类训练得到字典D';
S3.将字典D'通过K-SVD进行字典更新,得到字典D”;
S4.将待识别图像与字典D”进行冗余计算,得到残差值集合;
S5.获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;
S6.若最小残差值在预设的阈值范围内,则完成图像识别匹配。
2.根据权利要求1所述的识别方法,其特征在于:所述步骤S2后,步骤S3前还包括:将字典D'每一列归一单元化,使其具有单位范数。
3.根据权利要求2所述的识别方法,其特征在于:所述步骤S3后,步骤S4前还包括:根据字典D”计算L2范数最小化以及稀疏系数。
4.根据权利要求1所述的识别方法,其特征在于:所述步骤S6具体为:
若最小残差值在预设的阈值范围内,则将待识别图像归入最小残差值对应字典D”的分类中,完成图像识别匹配。
5.根据权利要求1所述的识别方法,其特征在于:若步骤S5中判断最小残差值不在预设的阈值范围内时,则图像识别显示不匹配。
6.一种基于多核学习K-SVD的识别系统,其特征在于,系统包括:转化模块、多核训练模块、K-SVD更新模块、残差计算模块、残差判断模块以及识别匹配模块;所述转化模块、多核训练模块、K-SVD更新模块、残差计算模块、残差判断模块以及识别匹配模块依次连接,其中:
转化模块,用于将经验图像训练转化为列向量形成字典D;
多核训练模块,用于通过多核函数将字典D分类训练得到字典D';
K-SVD更新模块,用于将字典D'通过K-SVD进行字典更新,得到字典D”;
残差计算模块,用于将待识别图像与字典D”进行冗余计算,得到残差值集合;
残差判断模块,用于获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;
识别匹配模块,用于若最小残差值在预设的阈值范围内,则完成图像识别匹配。
7.根据权利要求6所述的识别系统,其特征在于,还包括归一单元模块,所述归一单元模块连接于多核训练模块以及K-SVD更新模块,所述归一单元模块用于将字典D'每一列归一单元化,使其具有单位范数。
8.根据权利要求7所述的识别系统,其特征在于,还包括范数计算模块,所述范数计算模块连接于K-SVD更新模块以及残差计算模块,所述范数计算模块用于根据字典D”计算L2范数最小化以及稀疏系数。
9.根据权利要求6所述的识别系统,其特征在于,所述识别匹配模块具体用于:所述残差判断模块判断出最小残差值在预设的阈值范围内时,所述识别匹配模块将待识别图像归入最小残差值对应字典D”的分类中,完成图像识别匹配。
10.根据权利要求6所述的识别系统,其特征在于,还包括不匹配显示模块,所述不匹配显示模块与残差判断模块连接,当残差判断模块判断出最小残差值不在预设的阈值范围内时,所述不匹配显示模块对图像识别显示为不匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910387408.1A CN110119776A (zh) | 2019-05-10 | 2019-05-10 | 基于多核学习k-svd的识别方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910387408.1A CN110119776A (zh) | 2019-05-10 | 2019-05-10 | 基于多核学习k-svd的识别方法及其系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110119776A true CN110119776A (zh) | 2019-08-13 |
Family
ID=67522127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910387408.1A Pending CN110119776A (zh) | 2019-05-10 | 2019-05-10 | 基于多核学习k-svd的识别方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110119776A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112365463A (zh) * | 2020-11-09 | 2021-02-12 | 珠海市润鼎智能科技有限公司 | 高速图像中微小物体的实时检测方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262736A (zh) * | 2011-07-21 | 2011-11-30 | 西北工业大学 | 空间目标图像分类与识别方法 |
CN103268494A (zh) * | 2013-05-15 | 2013-08-28 | 江苏大学 | 基于稀疏表示的寄生虫虫卵识别方法 |
US20140037199A1 (en) * | 2005-04-04 | 2014-02-06 | Michal Aharon | System and method for designing of dictionaries for sparse representation |
CN105631478A (zh) * | 2015-12-25 | 2016-06-01 | 天津科技大学 | 基于稀疏表示字典学习的植物分类方法 |
CN106066994A (zh) * | 2016-05-24 | 2016-11-02 | 北京工业大学 | 一种基于Fisher判别的稀疏表示的人脸识别方法 |
CN106529586A (zh) * | 2016-10-25 | 2017-03-22 | 天津大学 | 基于补充文本特征的图像分类方法 |
CN106934837A (zh) * | 2017-01-16 | 2017-07-07 | 鲁东大学 | 图像重构方法及装置 |
CN107368803A (zh) * | 2017-07-14 | 2017-11-21 | 广州智慧城市发展研究院 | 一种基于类别稀疏表示的人脸识别方法及系统 |
-
2019
- 2019-05-10 CN CN201910387408.1A patent/CN110119776A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140037199A1 (en) * | 2005-04-04 | 2014-02-06 | Michal Aharon | System and method for designing of dictionaries for sparse representation |
CN102262736A (zh) * | 2011-07-21 | 2011-11-30 | 西北工业大学 | 空间目标图像分类与识别方法 |
CN103268494A (zh) * | 2013-05-15 | 2013-08-28 | 江苏大学 | 基于稀疏表示的寄生虫虫卵识别方法 |
CN105631478A (zh) * | 2015-12-25 | 2016-06-01 | 天津科技大学 | 基于稀疏表示字典学习的植物分类方法 |
CN106066994A (zh) * | 2016-05-24 | 2016-11-02 | 北京工业大学 | 一种基于Fisher判别的稀疏表示的人脸识别方法 |
CN106529586A (zh) * | 2016-10-25 | 2017-03-22 | 天津大学 | 基于补充文本特征的图像分类方法 |
CN106934837A (zh) * | 2017-01-16 | 2017-07-07 | 鲁东大学 | 图像重构方法及装置 |
CN107368803A (zh) * | 2017-07-14 | 2017-11-21 | 广州智慧城市发展研究院 | 一种基于类别稀疏表示的人脸识别方法及系统 |
Non-Patent Citations (4)
Title |
---|
徐俊等: "基于核字典学习的图像分类", 《计算机应用研究》 * |
徐俊等: "基于核字典学习的图像分类", 《计算机应用研究》, vol. 34, no. 12, 31 December 2017 (2017-12-31), pages 5 - 7 * |
梁雅丽: "基于压缩感知的医学数据分类研究", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 * |
梁雅丽: "基于压缩感知的医学数据分类研究", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》, 15 February 2018 (2018-02-15), pages 9 - 11 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112365463A (zh) * | 2020-11-09 | 2021-02-12 | 珠海市润鼎智能科技有限公司 | 高速图像中微小物体的实时检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111353542B (zh) | 图像分类模型的训练方法、装置、计算机设备和存储介质 | |
CN110008338B (zh) | 一种融合gan和迁移学习的电商评价情感分析方法 | |
CN110472229A (zh) | 序列标注模型训练方法、电子病历处理方法及相关装置 | |
CN110069631A (zh) | 一种文本处理方法、装置以及相关设备 | |
WO2024011814A1 (zh) | 一种图文互检方法、系统、设备及非易失性可读存储介质 | |
CN109766469A (zh) | 一种基于深度哈希学习优化的图像检索方法 | |
CN112766507B (zh) | 基于嵌入式和候选子图剪枝的复杂问题知识库问答方法 | |
CN106844738B (zh) | 基于神经网络的食材之间容克关系的分类方法 | |
CN110765254A (zh) | 一种融合多视角答案重排序的多文档问答系统模型 | |
CN110990596B (zh) | 一种基于自适应量化多模态哈希检索方法及系统 | |
CN106970981B (zh) | 一种基于转移矩阵构建关系抽取模型的方法 | |
CN111026887B (zh) | 一种跨媒体检索的方法及系统 | |
CN108804591A (zh) | 一种病历文本的文本分类方法及装置 | |
CN109284411A (zh) | 一种基于有监督超图离散化图像二值编码方法 | |
CN108171261A (zh) | 鲁棒的自适应半监督图像分类方法、装置、设备及介质 | |
CN117390497B (zh) | 基于大语言模型的类目预测方法、装置和设备 | |
CN112488301A (zh) | 一种基于多任务学习和注意力机制的食品反演方法 | |
CN108804544A (zh) | 互联网影视多源数据融合方法和装置 | |
CN109753649A (zh) | 基于细粒度匹配信号的文本相关性度量方法和系统 | |
CN114239612A (zh) | 一种多模态神经机器翻译方法、计算机设备及存储介质 | |
CN108537342A (zh) | 一种基于邻居信息的网络表示学习方法及系统 | |
CN109635004B (zh) | 一种数据库的对象描述提供方法、装置及设备 | |
CN113255701B (zh) | 一种基于绝对-相对学习架构的小样本学习方法和系统 | |
CN110119776A (zh) | 基于多核学习k-svd的识别方法及其系统 | |
Guo et al. | Matching visual features to hierarchical semantic topics for image paragraph captioning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190813 |