CN107392256A - 一种图像识别方法及系统 - Google Patents

一种图像识别方法及系统 Download PDF

Info

Publication number
CN107392256A
CN107392256A CN201710639261.1A CN201710639261A CN107392256A CN 107392256 A CN107392256 A CN 107392256A CN 201710639261 A CN201710639261 A CN 201710639261A CN 107392256 A CN107392256 A CN 107392256A
Authority
CN
China
Prior art keywords
mrow
msub
msubsup
image
bag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710639261.1A
Other languages
English (en)
Inventor
黎启祥
肖燕珊
刘波
郝志峰
阮奕邦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201710639261.1A priority Critical patent/CN107392256A/zh
Publication of CN107392256A publication Critical patent/CN107392256A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种图像识别方法及系统,包括:获取图像信息,提取图像的特征数据;对特征数据进行标记,转换成多示例的表示形式;通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;训练得到多示例多任务图像识别分类器,对图像进行识别分类。本申请公开的上述图像识别方法,利用给多示例加权包来降低图像识别中噪声对分类结果的影响,同时提高分类精度;并且算法扩展到多任务环境中,利用多任务环境的优势,能有效的利用图像之间的关联性,进一步提高识别准确率。

Description

一种图像识别方法及系统
技术领域
本发明涉及图像识别技术领域,特别是涉及一种图像识别方法及系统。
背景技术
目前,随着互联网的快速发展,网络数据越来越庞大,尤其图像数据呈几何倍增长。因此,如何合理而有效的利用这些数据成为了我们的思考。同时,随着机器学习的极大发展,在线图像识别,例如手写数字,人脸识别等,也得到了广泛的应用。
一方面,在应用的过程中,由于手写设备的局限,拍摄设备的误差,数据的环境和传输过程等不确定因素的影响,获得的图像经常会包含噪声数据,数据的有效性有所欠缺,基于多示例的支持向量机无法进行有效的学习和表达,从而降低了图像的识别精度,严重影响到图像识别的广泛应用;另一方面,由于图像识别应用中,由于获取的图像数据不充足,而这些图像又比较相似而有潜在的联系时,基于单任务多示例的支持向量机无法更加深入了利用图像之间的联系,从而影响识别的效率,降低了图像识别精度使得图像的识别的准确率不高。
发明内容
有鉴于此,本发明的目的在于提供一种图像识别方法及系统,可以降低图像识别中噪声对分类结果的影响,并且提高分类精度和识别准确率。其具体方案如下:
一种图像识别方法,包括:
获取图像信息,提取所述图像的特征数据;
对所述特征数据进行标记,转换成多示例的表示形式;
通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;
训练得到多示例多任务图像识别分类器,对所述图像进行识别分类。
优选地,在本发明实施例提供的上述图像识别方法中,通过多示例加权包进行机器学习,具体包括:
对所述包示例中的噪声数据进行处理,赋予所述包示例不同的权值,利用迭代的训练分类器,训练示例权值,改进包表示。
优选地,在本发明实施例提供的上述图像识别方法中,进行多任务学习环境的扩展,具体包括:
利用多任务中的人物中共享图像的信息,确定所述图像之间的关联性。
优选地,在本发明实施例提供的上述图像识别方法中,对所述特征数据进行标记,转换成多示例的表示形式,具体包括:
将所述特征数据转换为矩阵数据;
假设存在T个分类任务,则第t个分类任务的数据集表示为Dt,包含|Nt|个负多示例包和|Pt|个正多示例包,此时
Dt=Nt∪Pt
其中,Nt表示第t个分类任务的负示例包;Pt表示第t个分类任务的正示例包;Bit表示负多示例包,由m个示例组成;Bjt表示正多示例包,由m个示例组成;
Nt对应的标签集为Yit∈{-1,+1}表示第t个分类任务中的负多示例包Bit所关联的标签;Pt对应的标签集为Yjt∈{-1,+1}表示为第t个分类任务中的正多示例包Bjt所关联的标签。
优选地,在本发明实施例提供的上述图像识别方法中,下述公式为加权的公式:
yit Z=-1;
yjt Z=+1;
其中,表示第k次负多示例包迭代的权值;表示第k次正多示例包迭代的权值;表示负多示例包迭代的初始化权值;表示正多示例包迭代的初始化权值;yit Z表示负示例包中所有示例标签;yjtZ表示负示例包中所有示例标签。
优选地,在本发明实施例提供的上述图像识别方法中,利用多任务中的人物中共享图像的信息,确定所述图像之间的关联性,具体包括:
构建第t个分类任务中正多示例包和负多示例包所关联的拉格朗日乘子列向量:
其中,αit表示第t个分类任务中负多示例包nit所关联的拉格朗日乘子,共有|Nt|个;βjt表示第t个分类任务中正多示例包pjt所关联的拉格朗日乘子,共有|Pt|个。
优选地,在本发明实施例提供的上述图像识别方法中,利用多任务中的人物中共享图像的信息,确定图像间的关联性,具体还包括:
构建T个分类任务中的所有多示例包构成的矩阵:
其中,表示第t个分类任务所有负多示例包构成的包矩阵;表示第t个分类任务所有正多示例包构成的包矩阵;φ(nit)表示负多示例包nit在多任务学习环境下的映射;φ(pjt)表示正多示例包pjt在多任务学习环境下的映射。
本发明实施例还提供了一种图像识别系统,包括:
数据提取模块,用于获取图像信息,提取所述图像的特征数据;
数据转换模块,用于对所述特征数据进行标记,转换成多示例的表示形式;
加权包学习模块,用于通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;
分类器获取模块,用于训练得到多示例多任务图像识别分类器,对所述图像进行识别分类
本发明所提供的一种图像识别方法及系统,包括:获取图像信息,提取图像的特征数据;对特征数据进行标记,转换成多示例的表示形式;通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;训练得到多示例多任务图像识别分类器,对图像进行识别分类。本发明公开的上述图像识别方法,利用给多示例加权包来降低图像识别中噪声对分类结果的影响,同时提高分类精度;并且算法扩展到多任务环境中,利用多任务环境的优势,能有效的利用图像之间的关联性,进一步提高识别准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的图像识别方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种图像识别方法,如图1所示,包括以下步骤:
S101、获取图像信息,提取图像的特征数据;
S102、对特征数据进行标记,转换成多示例的表示形式;
S103、通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;
S104、训练得到多示例多任务图像识别分类器,对图像进行识别分类。
在本发明实施例提供的上述图像识别方法中,首先获取图像信息,提取图像的特征数据;然后对特征数据进行标记,转换成多示例的表示形式;之后通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;最后训练得到多示例多任务图像识别分类器,对图像进行识别分类。这种图像识别方法,利用给多示例加权包来降低图像识别中噪声对分类结果的影响,同时提高分类精度;并且算法扩展到多任务环境中,利用多任务环境的优势,能有效的利用图像之间的关联性,进一步提高识别准确率。
需要说明的是,多示例加权包(即训练集)由若干个包组成,每个包包含若干个示例,包示例标签未知,现有技术中正包中不仅存在正示例,也可能包含负示例噪声,会影响分类效果;而本发明通过多示例加权包进行机器学习可以实现降噪。
在具体实施时,在本发明实施例提供的上述图像识别方法中,步骤S103通过多示例加权包进行机器学习,具体可以包括:
对包示例中的噪声数据进行处理,赋予包示例不同的权值,利用迭代的训练分类器,训练示例权值,改进包表示。
这样针对包示例存在噪声的情况,提出赋予包示例不同的权值,不断更新分类器,调整权值,可以降低噪声对分类结果影响,提高分类精度。
在具体实施时,在本发明实施例提供的上述图像识别方法中,为了进一步提高图像识别精度,步骤S103进行多任务学习环境的扩展,具体可以包括:
利用多任务中的人物中共享图像的信息,确定图像之间的关联性。
在具体实施时,在本发明实施例提供的上述图像识别方法中,步骤S102对特征数据进行标记,转换成多示例的表示形式,具体可以包括:
将特征数据转换为矩阵数据;
假设存在T个分类任务,则第t个分类任务的数据集表示为Dt,包含|Nt|个负多示例包和|Pt|个正多示例包,此时
Dt=Nt∪Pt
其中,Nt表示第t个分类任务的负示例包;Pt表示第t个分类任务的正示例包;Bit表示负多示例包,由m个示例组成;Bjt表示正多示例包,由m个示例组成;
Nt对应的标签集为Yit∈{-1,+1}表示第t个分类任务中的负多示例包Bit所关联的标签;Pt对应的标签集为Yjt∈{-1,+1}表示为第t个分类任务中的正多示例包Bjt所关联的标签。
在具体实施时,在本发明实施例提供的上述图像识别方法中,下述公式为加权的公式:
yit Z=-1;
yjt Z=+1;
其中,表示第k次负多示例包迭代的权值;表示第k次正多示例包迭代的权值;表示负多示例包迭代的初始化权值;表示正多示例包迭代的初始化权值;yit Z表示负示例包中所有示例标签;yjt Z表示负示例包中所有示例标签。
在具体实施时,在本发明实施例提供的上述图像识别方法中,利用多任务中的人物中共享图像的信息,确定图像之间的关联性,具体可以包括:
构建第t个分类任务中正多示例包和负多示例包所关联的拉格朗日乘子列向量:
其中,αit表示第t个分类任务中负多示例包nit所关联的拉格朗日乘子,共有|Nt|个;βjt表示第t个分类任务中正多示例包pjt所关联的拉格朗日乘子,共有|Pt|个。
之后,构建T个分类任务中的所有多示例包构成的矩阵:
其中,表示第t个分类任务所有负多示例包构成的包矩阵;表示第t个分类任务所有正多示例包构成的包矩阵;φ(nit)表示负多示例包nit在多任务学习环境下的映射;φ(pjt)表示正多示例包pjt在多任务学习环境下的映射。
下面以一个具体的实例详细的说明本发明实施例提供的图像识别方法:
步骤一、初始化第t个分类任务的训练集,设置负多示例包中所有示例标签yit Z=-1,示例初始权值此时正多示例包中的所有示例标签yjt Z=+1,示例初始权值此时ε=0.01,任务的完成程度Ω={0,…,0,…,0},k=1迭代开始;
步骤二、计算第t个分类任务中训练集示例的权值其中,正包迭代方式负包迭代方式
步骤三、k=1时,构建向量nit和pjt,否则更新nit和pjt的值,nit表示负多示例包,pjt是正多示例包,
步骤四、构建第t个分类任务中正负多示例包所关联的拉格朗日乘子列向量αt和βt它们分别表示为其中,αit为第t个分类任务中负多示例包nit所关联的拉格朗日乘子,共有|Nt|个,βjt为第t个分类任务中正多示例包pjt所关联的拉格朗日乘子,共有|Pt|个;
步骤五、构建T个分类任务中的所有多示例包构成的矩阵:其中,为第t个分类任务所有负多示例包构成的包矩阵和为第t个分类任务所有正多示例包构成的包矩阵。其中,为负多示例包nit在多任务学习环境下的映射,为正多示例包pjt在多任务学习环境下的映射;
步骤六、参数向量Gt=[HT,LT]T,其中H=[1,…,1,…,1]T是长度为|Nt|的列向量,而为控制变量构成的列向量;
步骤七、因此,提出了如下优化问题:
max imize:
subject to:
0≤γst≤C1,1≤s≤|Nt|
0≤γst≤C2,|Nt|+1≤s≤|Nt|+|Pt|
公式(1)基本实现了对多示例包中的示例赋予权值,并且进行多次迭代更新权值,达到降低噪声的影响的目的,而且把算法扩展到多任务学习环境中,利用任务之间潜在的关联性,提高算法的预测性能;
步骤八、计算第t个分类任务的Jkt,具体步骤如下:
输入:T个任务数据集χ12,…,χT,参数γ0和γ1,惩罚系数C,精度ε,任务完成程度参数Ω={Ω12,…,ΩT},迭代次数k;
输出:T个任务的分类器:f1,f2,…,fT,T个分类任务中测试包的标签YT
整个步骤简化描述下:
1)初始化第t个分类任务的训练集,设置负多示例包中所有示例标签yit Z=-1,示例初始权值正多示例包中的所有示例标签yjt Z=+1,示例初始权值ε=0.01,任务的完成程度Ω={0,…,0,…,0},k=1迭代开始;
2)计算第t个分类任务中训练集示例的权值
3)k=1时,构建向量nit和pjt,否则更新nit和pjt的值;
4)基于数据集χt,训练得到第t个分类任务的分类器ft
5)计算第t个分类任务的Jkt。若Ωt=1则不再迭代此任务,等待其他任务迭代结束;若Ωt=0则继续迭代至(J|k-1|t-Jkt)/Jkt<ε或者迭代次数达到k时,并设置Ωt=1。
6)计算更新第t个分类任务中负多示例包的示例标签yit Z和正多示例包的示例标签yjt Z
7)k=k+1并跳转到步骤2;
8)迭代结束,得到每个任务的分类器并且利用该分类器计算得到T个分类任务中测试包的标签YT
至此,完成了本发明实施例提供的上述图像识别方法。
基于同一发明构思,本发明实施例还提供了一种图像识别系统,由于该系统解决问题的原理与前述一种图像识别方法相似,因此该系统的实施可以参见图像识别方法的实施,重复之处不再赘述。
在具体实施时,本发明实施例提供的图像识别系统,具体包括:
数据提取模块,用于获取图像信息,提取图像的特征数据;
数据转换模块,用于对特征数据进行标记,转换成多示例的表示形式;
加权包学习模块,用于通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;
分类器获取模块,用于训练得到多示例多任务图像识别分类器,对图像进行识别分类。
在本发明实施例提供的上述图像识别系统中,可以对示例加权,降低了噪声示例对分类预测的干扰,并通过扩展到多任务学习环境中,从而弥补了训练数据不足所造成的模型欠拟合问题,降低了噪声数据对训练过程的干扰,并且能够利用多个分类任务间的关联性来进行算法性能的提高。
本发明实施例提供的一种图像识别方法及系统,包括:获取图像信息,提取图像的特征数据;对特征数据进行标记,转换成多示例的表示形式;通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;训练得到多示例多任务图像识别分类器,对图像进行识别分类。本发明公开的上述图像识别方法,利用给多示例加权包来降低图像识别中噪声对分类结果的影响,同时提出赋予包示例不同的权值,不断更新分类器,调整权值,以提高分类精度;并且算法扩展到多任务环境中,利用多任务环境的优势,能有效的利用图像之间的关联性,进一步提高识别准确率。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的图像识别方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种图像识别方法,其特征在于,包括:
获取图像信息,提取所述图像的特征数据;
对所述特征数据进行标记,转换成多示例的表示形式;
通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;
训练得到多示例多任务图像识别分类器,对所述图像进行识别分类。
2.根据权利要求1所述的图像识别方法,其特征在于,通过多示例加权包进行机器学习,具体包括:
对所述包示例中的噪声数据进行处理,赋予所述包示例不同的权值,利用迭代的训练分类器,训练示例权值,改进包表示。
3.根据权利要求2所述的图像识别方法,其特征在于,进行多任务学习环境的扩展,具体包括:
利用多任务中的人物中共享图像的信息,确定所述图像之间的关联性。
4.根据权利要求3所述的图像识别方法,其特征在于,对所述特征数据进行标记,转换成多示例的表示形式,具体包括:
将所述特征数据转换为矩阵数据;
假设存在T个分类任务,则第t个分类任务的数据集表示为Dt,包含|Nt|个负多示例包和|Pt|个正多示例包,此时
Dt=Nt∪Pt
<mrow> <msub> <mi>N</mi> <mi>t</mi> </msub> <mo>=</mo> <mo>&amp;lsqb;</mo> <msub> <mi>B</mi> <mrow> <mn>1</mn> <mi>t</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>B</mi> <mrow> <mrow> <mo>|</mo> <msub> <mi>N</mi> <mi>t</mi> </msub> <mo>|</mo> </mrow> <mi>t</mi> </mrow> </msub> <mo>&amp;rsqb;</mo> <mo>;</mo> </mrow>
<mrow> <msub> <mi>P</mi> <mi>t</mi> </msub> <mo>=</mo> <mo>&amp;lsqb;</mo> <msub> <mi>B</mi> <mrow> <mn>1</mn> <mi>t</mi> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>B</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>B</mi> <mrow> <mrow> <mo>|</mo> <msub> <mi>P</mi> <mi>l</mi> </msub> <mo>|</mo> </mrow> <mi>t</mi> </mrow> </msub> <mo>&amp;rsqb;</mo> <mo>;</mo> </mrow>
其中,Nt表示第t个分类任务的负示例包;Pt表示第t个分类任务的正示例包;Bit表示负多示例包,由m个示例组成;Bjt表示正多示例包,由m个示例组成;
Nt对应的标签集为Yit∈{-1,+1}表示第t个分类任务中的负多示例包Bit所关联的标签;Pt对应的标签集为Yjt∈{-1,+1}表示为第t个分类任务中的正多示例包Bjt所关联的标签。
5.根据权利要求4所述的图像识别方法,其特征在于,下述公式为加权的公式:
<mrow> <msubsup> <mi>Q</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>Q</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </msubsup> <msup> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>Y</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mo>&amp;CenterDot;</mo> <msubsup> <mi>y</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> <mi>z</mi> </msubsup> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mo>/</mo> <msup> <mi>&amp;alpha;</mi> <mn>2</mn> </msup> </mrow> </msup> <mo>;</mo> </mrow>
<mrow> <msubsup> <mi>Q</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>Q</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </msubsup> <msup> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>Y</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mo>&amp;CenterDot;</mo> <msubsup> <mi>y</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> <mi>z</mi> </msubsup> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mo>/</mo> <msup> <mi>&amp;alpha;</mi> <mn>2</mn> </msup> </mrow> </msup> </mrow>
<mrow> <msubsup> <mi>Q</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> </mrow> </msubsup> <mo>=</mo> <mn>1</mn> <mo>/</mo> <mrow> <mo>|</mo> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mo>|</mo> </mrow> <mo>;</mo> </mrow>
<mrow> <msubsup> <mi>Q</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> </mrow> </msubsup> <mo>=</mo> <mn>1</mn> <mo>/</mo> <mrow> <mo>|</mo> <msub> <mi>B</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mo>|</mo> </mrow> <mo>;</mo> </mrow>
yit Z=-1;
yjt Z=+1;
其中,表示第k次负多示例包迭代的权值;表示第k次正多示例包迭代的权值;表示负多示例包迭代的初始化权值;表示正多示例包迭代的初始化权值;yit Z表示负示例包中所有示例标签;yjt Z表示负示例包中所有示例标签。
6.根据权利要求5所述的图像识别方法,其特征在于,利用多任务中的人物中共享图像的信息,确定所述图像之间的关联性,具体包括:
构建第t个分类任务中正多示例包和负多示例包所关联的拉格朗日乘子列向量:
<mrow> <msub> <mi>&amp;alpha;</mi> <mi>t</mi> </msub> <mo>=</mo> <msup> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>&amp;alpha;</mi> <mrow> <mn>1</mn> <mi>t</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>&amp;alpha;</mi> <mrow> <mn>2</mn> <mi>t</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>&amp;alpha;</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>&amp;alpha;</mi> <mrow> <mrow> <mo>|</mo> <msub> <mi>N</mi> <mi>t</mi> </msub> <mo>|</mo> </mrow> <mi>t</mi> </mrow> </msub> <mo>&amp;rsqb;</mo> </mrow> <mi>T</mi> </msup> <mo>;</mo> </mrow>
<mrow> <msub> <mi>&amp;beta;</mi> <mi>t</mi> </msub> <mo>=</mo> <msup> <mrow> <mo>[</mo> <msub> <mi>&amp;beta;</mi> <mrow> <mn>1</mn> <mi>t</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>&amp;beta;</mi> <mrow> <mn>2</mn> <mi>t</mi> </mrow> </msub> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <msub> <mi>&amp;beta;</mi> <mi>jt</mi> </msub> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <msub> <mi>&amp;beta;</mi> <mrow> <mo>|</mo> <msub> <mi>P</mi> <mi>t</mi> </msub> <mo>|</mo> <mi>t</mi> </mrow> </msub> <mo>]</mo> </mrow> <mi>T</mi> </msup> <mo>;</mo> </mrow>
<mrow> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>z</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mo>|</mo> </mrow> </msubsup> <msup> <msub> <mi>Q</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </msup> <msubsup> <mi>B</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> <mi>z</mi> </msubsup> <mo>/</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>z</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mo>|</mo> </mrow> </msubsup> <msup> <msub> <mi>Q</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </msup> <mo>;</mo> </mrow>
<mrow> <msub> <mi>p</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>z</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <msub> <mi>B</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mo>|</mo> </mrow> </msubsup> <msubsup> <mi>Q</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <msubsup> <mi>B</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> <mi>z</mi> </msubsup> <mo>/</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>z</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <msub> <mi>B</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mo>|</mo> </mrow> </msubsup> <msubsup> <mi>Q</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> <mrow> <mi>z</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mo>;</mo> </mrow>
其中,αit表示第t个分类任务中负多示例包nit所关联的拉格朗日乘子,共有|Nt|个;βjt表示第t个分类任务中正多示例包pjt所关联的拉格朗日乘子,共有|Pt|个。
7.根据权利要求6所述的图像识别方法,其特征在于,利用多任务中的人物中共享图像的信息,确定图像间的关联性,具体还包括:
构建T个分类任务中的所有多示例包构成的矩阵:
其中,表示第t个分类任务所有负多示例包构成的包矩阵;表示第t个分类任务所有正多示例包构成的包矩阵;φ(nit)表示负多示例包nit在多任务学习环境下的映射;φ(pjt)表示正多示例包pjt在多任务学习环境下的映射。
8.一种图像识别系统,其特征在于,包括:
数据提取模块,用于获取图像信息,提取所述图像的特征数据;
数据转换模块,用于对所述特征数据进行标记,转换成多示例的表示形式;
加权包学习模块,用于通过多示例加权包进行机器学习,并进行多任务学习环境的扩展;
分类器获取模块,用于训练得到多示例多任务图像识别分类器,对所述图像进行识别分类。
CN201710639261.1A 2017-07-31 2017-07-31 一种图像识别方法及系统 Pending CN107392256A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710639261.1A CN107392256A (zh) 2017-07-31 2017-07-31 一种图像识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710639261.1A CN107392256A (zh) 2017-07-31 2017-07-31 一种图像识别方法及系统

Publications (1)

Publication Number Publication Date
CN107392256A true CN107392256A (zh) 2017-11-24

Family

ID=60342316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710639261.1A Pending CN107392256A (zh) 2017-07-31 2017-07-31 一种图像识别方法及系统

Country Status (1)

Country Link
CN (1) CN107392256A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414624A (zh) * 2019-08-06 2019-11-05 广东工业大学 基于多任务学习的分类模型构建方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013004093A (ja) * 2011-06-16 2013-01-07 Fujitsu Ltd マルチインスタンス学習による検索方法及びシステム
CN105069473A (zh) * 2015-08-05 2015-11-18 广东工业大学 面向在线不确定图像识别的多示例加权包学习方法
CN106055705A (zh) * 2016-06-21 2016-10-26 广东工业大学 基于最大间距多任务多示例学习的网页分类方法
CN106127247A (zh) * 2016-06-21 2016-11-16 广东工业大学 基于多任务多示例支持向量机的图像分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013004093A (ja) * 2011-06-16 2013-01-07 Fujitsu Ltd マルチインスタンス学習による検索方法及びシステム
CN105069473A (zh) * 2015-08-05 2015-11-18 广东工业大学 面向在线不确定图像识别的多示例加权包学习方法
CN106055705A (zh) * 2016-06-21 2016-10-26 广东工业大学 基于最大间距多任务多示例学习的网页分类方法
CN106127247A (zh) * 2016-06-21 2016-11-16 广东工业大学 基于多任务多示例支持向量机的图像分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
TAO ZENG,ET AL.: "Deep Convolutional Neural Networks for Multi-Instance Multi-Task Learning", 《2015 IEEE INTERNATIONAL CONFERENCE ON DATA MINING》 *
张丽阳,等.: "基于示例加权的稀疏正包多示例学习", 《计算机工程与设计》 *
张丽阳: "基于示例加权支持向量机的多示例学习算法研究", 《万方数据》 *
颜庆义,等: "《视频分割及其应用》", 30 April 2014, 国防工业出版社 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414624A (zh) * 2019-08-06 2019-11-05 广东工业大学 基于多任务学习的分类模型构建方法及装置

Similar Documents

Publication Publication Date Title
CN107247989B (zh) 一种实时的计算机视觉处理方法及装置
JP2019101535A (ja) 教師データ作成装置および該方法ならびに画像セグメンテーション装置および該方法
CN103971102B (zh) 基于手指轮廓和决策树的静态手势识别方法
CN107368845A (zh) 一种基于优化候选区域的Faster R‑CNN目标检测方法
CN106682696A (zh) 基于在线示例分类器精化的多示例检测网络及其训练方法
CN107480730A (zh) 电力设备识别模型构建方法和系统、电力设备的识别方法
Ye et al. A lightweight model of VGG-16 for remote sensing image classification
CN107239736A (zh) 基于多任务级联卷积神经网络的人脸检测方法及检测装置
CN106650789A (zh) 一种基于深度lstm网络的图像描述生成方法
CN105069413A (zh) 一种基于深度卷积神经网络的人体姿势识别方法
CN107273490A (zh) 一种基于知识图谱的组合错题推荐方法
CN105825511A (zh) 一种基于深度学习的图片背景清晰度检测方法
CN104778702A (zh) 基于深度学习的图像隐写检测方法
CN107132516A (zh) 一种基于深度置信网络的雷达一维距离像目标识别方法
CN110991532B (zh) 基于关系视觉注意机制的场景图产生方法
CN103793926B (zh) 基于样本重选择的目标跟踪方法
CN105046277A (zh) 特征显著性在图像质量评价中的鲁棒机理研究方法
CN103927550B (zh) 一种手写体数字识别方法及系统
CN105931253A (zh) 一种基于半监督学习相结合的图像分割方法
CN103942749B (zh) 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
CN107316067A (zh) 一种基于惯性传感器的空中手写字符识别方法
CN102902981B (zh) 基于慢特征分析的暴力视频检测方法
CN110197224B (zh) 基于特征空间深度对抗学习的空中手写字符轨迹恢复方法
CN105005769A (zh) 一种基于深度信息的手语识别方法
CN106022363A (zh) 一种适用于自然场景下的中文文字识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171124

RJ01 Rejection of invention patent application after publication