CN105446997A - 图片内容识别方法和装置 - Google Patents

图片内容识别方法和装置 Download PDF

Info

Publication number
CN105446997A
CN105446997A CN201410350987.XA CN201410350987A CN105446997A CN 105446997 A CN105446997 A CN 105446997A CN 201410350987 A CN201410350987 A CN 201410350987A CN 105446997 A CN105446997 A CN 105446997A
Authority
CN
China
Prior art keywords
collection
sample characteristics
fisrt feature
feature
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410350987.XA
Other languages
English (en)
Other versions
CN105446997B (zh
Inventor
江焯林
孔庶
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201410350987.XA priority Critical patent/CN105446997B/zh
Publication of CN105446997A publication Critical patent/CN105446997A/zh
Application granted granted Critical
Publication of CN105446997B publication Critical patent/CN105446997B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明实施例提供一种图片内容识别方法和装置。本发明实施例涉及图像识别技术领域,用以解决计算机视觉领域的图片内容识别问题。方法包括接收待识别图片;根据图片识别模型对所述待识别图片进行识别,所述图片识别模型中包括第一特征集的集合,所述第一特征集具有用于识别图片内容的内容信息;输出图片识别结果。本发明实施例提供的图片内容识别方法和装置,可以应用于对图片内容识别的精确度要求较高的图片内容识别设备。

Description

图片内容识别方法和装置
技术领域
本发明实施例涉及图像识别技术,尤其涉及一种图片内容识别方法和装置。
背景技术
图片内容识别是指对图片进行解释,以识别出图片中包含的物体、图片的拍摄场景等。图片内容识别涉及诸如基于图片的物体分类、基于图片的物体检测、基于视频跟踪的再定位等计算机视觉问题,是计算机视觉领域的重要组成部分。
现有技术中,常用的图片内容识别方法是物体检测法。当前的物体检测法主要是通过定义一系列模板,使每个模板捕捉某种特定类型的物体,或者特定类型物体的某个部位,以捕捉可能出现在图片的任意位置的物体。其中,定义的模板通常是通过在足够多的训练集中进行学习得到,训练集也通常是通过人为地在一些图片中进行标注获得,训练集的采集耗费大量人力、物力,且通常无法在合理的时间内获得足够多的训练集图片,以捕捉足够多的物体类别信息特征,也就无法对图片中包含的复杂内容进行充分解释。
因此,上述现有技术的图片内容识别方法,效率低,且通常无法识别图片包含的复杂内容。
发明内容
本发明的实施例提供一种图片内容识别方法和装置,用以在确保图片内容识别效率的同时,提高图片内容识别的精确度。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供一种图片内容识别方法,包括:
接收待识别图片;
根据图片识别模型对所述待识别图片进行识别,所述图片识别模型中包括第一特征集的集合,所述第一特征集具有用于识别图片内容的内容信息;
输出图片识别结果。
在第一方面的第一种可能的实现方式中,
所述根据图片识别模型对所述待识别图片进行识别包括:
提取待识别图片中的低级特征;
所述待识别图片包含n个第二特征区域,所述第二特征区域内包含的低级特征形成第二特征集,所述第二特征集用于表示所述第二特征区域的内容,所述n为n≧2的整数;
计算所述第二特征集与所述第一特征集之间的相似度值;
当所述第一特征集与所述第二特征集的相似度值大于预设阈值时,用所述第一特征集所具有的内容信息描述所述第二特征集。
在第一方面的第二种可能的实现方式中,
所述根据图片识别模型对所述待识别图片进行识别之前,所述方法还包括:
提取样本图片堆中每一张样本图片的低级特征;
所述样本图片包含m个样本特征区域,所述样本特征区域内包含的低级特征形成样本特征集,所述样本特征集用于表示所述样本特征区域的内容,所述m为m≧2的整数;
计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值;
根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,所述具有判别性和代表性的样本特征集为所述第一特征集,所述判别性表示选出的第一特征集对所述样本图片堆所包含的图片特征具有区分能力,所述代表性表示选出的第一特征集对所述样本图片堆中所包含的图片特征具有覆盖能力。
结合第一方面或第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值,包括:
利用距离计算公式计算样本特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,样本特征集X={x1,...,xr},样本特征集Y={y1,...,yq},r为样本特征集X中的特征集个数,q为样本特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
结合第一方面或第一方面的第一种可能的实现方式,在第四种可能的实现方式中,所述计算所述第二特征集与所述第一特征集之间的相似度值,包括:
利用距离计算公式计算第二特征集与第一特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,第二特征集X={x1,...,xr},第一特征集Y={y1,...,yq},r为第二特征集X中的特征集个数,q为第一特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
结合第一方面或第一方面的第二种可能的实现方式,在第五种可能的实现方式中,所述根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,包括:
对样本特征集进行编号;
根据样本特征集两两之间的相似度值和样本特征集选择公式,选择出具有判别性和代表性的样本特征集作为第一特征集,所述样本特征集选择公式为:
A=argmaxH(A)+λG(A)
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,全集I为所有样本特征集的编号的集合,|A|≤K,K为需要选出的第一特征集的数量,H(A)用于根据样本特征集两两之间的相似度值控制选出的第一特征集具有判别性和代表性,G(A)用于根据样本特征集两两之间的相似度值控制选择出的第一特征集在所述样本图片堆中各个样本图片分布的平均性,λ为控制参数。
结合第一方面或第一方面的第五种可能的实现方式,在第六种可能的实现方式中,在所述对样本特征集进行编号之后,还包括:
构建表示所述样本特征集两两之间的相似度值的矩阵S,矩阵中的元素SMN表示第M个样本特征集与第N个样本特征集的相似度值,其中M、N为样本特征集的编号;
所述H(A)具体定义为:
H ( A ) = log ( μ + h ( S A , A ) - ( τ - 1 ) h ( S A , A ‾ ) - τh ( S A ‾ , A ‾ ) )
h(SM,N)=∑i∈Mj∈NSij
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,μ的取值为预设值,τ为大于2的实数,为A的补集,全集I为所有样本特征集的编号的集合,M为矩阵S的行索引号,N为矩阵S的列索引号,i、j为用于累加循环的参数变量。
结合第一方面或第一方面的第五种可能的实现方式或第一方面的第六种可能的实现方式,在第七种可能的实现方式中,所述G(A)具体定义为:
G ( A ) = Σ q = 1 Q log ( | A q | + 1 )
其中,A为选出的第一特征集的索引的集合,Aq是A的子集,与Aq对应的特征集为属于第q张样本图片的特征集,Q为样本图片的数量。
第二方面,本发明实施例提供一种图片内容识别方法,包括:
接收模块,用于接收待识别图片;
识别模块,用于根据图片识别模型对所述待识别图片进行识别,所述图片识别模型中包括第一特征集的集合,所述第一特征集具有用于识别图片内容的内容信息;
输出模块,用于输出图片识别结果。
在第二方面的第一种可能的实现方式中,所述装置还包括:
提取模块,用于提取待识别图片中的低级特征;
所述待识别图片包含n个第二特征区域,所述第二特征区域内包含的低级特征形成第二特征集,所述第二特征集用于表示所述第二特征区域的内容,所述n为n≧2的整数;
计算模块,用于计算所述第二特征集与所述第一特征集之间的相似度值;
当所述第一特征集与所述第二特征集的相似度值大于预设阈值时,用所述第一特征集所具有的内容信息描述所述第二特征集。
在第二方面的第二种可能的实现方式中,
所述提取模块,还用于提取样本图片堆中每一张样本图片的低级特征;
所述样本图片包含m个样本特征区域,所述样本特征区域内包含的低级特征形成样本特征集,所述样本特征集用于表示所述样本特征区域的内容,所述m为m≧2的整数;
所述计算模块,还用于计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值;
所述装置还包括:
获取模块,用于根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,所述具有判别性和代表性的样本特征集为所述第一特征集,所述判别性表示选出的第一特征集对所述样本图片堆所包含的图片特征具有区分能力,所述代表性表示选出的第一特征集对所述样本图片堆中所包含的图片特征具有覆盖能力。
结合第二方面或第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述计算模块,具体用于:
利用距离计算公式计算样本特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,样本特征集X={x1,...,xr},样本特征集Y={y1,...,yq},r为样本特征集X中的特征集个数,q为样本特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
结合第二方面或第二方面的第一种可能的实现方式,在第四种可能的实现方式中,所述计算模块,具体用于:
利用距离计算公式计算第二特征集与第一特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,第二特征集X={x1,...,xr},第一特征集Y={y1,...,yq},r为第二特征集X中的特征集个数,q为第一特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
结合第二方面或第二方面的第二种可能的实现方式,在第五种可能的实现方式中,所述获取模块,具体用于:
对样本特征集进行编号;
根据样本特征集两两之间的相似度值和样本特征集选择公式,选择出具有判别性和代表性的样本特征集作为第一特征集,所述样本特征集选择公式为:
A=argmaxH(A)+λG(A)
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,全集I为所有样本特征集的编号的集合,|A|≤K,K为需要选出的第一特征集的数量,H(A)用于根据样本特征集两两之间的相似度值控制选出的第一特征集具有判别性和代表性,G(A)用于根据样本特征集两两之间的相似度值控制选择出的第一特征集在所述样本图片堆中各个样本图片分布的平均性,λ为控制参数,其大小通过实验获得。
结合第二方面或第二方面的第五种可能的实现方式,在第六种可能的实现方式中,所述获取模块还用于:
构建表示所述样本特征集两两之间的相似度值的矩阵S,矩阵中的元素SMN表示第M个样本特征集与第N个样本特征集的相似度值,其中M、N为样本特征集的编号;
所述H(A)具体定义为:
H ( A ) = log ( μ + h ( S A , A ) - ( τ - 1 ) h ( S A , A ‾ ) - τh ( S A ‾ , A ‾ ) )
h(SM,N)=∑i∈Mj∈NSij
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,μ的取值为预设值,μ的取值需要为足够大的数,因此,具体值需根据经验和实施效果确定,τ为大于2的实数,为A的补集,全集I为所有样本特征集的编号的集合,M为矩阵S的行索引号,N为矩阵S的列索引号,i、j为用于累加循环的参数变量。
结合第二方面或第二方面的第五种可能的实现方式或第二方面的第六种可能的实现方式,在第七种可能的实现方式中,所述G(A)具体定义为:
G ( A ) = Σ q = 1 Q log ( | A q | + 1 )
其中,A为选出的第一特征集的索引的集合,Aq是A的子集,与Aq对应的特征集为属于第q张样本图片的特征集,Q为样本图片的数量。
本发明实施例提供的技术方案,通过预先定义图片识别模型,在接收到待识别图片后,可以根据图片识别模型对所述待识别图片进行识别,由于图片识别模型中包括第一特征集的集合,第一特征集具有用于识别图片内容的内容信息,因此,可以根据图片识别模型识别出待识别图片的内容,并输出图片识别结果。由于集合了样本图片内容信息的第一特征集的生成可以是自动化的过程,例如,利用现有技术中成熟的低级特征提取器提取生成,因此,可以根据对图片内容识别的精确度的要求,设计出相应数量的第一特征集;第一特征集的生成可以通过对大量与待识别图片相关的样本图片中提取生成,因此,本发明实施例提供的技术方案,可以在确保图片内容识别效率的同时,提高图片内容识别的精确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明图片内容识别方法实施例一的流程图;
图2为本发明图片内容识别方法实施例二的流程图;
图3为本发明图片识别模板实施例的示意图;
图4为本发明图片内容识别装置实施例一的结构示意图;
图5为本发明图片内容识别装置实施例二的结构示意图;
图6为本发明图片内容识别装置实施例三的结构示意图;
图7为本发明实施例提供的图片内容识别设备实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明图片内容识别方法实施例一的流程图。如图1所示,本实施例的方法可以包括以下内容。
S101、接收待识别图片。
S102、根据图片识别模型对待识别图片进行识别。
S103、输出图片识别结果。
具体的,图片内容识别装置接收待识别图片,根据图片识别模型对待识别图片进行识别,图片识别模型中包括第一特征集的集合,第一特征集具有用于识别图片内容的内容信息。第一特征集可以预先生成,例如,可以通过从大量与待识别图片相关的样本图片中提取生成。输出的图片识别结果,可以是对待识别图片内容的识别,也可以是对待识别图片内容类别的识别。
本实施例中,通过预先定义图片识别模型,在接收到待识别图片后,可以根据图片识别模型对所述待识别图片进行识别,由于图片识别模型中包括第一特征集的集合,第一特征集具有用于识别图片内容的内容信息,因此,可以根据图片识别模型识别出待识别图片的内容,并输出图片识别结果。由于集合了待识别图片内容信息的第一特征集的生成可以是自动化的过程,例如,利用现有技术中成熟的低级特征提取器提取生成,因此,可以根据对图片内容识别的精确度的要求,设计出相应数量的第一特征集;第一特征集的生成可以通过从大量与待识别图片相关的样本图片中提取生成,在具体的操作过程中,通常会有多个第一特征集,每一个第一特征集是某种类似特征的集合,这里说的某种类似特征对应某种对应的图片内容,因此,当待识别图片输入该图片识别模型后,图片内容识别装置根据图片识别模型中的第一特征集对待识别图片进行识别,当第一特征集足够多的时候,该图片识别模型对待识别图片的局部细节识别能力也更强,这样,本发明实施例提供的这样一个技术方案,可以在确保图片内容识别效率的同时,提高对图片内容识别的精确度。
图2为本发明图片内容识别方法实施例二的流程图。如图2所示,在图1所示本发明方法实施例一的基础上,在S102中所述的根据图片识别模型对所述待识别图片进行识别,具体为:
S201、提取待识别图片中的低级特征。
S202、用待识别图片的低级特征标识待识别图片的第二特征区域。
具体的,第二特征区域为预先定义的图片识别模板中的四边形区域(也可以是其它形状,对此不做限定)。每个图片识别模板通常包含一个用于捕捉图片中特定区域的内容信息的特征区域,图片识别模板的数量可以根据图片内容识别的精确度要求和图片识别的速度要求等各因素设定。
图3为本发明图片识别模板实施例的示意图。如图3所示,图中的每个正方形区域代表一个图片识别模板,共定义了256个图片识别模板。每个图片识别模板包括一个特征区域(即每个正方形区域的白色区域)。当将各个正方形区域放大成与待识别图片的大小一致时,应使各个特征区域能覆盖到待识别图片的各个区域,以捕捉到出现在图片任意位置的内容信息。
对于给定的待识别图片,可以采用当前成熟的低级特征提取器来获得待识别图片的低级特征,例如SIFT(scale-invariantfeaturetransform,尺度不变的特征变换)特征、HoG(histogramsoforientedgradients,方向梯度直方图)特征等。
本实施例中,所述待识别图片包含n个第二特征区域,所述第二特征区域内包含的低级特征形成第二特征集,所述第二特征集用于表示所述第二特征区域的内容,所述n为n≧2的整数。
S203、计算第二特征集与所述第一特征集之间的相似度值。
具体的,第一特征集的生成可以通过从大量与待识别图片相关的样本图片中提取生成。相似度值作为特征集之间相似性的测量,其计算规则不做限定。
S204、当第一特征集与第二特征集的相似度值大于预设阈值时,用第一特征集所具有的内容信息描述第二特征集。
具体的,对于每个第二特征集,找出与其相似性较大的第一特征集,进而用第一特征集所具有的内容信息描述第二特征集,实现对待识别图片进行图片分类或者对图片内容解释。
本实施例中,通过提取待识别图片中的低级特征,并用待识别图片的低级特征标识待识别图片的各个第二特征区域,生成第二特征集,并进一步的计算第二特征集与第一特征集之间的相似度值,当第一特征集与所第二特征集的相似度值大于预设阈值时,用第一特征集所具有的内容信息描述第二特征集,识别出待识别图片中的内容信息,实现了对待识别图片的分类或者对图片内容的解释。由于集合了待识别图片内容信息的第二特征集的生成可以是自动化的过程,例如,利用现有技术中成熟的低级特征提取器提取生成,相似度值的计算过程也可以通过计算机快速、准确的执行,因此,可以根据对图片内容识别的精确度的要求,设计出相应数量的图片内容识别模板;类似的,用于图片内容识别的第一特征集的生成也可以是自动化的过程,第一特征集的生成可以通过从大量与待识别图片相关的图片特征中提取生成,因此,本发明实施例提供的技术方案,可以在确保图片内容识别效率的同时,提高图片内容识别的精确度。
如上所述的方法,其中,所述根据图片识别模型对所述待识别图片进行识别之前,所述方法还包括:
提取样本图片堆中每一张样本图片的低级特征;
所述样本图片包含m个样本特征区域,所述样本特征区域内包含的低级特征形成样本特征集,所述样本特征集用于表示所述样本特征区域的内容,所述m为m≧2的整数;
计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值;
根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,所述具有判别性和代表性的样本特征集为所述第一特征集。所述判别性表示选出的第一特征集对所述样本图片堆所包含的图片特征具有区分能力,例如,选出的第一特征集中的特征与没有被选出的特征具有较大的差异或者较小的相似性;所述代表性表示选出的第一特征集对所述样本图片堆中所包含的图片特征具有覆盖能力,例如,选出的第一特征集内所包含的特征之间具有较大的相似性,因为样本图片堆的关联在于包含相似的图片内容。
具体的,所述样本图片是指与待识别图片的内容相关的图片,在具体的实现过程中,为了保证第一特征集的判别性和代表性,通常情况下选取的样本图片是同一类型的图片,大量这样的样本图片组成样本图片堆。从这样的属于某一类型的图片堆中提取出来的第一特征集对待识别图片中的含有该类型内容能够准确识别出来。举例说:当该图片堆都是关于猫的样本图片,则根据该图片堆提取出来的第一特征集具有了用于识别猫的内容信息,那么当待识别图片中有猫的时候则可以根据图片识别模型准确识别出来;当另一个图片堆都是关于狗的样本图片,则根据这个图片堆提取出来的第一特征集具有了用于识别狗的内容信息,那么当待识别图片中有狗的时候则可以根据图片识别模型准确的识别出来。在具体的实现过程中,为了使得图片识别模型具有更精确的识别能力,可以根据足够多的样本图片堆来提取足够多具有相应内容信息的第一特征集。
比如,可以根据对图片内容识别的精确度的要求,通过搜索引擎等手段获得相应数量的样本图片堆,并采用当前成熟的低级特征提取器来获得样本图片堆中样本图片的低级特征,然后进一步的用所述低级特征表达样本图片的特征区域的内容信息,生成样本特征集。计算样本图片堆内包含的所有样本特征集两两之间的相似度值,以选择出具有代表性和判断性的样本特征集,即为生成的第一特征集。
本发明实施例中,通过从与待识别图片相关的样本图片中选择出具有代表性和判断性的样本特征集,生成的第一特征集可以更精确的识别图片内包含的更多细节内容,因此,本发明实施例提供的技术方案,可以有效的提高图片内容识别的精确度。在具体的操作过程中,为了使得这个图片识别模型所包含的第一特征集对更多的待识别图片具有更广泛的识别能力,对于第一特征集的提取过程可以是在线的,即不停的对新的样本图片堆进行提取获取更丰富的第一特征集,从而识别出更多的图片内容。
如上所述的方法,优选地,所述计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值,包括:
先利用距离计算公式计算样本特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,样本特征集X={x1,...,xr},样本特征集Y={y1,...,yq},r为样本特征集X中的特征集个数,q为样本特征集Y中的特征集个数;
再通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
例如,X为样本图片的一个样本特征集,用所述样本图片的低级特征集表示为X={x1,...,xr},即与X对应的样本特征区域包含了样本图片的r个低级特征。类似地,Y为样本图片的另一个样本特征集,用所述样本图片的低级特征集表示为Y={y1,...,yq},即与Y对应的样本特征区域包含了样本图片的q个低级特征。因此,计算出的X和Y的相似度值,可以反映出对应的样本特征区域在内容层次上的相似性。
如上所述的方法,优选地,所述计算所述第二特征集与所述第一特征集之间的相似度值,包括:
先利用距离计算公式计算第二特征集与第一特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,第二特征集X={x1,...,xr},第一特征集Y={y1,...,yq},r为第二特征集X中的特征集个数,q为第一特征集Y中的特征集个数;
再通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
例如,X为一个第二特征集,用待识别图片的低级特征集表示为X={x1,...,xr},即与X对应的第二特征区域包含了待识别图片的r个低级特征。类似地,Y为一个第一特征集,用样本图片的低级特征集表示为Y={y1,...,yq},即与Y对应的样本特征区域包含了样本图片的q个低级特征。因此,计算出的X和Y的相似度值,可以反映出对应的待识别图片的第二特征区域与样本图片的样本特征区域在内容层次上的相似性。
如上所述的方法,其中,所述根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,具体可以包括:
对样本特征集进行编号;
根据样本特征集两两之间的相似度值和样本特征集选择公式,选择出具有判别性和代表性的样本特征集作为第一特征集,所述样本特征集选择公式为:
A=argmaxH(A)+λG(A)
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,全集I为所有样本特征集的编号的集合,|A|≤K,K为需要选出的第一特征集的数量,H(A)用于根据样本特征集两两之间的相似度值控制选出的第一特征集具有判别性和代表性,G(A)用于根据样本特征集两两之间的相似度值控制选择出的第一特征集在所述样本图片堆中各个样本图片分布的平均性,λ为控制参数。
如上所述的方法,其中,在所述对样本特征集进行编号之后,还可以包括:
构建表示所述样本特征集两两之间的相似度值的矩阵S,矩阵中的元素SMN表示第M个样本特征集与第N个样本特征集的相似度值,其中M、N为样本特征集的编号;
所述H(A)具体定义为:
H ( A ) = log ( μ + h ( S A , A ) - ( τ - 1 ) h ( S A , A ‾ ) - τh ( S A ‾ , A ‾ ) )
h(SM,N)=∑i∈Mj∈NSij
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,μ的取值为预设值,τ为大于2的实数,为A的补集,全集I为所有样本特征集的编号的集合,M为矩阵S的行索引号,N为矩阵S的列索引号,i、j为用于累加循环的参数变量。
如上所述的方法,其中,所述G(A)具体可以定义为:
G ( A ) = Σ q = 1 Q log ( | A q | + 1 )
其中,A为选出的第一特征集的索引的集合,Aq是A的子集,与Aq对应的特征集为属于第q张样本图片的特征集,Q为样本图片的数量。
例如,假设要选择出K个第一特征集,I为所有样本特征集的编号的集合,那么,需满足A∈I且|A|≤K,λ控制着所选择的第一特征集分布在每张样本图片的平均性,该选择方法期望在每张样本图片中都找出其具有代表性的第一特征集。方程h(SM,N)=∑i∈Mj∈NSij计算的是矩阵S中行号为M的矩阵元素和列号为N的矩阵元素之和,其中,需满足否则,h(SM,N)=0。
需要说明的是,H(A)中h(SA,A)模拟了所寻找的第一特征集中包含相同的物体,这样A索引的第一特征集的相似性会更大;模拟了相同图片中包含物体的第一特征集与不包含物体的第一特征集具有大的差异性(或小的相似性);模拟了来自不同图片的不包含物体的第一特征集(模拟成干扰/噪音信息),而这些第一特征集之间的相似性也会很小,因为所有来自同一类图片的关联都在于这些图片包含的相同物体。
Aq索引来自第q张图片的第一特征集。在这里,G(A)对图片中取样数目平衡性约束使得该方案能够针对图片进行逐一抽取;而通过调整约束强度的参数,还可以有效地提取出由于获取图片的失误而输入根本不含有效物体的图片。
图4为本发明图片内容识别装置实施例一的结构示意图。如图4所示,本实施例的图片内容识别装置可以包括接收模块401、识别模块402和输出模块403,其中,接收模块401,用于接收待识别图片;识别模块402,用于根据图片识别模型对所述待识别图片进行识别,所述图片识别模型中包括第一特征集的集合,所述第一特征集具有用于识别图片内容的内容信息;输出模块403,用于输出图片识别结果。
本实施例的图片内容识别装置可以用于执行图1所示方法实施例的方法,具备相应的功能模块,其实现原理和所要达到的技术效果类似,在此不再赘述。
图5为本发明图片内容识别装置实施例二的结构示意图。如图5所示,本实施例的图片内容识别装置还可以包括:提取模块501和计算模块502。其中,提取模块501,用于提取待识别图片中的低级特征;所述待识别图片包含n个第二特征区域,所述第二特征区域内包含的低级特征形成第二特征集,所述第二特征集用于表示所述第二特征区域的内容,所述n为n≧2的整数;计算模块502,用于计算所述第二特征集与所述第一特征集之间的相似度值;当所述第一特征集与所述第二特征集的相似度值大于预设阈值时,用所述第一特征集所具有的内容信息描述所述第二特征集。
本实施例的图片内容识别装置可以用于执行图2所示方法实施例的方法,具备相应的功能模块,其实现原理和所要达到的技术效果类似,在此不再赘述。
图6为本发明图片内容识别装置实施例三的结构示意图。如图6所示,本实施例的图片内容识别装置还可以包括:获取模块601。其中,提取模块501,还可以用于提取样本图片堆中每一张样本图片的低级特征;所述样本图片包含m个样本特征区域,所述样本特征区域内包含的低级特征形成样本特征集,所述样本特征集用于表示所述样本特征区域的内容,所述m为m≧2的整数;计算模块502,还可以用于计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值;获取模块601,用于根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,所述具有判别性和代表性的样本特征集为所述第一特征集,所述判别性表示选出的第一特征集对所述样本图片堆所包含的图片特征具有区分能力,所述代表性表示选出的第一特征集对所述样本图片堆中所包含的图片特征具有覆盖能力。
本实施例的图片内容识别装置,其实现原理和所要达到的技术效果上文中已有论述,在此不再赘述。
如上所述的装置,其中,计算模块502,具体可以用于:
利用距离计算公式计算样本特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,样本特征集X={x1,...,xr},样本特征集Y={y1,...,yq},r为样本特征集X中的特征集个数,q为样本特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
如上所述的装置,其中,计算模块502,具体还可以用于:
利用距离计算公式计算第二特征集与第一特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,第二特征集X={x1,...,xr},第一特征集Y={y1,...,yq},r为第二特征集X中的特征集个数,q为第一特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
本实施例的图片内容识别装置,其实现原理和所要达到的技术效果上文中已有论述,在此不再赘述。
如上所述的装置,其中,获取模块601,具体可以用于:
对样本特征集进行编号;
根据样本特征集两两之间的相似度值和样本特征集选择公式,选择出具有判别性和代表性的样本特征集作为第一特征集,所述样本特征集选择公式为:
A=argmaxH(A)+λG(A)
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,全集I为所有样本特征集的编号的集合,|A|≤K,K为需要选出的第一特征集的数量,H(A)用于根据样本特征集两两之间的相似度值控制选出的第一特征集具有判别性和代表性,G(A)用于根据样本特征集两两之间的相似度值控制选择出的第一特征集在所述样本图片堆中各个样本图片分布的平均性,λ为控制参数。
本实施例的图片内容识别装置,其实现原理和所要达到的技术效果上文中已有论述,在此不再赘述。
如上所述的装置,其中,获取模块601,具体还可以用于:
构建表示所述样本特征集两两之间的相似度值的矩阵S,矩阵中的元素SMN表示第M个样本特征集与第N个样本特征集的相似度值,其中M、N为样本特征集的编号;
所述H(A)具体定义为:
H ( A ) = log ( μ + h ( S A , A ) - ( τ - 1 ) h ( S A , A ‾ ) - τh ( S A ‾ , A ‾ ) )
h(SM,N)=∑i∈Mj∈NSij
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,μ的取值为预设值,τ为大于2的实数,为A的补集,全集I为所有样本特征集的编号的集合,M为矩阵S的行索引号,N为矩阵S的列索引号,i、j为用于累加循环的参数变量。
本实施例的图片内容识别装置,其实现原理和所要达到的技术效果上文中已有论述,在此不再赘述。
如上所述的装置,其中,所述G(A)具体定义为:
G ( A ) = Σ q = 1 Q log ( | A q | + 1 )
其中,A为选出的第一特征集的索引的集合,Aq是A的子集,与Aq对应的特征集为属于第q张样本图片的特征集,Q为样本图片的数量。
本实施例的图片内容识别装置,其实现原理和所要达到的技术效果上文中已有论述,在此不再赘述。
图7为本发明实施例提供的图片内容识别设备实施例的结构示意图。如图7所示,该图片内容识别设备包括至少一个处理器701(例如CPU),存储器703,和至少一个通信总线704,用于实现装置之间的连接通信。处理器701用于执行存储器703中存储的可执行模块,例如计算机程序。存储器703可能包含高速随机存取存储器(RAM:RandomAccessMemory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。
在一些实施方式中,存储器703存储了程序705,程序705可以被处理器701执行,这个程序包括执行一种图片内容识别方法,该方法包括:
接收待识别图片;
根据图片识别模型对所述待识别图片进行识别,所述图片识别模型中包括第一特征集的集合,所述第一特征集具有用于识别图片内容的内容信息;
输出图片识别结果。
上述执行图片内容识别方法的程序,优选地,所述根据图片识别模型对所述待识别图片进行识别包括:
提取待识别图片中的低级特征;
所述待识别图片包含n个第二特征区域,所述第二特征区域内包含的低级特征形成第二特征集,所述第二特征集用于表示所述第二特征区域的内容,所述n为n≧2的整数;
计算所述第二特征集与所述第一特征集之间的相似度值;
当所述第一特征集与所述第二特征集的相似度值大于预设阈值时,用所述第一特征集所具有的内容信息描述所述第二特征集。
上述执行图片内容识别方法的程序,优选地,所述根据图片识别模型对所述待识别图片进行识别之前,所述方法还包括:
提取样本图片堆中每一张样本图片的低级特征;
所述样本图片包含m个样本特征区域,所述样本特征区域内包含的低级特征形成样本特征集,所述样本特征集用于表示所述样本特征区域的内容,所述m为m≧2的整数;
计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值;
根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,所述具有判别性和代表性的样本特征集为所述第一特征集,所述判别性表示选出的第一特征集对所述样本图片堆所包含的图片特征具有区分能力,所述代表性表示选出的第一特征集对所述样本图片堆中所包含的图片特征具有覆盖能力。
上述执行图片内容识别方法的程序,优选地,所述计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值,包括:
利用距离计算公式计算样本特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,样本特征集X={x1,...,xr},样本特征集Y={y1,...,yq},r为样本特征集X中的特征集个数,q为样本特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
上述执行图片内容识别方法的程序,优选地,所述计算所述第二特征集与所述第一特征集之间的相似度值,包括:
利用距离计算公式计算第二特征集与第一特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,第二特征集X={x1,...,xr},第一特征集Y={y1,...,yq},r为第二特征集X中的特征集个数,q为第一特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
上述执行图片内容识别方法的程序,优选地,所述根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,包括:
对样本特征集进行编号;
根据样本特征集两两之间的相似度值和样本特征集选择公式,选择出具有判别性和代表性的样本特征集作为第一特征集,所述样本特征集选择公式为:
A=argmaxH(A)+λG(A)
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,全集I为所有样本特征集的编号的集合,|A|≤K,K为需要选出的第一特征集的数量,H(A)用于根据样本特征集两两之间的相似度值控制选出的第一特征集具有判别性和代表性,G(A)用于根据样本特征集两两之间的相似度值控制选择出的第一特征集在所述样本图片堆中各个样本图片分布的平均性,λ为控制参数。
上述执行图片内容识别方法的程序,优选地,在所述对样本特征集进行编号之后,还包括:
构建表示所述样本特征集两两之间的相似度值的矩阵S,矩阵中的元素SMN表示第M个样本特征集与第N个样本特征集的相似度值,其中M、N为样本特征集的编号;
所述H(A)具体定义为:
H ( A ) = log ( μ + h ( S A , A ) - ( τ - 1 ) h ( S A , A ‾ ) - τh ( S A ‾ , A ‾ ) )
h(SM,N)=∑i∈Mj∈NSij
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,μ的取值为预设值,τ为大于2的实数,为A的补集,全集I为所有样本特征集的编号的集合,M为矩阵S的行索引号,N为矩阵S的列索引号,i、j为用于累加循环的参数变量。
上述执行图片内容识别方法的程序,优选地,所述G(A)具体定义为:
G ( A ) = Σ q = 1 Q log ( | A q | + 1 )
其中,A为选出的第一特征集的索引的集合,Aq是A的子集,与Aq对应的特征集为属于第q张样本图片的特征集,Q为样本图片的数量。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (16)

1.一种图片内容识别方法,其特征在于,包括:
接收待识别图片;
根据图片识别模型对所述待识别图片进行识别,所述图片识别模型中包括第一特征集的集合,所述第一特征集具有用于识别图片内容的内容信息;
输出图片识别结果。
2.根据权利要求1所述的方法,其特征在于,
所述根据图片识别模型对所述待识别图片进行识别包括:
提取待识别图片中的低级特征;
所述待识别图片包含n个第二特征区域,所述第二特征区域内包含的低级特征形成第二特征集,所述第二特征集用于表示所述第二特征区域的内容,所述n为n≧2的整数;
计算所述第二特征集与所述第一特征集之间的相似度值;
当所述第一特征集与所述第二特征集的相似度值大于预设阈值时,用所述第一特征集所具有的内容信息描述所述第二特征集。
3.根据权利要求1所述的方法,其特征在于,
所述根据图片识别模型对所述待识别图片进行识别之前,所述方法还包括:
提取样本图片堆中每一张样本图片的低级特征;
所述样本图片包含m个样本特征区域,所述样本特征区域内包含的低级特征形成样本特征集,所述样本特征集用于表示所述样本特征区域的内容,所述m为m≧2的整数;
计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值;
根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,所述具有判别性和代表性的样本特征集为所述第一特征集,所述判别性表示选出的第一特征集对所述样本图片堆所包含的图片特征具有区分能力,所述代表性表示选出的第一特征集对所述样本图片堆中所包含的图片特征具有覆盖能力。
4.根据权利要求3所述的方法,其特征在于,所述计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值,包括:
利用距离计算公式计算样本特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,样本特征集X={x1,...,xr},样本特征集Y={y1,...,yq},r为样本特征集X中的特征集个数,q为样本特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
5.根据权利要求2所述的方法,其特征在于,所述计算所述第二特征集与所述第一特征集之间的相似度值,包括:
利用距离计算公式计算第二特征集与第一特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,第二特征集X={x1,...,xr},第一特征集Y={y1,...,yq},r为第二特征集X中的特征集个数,q为第一特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
6.根据权利要求3所述的方法,其特征在于,所述根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,包括:
对样本特征集进行编号;
根据样本特征集两两之间的相似度值和样本特征集选择公式,选择出具有判别性和代表性的样本特征集作为第一特征集,所述样本特征集选择公式为:
A=argmaxH(A)+λG(A)
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,全集I为所有样本特征集的编号的集合,|A|≤K,K为需要选出的第一特征集的数量,H(A)用于根据样本特征集两两之间的相似度值控制选出的第一特征集具有判别性和代表性,G(A)用于根据样本特征集两两之间的相似度值控制选择出的第一特征集在所述样本图片堆中各个样本图片分布的平均性,λ为控制参数。
7.根据权利要求6所述的方法,其特征在于,在所述对样本特征集进行编号之后,还包括:
构建表示所述样本特征集两两之间的相似度值的矩阵S,矩阵中的元素SMN表示第M个样本特征集与第N个样本特征集的相似度值,其中M、N为样本特征集的编号;
所述H(A)具体定义为:
H ( A ) = log ( μ + h ( S A , A ) - ( τ - 1 ) h ( S A , A ‾ ) - τh ( S A ‾ , A ‾ ) )
h(SM,N)=∑i∈Mj∈NSij
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,μ的取值为预设值,τ为大于2的实数,为A的补集,全集I为所有样本特征集的编号的集合,M为矩阵S的行索引号,N为矩阵S的列索引号,i、j为用于累加循环的参数变量。
8.根据权利要求6或7所述的方法,其特征在于,所述G(A)具体定义为:
G ( A ) = Σ q = 1 Q log ( | A q | + 1 )
其中,A为选出的第一特征集的索引的集合,Aq是A的子集,与Aq对应的特征集为属于第q张样本图片的特征集,Q为样本图片的数量。
9.一种图片内容识别装置,其特征在于,包括:
接收模块,用于接收待识别图片;
识别模块,用于根据图片识别模型对所述待识别图片进行识别,所述图片识别模型中包括第一特征集的集合,所述第一特征集具有用于识别图片内容的内容信息;
输出模块,用于输出图片识别结果。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
提取模块,用于提取待识别图片中的低级特征;
所述待识别图片包含n个第二特征区域,所述第二特征区域内包含的低级特征形成第二特征集,所述第二特征集用于表示所述第二特征区域的内容,所述n为n≧2的整数;
计算模块,用于计算所述第二特征集与所述第一特征集之间的相似度值;
当所述第一特征集与所述第二特征集的相似度值大于预设阈值时,用所述第一特征集所具有的内容信息描述所述第二特征集。
11.根据权利要求9所述的装置,其特征在于,
所述提取模块,还用于提取样本图片堆中每一张样本图片的低级特征;
所述样本图片包含m个样本特征区域,所述样本特征区域内包含的低级特征形成样本特征集,所述样本特征集用于表示所述样本特征区域的内容,所述m为m≧2的整数;
所述计算模块,还用于计算所述样本图片堆内包含的所有样本特征集两两之间的相似度值;
所述装置还包括:
获取模块,用于根据样本特征集两两之间的相似度值获取具有判别性和代表性的样本特征集,所述具有判别性和代表性的样本特征集为所述第一特征集,所述判别性表示选出的第一特征集对所述样本图片堆所包含的图片特征具有区分能力,所述代表性表示选出的第一特征集对所述样本图片堆中所包含的图片特征具有覆盖能力。
12.根据权利要求11所述的装置,其特征在于,所述计算模块,具体用于:
利用距离计算公式计算样本特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,样本特征集X={x1,...,xr},样本特征集Y={y1,...,yq},r为样本特征集X中的特征集个数,q为样本特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
13.根据权利要求10所述的装置,其特征在于,所述计算模块,具体用于:
利用距离计算公式计算第二特征集与第一特征集之间的差异值,所述距离计算公式为:
Dis tan ce ( X | | Y ) = 1 2 r Σ i = 1 r ( min j | | x i - y j | | F 2 )
1 2 q Σ j = 1 q ( min i | | x i - y j | | F 2 )
其中,第二特征集X={x1,...,xr},第一特征集Y={y1,...,y},r为第二特征集X中的特征集个数,q为第一特征集Y中的特征集个数;
通过高斯方程转换公式将所述差异值转换成相似度值,所述转换公式为:
Similarity ( X | | Y ) = exp ( - Dis tan ce ( X | | Y ) σ 2 )
其中σ为控制上述高斯变化公式的参数,为经验值。
14.根据权利要求11所述的装置,其特征在于,所述获取模块,具体用于:
对样本特征集进行编号;
根据样本特征集两两之间的相似度值和样本特征集选择公式,选择出具有判别性和代表性的样本特征集作为第一特征集,所述样本特征集选择公式为:
A=argmaxH(A)+λG(A)
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,全集I为所有样本特征集的编号的集合,|A|≤K,K为需要选出的第一特征集的数量,H(A)用于根据样本特征集两两之间的相似度值控制选出的第一特征集具有判别性和代表性,G(A)用于根据样本特征集两两之间的相似度值控制选择出的第一特征集在所述样本图片堆中各个样本图片分布的平均性,λ为控制参数。
15.根据权利要求14所述的装置,其特征在于,所述获取模块还用于:
构建表示所述样本特征集两两之间的相似度值的矩阵S,矩阵中的元素SMN表示第M个样本特征集与第N个样本特征集的相似度值,其中M、N为样本特征集的编号;
所述H(A)具体定义为:
H ( A ) = log ( μ + h ( S A , A ) - ( τ - 1 ) h ( S A , A ‾ ) - τh ( S A ‾ , A ‾ ) )
h(SM,N)=∑i∈Mj∈NSij
其中,A为选出的第一特征集在样本特征集中的编号的集合,A∈I,μ的取值为预设值,τ为大于2的实数,A为A的补集,全集I为所有样本特征集的编号的集合,M为矩阵S的行索引号,N为矩阵S的列索引号,i、j为用于累加循环的参数变量。
16.根据权利要求6或7所述的装置,其特征在于,所述G(A)具体定义为:
G ( A ) = Σ q = 1 Q log ( | A q | + 1 )
其中,A为选出的第一特征集的索引的集合,Aq是A的子集,与Aq对应的特征集为属于第q张样本图片的特征集,Q为样本图片的数量。
CN201410350987.XA 2014-07-22 2014-07-22 图片内容识别方法和装置 Active CN105446997B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410350987.XA CN105446997B (zh) 2014-07-22 2014-07-22 图片内容识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410350987.XA CN105446997B (zh) 2014-07-22 2014-07-22 图片内容识别方法和装置

Publications (2)

Publication Number Publication Date
CN105446997A true CN105446997A (zh) 2016-03-30
CN105446997B CN105446997B (zh) 2019-06-18

Family

ID=55557193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410350987.XA Active CN105446997B (zh) 2014-07-22 2014-07-22 图片内容识别方法和装置

Country Status (1)

Country Link
CN (1) CN105446997B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778820A (zh) * 2016-11-25 2017-05-31 北京小米移动软件有限公司 识别模型确定方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021870A (zh) * 2007-03-20 2007-08-22 北京中星微电子有限公司 一种图片查询方法及系统
CN102521366A (zh) * 2011-12-16 2012-06-27 华中科技大学 融合分类与全局索引的图像检索方法和图像检索系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021870A (zh) * 2007-03-20 2007-08-22 北京中星微电子有限公司 一种图片查询方法及系统
CN102521366A (zh) * 2011-12-16 2012-06-27 华中科技大学 融合分类与全局索引的图像检索方法和图像检索系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MANORANJAN DASH等: "Feature Selection for Clustering", 《PACIFIC-ASIA CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING》 *
王卓峥等: "基于主元分析的图像配准新方法", 《第十六届全国图像图形学学术会议暨第六届立体图像技术学术研讨会》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778820A (zh) * 2016-11-25 2017-05-31 北京小米移动软件有限公司 识别模型确定方法及装置
CN106778820B (zh) * 2016-11-25 2020-06-19 北京小米移动软件有限公司 识别模型确定方法及装置

Also Published As

Publication number Publication date
CN105446997B (zh) 2019-06-18

Similar Documents

Publication Publication Date Title
Li et al. Multiattention network for semantic segmentation of fine-resolution remote sensing images
Li et al. An effective data augmentation strategy for CNN-based pest localization and recognition in the field
Yi et al. ASSD: Attentive single shot multibox detector
CN108154105B (zh) 水下生物检测与识别方法、装置、服务器及终端设备
Lang et al. Saliency detection by multitask sparsity pursuit
Esmaeili et al. Fast-at: Fast automatic thumbnail generation using deep neural networks
CN110348580A (zh) 构建gbdt模型的方法、装置及预测方法、装置
CN111260037B (zh) 图像数据的卷积运算方法、装置、电子设备及存储介质
CN107730553B (zh) 一种基于伪真值搜寻法的弱监督物体检测方法
CN114092487A (zh) 目标果实实例分割方法及系统
CN108960412A (zh) 图像识别方法、装置及计算机可读存储介质
CN103745233B (zh) 基于空间信息迁移的高光谱图像分类方法
Zhang et al. Bing++: A fast high quality object proposal generator at 100fps
CN110992307A (zh) 基于yolo的绝缘子定位识别方法及装置
CN109857878B (zh) 物品标注方法及装置、电子设备及存储介质
CN109753985A (zh) 视频分类方法及装置
Lin et al. Integrated circuit board object detection and image augmentation fusion model based on YOLO
CN105354228A (zh) 相似图搜索方法及装置
CN113822134A (zh) 一种基于视频的实例跟踪方法、装置、设备及存储介质
CN112613496A (zh) 一种行人重识别方法、装置、电子设备及存储介质
CN113570541A (zh) 图像质量评估方法、装置、电子设备及存储介质
CN105446997A (zh) 图片内容识别方法和装置
CN104298975B (zh) 一种分布式图像识别方法
CN113282781B (zh) 图像检索方法及装置
Choe et al. Improved techniques for weakly-supervised object localization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant