CN103377376A - 图像分类的方法和系统、图像检索的方法和系统 - Google Patents

图像分类的方法和系统、图像检索的方法和系统 Download PDF

Info

Publication number
CN103377376A
CN103377376A CN2012101104009A CN201210110400A CN103377376A CN 103377376 A CN103377376 A CN 103377376A CN 2012101104009 A CN2012101104009 A CN 2012101104009A CN 201210110400 A CN201210110400 A CN 201210110400A CN 103377376 A CN103377376 A CN 103377376A
Authority
CN
China
Prior art keywords
subregion
focus
image
feature
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101104009A
Other languages
English (en)
Inventor
贾宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2012101104009A priority Critical patent/CN103377376A/zh
Publication of CN103377376A publication Critical patent/CN103377376A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请提供了一种图像分类的方法和系统,以及,一种图像检索的方法和系统,其中,所述图像分类的方法包括:将图像分割为若干子区域;在所述子区域中提取焦点子区域;对所述焦点子区域进行颜色语义映射,获得语义特征;采用所述图像分类特征进行图像分类,所述图像分类特征包括语义特征。本申请可以提高图像分类的准确性和处理效率,降低分类处理的复杂度,并增加图像分类的相关性,同时提高图像检索的准确率和处理效率,提升用户进行图像检索的使用体验。

Description

图像分类的方法和系统、图像检索的方法和系统
技术领域
本申请涉及电子图像数据处理的技术领域,特别是涉及一种图像分类的方法,一种图像分类的系统,一种图像检索的方法,以及,一种图像检索的系统。
背景技术
随着现代电子计算机技术及Internet网络的迅速发展,庞大的、多样的图像信息不断出现,各行各业对图像的使用越来越广泛,进而推动了图像信息资源管理研究进一步发展。现在的图像广泛地分布在互联网上,缺少有效的组织,难以达到资源共享的目的。因此,如何利用海量的图像信息并从中找出需要的信息,是对图像信息查询技术提出的重大挑战。
20世纪90年代初期开始,基于图像的内容如颜色、形状、纹理和空间关系等特征来检索图像的技术(CBIR)应运而生,具体应用如大型的图像检索系统QBIC,Visualseek,Virage,Photobook等。CBIR克服了传统方法的不足,融合了图像识别和数据库技术,从而提供了更有效的检索和分类手段。然而图像的数字化表征,并不能很好地揭示其内在的本质,深层的语义内容得不到很好的反映。单纯的底层数字特征已经没有办法为图像的有效管理提供更好的支持。
中国专利号为ZL200810105980.6,发明名称为“一种基于带权图的半监督图像分类方法”的专利在2008年10月29日公开了一种通过分割图像,提取各个区域特征进行带权图的构建,并结合已标注图像的信息进行分类的方法,具体包括如下步骤:
在对数字图像进行分割的基础上,提取区域特征并计算各个区域面积占整幅图像面积的比例;
使用线性规划构建带权图;
使用标签传播的方法在带权图上传递已标注图像的类别信息;
最后根据类别信息传递的最终结果,对未标注图像进行分类。
上述方案使用线性规划构建带权图,其中需要设定的参数为近邻图像的数目,当该参数在较大的范围内变化时,得到的图像分类结果比较稳定,从而有效地克服了基于高斯函数构建带权图的方法中参数对分类结果影响较大的问题。
然而,这种现有技术仍存在下述缺点和不足:
1、准确性不足。
现有技术在处理图像特征上依赖图像的底层数字特征,而纯底层的数字特征不能完整刻画图像的全部信息,因此在分类结果中会造成很大的准确性不足问题。比如,一张包含一匹红色的侧面马的照片和一张包含一匹白色的正面马的照片,其底层特征(颜色、形状和纹理)差距极大,单纯的依赖底层的数字特征,会造成两幅图像分类不准确,即不一定能都分类到“马”这一类的图像中。
2、实现复杂度高和参数依赖。
对于图像的分类,主要计算量存在于特征提取和分类器的构造方面,实现复杂度非常高;再者,上述现有技术需要设置较多的参数,对参数有过度依赖性,并且其中计算时依赖所有的图像。
3、图像的主观意义结合度不高。
现有技术单纯地依赖底层数字特征或者关键词的文字匹配将影响图像的相关性,比如“电脑”和“计算机”是等同的概念,但是如果将这两个词作为某两幅差别很大的图像描述,那么将导致这两幅图像可能分配不到同一个类别中。
因而,目前本领域技术人员迫切需要解决的问题是,提出一种全新的图像分类机制,用以提高图像分类的准确性和处理效率,降低分类处理的复杂度,并增加图像分类的相关性,同时提高图像检索的准确率和处理效率,提升用户进行图像检索的使用体验。
发明内容
本申请的目的是提供一种图像分类的方法和系统,用以提高图像分类的准确性和处理效率,降低分类处理的复杂度,并增加图像分类的相关性。
本申请的又一目的是提供一种图像检索的方法和系统,用以提高图像检索的准确率和处理效率,提升用户进行图像检索的使用体验。
为了解决上述问题,本申请公开了一种图像分类的方法,包括:
将图像分割为若干子区域;
在所述子区域中提取焦点子区域;
对所述焦点子区域进行颜色语义映射,获得语义特征;
采用所述图像分类特征进行图像分类,所述图像分类特征包括语义特征。
优选的,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
优选的,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
优选的,所述针对子区域建立视觉焦点权重模型的步骤进一步包括:
针对各子区域按照如下公式建立视觉焦点权重模型:
W=ω1×Area+ω2×Pos+ω3×Brightness
其中,W表示各个子区域的视觉焦点权重,ω1是面积参数Area的权重系数,ω2是位置参数Pos的权重系数,ω3是亮度参数Brightness的权重系数;
面积参数Area: Area = S i S total
其中,Si表示对应的第i个子区域的面积大小;Stotal表示当前图像的大小;
位置参数Pos: Pos = p i p center
其中,pi表示对应的第i个子区域的在预设的子区域位置模板相应位置的大小;pcenter表示整个模板相应位置的面积大小;
亮度参数Brightness:
Brightness=|Max(mean(R,G,B))-Max(Globalmean(R,G,B))|
其中,mean(R,G,B)表示对应的第i个子区域的RGB均值,Globalmean(R,G,B)表示当前图像整体的亮度均值,Max(?)表示求最大值的函数。
优选的,所述对焦点子区域进行颜色语义映射,获得语义特征的步骤包括:
计算所述焦点子区域的RGB色彩均值;
切分RGB颜色空间;
按照预置的映射规则,将所述焦点子区域的RGB色彩均值映射到RGB颜色空间中,得到对应的语义特征。
优选的,所述语义特征为颜色语义名词的三元表征。
优选的,所述图像分类特征还包括底层特征,所述的方法还包括:
对图像进行底层特征提取。
优选的,所述的方法,还包括:
获得不同类别的图像分类数据库。
本申请实施例还公开了一种图像检索的方法,包括:
接收针对目标图像的搜索请求;
将所述目标图像分割为若干子区域;
在所述子区域中提取焦点子区域;
对所述焦点子区域进行颜色语义映射,获得语义特征;
采用所述目标图像的分类特征,在预置的图像分类数据库中获取对应类别的图像为搜索结果,其中,所述分类特征包括语义特征。
优选的,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
优选的,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
优选的,所述针对子区域建立视觉焦点权重模型的步骤进一步包括:
针对各子区域按照如下公式建立视觉焦点权重模型:
W=ω1×Area+ω2×Pos+ω3×Brightness
其中,W表示各个子区域的视觉焦点权重,ω1是面积参数Area的权重系数,ω2是位置参数Pos的权重系数,ω3是亮度参数Brightness的权重系数;
面积参数Area: Area = S i S total
其中,Si表示对应的第i个子区域的面积大小;Stotal表示当前图像的大小;
位置参数Pos:
Figure BDA0000153122490000052
其中pi表示对应的第i个子区域的在预设的子区域位置模板相应位置的大小;pcenter表示整个模板相应位置的面积大小;
亮度参数Brightness:
Brightness=|Max(mean(R,G,B))-Max(Globalmean(R,G,B))|
其中,mean(R,G,B)表示对应的第i个子区域的RGB均值,Globalmean(R,G,B)表示当前图像整体的亮度均值,Max(?)表示求最大值的函数。
优选的,所述对焦点子区域进行颜色语义映射,获得语义特征的步骤包括:
计算所述焦点子区域的RGB色彩均值;
切分RGB颜色空间;
按照预置的映射规则,将所述焦点子区域的RGB色彩均值映射到RGB颜色空间中,得到对应的语义特征。
优选的,所述分类特征还包括底层特征,所述的方法还包括:
对所述目标图像进行底层特征提取。
本申请实施例还公开了一种图像分类的系统,包括:
图像分割模块,用于将图像分割为若干子区域;
焦点提取模块,用于在所述子区域中提取焦点子区域;
语义映射模块,用于对所述焦点子区域进行颜色语义映射,获得语义特征;
分类模块,用于采用所述图像分类特征进行图像分类,所述图像分类特征包括语义特征。
本申请实施例还公开了一种图像检索的系统,包括:
搜索请求接收模块,用于接收针对目标图像的搜索请求;
图像分割模块,用于将所述目标图像分割为若干子区域;
焦点提取模块,用于在所述子区域中提取焦点子区域;
语义映射模块,用于对所述焦点子区域进行颜色语义映射,获得语义特征;
特征匹配模块,用于采用所述目标图像的分类特征,在预置的图像分类数据库中获取对应类别的图像为搜索结果,其中,所述分类特征包括语义特征。
与现有技术相比,本申请包括以下优点:
本申请结合图像对象的空间位置和形状亮度等特点,综合构建一个基于视觉注意的认知顺序模型,通过计算区域的焦点权重来分析区域的认识顺序,最后通过映射焦点子区域的颜色语义特征进行图像分类检索。本申请采用更深层的图像语义信息,提高了图像的主观意义结合度,并结合认知学和心理学完善了图像特征,从而有效提高了图像分类的准确性,增加了图像分类的相关性。
再者,本申请减少了特征提取计算的复杂度,并无需设置过多参数,从而可以提高图像分类的处理效率。相应地,本申请的图像检索准确率和处理效率也得到了有效提高,同时还提升了用户进行图像检索的使用体验。
附图说明
图1是本申请的一种图像分类的方法实施例1的步骤流程图;
图2是本申请的一种视觉焦点权重的建模过程的示例中位置模板的示意图;
图3是本申请的一种视觉焦点权重的建模过程的示例中各阶段图像和权值的示意图;
图4是本申请的一种图像分类的方法实施例2的步骤流程图;
图5是本申请的一种图像检索的方法实施例1的步骤流程图;
图6是本申请的一种图像检索的方法实施例2的步骤流程图;
图7是本申请的一种图像检索的示例中用户输入的目标图像的示意图;
图8是本申请的一种图像检索的示例中图像检索结果的示意图;
图9是本申请的一种图像分类的系统实施例的结构框图;
图10是本申请的一种图像检索的系统实施例的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例的核心构思之一在于,结合图像对象的空间位置和形状亮度等特点,综合构建一个基于视觉注意的认知顺序模型,通过计算区域的焦点权重来分析区域的认识顺序,最后通过映射焦点子区域的颜色语义特征进行图像分类检索。
参照图1,其示出了本申请的一种图像分类的方法实施例1的步骤流程图,具体可以包括如下步骤:
步骤101、将图像分割为若干子区域;
由于对单幅图像的视觉分析建立在图像子区域的基础上,因此开始需要对图像进行分割。作为本申请实施例具体应用的一种示例,可以采用基于LUV颜色空间的k-means聚类分割算法,将图像分割为若干子区域。当然,本领域技术人员采用任一种分割算法对图像进行子区域分割均是可行的,本申请对此无需加以限制。
在本申请实施例,对所述图像的类型不作限制,优选为对象类的图像。
步骤102、在所述子区域中提取焦点子区域;
本申请实施例可以将分割后的图像识别成子区域有序序列,序列顺序为子区域的视觉优先级顺序,排名靠前的区域被认为是视觉焦点,代表了图像的主要内容及表达语义。为此,在本申请构建了基于视觉注意机制的视觉焦点权重模型,这是一种分析图像区域之间认知顺序的模型。该模型可以突出图像的主要内容,分析区域的重要程度,并为之进行颜色语义特征构建。通过实验,证明视觉焦点识别在对象图片中非常有效。
在本申请的一种优选实施例中,所述步骤102可以包括如下子步骤:
子步骤S11、针对所述子区域建立视觉焦点权重模型;
子步骤S12、按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
在本申请的另一种优选实施例中,所述步骤102可以包括如下子步骤:
子步骤S21、针对所述子区域建立视觉焦点权重模型;
子步骤S22、按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
以下通过一个具体示例对所述步骤102的处理过程进一步说明:
1、构建模型:
将可能影响视觉认知顺序的元素逐个分析,建立视觉焦点权重模型。本申请发明人发现,影响视觉认知的元素由以下3个部分组成:(1)对象大小,(2)对象的位置,(3)对象的颜色亮度。经过这样的分析,为视觉焦点权重建立模型如下:
W=ω1×Area+ω2×Pos+ω3×Brightness
其中,W表示图像中每个子区域的权重值,即各个子区域的视觉焦点权重,ωi是一组权重系数,用来区分不同的视觉注意元素的影响因子(可以根据实际需求自行设定,比如认为亮度比较重要,那么可以设置亮度的权重因子较大,认为面积大小更重要,可以设置面积的权重因子较大),即ω1是面积参数Area的权重系数,ω2是位置参数Pos的权重系数,ω3是亮度参数Brightness的权重系数。
视觉焦点权重的建模过程即通过将图像分割后,对每个子区域进行视觉焦点权重计算,得到W值后对W进行排序,排序的结果即视觉焦点权重。
下面具体解释每个视觉注意元素参数的意义:
1)面积参数Area:
Figure BDA0000153122490000091
其中,Si表示对应的第i个子区域的面积大小,即第i个子区域的像素个数。Stotal表示整个图像的大小,即图像的像素总数。
2)位置参数Pos:
Figure BDA0000153122490000092
其中,pi表示对应的第i个子区域在预设的子区域位置模板相应位置的大小;如为第i个子区域在图2所示的位置模板中第一个(左上一)模板中央位置的大小,即在图像中央位置的像素个数;pcenter表示整个模板相应位置的面积大小,如整个模板中央位置的面积大小,即图像的中央位置的像素总数。
当然,所述图2所示的位置模板是可选的,并且仅仅用作示例,本领域技术人员在实际应用中选用任一种位置模板均是可行的,本申请对此无需加以限制。
3)亮度参数Brightness:
Brightness=|Max(mean(R,G,B))-Max(Globalmean(R,G,B))|
其中,mean(R,G,B)表示对应的第i个子区域的RGB均值,Globalmean(R,G,B)表示图像整体的亮度均值,Max(?)表示求最大值的函数。
当然,所述亮度计算方式也可以依据实际情况自定义,本申请对此无需加以限制。
2、焦点子区域选择:
在完成视觉焦点权重模型计算后,得到了子区域的权重排序。对于不同的图像,分割后的子区域个数不同,本发明定义了一些规则来选择焦点子区域,例如,在权重最大的子区域直接提取为焦点子区域;或如,对于分割后的图像,做一个视觉焦点合并,将可能的视觉焦点子区域进行合并。
为使本领域技术人员更好地理解本申请,以下提供一种具体的焦点选择算法和合并原则的代码示例:
Input:
1)图像
图像分割,子区域表SubregionList=createSubRegion();
计算图像的整体亮度gBright=BrightCalc();
Foreach region in SubregionList
计算子区域region的亮度b=BrightCalc(region);
计算与子区域整体的亮度差值的绝对值sub=|b-gBright|
设置子区域的亮度比值Region.setBright(sub/gBright);
计算region的面积参数:
area=region.pixel.size()/(img.width*img.height);
计算region的位置参数pos(利用图2所示的位置模板)
定义中间位置pos0
Foreach pixel in region
如果pixel在中间区域,则对应pos0=pos0+1;
位置参数Pos=pos0/region.pixel.size();
利用以上视觉焦点权利模型的计算公式得到每个子区域的权值w:
w=weightModelVisitor.getWeight(region);
Region.setWeight(w);
End Foreach
按照weight排序SubregionList;
If SubregionList.size()的一半大于3
选前三名作为前景焦点
Else if SubregionList.size()的一半大于2
选前两名作为前景焦点
Else
选第一名作为前景焦点
将选取的前景焦点的所有像素保存为regionPixelList
将这些像素单独保存并生成单独图像createImage();
Output:焦点子区域图像(前景突出,背景灰度化)。
即在实际中,非焦点子区域会被灰度化,而提取出的焦点子区域会被标记为有色彩,具体效果可以参见图3所示的图像分割、建模排序及焦点结果示意图。
步骤103,对所述焦点子区域进行颜色语义映射,获得语义特征;
在本申请的优选实施例中,所述步骤103具体可以包括如下子步骤:
子步骤S31、计算所述焦点子区域的RGB色彩均值;
子步骤S32、切分RGB颜色空间;
子步骤S33、按照预置的映射规则,将所述焦点子区域的RGB色彩均值映射到RGB颜色空间中,得到对应的语义特征。
在具体实现中,所述语义特征为颜色语义名词的三元表征。之所以定义为一种三元表征,主要是考虑到在焦点子区域选择时,最多选择前三名作为前景焦点,每一个焦点子区域对应一种颜色表示。最终构建141维图像特征,其中138维是图像直方图特征,3维是颜色语义名词的三元特征。当然,也可以采用其它颜色语义名词的N元的表征方式,本申请对此不作限制。
为使本领域技术人员更好地理解本申请,以下提供一种对焦点子区域进行颜色语义映射的具体算法示例:
Input:
1)图像子区域
获取图像像素子区域regionPixel[];
计算子区域的RGB色彩均值regionRGBMean;
切分RGB颜色空间;
对应映射规则,将regionRGBMean映射到RGB颜色空间中去得到对应的颜色语义名词;
Output:颜色语义三元表征[Color1,Color2,Color3]
以下进一步提供一种映射规则的示例:
Input:
1)图像区域颜色均值R,G,B
2)颜色语义名词集合S={黑,白,灰,红,橙,米黄,黄,绿,橄榄绿,青,蓝,粉,紫,棕}
Figure BDA0000153122490000121
Figure BDA0000153122490000131
Output:颜色语义名词C
上述映射规则即根据一个区域的RGB均值,将对应的区域用一个颜色语义名词表达,比如R<64并且G<64并且B<64,那么该区域为“黑”;如果R>192并且G>192并且B>192那么该区域为“白”等等。
当然,上述映射规则仅仅用作示例,本领域技术人员根据实际情况采用任一种映射规则都是可行的,本申请对此无需加以限制。
步骤104、采用所述语义特征进行图像分类。
在本申请实施例中,可以采用任一种分类算法采用语义特征进行图像分类。如HNB(Hidden-nalve-bayes,隐藏朴素贝叶斯),BayesNet(贝叶斯)和SVM(支持向量机)等分类算法均是可行的,本申请对此无需加以限制。
参照图4,其示出了本申请的一种图像分类的方法实施例2的步骤流程图,具体可以包括如下步骤:
步骤401、将图像分割为若干子区域;
步骤402、在所述子区域中提取焦点子区域;
步骤403、对所述焦点子区域进行颜色语义映射,获得语义特征;
步骤404、对图像进行底层特征提取;
步骤405、采用所述底层特征和语义特征进行图像分类,获得不同类别的图像分类数据库。
相较于图1所示的方法实施例1而言,本实施例增加了图像底层特征提取以及将底层特征和语义特征组合构成图像分类特征的处理。本实施例与当前技术结合更为紧密,也能获得更佳的分类效果。
底层特征主要包括颜色、形状、纹理等特征,为使本领域技术人员更好地理解本申请,以下提供几种底层特征的提取方法:
I.颜色
颜色是彩色图像最底层、最直观的物理特征,通常对噪声,图像质量的退化,尺寸、分辨率和方向等的变化具有很强的鲁棒性,是绝大多数基于内容的图像和视频检索的多媒体数据库中使用的特征之一。颜色特征的描述方法主要有以下四种:
1)颜色直方图(ColorHistogram)
它是最简单也是最常用的颜色特征,描述了图像颜色的统计分布特性,具有平移、尺度、旋转不变性。其核心思想是,在颜色空间中采用一定的量化方法对颜色进行量化,然后统计每一个量化通道在整幅图像中所占的比重。
常用的颜色空间有RGB,CIE,HSI,HSV空间等,主要的量化方法有最重要信息位、颜色空间划分、颜色空间聚类、参考颜色、图像分割等,文献中讨论了对这些方法进行了讨论和总结。由于颜色直方图缺乏颜色的空间分布信息,改进的方法包括在颜色索引时加入空间位置信息和基于区域的颜色查询。最简单的方法是子窗口直方图法,即将图像分割成子图像,一一建立索引。另一文献中将图像分成了大小相等的九个子图像,然后统计每个子图像中的颜色直方图。
2)颜色相关图(ColorCorrelogram)
其主要思想是用颜色对相对于距离的分布来描述信息,它反映了像素对的空间相关性,以及局部像素分布和总体像素分布的相关性,并且容易计算,特征范围小,效果好。
3)颜色矩(ColorMoment)
其基本思想是在颜色直方图的基础上计算出每个颜色通的均值、方差、偏差,用这些统计量替代颜色的分布来表示颜色特征。它具有特征量少,处理简单的特点。
4)颜色一致性矢量(Color Coherence Vectors,CCV)
本质上是一种引入空间信息改进的直方图算法,统计了图像中各颜色最大区域的像素数量。通过分离开一致性像素和非一致性像素,比直方图算法具有更好的区别效果。
II.纹理
纹理是图像的重要特征之一,通常定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量,其本质是刻画像素的邻域灰度空间分布规律。纹理特征描述方法大致可以分为四类:统计法、结构法、模型法、频谱法。
1)统计法
统计法分析纹理的主要思想是通过图像中灰度级分布的随机属性来描述纹理特征。最简单的统计法是借助于灰度直方图的矩来描述纹理,但这种方法没有利用像素相对位置的空间信息。
2)结构法
结构法分析纹理的基本思想是假定纹理模式由纹理基元以一定的、有规律的形式重复排列组合而成,特征提取就变为确定这些基元并定量分析它们的排列规则。
3)模型法
模型法利用一些成熟的图像模型来描述纹理,如基于随机场统计学的马尔可夫随机场、子回归模型,以及在此基础上产生的多尺度子回归模型(MultiResolution Simultaneous Autoregressive,MRSA)等。这些模型的共同特点是通过少量的参数表征纹理。MRSA区分不同纹理模式的能力较强,但同时计算开销也较大。
4)频谱法
频谱法借助于频率特性来描述纹理特征,包括傅里叶功率谱法[13]、Gabor变换[14]、塔式小波变换(Pyramid Wavelet Transform,PWT)[15]、树式小波变换(Tree Wavelet Transform,TWT)[15]等方法。Manjunath and Ma[16]实验指出,Gabor特征提供了最佳的模式检索精度,检索性能优于TWT和PWT,略微优于MRSA,缺点是计算速度慢,其旋转不变性和尺度不变性仍有待讨论。
III.形状
形状是刻画物体最本质的特征,也是最难描述的图像特征之一,主要难在对图像中感兴趣目标的分割。对形状特征的提取主要是寻找一些几何不变量。目前用于图像检索的形状描述方法主要有两类:基于边缘和基于区域的形状方法。前者利用图像的边缘信息,而后者则利用区域内的灰度分布信息。
1)基于边缘
基于边缘的形状特征提取是在边缘检测的基础上,用面积、周长、偏心率、角点、链码、兴趣点、傅里叶描述子、矩描述子等特征来描述物体的形状,适用于图像边缘较为清晰、容易获取的图像。
2)基于形状
基于区域的形状特征提取的主要思路是通过图像分割技术提取出图像中感兴趣的物体,依靠区域内像素的颜色分布信息提取图像特征,适合于区域能够较为准确地分割出来、区域内颜色分布较为均匀的图像。
在本实施例中,同样可以采用任一种分类算法采用语义特征和底层特征进行图像分类。如HNB(Hidden-nalve-bayes,隐藏朴素贝叶斯),BayesNet(贝叶斯)和SVM(支持向量机)等分类算法均是可行的,本申请对此无需加以限制。
在具体实现中,所述步骤404可以与步骤401、402和403并行处理,以进一步提高图像分类的处理效率。本领域技术人员易于理解的是,所述步骤404也可以在步骤401之前执行,或在步骤401、402和403任一步骤中执行,本申请对此不作限制。
参照图5,其示出了本申请的一种图像检索的方法实施例1的步骤流程图,具体可以包括如下步骤:
步骤501、接收针对目标图像的搜索请求;
步骤502、将所述目标图像分割为若干子区域;
步骤503、在所述子区域中提取焦点子区域;
在本申请的一种优选实施例中,所述步骤503具体可以包括如下子步骤:
子步骤S41、针对所述子区域建立视觉焦点权重模型;
子步骤S42、按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
在本申请的另一种优选实施例中,所述步骤503具体可以包括如下子步骤:
子步骤S51、针对所述子区域建立视觉焦点权重模型;
子步骤S52、按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
作为本申请优选实施例具体应用的一种示例,可以针对各子区域按照如下公式建立视觉焦点权重模型:
W=ω1×Area+ω2×Pos+ω3×Brightness
其中,W表示各个子区域的视觉焦点权重,ω1是面积参数Area的权重系数,ω2是位置参数Pos的权重系数,ω3是亮度参数Brightness的权重系数;
面积参数Area: Area = S i S total .
其中,Si表示对应的第i个子区域的面积大小;Stotal表示当前图像的大小;
位置参数Pos: Pos = p i p center .
其中,pi表示对应的第i个子区域的在预设的子区域位置模板相应位置的大小;pcenter表示整个模板相应位置的面积大小;
亮度参数Brightness:
Brightness=|Max(mean(R,G,B))-Max(Globalmean(R,G,B))|,
其中,mean(R,G,B)表示对应的第i个子区域的RGB均值,Globalmean(R,G,B)表示当前图像整体的亮度均值,Max(?)表示求最大值的函数。
步骤504、对所述焦点子区域进行颜色语义映射,获得语义特征;
在本申请的一种优选实施例中,所述步骤504具体可以包括如下子步骤:
子步骤S61、计算所述焦点子区域的RGB色彩均值;
子步骤S62、切分RGB颜色空间;
子步骤S63、按照预置的映射规则,将所述焦点子区域的RGB色彩均值映射到RGB颜色空间中,得到对应的语义特征。
步骤505、采用所述目标图像的语义特征,在预置的图像分类数据库中获取对应类别的图像为搜索结果。
本实施例针对用户提交搜索的目标图像,以图像语义特征为线索从图像分类数据库中检出具有相似特性的其它图像。具体而言,从目标图像中提取的语义特征可以组成一个向量,目标图像和检索图像之间可以通过定义一个距离或者相似性的测量度来计算相似程度。在检索的过程中,根据相似性度量的算法计算查询特征(目标图像的语义特征)与特征库(图像分类数据库)中对应图像的每组特征的相似程度,把所得结果由大到小排序后得到一个匹配图像序列返回给用户。其间可以通过人机交互,对检索的结果逐步求精,不断缩小匹配集合的范围,从而定位到目标。匹配过程常利用特征向量之间的距离函数来进行相似性度量,模仿人类的认知过程,近似得到数据库的认知排序。常用的距离度量公式有:Minkkowsky距离,Manhattan距离,Euclidean距离,加权Euclidean距离,Chebyshev距离,Mahalanobis距离等,本领域技术人员根据实际情况任意采用均可,本申请对此不作限制。
参照图6,其示出了本申请的一种图像检索的方法实施例2的步骤流程图,具体可以包括如下步骤:
步骤601、接收针对目标图像的搜索请求;
步骤602、将所述目标图像分割为若干子区域;
步骤603、在所述子区域中提取焦点子区域;
步骤604、对所述焦点子区域进行颜色语义映射,获得语义特征;
步骤605、对所述目标图像进行底层特征提取;
步骤606、采用所述目标图像的语义特征和底层特征,在预置的图像分类数据库中获取对应类别的图像为搜索结果。
在具体实现中,用户可以提交搜索图像触发针对该图像(目标图像)的搜索请求,在本实施例中,将根据所述目标图像提取语义特征和底层特征,然后根据提取出来的特征进行检索匹配,具体可以根据相关度计算方法,匹配和筛选相应类别的图像分类数据库中的图像,作为搜索结果反馈给用户。
本领域技术人员易于理解的是,所述步骤605可以与步骤601、602、603和604并行处理,以进一步提高图像检索的处理效率。所述步骤605也可以在步骤601之前执行,或在步骤601、602、603和604任一步骤中执行,本申请对此不作限制。
为使本领域技术人员更好地理解本申请,以下提供一种应用本申请实施例进行图像检索的示例:
在搜集了大量的图像数据后,对每一幅图像进行本说明书描述的生成语义特征向量的方法,然后进行训练分类。在得到一定规模的训练集后,利用训练集文件可以进行分类计算。计算结果可以应用于分类结果,也可以用于检索。
具体步骤可以如下:
一、针对一幅图像,计算得到该图像的语义特征向量如下:
[gray,none,none,39,18,23,25,15,23,12,17,14,20,14,15,7,16,13,16,16,18,14,16,14,14,16,15,15,16,15,13,18,15,15,15,15,16,15,16,16,16,16,15,16,17,15,13,17,15,16,15,15,16,16,16,16,18,15,15,16,16,15,15,14,16,15,15,23,15,21,19,15,15,16,17,17,18,16,15,18,15,16,15,16,15,16,16,15,15,15,14,16,15,16,16,43,16,8,13,15,17,15,14,15,13,15,15,13,16,16,16,16,16,16,16,16,16,15,17,15,16,16,15,6234.375,56.93930273902586,124.0,122.0,127.0,160.0,137.0,152.0,205.0,279.0,253.0,179.0,149.0,154.0,113.0,111.0,114.0,101.0,elephant]
二、不断通过对图像数据库中的原始图像进行计算,得到大量的语义特征向量,构建训练集,假设形式如下:
【black,gray,gray,12,11,19,13,17,14,15,16,17,14,15,16,15,16,15,16,15,14,16,15,15,17,15,15,16,16,15,15,16,16,16,16,17,16,15,13,17,16,16,16,16,16,15,15,16,15,16,15,15,14,15,16,15,16,16,15,15,15,15,16,15,16,15,15,29,16,23,20,15,16,15,15,14,17,15,15,15,15,15,16,16,16,16,16,15,15,16,16,16,15,16,16,29,15,10,12,16,15,16,17,16,15,16,16,16,16,16,15,16,16,15,16,17,16,15,15,15,16,15,15,5688.375,45.43360005076996,220.0,142.0,118.0,82.0,93.0,103.0,138.0,444.0,287.0,110.0,100.0,105.0,113.0,136.0,150.0,139.0】
【black,gray,gray,13,11,28,15,14,22,16,21,18,18,19,16,12,14,17,15,16,16,12,13,12,16,16,12,14,13,16,16,15,15,16,15,15,17,18,20,12,15,16,17,16,15,16,16,15,16,16,16,12,18,16,15,16,15,15,16,15,16,16,15,16,16,16,15,31,17,18,18,17,16,15,16,16,16,16,16,16,15,16,16,16,15,15,15,16,16,15,15,16,15,16,16,28,14,11,14,15,14,16,14,15,14,15,16,16,16,15,15,15,16,17,16,15,16,16,17,16,16,15,16,5893.125,67.91773485628714,165.0,82.0,84.0,111.0,91.0,112.0,156.0,263.0,287.0,278.0,213.0,217.0,126.0,98.0,105.0,92.0】
【gray,gray,gray,28,10,24,12,18,17,16,12,19,13,15,13,17,14,13,16,16,17,17,15,15,16,16,14,16,17,17,17,17,16,13,15,14,16,16,16,16,16,16,15,16,13,14,16,16,16,15,16,15,15,16,15,17,16,16,15,16,15,15,15,15,15,16,16,43,14,27,16,16,19,15,16,18,14,16,15,14,17,14,16,14,16,15,15,15,15,16,15,16,17,14,17,24,16,7,16,16,14,16,14,14,16,15,16,16,15,16,15,17,15,16,16,16,16,16,15,16,15,16,15,6084.75,51.951917705440906,140.0,107.0,94.0,101.0,108.0,127.0,264.0,451.0,318.0,176.0,99.0,105.0,87.0,92.0,118.0,93.0】
【gray,gray,blue,17,7,24,17,21,16,15,12,16,19,14,15,18,17,16,15,15,15,16,14,16,15,16,16,15,17,16,15,17,16,15,15,16,16,18,13,18,14,14,15,17,16,16,15,15,16,15,16,16,15,16,15,15,15,15,15,14,15,16,16,16,16,15,17,29,18,23,23,15,15,17,16,16,19,19,15,15,15,16,16,16,16,16,15,17,18,15,15,16,15,15,16,32,13,10,11,16,16,15,15,16,13,13,16,16,16,15,16,15,15,15,16,14,14,16,16,16,16,16,16,5941.6875,62.22468151661002,149.0,133.0,122.0,109.0,122.0,124.0,190.0,348.0,269.0,143.0,149.0,152.0,120.0,121.0,131.0,98.0】
【black,gray,blue,22,18,21,12,16,13,16,15,14,12,13,16,17,15,15,17,15,15,16,15,13,17,16,16,16,16,15,14,15,16,16,16,15,16,16,16,17,15,16,15,16,16,16,16,16,14,16,16,16,15,15,17,16,15,16,15,15,16,15,16,15,16,15,15,35,17,26,25,18,17,16,16,15,21,17,13,15,17,16,16,16,15,14,13,15,14,15,15,15,15,16,15,30,14,8,8,14,14,15,15,16,12,15,17,16,15,15,16,15,16,17,17,16,17,16,16,16,16,15,16,13379.047619047618,49.760226526857785,125.0,113.0,103.0,139.0,108.0,177.0,212.0,353.0,288.0,188.0,160.0,112.0,109.0,112.0,103.0,78.0】
【black,blue,gray,19,15,8,13,15,13,16,16,15,16,14,16,16,17,16,15,16,14,16,15,14,16,16,17,16,14,15,16,15,16,16,16,14,17,16,17,15,15,15,14,16,15,15,15,16,16,16,14,14,16,17,16,15,15,16,15,15,17,15,14,16,16,15,16,48,22,24,14,16,24,10,18,12,18,15,17,12,14,15,15,14,18,15,15,16,16,15,14,16,16,17,17,22,12,11,18,16,10,19,15,18,14,16,14,18,16,15,16,17,14,16,16,15,15,16,16,16,15,15,15,5832.75,51.73147268771606,127.0,96.0,75.0,92.0,93.0,107.0,239.0,521.0,342.0,196.0,111.0,108.0,82.0,81.0,103.0,107.0】
【black,black,gray,14,16,16,11,16,12,18,15,18,14,10,15,16,15,13,16,16,15,16,13,14,19,16,17,15,17,17,14,16,15,14,15,15,15,15,17,16,15,14,16,17,16,15,14,15,16,15,16,16,16,15,15,15,14,17,17,16,15,16,15,16,15,15,15,27,14,16,16,14,16,14,17,13,15,17,13,17,15,15,15,16,16,17,14,17,16,15,16,16,16,15,17,33,16,15,16,17,15,16,15,17,16,14,17,14,16,16,16,16,15,15,16,15,15,16,15,15,15,16,15,5416.6875,61.516147203308535,360.0,181.0,117.0,167.0,126.0,119.0,131.0,183.0,147.0,105.0,102.0,115.0,124.0,142.0,161.0,200.0】
【gray,gray,black,26,7,16,22,15,20,15,19,18,25,24,18,14,15,17,20,17,17,17,17,21,19,15,15,16,15,14,16,8,16,15,15,16,14,16,18,16,13,16,15,14,16,17,18,15,14,14,16,15,16,14,15,15,17,17,16,16,14,16,15,16,15,15,15,26,17,18,17,15,16,15,16,15,16,16,15,16,16,15,15,16,15,15,15,16,16,16,16,16,16,15,16,34,14,14,14,16,15,16,15,16,15,15,16,15,16,16,16,15,15,16,16,15,16,16,15,15,15,16,15,5702.8125,81.44085401863387,486.0,141.0,121.0,102.0,69.0,93.0,107.0,181.0,94.0,111.0,92.0,137.0,98.0,134.0,168.0,346.0】
【gray,white,gray,14,11,13,8,10,18,21,21,14,15,14,15,18,13,18,26,18,13,16,15,16,15,14,16,13,17,13,20,9,16,11,16,14,16,15,16,16,15,15,16,13,16,15,16,15,14,15,15,16,15,15,15,15,17,16,15,16,15,16,14,16,15,15,16,26,15,16,18,16,15,15,15,16,16,16,15,16,15,16,14,15,15,16,15,16,16,15,16,16,15,15,15,34,16,16,14,15,15,16,16,16,15,15,16,15,16,15,17,16,16,15,16,15,15,16,16,16,16,16,16,12876.190476190475,65.97967247610414,688.0,212.0,112.0,112.0,85.0,56.0,60.0,72.0,61.0,60.0,67.0,93.0,82.0,121.0,236.0,363.0】
【black,white,black,23,17,19,29,20,10,18,17,15,23,17,13,14,17,16,15,15,17,17,15,16,18,12,17,16,15,16,16,15,15,16,15,15,17,14,14,15,15,14,15,15,15,16,14,16,17,16,14,16,15,16,15,14,16,16,16,17,16,16,15,16,17,15,15,28,16,21,12,14,15,16,16,17,16,16,16,16,15,15,16,16,16,15,15,16,15,16,15,16,16,16,15,32,16,12,17,15,16,16,15,16,16,15,15,16,16,16,16,16,16,16,16,15,16,15,15,16,16,15,15,14412.190476190475,75.92777093955985,170.0,110.0,142.0,138.0,158.0,131.0,172.0,218.0,185.0,150.0,192.0,187.0,152.0,134.0,119.0,122.0】
【white,gray,black,20,17,24,25,19,18,18,13,17,25,17,19,19,15,15,14,17,15,14,11,18,17,11,13,12,16,15,17,16,16,16,15,15,16,11,18,12,14,17,16,16,16,16,15,15,17,15,17,15,16,16,15,15,15,14,15,15,15,16,15,15,16,15,15,26,16,20,18,16,17,15,15,16,15,17,15,15,15,15,16,16,16,17,16,16,15,15,15,16,16,16,16,33,14,13,13,15,16,16,15,16,15,15,17,16,16,15,15,16,15,16,16,15,16,16,15,15,16,15,16,5904.9375,72.38060004356474,137.0,116.0,126.0,145.0,137.0,163.0,159.0,259.0,337.0,198.0,154.0,120.0,133.0,116.0,108.0,72.0】
【gray,black,black,20,21,17,10,18,18,15,12,12,11,10,15,12,17,10,14,15,15,20,17,12,15,14,17,17,17,18,16,12,13,16,15,14,14,14,15,15,17,14,16,15,15,19,15,16,15,18,17,16,17,15,16,17,17,16,16,15,15,15,14,14,15,17,17,34,14,20,19,15,18,14,19,16,19,17,16,15,15,19,15,16,17,14,15,18,16,16,16,16,15,15,16,31,17,13,14,16,14,16,14,15,14,14,15,16,16,13,16,15,15,17,16,14,15,16,15,16,16,16,15,5654.25,75.55054658261132,268.0,141.0,109.0,157.0,109.0,118.0,172.0,298.0,186.0,153.0,127.0,157.0,121.0,96.0,145.0,123.0】
【gray,white,gray,15,8,8,16,7,18,18,17,7,18,16,14,17,12,20,13,16,14,19,17,16,16,15,16,16,15,15,14,18,14,17,16,16,14,16,16,16,15,16,14,17,16,15,16,14,17,15,16,15,15,15,17,15,16,16,15,15,15,15,16,16,16,15,15,22,16,21,16,15,16,15,18,17,16,15,15,16,15,15,16,15,16,15,15,15,16,16,16,15,16,16,16,35,17,13,15,16,16,17,14,15,16,15,16,15,15,16,15,16,15,16,16,16,15,16,16,15,15,15,15,5820.9375,63.669510805117625,280.0,133.0,149.0,159.0,128.0,128.0,161.0,197.0,132.0,133.0,124.0,153.0,159.0,137.0,156.0,151.0】
【gray,blue,gray,10,12,6,15,17,11,18,18,15,15,14,16,15,16,14,18,16,14,16,15,16,15,16,16,15,16,11,18,12,16,18,16,15,16,16,15,15,15,15,15,15,14,17,16,15,15,16,15,16,16,15,16,16,16,16,15,15,16,16,16,16,16,15,16,46,17,24,11,16,18,13,15,15,17,16,15,15,14,17,16,15,17,16,16,15,16,16,14,16,15,16,14,20,15,11,20,15,14,17,16,16,14,15,16,16,16,15,15,16,15,15,16,16,15,15,17,15,16,15,17,14186.666666666666,49.912458173701786,440.0,73.0,71.0,184.0,99.0,164.0,118.0,246.0,79.0,165.0,209.0,234.0,76.0,95.0,103.0,124.0】
三、加入类标签进行训练,得到最终训练集如下:
【black,gray,gray,12,11,19,13,17,14,15,16,17,14,15,16,15,16,15,16,15,14,16,15,15,17,15,15,16,16,15,15,16,16,16,16,17,16,15,13,17,16,16,16,16,16,15,15,16,15,16,15,15,14,15,16,15,16,16,15,15,15,15,16,15,16,15,15,29,16,23,20,15,16,15,15,14,17,15,15,15,15,15,16,16,16,16,16,15,15,16,16,16,15,16,16,29,15,10,12,16,15,16,17,16,15,16,16,16,16,16,15,16,16,15,16,17,16,15,15,15,16,15,15,5688.375,45.43360005076996,220.0,142.0,118.0,82.0,93.0,103.0,138.0,444.0,287.0,110.0,100.0,105.0,113.0,136.0,150.0,139.0,elephant】
【black,gray,gray,13,11,28,15,14,22,16,21,18,18,19,16,12,14,17,15,16,16,12,13,12,16,16,12,14,13,16,16,15,15,16,15,15,17,18,20,12,15,16,17,16,15,16,16,15,16,16,16,12,18,16,15,16,15,15,16,15,16,16,15,16,16,16,15,31,17,18,18,17,16,15,16,16,16,16,16,16,15,16,16,16,15,15,15,16,16,15,15,16,15,16,16,28,14,11,14,15,14,16,14,15,14,15,16,16,16,15,15,15,16,17,16,15,16,16,17,16,16,15,16,5893.125,67.91773485628714,165.0,82.0,84.0,111.0,91.0,112.0,156.0,263.0,287.0,278.0,213.0,217.0,126.0,98.0,105.0,92.0,elephant】
【gray,gray,gray,28,10,24,12,18,17,16,12,19,13,15,13,17,14,13,16,16,17,17,15,15,16,16,14,16,17,17,17,17,16,13,15,14,16,16,16,16,16,16,15,16,13,14,16,16,16,15,16,15,15,16,15,17,16,16,15,16,15,15,15,15,15,16,16,43,14,27,16,16,19,15,16,18,14,16,15,14,17,14,16,14,16,15,15,15,15,16,15,16,17,14,17,24,16,7,16,16,14,16,14,14,16,15,16,16,15,16,15,17,15,16,16,16,16,16,15,16,15,16,15,6084.75,51.951917705440906,140.0,107.0,94.0,101.0,108.0,127.0,264.0,451.0,318.0,176.0,99.0,105.0,87.0,92.0,118.0,93.0,elephant】
【gray,gray,blue,17,7,24,17,21,16,15,12,16,19,14,15,18,17,16,15,15,15,16,14,16,15,16,16,15,17,16,15,17,16,15,15,16,16,18,13,18,14,14,15,17,16,16,15,15,16,15,16,16,15,16,15,15,15,15,15,14,15,16,16,16,16,15,17,29,18,23,23,15,15,17,16,16,19,19,15,15,15,16,16,16,16,16,15,17,18,15,15,16,15,15,16,32,13,10,11,16,16,15,15,16,13,13,16,16,16,15,16,15,15,15,16,14,14,16,16,16,16,16,16,5941.6875,62.22468151661002,149.0,133.0,122.0,109.0,122.0,124.0,190.0,348.0,269.0,143.0,149.0,152.0,120.0,121.0,131.0,98.0,elephant】
【black,gray,blue,22,18,21,12,16,13,16,15,14,12,13,16,17,15,15,17,15,15,16,15,13,17,16,16,16,16,15,14,15,16,16,16,15,16,16,16,17,15,16,15,16,16,16,16,16,14,16,16,16,15,15,17,16,15,16,15,15,16,15,16,15,16,15,15,35,17,26,25,18,17,16,16,15,21,17,13,15,17,16,16,16,15,14,13,15,14,15,15,15,15,16,15,30,14,8,8,14,14,15,15,16,12,15,17,16,15,15,16,15,16,17,17,16,17,16,16,16,16,15,16,13379.047619047618,49.760226526857785,125.0,113.0,103.0,139.0,108.0,177.0,212.0,353.0,288.0,188.0,160.0,112.0,109.0,112.0,103.0,78.0,elephant】
【black,blue,gray,19,15,8,13,15,13,16,16,15,16,14,16,16,17,16,15,16,14,16,15,14,16,16,17,16,14,15,16,15,16,16,16,14,17,16,17,15,15,15,14,16,15,15,15,16,16,16,14,14,16,17,16,15,15,16,15,15,17,15,14,16,16,15,16,48,22,24,14,16,24,10,18,12,18,15,17,12,14,15,15,14,18,15,15,16,16,15,14,16,16,17,17,22,12,11,18,16,10,19,15,18,14,16,14,18,16,15,16,17,14,16,16,15,15,16,16,16,15,15,15,5832.75,51.73147268771606,127.0,96.0,75.0,92.0,93.0,107.0,239.0,521.0,342.0,196.0,111.0,108.0,82.0,81.0,103.0,107.0,elephant】
【black,black,gray,14,16,16,11,16,12,18,15,18,14,10,15,16,15,13,16,16,15,16,13,14,19,16,17,15,17,17,14,16,15,14,15,15,15,15,17,16,15,14,16,17,16,15,14,15,16,15,16,16,16,15,15,15,14,17,17,16,15,16,15,16,15,15,15,27,14,16,16,14,16,14,17,13,15,17,13,17,15,15,15,16,16,17,14,17,16,15,16,16,16,15,17,33,16,15,16,17,15,16,15,17,16,14,17,14,16,16,16,16,15,15,16,15,15,16,15,15,15,16,15,5416.6875,61.516147203308535,360.0,181.0,117.0,167.0,126.0,119.0,131.0,183.0,147.0,105.0,102.0,115.0,124.0,142.0,161.0,200.0,elephant】
【gray,gray,black,26,7,16,22,15,20,15,19,18,25,24,18,14,15,17,20,17,17,17,17,21,19,15,15,16,15,14,16,8,16,15,15,16,14,16,18,16,13,16,15,14,16,17,18,15,14,14,16,15,16,14,15,15,17,17,16,16,14,16,15,16,15,15,15,26,17,18,17,15,16,15,16,15,16,16,15,16,16,15,15,16,15,15,15,16,16,16,16,16,16,15,16,34,14,14,14,16,15,16,15,16,15,15,16,15,16,16,16,15,15,16,16,15,16,16,15,15,15,16,15,5702.8125,81.44085401863387,486.0,141.0,121.0,102.0,69.0,93.0,107.0,181.0,94.0,111.0,92.0,137.0,98.0,134.0,168.0,346.0,elephant】
【gray,white,gray,14,11,13,8,10,18,21,21,14,15,14,15,18,13,18,26,18,13,16,15,16,15,14,16,13,17,13,20,9,16,11,16,14,16,15,16,16,15,15,16,13,16,15,16,15,14,15,15,16,15,15,15,15,17,16,15,16,15,16,14,16,15,15,16,26,15,16,18,16,15,15,15,16,16,16,15,16,15,16,14,15,15,16,15,16,16,15,16,16,15,15,15,34,16,16,14,15,15,16,16,16,15,15,16,15,16,15,17,16,16,15,16,15,15,16,16,16,16,16,16,12876.190476190475,65.97967247610414,688.0,212.0,112.0,112.0,85.0,56.0,60.0,72.0,61.0,60.0,67.0,93.0,82.0,121.0,236.0,363.0,elephant】
【black,white,black,23,17,19,29,20,10,18,17,15,23,17,13,14,17,16,15,15,17,17,15,16,18,12,17,16,15,16,16,15,15,16,15,15,17,14,14,15,15,14,15,15,15,16,14,16,17,16,14,16,15,16,15,14,16,16,16,17,16,16,15,16,17,15,15,28,16,21,12,14,15,16,16,17,16,16,16,16,15,15,16,16,16,15,15,16,15,16,15,16,16,16,15,32,16,12,17,15,16,16,15,16,16,15,15,16,16,16,16,16,16,16,16,15,16,15,15,16,16,15,15,14412.190476190475,75.92777093955985,170.0,110.0,142.0,138.0,158.0,131.0,172.0,218.0,185.0,150.0,192.0,187.0,152.0,134.0,119.0,122.0,elephant】
【white,gray,black,20,17,24,25,19,18,18,13,17,25,17,19,19,15,15,14,17,15,14,11,18,17,11,13,12,16,15,17,16,16,16,15,15,16,11,18,12,14,17,16,16,16,16,15,15,17,15,17,15,16,16,15,15,15,14,15,15,15,16,15,15,16,15,15,26,16,20,18,16,17,15,15,16,15,17,15,15,15,15,16,16,16,17,16,16,15,15,15,16,16,16,16,33,14,13,13,15,16,16,15,16,15,15,17,16,16,15,15,16,15,16,16,15,16,16,15,15,16,15,16,5904.9375,72.38060004356474,137.0,116.0,126.0,145.0,137.0,163.0,159.0,259.0,337.0,198.0,154.0,120.0,133.0,116.0,108.0,72.0,elephant】
【gray,black,black,20,21,17,10,18,18,15,12,12,11,10,15,12,17,10,14,15,15,20,17,12,15,14,17,17,17,18,16,12,13,16,15,14,14,14,15,15,17,14,16,15,15,19,15,16,15,18,17,16,17,15,16,17,17,16,16,15,15,15,14,14,15,17,17,34,14,20,19,15,18,14,19,16,19,17,16,15,15,19,15,16,17,14,15,18,16,16,16,16,15,15,16,31,17,13,14,16,14,16,14,15,14,14,15,16,16,13,16,15,15,17,16,14,15,16,15,16,16,16,15,5654.25,75.55054658261132,268.0,141.0,109.0,157.0,109.0,118.0,172.0,298.0,186.0,153.0,127.0,157.0,121.0,96.0,145.0,123.0,elephant】
【gray,white,gray,15,8,8,16,7,18,18,17,7,18,16,14,17,12,20,13,16,14,19,17,16,16,15,16,16,15,15,14,18,14,17,16,16,14,16,16,16,15,16,14,17,16,15,16,14,17,15,16,15,15,15,17,15,16,16,15,15,15,15,16,16,16,15,15,22,16,21,16,15,16,15,18,17,16,15,15,16,15,15,16,15,16,15,15,15,16,16,16,15,16,16,16,35,17,13,15,16,16,17,14,15,16,15,16,15,15,16,15,16,15,16,16,16,15,16,16,15,15,15,15,5820.9375,63.669510805117625,280.0,133.0,149.0,159.0,128.0,128.0,161.0,197.0,132.0,133.0,124.0,153.0,159.0,137.0,156.0,151.0,elephant】
【gray,blue,gray,10,12,6,15,17,11,18,18,15,15,14,16,15,16,14,18,16,14,16,15,16,15,16,16,15,16,11,18,12,16,18,16,15,16,16,15,15,15,15,15,15,14,17,16,15,15,16,15,16,16,15,16,16,16,16,15,15,16,16,16,16,16,15,16,46,17,24,11,16,18,13,15,15,17,16,15,15,14,17,16,15,17,16,16,15,16,16,14,16,15,16,14,20,15,11,20,15,14,17,16,16,14,15,16,16,16,15,15,16,15,15,16,16,15,15,17,15,16,15,17,14186.666666666666,49.912458173701786,440.0,73.0,71.0,184.0,99.0,164.0,118.0,246.0,79.0,165.0,209.0,234.0,76.0,95.0,103.0,124.0,elephant】
四、将最终训练文件分布存储,这些文件可以做为模型文件对任何输入的图像进行分类计算,分类结果可以用于检索。比如,分到哪一个具体类别中,那么检索目标图像的结果就是这个分类结果中对应的所有图像数据:
例如,针对图7所示的用户输入的目标图像,计算出特征向量如下:
【gray,none,none,42,20,20,25,14,23,11,16,14,14,12,17,13,15,13,17,14,18,11,12,17,16,15,14,16,15,15,15,17,16,15,18,16,16,17,15,15,16,16,17,16,16,15,14,15,16,15,15,15,15,16,15,14,15,14,16,16,15,16,15,17,17,15,15,35,16,18,19,15,17,15,17,15,14,16,16,15,16,15,16,15,16,14,16,17,16,16,15,16,16,16,16,28,17,14,13,16,14,16,14,15,16,15,16,16,16,16,16,16,16,17,15,14,15,15,16,15,16,15,15,6267.1875,57.62821681519685,153.0,138.0,109.0,129.0,141.0,155.0,213.0,291.0,280.0,181.0,148.0,137.0,102.0,93.0,108.0,102.0】
利用训练集在某分类器下分类,结果为elephant,那么将对应的elephant类下的图像输出如图8所示。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
参照图9,其示出了本申请的一种图像分类的系统实施例的结构框图,具体可以包括如下模块:
图像分割模块901,用于将图像分割为若干子区域;
焦点提取模块902,用于在所述子区域中提取焦点子区域;
语义映射模块903,用于对所述焦点子区域进行颜色语义映射,获得语义特征;
分类模块904,用于采用所述图像分类特征进行图像分类,所述图像分类特征包括语义特征。
在本申请的一种优选实施例中,所述焦点提取模块902具体可以包括如下子模块:
建模子模块,用于针对所述子区域建立视觉焦点权重模型;
第一条件提取子模块,用于按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
在本申请的另一种优选实施例中,所述焦点提取模块902具体可以包括如下子模块:
建模子模块,用于针对所述子区域建立视觉焦点权重模型;
第二条件提取子模块,用于按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
作为本申请实施例具体应用的一种示例,可以针对各子区域按照如下公式建立视觉焦点权重模型:
W=ω1×Area+ω2×Pos+ω3×Brightness
其中,W表示各个子区域的视觉焦点权重,ω1是面积参数Area的权重系数,ω2是位置参数Pos的权重系数,ω3是亮度参数Brightness的权重系数;
面积参数Area: Area = S i S total .
其中,Si表示对应的第i个子区域的面积大小;Stotal表示当前图像的大小;
位置参数Pos: Pos = p i p center .
其中,pi表示对应的第i个子区域的在预设的子区域位置模板相应位置的大小;pcenter表示整个模板相应位置的面积大小;
亮度参数Brightness:
Brightness=|Max(mean(R,G,B))-Max(Globalmean(R,G,B))|,
其中,mean(R,G,B)表示对应的第i个子区域的RGB均值,Globalmean(R,G,B)表示当前图像整体的亮度均值,Max(?)表示求最大值的函数。
在本申请的一种优选实施例中,所述语义映射模块903具体可以包括如下子模块:
色彩均值计算子模块,用于计算所述焦点子区域的RGB色彩均值;
颜色空间切分子模块,用于切分RGB颜色空间;
映射处理子模块,用于按照预置的映射规则,将所述焦点子区域的RGB色彩均值映射到RGB颜色空间中,得到对应的语义特征。
在具体实现中,所述语义特征可以为颜色语义名词的三元表征。
在本申请实施例中,所述图像分类特征还可以包括底层特征,本申请实施例还可以包括如下模块:
底层特征提取模块,用于对图像进行底层特征提取。
在具体应用中,本申请实施例还可以包括如下模块:
分类数据库生成模块,用于获得不同类别的图像分类数据库。
参照图10,其示出了本申请的一种图像检索的系统实施例的结构框图,具体可以包括如下模块:
搜索请求接收模块111,用于接收针对目标图像的搜索请求;
图像分割模块112,用于将所述目标图像分割为若干子区域;
焦点提取模块113,用于在所述子区域中提取焦点子区域;
语义映射模块114,用于对所述焦点子区域进行颜色语义映射,获得语义特征;
特征匹配模块115,用于采用所述目标图像的分类特征,在预置的图像分类数据库中获取对应类别的图像为搜索结果,其中,所述分类特征包括语义特征。
在本申请的一种优选实施例中,所述焦点提取模块113具体可以包括如下子模块:
建模子模块,用于针对所述子区域建立视觉焦点权重模型;
第一条件提取子模块,用于按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
在本申请的另一种优选实施例中,所述焦点提取模块113具体可以包括如下子模块:
建模子模块,用于针对所述子区域建立视觉焦点权重模型;
第二条件提取子模块,用于按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
在具体实现中,针对各子区域按照如下公式建立视觉焦点权重模型:
W=ω1×Area+ω2×Pos+ω3×Brightness
其中,W表示各个子区域的视觉焦点权重,ω1是面积参数Area的权重系数,ω2是位置参数Pos的权重系数,ω3是亮度参数Brightness的权重系数;
面积参数Area: Area = S i S total .
其中,Si表示对应的第i个子区域的面积大小;Stotal表示当前图像的大小;
位置参数Pos: Pos = p i p center .
其中,pi表示对应的第i个子区域的在预设的子区域位置模板相应位置的大小;pcenter表示整个模板相应位置的面积大小;
亮度参数Brightness:
Brightness=|Max(mean(R,G,B))-Max(Globalmean(R,G,B))|,
其中,mean(R,G,B)表示对应的第i个子区域的RGB均值,Globalmean(R,G,B)表示当前图像整体的亮度均值,Max(?)表示求最大值的函数。
在本申请的一种优选实施例中,所述语义映射模块114可以包括如下子模块:
色彩均值计算子模块,用于计算所述焦点子区域的RGB色彩均值;
颜色空间切分子模块,用于切分RGB颜色空间;
映射处理子模块,用于按照预置的映射规则,将所述焦点子区域的RGB色彩均值映射到RGB颜色空间中,得到对应的语义特征。
优选的是,所述语义特征可以为颜色语义名词的三元表征。
在具体实现中,所述图像分类特征还可以包括底层特征,本申请实施例还可以包括如下模块:
底层特征提取模块,用于对所述目标图像进行底层特征提取。
本说明书中的各个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种图像分类的方法,一种图像分类的系统,一种图像检索的方法和一种图像检索的系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (16)

1.一种图像分类的方法,其特征在于,包括:
将图像分割为若干子区域;
在所述子区域中提取焦点子区域;
对所述焦点子区域进行颜色语义映射,获得语义特征;
采用所述图像分类特征进行图像分类,所述图像分类特征包括语义特征。
2.根据权利要求1所述的方法,其特征在于,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
3.根据权利要求1所述的方法,其特征在于,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
4.根据权利要求2或3所述的方法,其特征在于,所述针对子区域建立视觉焦点权重模型的步骤进一步包括:
针对各子区域按照如下公式建立视觉焦点权重模型:
W=ω1×Area+ω2×Pos+ω3×Brightness
其中,W表示各个子区域的视觉焦点权重,ω1是面积参数Area的权重系数,ω2是位置参数Pos的权重系数,ω3是亮度参数Brightness的权重系数;
面积参数Area: Area = S i S total
其中,Si表示对应的第i个子区域的面积大小;Stotal表示当前图像的大小;
位置参数Pos: Pos = p i p center
其中,pi表示对应的第i个子区域的在预设的子区域位置模板相应位置的大小;pcenter表示整个模板相应位置的面积大小;
亮度参数Brightness:
Brightness=|Max(mean(R,G,B))-Max(Globalmean(R,G,B))|
其中,mean(R,G,B)表示对应的第i个子区域的RGB均值,Globalmean(R,G,B)表示当前图像整体的亮度均值,Max(?)表示求最大值的函数。
5.根据权利要求1或2或3所述的方法,其特征在于,所述对焦点子区域进行颜色语义映射,获得语义特征的步骤包括:
计算所述焦点子区域的RGB色彩均值;
切分RGB颜色空间;
按照预置的映射规则,将所述焦点子区域的RGB色彩均值映射到RGB颜色空间中,得到对应的语义特征。
6.根据权利要求5所述的方法,其特征在于,所述语义特征为颜色语义名词的三元表征。
7.根据权利要求1或2或3或6所述的方法,其特征在于,所述图像分类特征还包括底层特征,所述的方法还包括:
对图像进行底层特征提取。
8.根据权利要求1所述的方法,其特征在于,还包括:
获得不同类别的图像分类数据库。
9.一种图像检索的方法,其特征在于,包括:
接收针对目标图像的搜索请求;
将所述目标图像分割为若干子区域;
在所述子区域中提取焦点子区域;
对所述焦点子区域进行颜色语义映射,获得语义特征;
采用所述目标图像的分类特征,在预置的图像分类数据库中获取对应类别的图像为搜索结果,其中,所述分类特征包括语义特征。
10.根据权利要求9所述的方法,其特征在于,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
11.根据权利要求9所述的方法,其特征在于,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
12.根据权利要求10或11所述的方法,其特征在于,所述针对子区域建立视觉焦点权重模型的步骤进一步包括:
针对各子区域按照如下公式建立视觉焦点权重模型:
W=ω1×Area+ω2×Pos+ω3×Brightness
其中,W表示各个子区域的视觉焦点权重,ω1是面积参数Area的权重系数,ω2是位置参数Pos的权重系数,ω3是亮度参数Brightness的权重系数;
面积参数Area: Area = S i S total
其中,Si表示对应的第i个子区域的面积大小;Stotal表示当前图像的大小;
位置参数Pos:
Figure FDA0000153122480000032
其中pi表示对应的第i个子区域的在预设的子区域位置模板相应位置的大小;pcenter表示整个模板相应位置的面积大小;
亮度参数Brightness:
Brightness=|Max(mean(R,G,B))-Max(Globalmean(R,G,B))|
其中,mean(R,G,B)表示对应的第i个子区域的RGB均值,Globalmean(R,G,B)表示当前图像整体的亮度均值,Max(?)表示求最大值的函数。
13.根据权利要求9或10或11所述的方法,其特征在于,所述对焦点子区域进行颜色语义映射,获得语义特征的步骤包括:
计算所述焦点子区域的RGB色彩均值;
切分RGB颜色空间;
按照预置的映射规则,将所述焦点子区域的RGB色彩均值映射到RGB颜色空间中,得到对应的语义特征。
14.根据权利要求9或10或11所述的方法,其特征在于,所述分类特征还包括底层特征,所述的方法还包括:
对所述目标图像进行底层特征提取。
15.一种图像分类的系统,其特征在于,包括:
图像分割模块,用于将图像分割为若干子区域;
焦点提取模块,用于在所述子区域中提取焦点子区域;
语义映射模块,用于对所述焦点子区域进行颜色语义映射,获得语义特征;
分类模块,用于采用所述图像分类特征进行图像分类,所述图像分类特征包括语义特征。
16.一种图像检索的系统,其特征在于,包括:
搜索请求接收模块,用于接收针对目标图像的搜索请求;
图像分割模块,用于将所述目标图像分割为若干子区域;
焦点提取模块,用于在所述子区域中提取焦点子区域;
语义映射模块,用于对所述焦点子区域进行颜色语义映射,获得语义特征;
特征匹配模块,用于采用所述目标图像的分类特征,在预置的图像分类数据库中获取对应类别的图像为搜索结果,其中,所述分类特征包括语义特征。
CN2012101104009A 2012-04-13 2012-04-13 图像分类的方法和系统、图像检索的方法和系统 Pending CN103377376A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101104009A CN103377376A (zh) 2012-04-13 2012-04-13 图像分类的方法和系统、图像检索的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101104009A CN103377376A (zh) 2012-04-13 2012-04-13 图像分类的方法和系统、图像检索的方法和系统

Publications (1)

Publication Number Publication Date
CN103377376A true CN103377376A (zh) 2013-10-30

Family

ID=49462459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101104009A Pending CN103377376A (zh) 2012-04-13 2012-04-13 图像分类的方法和系统、图像检索的方法和系统

Country Status (1)

Country Link
CN (1) CN103377376A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102914A (zh) * 2013-04-02 2014-10-15 深圳中兴力维技术有限公司 基于差分链码直方图的目标分类方法及装置
CN105023025A (zh) * 2015-08-03 2015-11-04 大连海事大学 一种开集痕迹图像分类方法及系统
CN105184260A (zh) * 2015-09-10 2015-12-23 北京大学 一种图像特征提取方法及行人检测方法及装置
CN105631466A (zh) * 2015-12-21 2016-06-01 中国科学院深圳先进技术研究院 图像分类的方法及装置
CN105975922A (zh) * 2016-04-29 2016-09-28 乐视控股(北京)有限公司 信息处理方法及装置
CN106295706A (zh) * 2016-08-17 2017-01-04 山东大学 一种基于形状视觉知识库的图像自动分割和语义注释方法
CN106502533A (zh) * 2016-10-21 2017-03-15 上海与德信息技术有限公司 一种截屏方法及装置
CN107085766A (zh) * 2017-04-20 2017-08-22 温州市鹿城区中津先进科技研究院 基于销量进行备料策略指导的大数据分析方法
CN107103495A (zh) * 2017-04-20 2017-08-29 温州市鹿城区中津先进科技研究院 基于服装色彩特征采集分类统计销量的大数据分析方法
CN107153969A (zh) * 2017-04-20 2017-09-12 温州市鹿城区中津先进科技研究院 基于定位标签进行面料调度指导的大数据处理方法
CN107169817A (zh) * 2017-04-20 2017-09-15 温州市鹿城区中津先进科技研究院 电商平台展示图片颜色信息采集方法
CN108694225A (zh) * 2017-03-31 2018-10-23 阿里巴巴集团控股有限公司 一种图像搜索方法、特征向量的生成方法、装置及电子设备
CN108805190A (zh) * 2018-05-30 2018-11-13 北京奇艺世纪科技有限公司 一种图像处理方法及装置
CN109191381A (zh) * 2018-09-14 2019-01-11 恒信东方文化股份有限公司 一种标定焦点处理图像的方法及系统
CN109460623A (zh) * 2018-11-22 2019-03-12 上海华力微电子有限公司 相似版图判断方法
CN109657715A (zh) * 2018-12-12 2019-04-19 广东工业大学 一种语义分割方法、装置、设备及介质
CN110136214A (zh) * 2019-05-15 2019-08-16 天津科技大学 一种彩色图像颜色一致性描述方法
CN110390364A (zh) * 2019-07-31 2019-10-29 莆田学院 图像分类方法及装置
CN111275041A (zh) * 2020-01-20 2020-06-12 腾讯科技(深圳)有限公司 内窥镜图像展示方法、装置、计算机设备及存储介质
CN111382753A (zh) * 2018-12-27 2020-07-07 曜科智能科技(上海)有限公司 光场语义分割方法、系统、电子终端及存储介质
CN111476253A (zh) * 2019-01-23 2020-07-31 阿里巴巴集团控股有限公司 服装图像分类、图像分类方法、装置及设备
CN111784709A (zh) * 2020-07-07 2020-10-16 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备和计算机可读介质
CN111784710A (zh) * 2020-07-07 2020-10-16 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备和介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
贾宇: "基于语义的图像分类和检索研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102914A (zh) * 2013-04-02 2014-10-15 深圳中兴力维技术有限公司 基于差分链码直方图的目标分类方法及装置
CN105023025B (zh) * 2015-08-03 2018-09-25 大连海事大学 一种开集痕迹图像分类方法及系统
CN105023025A (zh) * 2015-08-03 2015-11-04 大连海事大学 一种开集痕迹图像分类方法及系统
CN105184260A (zh) * 2015-09-10 2015-12-23 北京大学 一种图像特征提取方法及行人检测方法及装置
CN105184260B (zh) * 2015-09-10 2019-03-08 北京大学 一种图像特征提取方法及行人检测方法及装置
CN105631466A (zh) * 2015-12-21 2016-06-01 中国科学院深圳先进技术研究院 图像分类的方法及装置
CN105631466B (zh) * 2015-12-21 2019-05-07 中国科学院深圳先进技术研究院 图像分类的方法及装置
CN105975922A (zh) * 2016-04-29 2016-09-28 乐视控股(北京)有限公司 信息处理方法及装置
CN106295706A (zh) * 2016-08-17 2017-01-04 山东大学 一种基于形状视觉知识库的图像自动分割和语义注释方法
CN106295706B (zh) * 2016-08-17 2019-04-19 山东大学 一种基于形状视觉知识库的图像自动分割和语义注释方法
CN106502533A (zh) * 2016-10-21 2017-03-15 上海与德信息技术有限公司 一种截屏方法及装置
CN108694225A (zh) * 2017-03-31 2018-10-23 阿里巴巴集团控股有限公司 一种图像搜索方法、特征向量的生成方法、装置及电子设备
CN107169817A (zh) * 2017-04-20 2017-09-15 温州市鹿城区中津先进科技研究院 电商平台展示图片颜色信息采集方法
CN107153969A (zh) * 2017-04-20 2017-09-12 温州市鹿城区中津先进科技研究院 基于定位标签进行面料调度指导的大数据处理方法
CN107103495A (zh) * 2017-04-20 2017-08-29 温州市鹿城区中津先进科技研究院 基于服装色彩特征采集分类统计销量的大数据分析方法
CN107085766A (zh) * 2017-04-20 2017-08-22 温州市鹿城区中津先进科技研究院 基于销量进行备料策略指导的大数据分析方法
CN108805190A (zh) * 2018-05-30 2018-11-13 北京奇艺世纪科技有限公司 一种图像处理方法及装置
CN109191381A (zh) * 2018-09-14 2019-01-11 恒信东方文化股份有限公司 一种标定焦点处理图像的方法及系统
CN109191381B (zh) * 2018-09-14 2023-06-23 恒信东方文化股份有限公司 一种标定焦点处理图像的方法及系统
CN109460623A (zh) * 2018-11-22 2019-03-12 上海华力微电子有限公司 相似版图判断方法
CN109657715A (zh) * 2018-12-12 2019-04-19 广东工业大学 一种语义分割方法、装置、设备及介质
CN109657715B (zh) * 2018-12-12 2024-02-06 广东省机场集团物流有限公司 一种语义分割方法、装置、设备及介质
CN111382753B (zh) * 2018-12-27 2023-05-12 曜科智能科技(上海)有限公司 光场语义分割方法、系统、电子终端及存储介质
CN111382753A (zh) * 2018-12-27 2020-07-07 曜科智能科技(上海)有限公司 光场语义分割方法、系统、电子终端及存储介质
CN111476253A (zh) * 2019-01-23 2020-07-31 阿里巴巴集团控股有限公司 服装图像分类、图像分类方法、装置及设备
CN111476253B (zh) * 2019-01-23 2024-04-02 阿里巴巴集团控股有限公司 服装图像分类、图像分类方法、装置及设备
CN110136214A (zh) * 2019-05-15 2019-08-16 天津科技大学 一种彩色图像颜色一致性描述方法
CN110136214B (zh) * 2019-05-15 2023-05-23 天津科技大学 一种彩色图像颜色一致性描述方法
CN110390364A (zh) * 2019-07-31 2019-10-29 莆田学院 图像分类方法及装置
WO2021147429A1 (zh) * 2020-01-20 2021-07-29 腾讯科技(深圳)有限公司 内窥镜图像展示方法、装置、计算机设备及存储介质
CN111275041A (zh) * 2020-01-20 2020-06-12 腾讯科技(深圳)有限公司 内窥镜图像展示方法、装置、计算机设备及存储介质
CN111784709A (zh) * 2020-07-07 2020-10-16 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备和计算机可读介质
CN111784710A (zh) * 2020-07-07 2020-10-16 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备和介质
CN111784709B (zh) * 2020-07-07 2023-02-17 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备和计算机可读介质
CN111784710B (zh) * 2020-07-07 2023-10-20 抖音视界有限公司 图像处理方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
CN103377376A (zh) 图像分类的方法和系统、图像检索的方法和系统
Wang et al. Visual saliency guided complex image retrieval
Li et al. A comparison of 3D shape retrieval methods based on a large-scale benchmark supporting multimodal queries
CN102073748B (zh) 一种基于视觉关键词的遥感影像语义检索方法
Yildizer et al. Efficient content-based image retrieval using multiple support vector machines ensemble
Penatti et al. Comparative study of global color and texture descriptors for web image retrieval
Singh et al. Content-based image retrieval using color moment and Gabor texture feature
CN101551823B (zh) 一种综合多特征图像检索方法
Wang et al. Remote sensing image retrieval by scene semantic matching
Fauqueur et al. Region-based image retrieval: Fast coarse segmentation and fine color description
CN108595636A (zh) 基于深度跨模态相关性学习的手绘草图的图像检索方法
Raza et al. Correlated primary visual texton histogram features for content base image retrieval
Liu et al. Region-based image retrieval with high-level semantic color names
CN103186538A (zh) 一种图像分类方法和装置、图像检索方法和装置
Zou et al. Chronological classification of ancient paintings using appearance and shape features
Song et al. Taking advantage of multi-regions-based diagonal texture structure descriptor for image retrieval
Singh et al. Image retrieval based on the combination of color histogram and color moment
Wang et al. Remote-sensing image retrieval by combining image visual and semantic features
Mehmood et al. Scene search based on the adapted triangular regions and soft clustering to improve the effectiveness of the visual-bag-of-words model
Cheng et al. A semantic learning for content-based image retrieval using analytical hierarchy process
Walia et al. Boosting local texture descriptors with Log-Gabor filters response for improved image retrieval
Ait-Aoudia et al. YACBIR: yet another content based image retrieval system
Chen et al. HyNet: A novel hybrid deep learning approach for efficient interior design texture retrieval
Srinivasa Rao et al. Content and context based image retrieval classification based on firefly-neural network
Oussalah Content based image retrieval: review of state of art and future directions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1186819

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20131030

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1186819

Country of ref document: HK