CN102682007A - 创建图像数据库的方法和装置 - Google Patents

创建图像数据库的方法和装置 Download PDF

Info

Publication number
CN102682007A
CN102682007A CN2011100592655A CN201110059265A CN102682007A CN 102682007 A CN102682007 A CN 102682007A CN 2011100592655 A CN2011100592655 A CN 2011100592655A CN 201110059265 A CN201110059265 A CN 201110059265A CN 102682007 A CN102682007 A CN 102682007A
Authority
CN
China
Prior art keywords
image
reference picture
input picture
picture
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100592655A
Other languages
English (en)
Inventor
王永攀
谢丁杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2011100592655A priority Critical patent/CN102682007A/zh
Publication of CN102682007A publication Critical patent/CN102682007A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请涉及一种创建图像数据库的方法和装置,该方法包括如下步骤:1)获取待区分的输入图像;2)通过以下步骤来判断所述输入图像是参考图像还是非参考图像:a.对所述输入图像进行预处理;b.对所述输入图像进行垃圾图像判断处理;c.对所述输入图像进行文字图像判别处理;3)将判断为参考图像的图像纳入图像数据库中。本申请的方法和装置能高效且准确地区分参考图像和非参考图像,并将对于互联网用户而言有用的参考图像纳入图像数据库中,将对于互联网用户而言无用的非参考数据排除在图像数据库之外,从而可以提高图像数据库的搜索效率。

Description

创建图像数据库的方法和装置
技术领域
本发明涉及一种创建图像数据库的方法和装置,特别涉及一种能提高数据库的检索效率的创建图像数据库的方法和装置。
背景技术
随着互联网的普及,网络购物已经逐渐融入了百姓的生活,越来越多的互联网用户开始接受这一方便快捷的购物方式。这些互联网用户往往希望快速且准确地从海量商品图像中搜索选取出其感兴趣的商品的图像,从而参考和/或购买相应的物品。但是网络上显示的商品图像繁多复杂,既有利用相机等图像采集设备实际拍摄所得到的实际商品的图像,以及对实际拍摄图像进行简单处理(如插值或采样)后的实际商品的图像,此外,还有一些并非由图像采集设备实际拍摄所得到的图像,如合成图像、图像软件生成的图像等。由于实际拍摄所得到的实际商品的图像更能准确代表商品,因此用户通常是希望快速搜索出此类图像,而非其他图像。从这个角度出发,可将互联网上的数字图像大致分为两类,一类是对实际商品的拍摄或扫描得到的图像(包括经过简单处理的实际商品的图像),如图1所示的连衣裙、领带、腰带等,这些对于通过互联网挑选购买商品的用户来说是有参考价值的,在此被称为参考图像;另一类是没有参考价值的图像,如由计算机软件生成的图像,以及非商品(如文字扫描图像等)图像,如图2所示的鳄鱼标志等,这些对于通过互联网挑选购买商品的用户来说是没有用的,被称为非参考图像。通过自动将互联网上的图像进行区分以认定其是参考图像或是非参考图像,并将参考图像纳入图像数据库中,而将非参考图像排除在图像数据库之外,从而可以创建对于上述用户而言更为简化、有用的图像数据库,由此提高图像数据库的搜索效率,减少用户的搜索时间,降低服务器的负担。
一种区分方法是,基于图像颜色数、主颜色率、色彩饱和度、颜色直方图相关性这几个特性来区分参考图像与非参考图像,该区分方法的原理是:通过与参考图像相比,满足以下条件的图像为非参考图像:颜色比较单一,主颜色率比较高,色彩饱和度高的像素点较多;并且非参考图像的颜色直方图与统计所得的平均颜色直方图的相关性大于非参考图像的颜色直方图与统计所得的参考图像的平均颜色直方图的相关性。这种方法的准确率和召回率偏低。其中,准确率是指区分出的相关图像中被正确区分的相关图像与被区分出的所有相关图像的比值。例如,区分出的真正的参考图像与区分出的所有参考图像的比值;召回率是指区分出的目标图像与所有目标图像的比值,例如区分出的参考图像与所有参考图像的比值。
上述方法对于例如尺度及颜色被插值或采样的图像,由于这些处理改变了原图像的一些性质,如颜色数、主颜色率等,因而,使用上述区分方法很难有效地区分出参考图像和非参考图像。
此外,互联网上的数字图像还包括通常包含白色、灰色或黑色主体颜色且信息较少的图像,这种图像被称为垃圾图像。垃圾图像中既有对上述用户有用的参考图像,也有对上述用户无用的非参考图像。因而,若仅使用上述判断方法进行判断,则很可能产生将所有垃圾图像都归为非参考图像的误判。例如,对于一种显示置于黑色背景上的白色衬衫的参考图像,这种图像本身的颜色数比较少,色彩饱和度较高,如果使用上述判断方法仅基于图像颜色数、色彩饱和度等进行判断,则会将其错误地判断为非参考图像。
发明内容
鉴于上述缺陷,本申请的一个目的是提供一种创建图像数据库的方法和装置,其可以快速、准确地对大规模图像库进行分类,从而提高图像数据库的搜索效率。
为了实现上述目的,本申请提供一种创建图像数据库的方法,其包括如下步骤:
1)获取待区分的输入图像;
2)通过以下步骤来判断输入图像是参考图像还是非参考图像:
a.对所述输入图像进行预处理;
b.对所述输入图像进行垃圾图像判断处理;
c.对所述输入图像进行文字图像判别处理;
3)将判断为参考图像的图像纳入图像数据库中。
本申请还提供一种创建图像数据库的装置,其包括:
获取图像模块,用于获取待区分的输入图像;以及
预处理模块,用于对所述输入图像进行预处理,从而判断输入图像是参考图像还是非参考图像;
垃圾图像判断处理模块,用于对所述输入图像进行垃圾图像判断处理,从而判断输入图像是参考图像还是非参考图像;
文字图像判别处理模块,用于对所述输入图像进行文字图像判别处理,从而判断输入图像是参考图像还是非参考图像;以及
图像纳入模块,用于将判断为参考图像的图像纳入图像数据库中。
在本申请中,图像预处理利用了如图像尺度及颜色数等几个效率极高的判断项,将那些容易区分的非参考图像召回,这样可以减少之后的垃圾图像与文字图像判别处理的判断量,大大减少了运行时间,从而提高了算法的效率。
此外,在本申请中,作用于颜色空间的垃圾图像判断处理并不是对整幅图像的主颜色率及饱和度进行判断,而是对图像进行了分块处理,通过各个分块之间的颜色关系来判断图像的类型,因而使得判断更为精确。
另外,在本申请中,分析图像所包含的内容,提出了根据文字区域所占比例来判断图像的类型,其与颜色空间的判断处理具有很好的互补性,从而以多角度全面进行判断,从而提高了召回率。
本申请包括如上所述的多个优点。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
图1示例性示出了参考图像的实例的示意图;
图2示例性示出了非参考图像的实例的示意图;
图3示例性示出了根据本申请创建图像数据库的主要处理的流程图;
图4示例性示出了根据本申请实施例的图像预处理的流程图;
图5示例性示出了根据本申请实施例的垃圾图像判断处理的流程图;
图6示例性示出了利用垃圾图像判断处理判断为垃圾图像的6个实例的示意图;
图7示例性示出了根据本申请实施例的文字图像判别处理的流程图;
图8示例性示出了根据本申请实施例的文字图像判别处理的改型的流程图;
图9示例性示出了根据本申请实施例的Sobel边缘检测效果的示意图;
图10示例性示出了根据本申请实施例的文字区域判断效果的示意图;
图11示例性示出了根据本申请实施例的文字区域统计效果的示意图;
图12示例性示出了根据本申请实施例的条纹误判解决效果的一个实例的示意图;
图13示例性示出了根据本申请实施例的条纹误判解决效果的另一个实例的示意图;
图14示例性示出了根据本申请实施例的文字图像判断过程的示意图;以及
图15示例性示出了根据本申请实施例的创建图像数据库的装置的功能框图。
具体实施方式
现将参照附图详细描述根据本申请的创建图像数据库的方法和装置,其中将重点描述如何区分参考图像和非参考图像。
根据一个实施例,先利用图像的物理尺度与颜色数这两个简单的判断项进行预处理,将那些容易区分的非参考图像排除;接下来,利用垃圾图像判断处理,将颜色单一的非参考图像排除;最后,利用文字图像判别处理,将包含文字较多的非参考图像召回。以上几个处理分别作用于图像的颜色空间与非颜色空间,故具有较好的互补性。以上几个处理的执行顺序可由本领域的技术人员根据实际情况进行调整。经过以上几个步骤,大部分的非参考图像可以被召回,即召回率很高,且具有很高的准确率,运行效率也很高。下面将参考附图进行详细描述。
根据一个实施例,如图3所示,其为创建图像数据库的主要流程图。该图像处理流程主要包括:图像获取步骤S1,用于获取待区分的输入图像;判断通过图像获取步骤S1获取的图像是参考图像还是非参考图像的图像预处理步骤S2、垃圾图像判断步骤S3;以及文字图像判别步骤S4;以及将判断为参考图像的图像添加到图像数据库中的步骤S5,和将判断为非参考图像的图像排除在图像数据库之外的步骤S6。下面将参照附图依次详细说明上述处理流程的具体步骤。
步骤S1,图像获取步骤;
用于获取待区分的输入图像;
步骤S2,图像预处理;
参照图4描述的图像预处理步骤S2,其利用一些简单的特征预先将那些在物理尺度和/或颜色空间上比较容易区分的非参考图像召回,并对图像进行压缩。
根据一个实施例,该步骤S2具体包括以下步骤:
步骤S21,根据图像的长与宽像素值判断输入的图像是否为非参考图像。即,确定输入图像的长与宽像素值,若输入图像的长或宽像素值小于一阈值(例如为80),则判断这一输入的图像为非参考图像,转到步骤S6;否则,进入步骤S22继续进行判断。
步骤S22,根据图像的长宽比判断输入的图像是否为非参考图像。对于参考图像,由于其通过诸如相机之类的图像采集设备拍摄而得,而图像采集设备的形状一定,故参考图像的长宽比有一定范围。因而,若经过步骤S21的图像的长宽比大于一阈值或小于一阈值(例如大于5或小于0.20),则该图像被判断为非参考图像,转到步骤S6;否则,进入步骤S23继续进行判断。
步骤S23,根据图像的长和宽像素值判断是否对图像进行压缩处理。即,判断图像的长或宽像素值是否大于一阈值(例如为200-250之间的任一值),若是,则进入步骤S24;否则,即判断图像的长、宽像素值并没有大于一阈值,转到步骤S25;
步骤S24,对图像进行压缩,之后进入将在后面描述的步骤S25。
图像压缩的目的是为了减少后面执行垃圾图像判断处理和文字图像判别处理的运行时间。经过发明人的大量实验校验,图像压缩虽对算法效果产生一定影响,但是大大减少了运行时间。其中,压缩后的图像的长宽比可以保持不变。
步骤S25,根据图像的颜色数判断输入图像是否为非参考图像。
该步骤中,可将输入图像的颜色空间进行压缩,统计输入图像包含的颜色数,若该颜色数小于一阈值(例如为7),则判断该图像为非参考图像,转到步骤S6;否则,进入步骤S3进行垃圾图像判断处理。
经大量实验证明,图像预处理步骤运行效率极高,将近50%的非参考图像在这一步骤中被排除,而且准确率极高,这大大减少了之后相对耗时的垃圾图像与文字图像判别处理的处理图像数目,有效提高了算法运行效率。
上述步骤及其执行顺序仅为一个实施例,本领域的技术人员可以根据实际情况修改上述步骤,如删除步骤S24,修改步骤S21、S22、S23、S25中的阈值,改变上述步骤的执行顺序,甚至在一定条件下重复执行某些步骤。
步骤S3、垃圾图像判断处理;
该步骤中,对于显示置于黑色背景上的白色衬衫的实拍图像之类的本身颜色数比较少且色彩饱和度较高的实拍图像,如果只通过整幅图像的颜色数、主颜色率等判断项来判断,则可能造成比较严重的误判,即将其误判为非参考图像而被排除在图像数据库之外。因而,本申请针对这种情况对图像进行了分块处理,根据各个分块主颜色的关系来判断图像是非参考图像还是参考图像。具体地说,可以将输入图像分成多个块,分别求取各个块的主颜色,并根据整幅输入图像的主颜色与各个块的主颜色来判断输入图像为参考图像还是非参考图像。
图5示例性示出了根据本申请通过分块处理进行垃圾图像判断步骤S3的处理流程图,包括以下步骤:
步骤S31、对图像的颜色空间进行压缩,例如将256色图像压缩为32色图像;
步骤S32、判断图像的主颜色是否为白色或黑色,如果是,则进入步骤S33;如果否,转步骤S4;
步骤S33、将图像分成多个块,并分别求取每个块中的主颜色;
该步骤中,可根据计算需要,将图像分成2至32个块,本实施例中优选分成九个块。
步骤S34、判断图像是否满足主颜色为黑色并且九个块的主颜色也为黑色,如果是,判断该图像为非参考图像,转步骤S5;如果否,进入步骤S35;
步骤S35、判断图像是否满足主颜色为白色并且9个块中有多个块的主颜色也偏白色,如果是,判断该图像为非参考图像,转步骤S5;如果否,进入步骤S36;
步骤S36、判断图像是否对角上存在主颜色为白色的块,如果是,判断该图像为非参考图像,转步骤S5,如果否,进入步骤S4;
上述步骤及其执行顺序仅为一个实施例,本领域的技术人员可以根据实际情况修改上述步骤,如图像块数的选取,图像的主颜色的选取、色块主颜色的选取,有效颜色的选取等等。
利用上述垃圾图像判断处理可以正确地将显示置于黑色背景上的白色衬衫的实拍图像之类的本身颜色数比较少且色彩饱和度较高的图像正确判断为参考图像。
图6为示出利用垃圾图像判断处理判断为非参考图像的6个实例的示意图。
步骤S4、文字图像判别处理;
由于非参考图像中有很大一部分是文字图像,这种文字图像通常包含较多的文字,在颜色空间上比较难将这类图像与参考图像区分开来。因而,为了提高区分参考图像和非参考图像的准确率,可针对这种特殊的文字图像进行判别。本申请通过判断图像中文字区域所占比例来区分这类图像。具体地说,可以对输入图像的边缘区域进行检测以得到边缘点图像,并根据边缘点图像中文字区域所占比例来判断所述输入图像为参考图像还是非参考图像。优选地,在将输入图像处理为边缘点图像之前,还包括将所述输入图像转换成灰度图的步骤。
如图7所示,其示例性示出了通过判断图像中文字区域所占比例来区分文字图像的流程图。下面是具体步骤。
步骤S41、将图像转化为灰度图。这是因为对于文字图像,图像对比度的特征远明显于颜色特征,故以下的操作均在灰度空间进行,这样也可以提高运行效率。
步骤S42、进行边缘检测,这是由于图像中的文字区域具有比较明显的边缘特征。在一个实施例中,使用左对角和右对角索贝尔算子(Sobel operator,Sobel算子,是图像处理中的算子之一,主要用作边缘检测)Sobel算子对图像的边缘区域进行检测,可以增强文字区域在图像中的效果。之所以选用Sobel算子一方面是因为该算子是各向同性的,因此对各个方向的笔画都能检测;另一方面,Sobel算子能产生双重边缘,这就更加凸显了图像中的文字笔画的边缘特征。
图9为Sobel边缘检测效果的示意图,其中,左侧的三个图像为原图(上面的两张图片为非参考图像,下面的一张图片为参考图像),右侧为通过边缘检测所得到的对应的三个图像。
步骤S43、进行文字区域的检测。在一个实施例中,通过分析Sobel边缘检测所得到的边缘点图像,可以发现文字图像存在一个特征,即文字行与行之间存在明显的空白行。根据统计,在未做压缩前,图像中文字的高度大多分布在8到45个像素之间,而经过预处理中的压缩后的文字高度大多都低于15个像素。因而,将上述边缘点图像分割为一个个16*16像素大小的窗口,分别对每一个窗口判断是否为文字区域:假设文字为横向书写文字,在窗口内做横向投影,投影值小于一定值的行被认为是空白行,求取每个窗口内最大的连续空白行数目Max_BL,之后根据Max_BL做判断:①若Max_BL小于第一阈值,则认为在该窗口中没有文字存在,为非文字区域,因为如果有文字存在,不同行的文字之间应该会有间隔;②若Max_BL大于第二阈值,同样认为该窗口为非文字区域;③若Max_BL处于第一与第二阈值之间,则判断为文字区域。之后,除去判断为非文字区域的窗口中的边缘点,保留第一与第二阈值之间的判断为文字区域的窗口中的边缘点。
图10为文字区域判断效果示意图。为了便于比对,图10中左侧的三个图像即为图9中右侧通过边缘检测所得到的三个图像,图10中右侧的三个图像为进行文字区域检测后得到的图像。从该图中可以看出,文字图像的边缘点基本都被保留下来,而非文字区域的边缘点基本都被抑制。
最后,进行文字区域数目统计S44。经过以上两步处理,文字区域与非文字区域表现出了较明显的不同,文字区域倾向于沿固定方向如横向密集分布,而非文字区域倾向于无方向性的曲线分布。在一个实施例中,使用高10个像素、宽40个像素大小的矩形窗口,分别以4个像素的移动量沿左右方向和8个像素的移动量沿上下方向对整幅图像区域进行判断,在矩形窗口内,如边缘点个数大于一定阈值,该窗口被认为是文字区域。统计整幅图像中文字区域所占比例,若该比例大于一定阈值,则该图像被判断为文字图像,从而作为非参考图像被排除在图像数据库之外,即进入步骤S6;否则作为参考图像被纳入图像数据库中,即进入步骤S5。
图11为文字区域统计效果示意图,同样,为了便于比对,图11中左侧的三个图像即为图10中右侧所示的进行文字区域检测后得到的图像,图11中的右侧为利用文字区域数目统计而得到的文字区域的定位效果。
经过上述图7所示的处理可以很好地将文字图像识别出来,并将其作为非参考图像排除在图像数据库之外。但是,由于条纹状图像经过以上处理后与文字图像表现出了类似的分布特性,因而对于这种条纹状图像,很容易产生误判。针对于此,本申请人通过细致分析条纹状图像及文字图案,发现条纹状图像的边缘点倾向于呈现线状分布,因此,利用这一区别点进行具体判断。即,参见图8,其在图7中的步骤S44之后加入进行条纹判断的步骤S45,这样可以使得条纹状商品图像不被误判,而可以正确地纳入图像数据库中。下面将详细地描述条纹判断步骤S45。
根据一实施例,计算上述10*40矩形窗口内10行中相邻像素差值的绝对值之和Sum_d,统计矩形窗口中Sum_d小于一定值的行的数目,如该数目大于一定阈值,则判断该矩形区域不是文字区域。该判断处理有效地解决了条纹状图案的误判,效果如图12和图13所示。图12和图13中的(a)为原图,(b)为Sobel边缘检测图,(c)为文字区域判断效果图,(d)为未加条纹判断项前得到的文字区域判断示意图,(e)为加上条纹判断项后得到的文字区域统计示意图,从图11和图12中的(d)与图11和图12中的(e)的对比可以看出,加入条纹判断项后,原先误判为文字的条纹图案基本都能正确判断。
图14为示例性示出整个文字判断处理过程的示意图,其中a为原图,b为Sobel边缘检测结果,c为文字区域检测结果,d为文字区域定位结果。
通过以上几个步骤的判断处理,可以有效地区分出参考图像与非参考图像,从而可以将参考图像纳入图像数据库中,并将非参考图像排除在图像数据库之外,由此提高图像数据库的搜索效率和准确率。在一个实施例中,对互联网上26000多张图像的测试结果如下面的表1所示。
表1
  准确率   召回率   运行效率
  预处理   99.94%   53.95%   0.61ms/p
  垃圾图像判断处理   93.92%   13.85%   2.56ms/p
  文字图像判别处理   92.46%   18.11%   3.12ms/p
  完整   97.43%   85.91%   5.62ms/p
从测试结果中看出,本申请在对网络图像的测试中取得了优异的结果,准确率达到97%以上,召回率也在85%以上。运行效率也很高,每秒内能实现170多张图像的处理,其中,运行效率单位为毫秒/张(ms/p)。
应注意的是,上述图像处理步骤仅为本申请的一种实施例,本领域的技术人员可以根据实际情况进行各种变型,例如本申请的图像处理步骤可以不必包含预处理、垃圾图像判断处理、文字图像判别处理的全部处理,而是包含它们中的一个或任意组合。本申请的图像处理的步骤顺序可以不必如图3所示,而是可以做各种改变。对于某一图像处理步骤,本领域的技术人员也可以根据实际情况改变,如在垃圾图像判断过程中,尽管在实施例中描述将图像分成九个块,但也可将图像分成其它适合的块数。
本申请的创建图像数据库的方法可用计算机执行计算机可执行程序实现。
图15示例性示出本申请创建图像数据库的装置的功能框图,本申请的创建图像数据库的装置对应于上述实施例中的创建图像数据库的方法。参见图15,创建图像数据库的装置包括:获取图像模块,用于获取待区分的输入图像;预处理模块,用于对所述输入图像进行预处理,从而判断所述输入图像是参考图像还是非参考图像;垃圾图像判断处理模块,用于对所述输入图像进行垃圾图像判断处理,从而判断所述输入图像是参考图像还是非参考图像;文字图像判别处理模块,用于对所述输入图像进行文字图像判别处理,从而判断所述输入图像是参考图像还是非参考图像;以及图像纳入模块,用于将判断为参考图像的图像纳入图像数据库中。
所述预处理模块用于根据所述输入图像的长与宽像素值、或者长宽比来判断所述输入图像为参考图像还是非参考图像。
所述预处理模块用于根据所述输入图像的颜色数来判断所述输入图像为参考图像还是非参考图像。
所述垃圾图像判断处理模块用于将所述输入图像分成多个块,分别求取各个块的主颜色,并根据整幅图像的主颜色与各个块的主颜色来判断述输入图像为参考图像还是非参考图像。
所述文字图像判别处理模块用于对所述输入图像处理的边缘区域进行检测以得到边缘点图像,并根据所述边缘点图像中文字区域所占比例来判断所述输入图像为参考图像还是非参考图像。
所述文字图像判别处理模块还用于在将所述输入图像处理为边缘点图像之前,将所述输入图像转换成灰度图。
所述文字图像判别处理模块还用于对所述输入图像进行条纹判断,以将条纹状商品的图像判断为参考图像。
本申请包括如下所述的多个优点之一或任意组合,但不限于这些优点:
在本申请中,作用于颜色空间的垃圾图像判断项并不是对整幅图像的主颜色率及饱和度进行判断,而是对图像进行了分块处理,通过各个分块之间的颜色关系来判断图像的类型,因而使得判断更为精确;
另外,在本申请中,分析图像所包含的内容,提出了根据文字区域所占比例来判断图像的类型,其与颜色空间的判断项具有很好的互补性,从而以多角度全面进行判断,从而提高了召回率;
此外,在本申请中,图像预处理利用了如图像尺度及颜色数等几个效率极高的判断项,将那些容易区分的非参考图像召回,这样可以减少之后的垃圾图像与文字图像判断项的判断量,大大减少了运行时间,从而提高了算法的效率;
由于本申请利用上述有效的判别方式来创建图像数据库,因而可以简化图像数据库并使图像数据库的内容精准,从而可以大大提高图像数据库的搜索效率。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
尽管上面以示例性实施例的方式对本申请进行了详细描述,但本申请的范围不限于上述实施例,本领域的技术人员可以对本申请进行各种改进和变型,这些均不脱离本申请的范围和构思。

Claims (8)

1.一种创建图像数据库的方法,其特征在于包括如下步骤:
1)获取待区分的输入图像;
2)通过以下步骤来判断所述输入图像为参考图像还是非参考图像:
a.对所述输入图像进行预处理;
b.对所述输入图像进行垃圾图像判断处理;
c.对所述输入图像进行文字图像判断处理;
3)将判断为参考图像的图像纳入图像数据库中。
2.根据权利要求1所述的方法,其特征在于,所述步骤a具体包括:
根据所述输入图像的长与宽的像素值、或者长宽比来判断所述输入图像是否为非参考图像。
3.根据权利要求1所述的方法,其特征在于,所述步骤a包括:
根据所述输入图像的颜色数来判断所述输入图像是否为非参考图像。
4.根据权利要求1所述的方法,其特征在于,步骤b包括:将所述输入图像分成多个块,分别求取各个块的主颜色,并根据整幅输入图像的主颜色与各个块的主颜色来判断所述输入图像为参考图像还是非参考图像。
5.根据权利要求1所述的方法,其中,步骤c包括:对所述输入图像的边缘区域进行检测以得到边缘点图像,并根据所述边缘点图像中文字区域所占比例来判断所述输入图像为参考图像还是非参考图像。
6.根据权利要求5所述的方法,其中,在将所述输入图像处理为边缘点图像之前,还包括将所述输入图像转换成灰度图的步骤。
7.根据权利要求5所述的方法,其中,步骤c还包括对所述输入图像进行条纹判断的步骤,以将条纹状商品的图像判断为参考图像。
8.一种创建图像数据库的装置,包括:
获取图像模块,用于获取待区分的输入图像;
预处理模块,用于对所述输入图像进行预处理,从而判断所述输入图像是参考图像还是非参考图像;
垃圾图像判断处理模块,用于对所述输入图像进行垃圾图像判断处理,从而判断所述输入图像是参考图像还是非参考图像; 
文字图像判别处理模块,用于对所述输入图像进行文字图像判别处理,从而判断所述输入图像是参考图像还是非参考图像;以及
图像纳入模块,用于将判断为参考图像的图像纳入图像数据库中。 
CN2011100592655A 2011-03-11 2011-03-11 创建图像数据库的方法和装置 Pending CN102682007A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100592655A CN102682007A (zh) 2011-03-11 2011-03-11 创建图像数据库的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100592655A CN102682007A (zh) 2011-03-11 2011-03-11 创建图像数据库的方法和装置

Publications (1)

Publication Number Publication Date
CN102682007A true CN102682007A (zh) 2012-09-19

Family

ID=46813953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100592655A Pending CN102682007A (zh) 2011-03-11 2011-03-11 创建图像数据库的方法和装置

Country Status (1)

Country Link
CN (1) CN102682007A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203764A (zh) * 2016-03-18 2017-09-26 北大方正集团有限公司 长微博图片识别方法和装置
CN108632639A (zh) * 2017-03-23 2018-10-09 北京小唱科技有限公司 一种视频类型判断方法及服务器
CN109543709A (zh) * 2018-10-11 2019-03-29 成都三零凯天通信实业有限公司 一种图片快速预处理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1469101A (zh) * 2002-06-28 2004-01-21 富士写真光机株式会社 从条纹图像提取圆形区域的方法
US20060008181A1 (en) * 2004-07-07 2006-01-12 Koji Takekoshi Image management device and method for managing plurality of images
CN101458770A (zh) * 2008-12-24 2009-06-17 北京文通科技有限公司 一种文字识别的方法和系统
CN101819637A (zh) * 2010-04-02 2010-09-01 南京邮电大学 利用图片的局部不变特征检测图像型垃圾邮件的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1469101A (zh) * 2002-06-28 2004-01-21 富士写真光机株式会社 从条纹图像提取圆形区域的方法
US20060008181A1 (en) * 2004-07-07 2006-01-12 Koji Takekoshi Image management device and method for managing plurality of images
CN101458770A (zh) * 2008-12-24 2009-06-17 北京文通科技有限公司 一种文字识别的方法和系统
CN101819637A (zh) * 2010-04-02 2010-09-01 南京邮电大学 利用图片的局部不变特征检测图像型垃圾邮件的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王永攀等: "区分商品图中计算机生成图和相机拍摄图的方法", 《光电工程》 *
贾宗良等: "数字图像条纹检测——极值判别方法", 《南京航空学院学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203764A (zh) * 2016-03-18 2017-09-26 北大方正集团有限公司 长微博图片识别方法和装置
CN107203764B (zh) * 2016-03-18 2020-08-07 北大方正集团有限公司 长微博图片识别方法和装置
CN108632639A (zh) * 2017-03-23 2018-10-09 北京小唱科技有限公司 一种视频类型判断方法及服务器
CN109543709A (zh) * 2018-10-11 2019-03-29 成都三零凯天通信实业有限公司 一种图片快速预处理方法

Similar Documents

Publication Publication Date Title
US11004129B2 (en) Image processing
US9665789B2 (en) Device and method for analyzing the correlation between an image and another image or between an image and a video
US9767567B2 (en) Method and apparatus for separating foreground image, and non-transitory computer-readable recording medium
US8406470B2 (en) Object detection in depth images
CN102013008B (zh) 一种基于支持向量机的烟雾检测方法及装置
AU2016225841B2 (en) Predicting accuracy of object recognition in a stitched image
US8542875B2 (en) Image processing based on visual attention and reduced search based generated regions of interest
Fan et al. An improved automatic isotropic color edge detection technique
US20060204082A1 (en) Fusion of color space data to extract dominant color
JP2017084336A (ja) 画像化された文書からテキストを抽出する方法及び装置
CN104239909A (zh) 一种图像的识别方法和装置
Park Shape-resolving local thresholding for object detection
US20140050411A1 (en) Apparatus and method for generating image feature data
CN110502977B (zh) 一种建筑物变化分类检测方法、系统、装置及存储介质
US20160026859A1 (en) Image processing apparatus, image processing method and image processing program
CN109543686B (zh) 基于自适应多阈值的字符识别预处理二值化方法
CN102610104A (zh) 一种车载的前方车辆检测方法
CN114422720B (zh) 视频浓缩方法、系统、装置和存储介质
Fan et al. Fuzzy color distribution chart-based shot boundary detection
CN110517285B (zh) 基于运动估计me-cnn网络的大场景极小目标跟踪
CN102682007A (zh) 创建图像数据库的方法和装置
CN110119675B (zh) 一种产品识别方法和装置
CN108710881B (zh) 神经网络模型、候选目标区域生成方法、模型训练方法
CN110705568B (zh) 一种图像特征点提取的优化方法
CN113361321B (zh) 一种红外小目标检测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1170034

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120919

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1170034

Country of ref document: HK