CN102110122B - 一种建立样本图片索引表和图片过滤、搜索方法及装置 - Google Patents
一种建立样本图片索引表和图片过滤、搜索方法及装置 Download PDFInfo
- Publication number
- CN102110122B CN102110122B CN2009102601755A CN200910260175A CN102110122B CN 102110122 B CN102110122 B CN 102110122B CN 2009102601755 A CN2009102601755 A CN 2009102601755A CN 200910260175 A CN200910260175 A CN 200910260175A CN 102110122 B CN102110122 B CN 102110122B
- Authority
- CN
- China
- Prior art keywords
- picture
- node
- sample picture
- nodes
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000001914 filtration Methods 0.000 title claims abstract description 37
- 238000000605 extraction Methods 0.000 claims abstract description 25
- 239000013598 vector Substances 0.000 claims description 29
- 238000004364 calculation method Methods 0.000 claims description 16
- 241000282320 Panthera leo Species 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 14
- 238000005516 engineering process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000002537 cosmetic Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
- G06V10/464—Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种建立样本图片索引表和图片过滤、搜索方法及装置,以提高监控图片的准确率。一种图片过滤方法包括:保存样本图片索引表;利用设定的提取算法从获得的待检索图片中提取若干局部特征;利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;统计所述待检索图片与对应的每个样本图片中重复的节点数目;利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
Description
技术领域
本申请涉及图片识别技术领域,特别是指一种建立样本图片索引表和图片过滤、搜索方法及装置。
背景技术
互联网企业普遍存在对图片监控的需求,比如:淘宝网网上交易中不可避免地出现了少量违禁物体,如枪支,药品等,需要保障通过企业软件上传的图片符合国家的法律法规。传统地监控商品方式是通过监控其商品名称,文字描述等文本信息完成。违规分子为逃避监控,往往使用隐晦的,不清晰的或者暗号对违规商品进行描述,这为淘宝网监控商品带来了极大的困扰。
目前,已经提出了基础图片过滤的理论技术,基于图像识别的图片过滤技术,其基础是图像识别技术,但是在实践中还是存在着较大的问题。例如“绿坝·花季护航”软件就提供了基于图片识别的主动色情图片监控技术。“绿坝.花季护航”的色情图像检测技术目前以肤色分割为基础识别出可能包含大量裸露人体的图片。该软件的优势在于,可以主动出击式地拦截黄色图片,但是由于以肤色分割为基础,因此可能将非色情图像检测成色情图像,误检率高。
图像识别技术本身是一个尚未发展成熟的研究领域。如何有效地,快速地为各种不同图像内容建模至今仍困扰着研究者们。即使是在色情图像分类这一相对成熟的研究领域,仍然不能达到另人满意的实用效果。而网络交易的应用领域,需要监控地并不止包括黄色图像,书籍、药品枪支、证件和化妆品等等。来自不同种类的图像都有可能成为监控的对象。不仅如此,由于网络交易需要监控的图像内容变化速度非常之快,传统的基于图像识别的过滤技术已经完全不能胜任网络交易的应用。
现有的基于图片识别的过滤技术,因为其较低的准确率,并不能满足网络交易的商业应用。
发明内容
本申请提供一种建立样本图片索引表和图片过滤方法及装置,用以提高监控图片的准确率。
本申请提供的一种建立样本图片索引表的方法,包括:
从样本图片中提取若干局部特征信息,其中,所述局部特征为局部特征矢量;
利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,其中,每个节点对应一个节点标识;
设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
本申请提供的一种进行图片过滤的方法,包括:保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目,该方法还包括:
从获得的待检索图片中提取若干局部特征,其中,所述局部特征信息为局部特征矢量;
利用设定的聚类算法计算所述待检索图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,并将每个节点对应一个节点标识,利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计所述待检索图片与对应的每个样本图片中重复的节点数目;
利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
本申请提供的一种建立样本图片索引表的装置,包括:
特征提取单元,用于从样本图片中提取若干局部特征信息,其中,所述局部特征信息为局部特征矢量;
聚类单元,用于利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,其中,每个节点对应一个节点标识;
存储单元,用于设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
本申请提供的一种进行图片过滤的装置,该装置包括:
存储单元,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元,用于从获得的待检索图片中提取若干局部特征,其中,所述局部特征信息为局部特征矢量;
节点确定单元,用于利用设定的聚类算法计算所述待检索图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,并将每个节点对应一个节点标识;
索引单元,用于利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计单元,用于统计所述待检索图片与对应的每个样本图片中重复的节点数目;
相似度计算单元,用于利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
输出过滤单元,用于如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
本申请提供的一种进行图片搜索的方法,包括:保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目,该方法还包括:
从获得的待搜索图片中提取若干局部特征,其中,所述局部特征信息为局部特征矢量;
利用设定的聚类算法计算所述待检索图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,并将每个节点对应一个节点标识,利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计所述待搜索图片与对应的每个样本图片重复的节点数目;
利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
本申请提供的一种进行图片搜索的装置,包括:
存储单元,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元,用于从获得的待搜索图片中提取若干局部特征,其中,所述局部特征信息为局部特征矢量;
节点确定单元,用于利用设定的聚类算法计算所述待检索图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,并将每个节点对应一个节点标识;
索引单元,用于利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计单元,用于统计所述待搜索图片与对应的每个样本图片的重复节点数目;
相似度计算单元,用于利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
输出过滤单元,用于如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
本申请实施例从获得的待检索图片中提取若干局部特征;利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;计算得到所述待检索图片与样本图片的相似度;如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出,以进一步进行排查,提高了监控图片的准确率。同样,本申请方案应用到图片搜索过程中,从获得的待搜索图片中提取若干局部特征;利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;计算得到所述待搜索图片与样本图片的相似度;如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果,图片搜素的准确率高。
附图说明
图1为本申请实施例建立样本图片索引表的方法的流程示意图;
图2为本申请实施例实现图片过滤的方法的流程示意图;
图3为本申请实现图片过滤的方法的一具体实施例;
图4为本申请实施例的建立样本图片索引表的装置的结构示意图;
图5为本申请实施例进行图片过滤的装置的结构示意图;
图6为本申请实施例的实现图片搜索的方法的流程示意图;
图7为本申请实施例进行图片搜索的装置的结构示意图。
具体实施方式
在本申请实施例中,为了提高图片过滤的正确率,需要保存样本图片索引表,样本图片索引表中保存样本图片中包括的局部特征所属的节点信息,当将从获得的待检索图片中提取局部特征时,获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;统计所述待检索图片与对应的每个样本图片中重复的节点数目;利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出送入图片排查单元。
参见图1所示,本实施例建立样本图片索引表的方法,包括以下步骤:
步骤101:利用设定的提取算法从样本图片中提取若干局部特征信息。
样本图片是指预先选择出的可作为是否进行过滤参照的图片。可以针对多个样本图片提取局部特征。样本图片的选择可以根据需要自行设定,比如可以将色情图片作为样本图片,也可以将书籍、药品枪支、证件和化妆品的图片作为样本图片。
这里,提取算法可以为任意一种具有尺度不变性的局部特征提取算法,比如:可以为基于Linderberg尺度不变理论的特征检测子以及Dvid Lowe的类SIFT的高维描述子的算法,这些提取算法可以自动获取图像结构的尺度,并在该尺度上计算具有一定抗尺度变化,光照变化,角度变化,旋转变化等不同变化的局部图像特征。在获取图像特征之后,一幅图像被表示为数百个局部特征。所述局部特征信息可以为提取的局部特征矢量。本申请对采用何种提取算法进行样本图片局部特征信息的提取并不做限定。
步骤102:利用设定的聚类算法对所有样本图片的局部特征信息进行聚类,其中,将具有设定相似度的局部特征划分对应同一节点,每个节点对应一个节点标识。
步骤102中,可以按照相似度,将多个局部特征划分为若干组,即将比较相似的局部特征设置为一组内,将每组称为一个节点,每组的局部特征归属于对应的节点。
如果所述局部特征信息为局部特征矢量,则步骤102可以利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点。
步骤103:设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
参见图2所示,本实施例实现图片过滤的方法包括以下步骤:
步骤201:利用设定的提取算法从获得的待检索图片中提取若干局部特征。
步骤202:利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识。
步骤203:统计所述待检索图片与对应的每个样本图片中重复的节点数目。
步骤204:利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度。
这里,获得所述待检索图片的相似度可以这样实现:
比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待检索图片与对应的样本图片的重复节点数目与所述较小的节点数目的比值,作为所述待检索图片与该样本图片的相似度。本申请也可以选择待检索图片对应的节点数目与从所述索引表中获得的对应的节点数目中的较大的节点数目作为相似度的计算数值。本申请对此并不做限定。
步骤205:判断待检索图片与样本图片的相似度是否超过设定的阈值,如果超过,则将该图片过滤出送入图片排查单元,否则,认为该图片为正常图片。
以下举具体实施例详细说明本申请的技术方案。
参见图3所示,本申请实施例的具体实现过程如下:
步骤300:利用设定的算法从样本图片中提取若干局部特征作为该图片的图像特征,并利用聚类算法将相似的局部特征量化为同一节点,建立索引表,该索引表包括:节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系。这里,采用聚类的方式可以降低高维的局部特征的计算量。
如:表1中,节点标识为“1”的节点归属于样本图片标识为“#Img3307”、“#Img4615”,在样本图片“#Img3307”中,出现次数为“2”,在样本图片“#Img4615”中,出现次数为“3”;节点标识为“N”的节点归属于样本图片标识为“#Img2948”和“#Img3693”的样本图片中,其中,在样本图片“#Img2948”中出现3次,在样本图片“#Img3693”中出现5次。这里,样本图像编号相当于样本图片标识。
表1
步骤301:当收到用户上传的图片时,触发内容安全过滤系统收集会员上传图片的存储路径。
步骤302:通过图片存储路径从文件系统下载用户上传的图片。
步骤303:将获取的图片作为待检索图片送入检索库。
步骤304:图片检索库利用步骤201相同的算法提取待检索图片的若干局部特征作为该图片的图像特征。
步骤305:图片检索库将待检索图片的局部特征利用与步骤202同的聚类算法将待检索图片中相似的局部特征量化为对应的节点。
步骤306:图片检索库将待检索图片对应的节点标识索引所述索引表,获得待检索图片中每个节点标识对应的样本图像编号,并统计待检索图片与每个样本图片的重复节点数目。
步骤307:利用待检索图片与每个样本图片的重复节点数目,以及待检索图片与样本图片中较少的节点数目获得待检索图片与样本图片的相似度。
提取的所有样本图片中的局部特征最后都会被聚类或分类到不同的节点。待检测图片ImgA所有的局部特征将被分类到一个节点集A={a1,a2,...,aN}中,同样的,样本图片ImgB中的局部特征也将被聚类到一个节点集B={b1,b2,..,bM}。其中a1,a2...,aN和b1,b2,...,bM都代表了节点编号。那么重复节点数目指的是A∩B,也就是A与B的交集,而较少节点数目则是min(N,M)。
步骤308:如果待检索图片与样本图片的相似度超过设定的阈值,将该图片过滤出送入图片排查单元。
这里,如果待检索图片与样本图片的相似度超过阈值,那么待检索图片被认为是可疑图片。为进一步确认待检索图片的危险度,该图片进入图片排查单元等待人工确认。
图片排查单元中的样本图片是由系统自动判决的危险图片,其中包含少量误判,需要人工审核。另外,由于系统判决的危险图片中,有部分与样本图片虽然相似,但并不完全一致,这类图片可在审核后加入样本库,进一步完善图片样本库。
图片样本库的管理也可以由人工完成。由于违禁图片具有时变性,本产品也提供人工修改样本库的功能。在样本库被更新以后,索引文件也将实时更改,并能及时反馈到检索结果中,实现了较高的灵活性。
参见图4所示,本实施例的建立样本图片索引表的装置,包括:特征提取单元41、聚类单元42和存储单元43。其中,
特征提取单元41,用于利用设定的提取算法从样本图片中提取若干局部特征信息;
聚类单元42,用于利用设定的聚类算法对所有样本图片的局部特征信息进行聚类,其中,将具有设定相似度的局部特征划分对应同一节点,每个节点对应一个节点标识;
存储单元43,用于设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
所述提取算法为任意一种具有尺度不变性的局部特征提取算法;
所述提取算法为基于Linderberg尺度不变理论的特征检测子,或为DvidLowe的类SIFT的高维描述子的算法。
所述局部特征信息为局部特征矢量,则所述聚类单元42,用于利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点。
参见图5所示,本实施例的进行图片过滤的装置包括:
存储单元51,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元52,用于利用设定的提取算法从获得的待检索图片中提取若干局部特征;
节点确定单元53,用于利用所述聚类算法获得所述待检索图片中的局部特征对应的节点;
索引单元54,用于利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计单元55,用于统计所述待检索图片与每个样本图片的重复节点数目;
相似度计算单元56,用于利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
输出过滤单元57,用于如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
所述相似度计算单元56,用于比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待检索图片与对应的每个样本图片中的重复节点数目与所述较小的节点数目的比值,作为所述待检索图片的相似度。
本申请实施例基于图像检索的过滤技术是将上传图片与需要监控的样本图片作对比,如果上传图片与样本图片高度相似,那么上传图片将被送入图片排查单元,接受排查。该技术方案的优点是,速度快,精度高,同时人工排查也能进一步降低误检率。
本申请提供的实施例并不试图识别图像的内容,而是简单高效地将上传图像与样本图像作对比,并分析其相似程度作为上传图像的危险程度,对于危险程度高的图像,将进一步由人工排查。由于网上交易所涉及的图像大多数是商品图像,而商品图像被重复利用或简单修改后重复利用的可能性极高,利用图像检索和对比,可以监控到绝大多数违规图像。另外由于样本库是由人工实时维护的,当监控要求变化时,只需要修改样本图像库,即修改监控规范。对于不同的商品类目可定制不同的监控指标,解决了覆盖率的问题。同时,针对不同商品类目的特点,可分析出图片的特性,定制监控的模糊度,从而达到提供准确率的目的。
同样,本申请上述图片检索的思想还可以应用到图片搜索的领域,其中,需要预先在搜索引擎服务器端建立图片数据库,这个图片数据库中存储的图片,可以是登陆该网站的用户上传的图片,也可以是从其它系统中的导入的图片,还可以是通过网络爬虫从海量的互联网网页中抓取得到,还可能以其它方式得到的图片,再或者是上述几种来源中的一种或几种方式结合而来的图片,本申请中并不做限定。网络爬虫定时抓取互联网中的海量网页图片的技术已是公知的技术,这里不再介绍。针对所述图片数据库中的图片进行局部特征信息提取,并建立样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。当搜索引擎的客户端发出图片搜索的指令后,搜索引擎服务器针对待搜索图片进行解析,并在样本图片索引表中进行查询,从而获得与待搜索图片相同或相近似的图片,并反馈给搜索引擎客户端。
参见图6所示,本申请实施例的一种进行图片搜索的方法包括以下步骤:
步骤601:从获得的待搜索图片中提取若干局部特征。
步骤602:获得所述待搜索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
步骤603:统计所述待搜索图片与对应的每个样本图片重复的节点数目;
步骤604:利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
获得所述待搜索图片的相似度可以这样实现:
比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待搜索图片与对应的每个样本图片重复的节点数目与所述较小的节点数目的比值,作为所述待搜索图片的相似度。
当然,本申请也可以选择待检索图片对应的节点数目与从所述索引表中获得的对应的节点数目中的较大的节点数目作为相似度的计算数值。本申请对此并不做限定。
步骤605:如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
参见图7所示,本申请进行图片搜索的装置包括:
存储单元71,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元72,用于从获得的待搜索图片中提取若干局部特征;
节点确定单元73,用于获得所述待搜索图片中的局部特征对应的节点;
索引单元74,用于利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计单元75,用于统计所述待搜索图片与对应的每个样本图片的重复节点数目;
相似度计算单元76,用于利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
搜索输出单元77,用于如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片输出。
所述相似度计算单元76,可以用于比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待搜索图片与对应的每个样本图片的重复节点数目与所述较小的节点数目的比值,作为所述待搜索图片的相似度。
所述相似度计算单元76,可以用于比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;将所述待搜索图片与对应的每个样本图片的重复节点数目与所述较大的节点数目的比值,作为所述待搜索图片的相似度。
本申请上述方案应用到图片搜索过程中,如果获得一个待搜索图片,可以从待搜索图片中提取若干局部特征;利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;计算得到所述待搜索图片与样本图片的相似度;如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果,图片搜素的准确率高。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (17)
1.一种建立样本图片索引表的方法,其特征在于,该方法包括以下步骤:
从样本图片中提取若干局部特征,其中,所述局部特征为局部特征矢量;
利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,其中,每个节点对应一个节点标识;
设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
2.根据权利要求1所述的方法,其特征在于,所述从样本图片中提取若干局部特征是通过一种具有尺度不变性的局部特征提取算法进行的。
3.根据权利要求2所述的方法,其特征在于,所述提取算法为基于Linderberg尺度不变理论的特征检测子,或为Dvid Lowe的类SIFT的高维描述子的算法。
4.一种进行图片过滤的方法,其特征在于,保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目,该方法还包括:
从获得的待检索图片中提取若干局部特征,其中,所述局部特征信息为局部特征矢量;
利用设定的聚类算法计算所述待检索图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,并将每个节点对应一个节点标识,利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计所述待检索图片与对应的每个样本图片重复的节点数目;
利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
5.根据权利要求4所述的方法,其特征在于,获得所述待检索图片的相似度,包括:
比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;
将所述待检索图片与对应的每个样本图片重复的节点数目与所述较小的节点数目的比值,作为所述待检索图片的相似度。
6.根据权利要求4所述的方法,其特征在于,获得所述待检索图片的相似度,包括:
比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;
将所述待检索图片与对应的每个样本图片重复的节点数目与所述较大的节点数目的比值,作为所述待检索图片的相似度。
7.一种建立样本图片索引表的装置,其特征在于,该装置包括:
特征提取单元,用于从样本图片中提取若干局部特征信息,其中,所述局部特征信息为局部特征矢量;
聚类单元,用于利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,其中,每个节点对应一个节点标识;
存储单元,用于设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
8.根据权利要求7所述的装置,其特征在于,所述特征提取单元是通过一种具有尺度不变性的局部特征提取算法从样本图片中提取若干局部特征信息;
所述提取算法为基于Linderberg尺度不变理论的特征检测子,或为DvidLowe的类SIFT的高维描述子的算法。
9.一种进行图片过滤的装置,其特征在于,该装置包括:
存储单元,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元,用于从获得的待检索图片中提取若干局部特征,其中,所述局部特征信息为局部特征矢量;
节点确定单元,用于利用设定的聚类算法计算所述待检索图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,并将每个节点对应一个节点标识;
索引单元,用于利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计单元,用于统计所述待检索图片与对应的每个样本图片的重复节点数目;
相似度计算单元,用于利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
输出过滤单元,用于如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
10.根据权利要求9所述的装置,其特征在于,所述相似度计算单元,用于比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待检索图片与对应的每个样本图片的重复节点数目与所述较小的节点数目的比值,作为所述待检索图片的相似度。
11.根据权利要求9所述的装置,其特征在于,所述相似度计算单元,用于比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;将所述待检索图片与对应的每个样本图片的重复节点数目与所述较大的节点数目的比值,作为所述待检索图片的相似度。
12.一种进行图片搜索的方法,其特征在于,保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目,该方法还包括:
从获得的待搜索图片中提取若干局部特征,其中,所述局部特征信息为局部特征矢量;
利用设定的聚类算法计算所述待检索图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,并将每个节点对应一个节点标识,利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计所述待搜索图片与对应的每个样本图片重复的节点数目;
利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
13.根据权利要求12所述的方法,其特征在于,获得所述待搜索图片的相似度,包括:
比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;
将所述待搜索图片与对应的每个样本图片重复的节点数目与所述较小的节点数目的比值,作为所述待搜索图片的相似度。
14.根据权利要求12所述的方法,其特征在于,获得所述待搜索图片的相似度,包括:
比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;
将所述待搜索图片与对应的每个样本图片重复的节点数目与所述较大的节点数目的比值,作为所述待搜索图片的相似度。
15.一种进行图片搜索的装置,其特征在于,该装置包括:
存储单元,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元,用于从获得的待搜索图片中提取若干局部特征,其中,所述局部特征信息为局部特征矢量;
节点确定单元,用于利用设定的聚类算法计算所述待检索图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点,并将每个节点对应一个节点标识;
索引单元,用于利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计单元,用于统计所述待搜索图片与对应的每个样本图片的重复节点数目;
相似度计算单元,用于利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
输出过滤单元,用于如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
16.根据权利要求15所述的装置,其特征在于,所述相似度计算单元,用于比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待搜索图片与对应的每个样本图片的重复节点数目与所述较小的节点数目的比值,作为所述待搜索图片的相似度。
17.根据权利要求15所述的装置,其特征在于,所述相似度计算单元,用于比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;将所述待搜索图片与对应的每个样本图片的重复节点数目与所述较大的节点数目的比值,作为所述待搜索图片的相似度。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102601755A CN102110122B (zh) | 2009-12-24 | 2009-12-24 | 一种建立样本图片索引表和图片过滤、搜索方法及装置 |
US13/056,001 US8577153B2 (en) | 2009-12-24 | 2010-10-28 | Method and system for sample image index creation and image filtering and search |
JP2012545942A JP5665879B2 (ja) | 2009-12-24 | 2010-10-28 | サンプル画像インデックスの作成ならびに画像フィルタリングおよび検索のための方法およびシステム |
PCT/US2010/054493 WO2011078911A1 (en) | 2009-12-24 | 2010-10-28 | Method and system for sample image index creation and image filtering and search |
EP10839953.6A EP2517154A4 (en) | 2009-12-24 | 2010-10-28 | METHOD AND SYSTEM FOR CREATING AN INDEX OF SPECIMEN IMAGES, AND FOR FILTERING AND SEARCHING AN IMAGE |
HK11108935.8A HK1155235A1 (en) | 2009-12-24 | 2011-08-24 | A method and device for establishing sample picture index table, picture filtering and searching |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102601755A CN102110122B (zh) | 2009-12-24 | 2009-12-24 | 一种建立样本图片索引表和图片过滤、搜索方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102110122A CN102110122A (zh) | 2011-06-29 |
CN102110122B true CN102110122B (zh) | 2013-04-03 |
Family
ID=44174284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102601755A Active CN102110122B (zh) | 2009-12-24 | 2009-12-24 | 一种建立样本图片索引表和图片过滤、搜索方法及装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8577153B2 (zh) |
EP (1) | EP2517154A4 (zh) |
JP (1) | JP5665879B2 (zh) |
CN (1) | CN102110122B (zh) |
HK (1) | HK1155235A1 (zh) |
WO (1) | WO2011078911A1 (zh) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9768082B2 (en) * | 2009-02-13 | 2017-09-19 | Hermes Microvision Inc. | Method and machine for examining wafers |
CN103136228A (zh) | 2011-11-25 | 2013-06-05 | 阿里巴巴集团控股有限公司 | 一种图片搜索方法以及图片搜索装置 |
CN103207879B (zh) * | 2012-01-17 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 图像索引的生成方法及设备 |
CN102682091A (zh) * | 2012-04-25 | 2012-09-19 | 腾讯科技(深圳)有限公司 | 基于云服务的视觉搜索方法和系统 |
JP6064392B2 (ja) * | 2012-06-29 | 2017-01-25 | 株式会社リコー | 検索装置、検索方法、検索プログラムおよび検索システム |
CN103793434A (zh) * | 2012-11-02 | 2014-05-14 | 北京百度网讯科技有限公司 | 一种基于内容的图片搜索方法和装置 |
US9626567B2 (en) * | 2013-03-13 | 2017-04-18 | Visible Measures Corp. | Automated video campaign building |
CN103473299B (zh) * | 2013-09-06 | 2017-02-08 | 北京锐安科技有限公司 | 一种网站不良似然度获取方法和装置 |
US10521817B2 (en) | 2014-04-02 | 2019-12-31 | Nant Holdings Ip, Llc | Augmented pre-paid cards, systems and methods |
CN105224569B (zh) | 2014-06-30 | 2018-09-07 | 华为技术有限公司 | 一种数据过滤、构造数据滤波器的方法及装置 |
CN105335047B (zh) * | 2014-08-14 | 2024-05-28 | 小米科技有限责任公司 | 显示图片的方法及装置 |
CN105404631B (zh) * | 2014-09-15 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 图片识别方法和装置 |
CN104268445A (zh) * | 2014-09-30 | 2015-01-07 | 小米科技有限责任公司 | 防止图片二次传播的方法及装置 |
CN104268446A (zh) * | 2014-09-30 | 2015-01-07 | 小米科技有限责任公司 | 防止视频二次传播的方法及装置 |
CN104899744B (zh) * | 2015-06-29 | 2018-03-16 | 汪新淮 | 钱币邮票收藏品交易系统与交易方法 |
CN105930499B (zh) * | 2016-05-09 | 2019-11-22 | 深圳市数极科技有限公司 | 一种图片搜索方法及系统 |
CN107590491B (zh) * | 2016-07-07 | 2021-08-06 | 阿里巴巴集团控股有限公司 | 一种图像处理方法及装置 |
CN106250907A (zh) * | 2016-07-08 | 2016-12-21 | 大连大学 | 云计算环境基于过采样修正的大规模图像聚类方法 |
CN106844421A (zh) * | 2016-11-30 | 2017-06-13 | 上海仙剑文化传媒股份有限公司 | 一种数字图片管理方法及系统 |
KR102402096B1 (ko) * | 2017-03-27 | 2022-05-26 | 삼성전자주식회사 | 이미지 내 오브젝트와 관련된 정보를 제공하는 전자 장치 |
CN108121781B (zh) * | 2017-12-18 | 2021-09-24 | 辽宁师范大学 | 基于高效样本选取与参数优化的相关反馈图像检索方法 |
CN108171135A (zh) * | 2017-12-21 | 2018-06-15 | 深圳云天励飞技术有限公司 | 人脸检测方法、装置及计算机可读存储介质 |
CN110727815B (zh) * | 2018-07-16 | 2024-01-30 | 浙江大华技术股份有限公司 | 一种更新以图搜图的图库的方法、设备及可读存储介质 |
CN109165307B (zh) * | 2018-09-19 | 2021-02-02 | 腾讯科技(深圳)有限公司 | 一种特征检索方法、装置和存储介质 |
CN109711298B (zh) * | 2018-12-14 | 2021-02-12 | 南京甄视智能科技有限公司 | 基于faiss的高效人脸特征值检索的方法和系统 |
JP7269747B2 (ja) * | 2019-02-05 | 2023-05-09 | 株式会社日立製作所 | 検出装置、検出方法、および検出プログラム |
CN111428179B (zh) * | 2020-03-19 | 2023-09-19 | 新方正控股发展有限责任公司 | 图片监测方法、装置及电子设备 |
CN112182287B (zh) * | 2020-09-10 | 2021-06-08 | 南京信息工程大学 | 一种基于时空视觉词组和分层匹配的视频拷贝检测方法 |
CN113312904A (zh) * | 2021-05-31 | 2021-08-27 | 南京航空航天大学 | 一种基于抽象语法树的代码片段推荐方法与系统 |
CN116630597B (zh) * | 2023-06-08 | 2024-07-16 | 深圳市玩瞳科技有限公司 | 一种蜂巢形图像指标、其解码方法、装置和设备 |
CN116881485B (zh) * | 2023-06-19 | 2024-07-12 | 北京百度网讯科技有限公司 | 生成图像检索索引的方法及装置、电子设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6321232B1 (en) * | 1998-12-18 | 2001-11-20 | Xerox Corporation | Method for creating a geometric hash tree in a document processing system |
US6792164B2 (en) * | 1999-11-16 | 2004-09-14 | International Business Machines Corporation | Method and apparatus for indexing and retrieving images from an image database based on a color query |
CN101211355A (zh) * | 2006-12-30 | 2008-07-02 | 中国科学院计算技术研究所 | 一种基于聚类的图像查询方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0545944A (ja) * | 1991-08-14 | 1993-02-26 | Mita Ind Co Ltd | 画像形成装置 |
US5740269A (en) | 1994-09-20 | 1998-04-14 | Neopath, Inc. | Method and apparatus for robust biological specimen classification |
US6072904A (en) | 1997-12-31 | 2000-06-06 | Philips Electronics North America Corp. | Fast image retrieval using multi-scale edge representation of images |
US6564225B1 (en) * | 2000-07-14 | 2003-05-13 | Time Warner Entertainment Company, L.P. | Method and apparatus for archiving in and retrieving images from a digital image library |
KR100374791B1 (ko) | 2000-11-22 | 2003-03-04 | 삼성전자주식회사 | 영상의 영역 구분 방법 및 장치 |
KR100788643B1 (ko) * | 2001-01-09 | 2007-12-26 | 삼성전자주식회사 | 색과 질감의 조합을 기반으로 하는 영상 검색 방법 |
US7343046B2 (en) | 2004-02-12 | 2008-03-11 | Xerox Corporation | Systems and methods for organizing image data into regions |
JP2005293123A (ja) * | 2004-03-31 | 2005-10-20 | Nippon Telegraph & Telephone West Corp | コンテンツフィルタリングシステム、その方法およびプログラム |
US8086038B2 (en) * | 2007-07-11 | 2011-12-27 | Ricoh Co., Ltd. | Invisible junction features for patch recognition |
US7848566B2 (en) | 2004-10-22 | 2010-12-07 | Carnegie Mellon University | Object recognizer and detector for two-dimensional images using bayesian network based classifier |
US7734067B2 (en) | 2004-12-07 | 2010-06-08 | Electronics And Telecommunications Research Institute | User recognition system and method thereof |
US7831599B2 (en) | 2005-03-04 | 2010-11-09 | Eastman Kodak Company | Addition of new images to an image database by clustering according to date/time and image content and representative image comparison |
JP4992072B2 (ja) * | 2005-08-16 | 2012-08-08 | 国立大学法人東京工業大学 | 複数のxml文書の類似性検出システム、および、複数のxml文書の統合システム |
JP4721830B2 (ja) * | 2005-08-31 | 2011-07-13 | トヨタ自動車株式会社 | 画像検索方法及び装置 |
US7725484B2 (en) * | 2005-11-18 | 2010-05-25 | University Of Kentucky Research Foundation (Ukrf) | Scalable object recognition using hierarchical quantization with a vocabulary tree |
WO2007103834A1 (en) | 2006-03-03 | 2007-09-13 | Honeywell International, Inc. | Indexing and database search system |
US7813561B2 (en) * | 2006-08-14 | 2010-10-12 | Microsoft Corporation | Automatic classification of objects within images |
DE102006043910B4 (de) | 2006-09-19 | 2010-02-25 | Siemens Ag | Ergebnisfilter und Verfahren zur Selektion der Ergebnisdaten einer Applikation zur automatischen Mustererkennung |
JP5139716B2 (ja) * | 2007-05-16 | 2013-02-06 | キヤノン株式会社 | 画像検索装置及び画像検索方法 |
US20090092299A1 (en) | 2007-10-03 | 2009-04-09 | Siemens Medical Solutions Usa, Inc. | System and Method for Joint Classification Using Feature Space Cluster Labels |
JP4881278B2 (ja) | 2007-10-31 | 2012-02-22 | 株式会社東芝 | 物体認識装置及びその方法 |
US8144947B2 (en) * | 2008-06-27 | 2012-03-27 | Palo Alto Research Center Incorporated | System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints |
US8254697B2 (en) * | 2009-02-02 | 2012-08-28 | Microsoft Corporation | Scalable near duplicate image search with geometric constraints |
US8542950B2 (en) | 2009-06-02 | 2013-09-24 | Yahoo! Inc. | Finding iconic images |
-
2009
- 2009-12-24 CN CN2009102601755A patent/CN102110122B/zh active Active
-
2010
- 2010-10-28 EP EP10839953.6A patent/EP2517154A4/en active Pending
- 2010-10-28 US US13/056,001 patent/US8577153B2/en active Active
- 2010-10-28 WO PCT/US2010/054493 patent/WO2011078911A1/en active Application Filing
- 2010-10-28 JP JP2012545942A patent/JP5665879B2/ja active Active
-
2011
- 2011-08-24 HK HK11108935.8A patent/HK1155235A1/xx unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6321232B1 (en) * | 1998-12-18 | 2001-11-20 | Xerox Corporation | Method for creating a geometric hash tree in a document processing system |
US6792164B2 (en) * | 1999-11-16 | 2004-09-14 | International Business Machines Corporation | Method and apparatus for indexing and retrieving images from an image database based on a color query |
CN101211355A (zh) * | 2006-12-30 | 2008-07-02 | 中国科学院计算技术研究所 | 一种基于聚类的图像查询方法 |
Also Published As
Publication number | Publication date |
---|---|
US20120275705A1 (en) | 2012-11-01 |
EP2517154A4 (en) | 2015-03-18 |
WO2011078911A1 (en) | 2011-06-30 |
CN102110122A (zh) | 2011-06-29 |
JP2013515998A (ja) | 2013-05-09 |
HK1155235A1 (en) | 2012-05-11 |
EP2517154A1 (en) | 2012-10-31 |
US8577153B2 (en) | 2013-11-05 |
JP5665879B2 (ja) | 2015-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102110122B (zh) | 一种建立样本图片索引表和图片过滤、搜索方法及装置 | |
US20240111818A1 (en) | Method for training isolation forest, and method for recognizing web crawler | |
CN111897962B (zh) | 一种物联网资产标记方法及装置 | |
TWI743835B (zh) | 一種資訊處理方法及裝置、儲存介質 | |
CN108734184B (zh) | 一种对敏感图像进行分析的方法及装置 | |
CN107169106B (zh) | 视频检索方法、装置、存储介质及处理器 | |
CN107291910A (zh) | 一种视频片段结构化查询方法、装置及电子设备 | |
CN106570015B (zh) | 图像搜索方法和装置 | |
CN106874951B (zh) | 一种旅客关注度评级方法及装置 | |
CN109284613B (zh) | 标识检测及仿冒站点检测方法、装置、设备及存储介质 | |
CN104951553B (zh) | 一种数据处理准确的内容搜集与数据挖掘平台及其实现方法 | |
CN107122439A (zh) | 一种视频片段查询方法及装置 | |
Maigrot et al. | Mediaeval 2016: A multimodal system for the verifying multimedia use task | |
CN114692593B (zh) | 一种网络信息安全监测预警方法 | |
CN107533547B (zh) | 产品索引编排方法及其系统 | |
CN104317946A (zh) | 一种基于多张关键图的图像内容检索方法 | |
Hernández et al. | Video analysis system using deep learning algorithms | |
CN110020161B (zh) | 数据处理方法、日志处理方法和终端 | |
Shukran et al. | New approach on the techniques of content-based image retrieval (CBIR) using color, texture and shape features | |
Sun et al. | Indiscernible object counting in underwater scenes | |
CN109657123B (zh) | 一种基于信息熵的食品安全事件聚类分析方法 | |
CN107609104B (zh) | 根据视频图像素材查找相关视频的方法和系统 | |
CN114781974A (zh) | 货品存储出入库管理方法、装置、设备及存储介质 | |
Dong et al. | Research on fast face retrieval optimization algorithm based on fuzzy clustering | |
CN116012924B (zh) | 人脸图库构建方法、装置及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1155235 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1155235 Country of ref document: HK |