CN102110122A - 一种建立样本图片索引表和图片过滤、搜索方法及装置 - Google Patents

一种建立样本图片索引表和图片过滤、搜索方法及装置 Download PDF

Info

Publication number
CN102110122A
CN102110122A CN2009102601755A CN200910260175A CN102110122A CN 102110122 A CN102110122 A CN 102110122A CN 2009102601755 A CN2009102601755 A CN 2009102601755A CN 200910260175 A CN200910260175 A CN 200910260175A CN 102110122 A CN102110122 A CN 102110122A
Authority
CN
China
Prior art keywords
samples pictures
local feature
picture
obtains
interstitial content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009102601755A
Other languages
English (en)
Other versions
CN102110122B (zh
Inventor
段曼妮
温新赐
冯旭瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2009102601755A priority Critical patent/CN102110122B/zh
Priority to US13/056,001 priority patent/US8577153B2/en
Priority to PCT/US2010/054493 priority patent/WO2011078911A1/en
Priority to JP2012545942A priority patent/JP5665879B2/ja
Priority to EP10839953.6A priority patent/EP2517154A4/en
Publication of CN102110122A publication Critical patent/CN102110122A/zh
Priority to HK11108935.8A priority patent/HK1155235A1/xx
Application granted granted Critical
Publication of CN102110122B publication Critical patent/CN102110122B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种建立样本图片索引表和图片过滤、搜索方法及装置,以提高监控图片的准确率。一种图片过滤方法包括:保存样本图片索引表;利用设定的提取算法从获得的待检索图片中提取若干局部特征;利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;统计所述待检索图片与对应的每个样本图片中重复的节点数目;利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。

Description

一种建立样本图片索引表和图片过滤、搜索方法及装置
技术领域
本申请涉及图片识别技术领域,特别是指一种建立样本图片索引表和图片过滤、搜索方法及装置。
背景技术
互联网企业普遍存在对图片监控的需求,比如:淘宝网网上交易中不可避免地出现了少量违禁物体,如枪支,药品等,需要保障通过企业软件上传的图片符合国家的法律法规。传统地监控商品方式是通过监控其商品名称,文字描述等文本信息完成。违规分子为逃避监控,往往使用隐晦的,不清晰的或者暗号对违规商品进行描述,这为淘宝网监控商品带来了极大的困扰。
目前,已经提出了基础图片过滤的理论技术,基于图像识别的图片过滤技术,其基础是图像识别技术,但是在实践中还是存在着较大的问题。例如“绿坝·花季护航”软件就提供了基于图片识别的主动色情图片监控技术。“绿坝.花季护航”的色情图像检测技术目前以肤色分割为基础识别出可能包含大量裸露人体的图片。该软件的优势在于,可以主动出击式地拦截黄色图片,但是由于以肤色分割为基础,因此可能将非色情图像检测成色情图像,误检率高。
图像识别技术本身是一个尚未发展成熟的研究领域。如何有效地,快速地为各种不同图像内容建模至今仍困扰着研究者们。即使是在色情图像分类这一相对成熟的研究领域,仍然不能达到另人满意的实用效果。而网络交易的应用领域,需要监控地并不止包括黄色图像,书籍、药品枪支、证件和化妆品等等。来自不同种类的图像都有可能成为监控的对象。不仅如此,由于网络交易需要监控的图像内容变化速度非常之快,传统的基于图像识别的过滤技术已经完全不能胜任网络交易的应用。
现有的基于图片识别的过滤技术,因为其较低的准确率,并不能满足网络交易的商业应用。
发明内容
本申请提供一种建立样本图片索引表和图片过滤方法及装置,用以提高监控图片的准确率。
本申请提供的一种建立样本图片索引表的方法,包括:
从样本图片中提取若干局部特征信息;
对所述样本图片的局部特征信息进行聚类,其中,将具有设定相似度的局部特征划分对应同一节点,每个节点对应一个节点标识;
设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
本申请提供的一种进行图片过滤的方法,包括:保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目,该方法还包括:
从获得的待检索图片中提取若干局部特征;
获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计所述待检索图片与对应的每个样本图片中重复的节点数目;
利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
本申请提供的一种建立样本图片索引表的装置,包括:
特征提取单元,用于从样本图片中提取若干局部特征信息;
聚类单元,用于对所有样本图片的局部特征信息进行聚类,其中,将具有设定相似度的局部特征划分对应同一节点,每个节点对应一个节点标识;
存储单元,用于设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
本申请提供的一种进行图片过滤的装置,该装置包括:
存储单元,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元,用于从获得的待检索图片中提取若干局部特征;
节点确定单元,用于获得所述待检索图片中的局部特征对应的节点;
索引单元,用于利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计单元,用于统计所述待检索图片与对应的每个样本图片中重复的节点数目;
相似度计算单元,用于利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
输出过滤单元,用于如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
本申请提供的一种进行图片搜索的方法,包括:保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目,该方法还包括:
从获得的待搜索图片中提取若干局部特征;
获得所述待搜索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计所述待搜索图片与对应的每个样本图片重复的节点数目;
利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
本申请提供的一种进行图片搜索的装置,包括:
存储单元,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元,用于从获得的待搜索图片中提取若干局部特征;
节点确定单元,用于获得所述待搜索图片中的局部特征对应的节点;
索引单元,用于利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计单元,用于统计所述待搜索图片与对应的每个样本图片的重复节点数目;
相似度计算单元,用于利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
输出过滤单元,用于如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
本申请实施例从获得的待检索图片中提取若干局部特征;利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;计算得到所述待检索图片与样本图片的相似度;如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出,以进一步进行排查,提高了监控图片的准确率。同样,本申请方案应用到图片搜索过程中,从获得的待搜索图片中提取若干局部特征;利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;计算得到所述待搜索图片与样本图片的相似度;如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果,图片搜素的准确率高。
附图说明
图1为本申请实施例建立样本图片索引表的方法的流程示意图;
图2为本申请实施例实现图片过滤的方法的流程示意图;
图3为本申请实现图片过滤的方法的一具体实施例;
图4为本申请实施例的建立样本图片索引表的装置的结构示意图;
图5为本申请实施例进行图片过滤的装置的结构示意图;
图6为本申请实施例的实现图片搜索的方法的流程示意图;
图7为本申请实施例进行图片搜索的装置的结构示意图。
具体实施方式
在本申请实施例中,为了提高图片过滤的正确率,需要保存样本图片索引表,样本图片索引表中保存样本图片中包括的局部特征所属的节点信息,当将从获得的待检索图片中提取局部特征时,获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;统计所述待检索图片与对应的每个样本图片中重复的节点数目;利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出送入图片排查单元。
参见图1所示,本实施例建立样本图片索引表的方法,包括以下步骤:
步骤101:利用设定的提取算法从样本图片中提取若干局部特征信息。
样本图片是指预先选择出的可作为是否进行过滤参照的图片。可以针对多个样本图片提取局部特征。样本图片的选择可以根据需要自行设定,比如可以将色情图片作为样本图片,也可以将书籍、药品枪支、证件和化妆品的图片作为样本图片。
这里,提取算法可以为任意一种具有尺度不变性的局部特征提取算法,比如:可以为基于Linderberg尺度不变理论的特征检测子以及Dvid Lowe的类SIFT的高维描述子的算法,这些提取算法可以自动获取图像结构的尺度,并在该尺度上计算具有一定抗尺度变化,光照变化,角度变化,旋转变化等不同变化的局部图像特征。在获取图像特征之后,一幅图像被表示为数百个局部特征。所述局部特征信息可以为提取的局部特征矢量。本申请对采用何种提取算法进行样本图片局部特征信息的提取并不做限定。
步骤102:利用设定的聚类算法对所有样本图片的局部特征信息进行聚类,其中,将具有设定相似度的局部特征划分对应同一节点,每个节点对应一个节点标识。
步骤102中,可以按照相似度,将多个局部特征划分为若干组,即将比较相似的局部特征设置为一组内,将每组称为一个节点,每组的局部特征归属于对应的节点。
如果所述局部特征信息为局部特征矢量,则步骤102可以利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点。
步骤103:设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
参见图2所示,本实施例实现图片过滤的方法包括以下步骤:
步骤201:利用设定的提取算法从获得的待检索图片中提取若干局部特征。
步骤202:利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识。
步骤203:统计所述待检索图片与对应的每个样本图片中重复的节点数目。
步骤204:利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度。
这里,获得所述待检索图片的相似度可以这样实现:
比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待检索图片与对应的样本图片的重复节点数目与所述较小的节点数目的比值,作为所述待检索图片与该样本图片的相似度。本申请也可以选择待检索图片对应的节点数目与从所述索引表中获得的对应的节点数目中的较大的节点数目作为相似度的计算数值。本申请对此并不做限定。
步骤205:判断待检索图片与样本图片的相似度是否超过设定的阈值,如果超过,则将该图片过滤出送入图片排查单元,否则,认为该图片为正常图片。
以下举具体实施例详细说明本申请的技术方案。
参见图3所示,本申请实施例的具体实现过程如下:
步骤300:利用设定的算法从样本图片中提取若干局部特征作为该图片的图像特征,并利用聚类算法将相似的局部特征量化为同一节点,建立索引表,该索引表包括:节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系。这里,采用聚类的方式可以降低高维的局部特征的计算量。
如:表1中,节点标识为“1”的节点归属于样本图片标识为“#Img3307”、“#Img4615”,在样本图片“#Img3307”中,出现次数为“2”,在样本图片“#Img4615”中,出现次数为“3”;节点标识为“N”的节点归属于样本图片标识为“#Img2948”和“#Img3693”的样本图片中,其中,在样本图片“#Img2948”中出现3次,在样本图片“#Img3693”中出现5次。这里,样本图像编号相当于样本图片标识。
  节点标识   倒排表(所在样本图像编号,出现次数)
  1   (#Img3307,2)(#Img4615,3)......
  ......   ......
  N   (#Img2948,3)(#Img3693,5)......
表1
步骤301:当收到用户上传的图片时,触发内容安全过滤系统收集会员上传图片的存储路径。
步骤302:通过图片存储路径从文件系统下载用户上传的图片。
步骤303:将获取的图片作为待检索图片送入检索库。
步骤304:图片检索库利用步骤200中相同的算法提取待检索图片的若干局部特征作为该图片的图像特征。
步骤305:图片检索库将待检索图片的局部特征利用与步骤200相同的聚类算法将待检索图片中相似的局部特征量化为对应的节点。
步骤306:图片检索库将待检索图片对应的节点标识索引所述索引表,获得待检索图片中每个节点标识对应的样本图像编号,并统计待检索图片与每个样本图片的重复节点数目。
步骤307:利用待检索图片与每个样本图片的重复节点数目,以及待检索图片与样本图片中较少的节点数目获得待检索图片与样本图片的相似度。
提取的所有样本图片中的局部特征最后都会被聚类或分类到不同的节点。待检测图片ImgA所有的局部特征将被分类到一个节点集A={a1,a2,...,aN}中,同样的,样本图片ImgB中的局部特征也将被聚类到一个节点集B={b1,b2,..,bM}。其中a1,a2...,aN和b1,b2,...,bM都代表了节点编号。那么重复节点数目指的是A∩B,也就是A与B的交集,而较少节点数目则是min(N,M)。
步骤308:如果待检索图片与样本图片的相似度超过设定的阈值,将该图片过滤出送入图片排查单元。
这里,如果待检索图片与样本图片的相似度超过阈值,那么待检索图片被认为是可疑图片。为进一步确认待检索图片的危险度,该图片进入图片排查单元等待人工确认。
图片排查单元中的样本图片是由系统自动判决的危险图片,其中包含少量误判,需要人工审核。另外,由于系统判决的危险图片中,有部分与样本图片虽然相似,但并不完全一致,这类图片可在审核后加入样本库,进一步完善图片样本库。
图片样本库的管理也可以由人工完成。由于违禁图片具有时变性,本产品也提供人工修改样本库的功能。在样本库被更新以后,索引文件也将实时更改,并能及时反馈到检索结果中,实现了较高的灵活性。
参见图4所示,本实施例的建立样本图片索引表的装置,包括:特征提取单元41、聚类单元42和存储单元43。其中,
特征提取单元41,用于利用设定的提取算法从样本图片中提取若干局部特征信息;
聚类单元42,用于利用设定的聚类算法对所有样本图片的局部特征信息进行聚类,其中,将具有设定相似度的局部特征划分对应同一节点,每个节点对应一个节点标识;
存储单元43,用于设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
所述提取算法为任意一种具有尺度不变性的局部特征提取算法;
所述提取算法为基于Linderberg尺度不变理论的特征检测子,或为DvidLowe的类SIFT的高维描述子的算法。
所述局部特征信息为局部特征矢量,则所述聚类单元42,用于利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点。
参见图5所示,本实施例的进行图片过滤的装置包括:
存储单元51,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元52,用于利用设定的提取算法从获得的待检索图片中提取若干局部特征;
节点确定单元53,用于利用所述聚类算法获得所述待检索图片中的局部特征对应的节点;
索引单元54,用于利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计单元55,用于统计所述待检索图片与每个样本图片的重复节点数目;
相似度计算单元56,用于利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
输出过滤单元57,用于如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
所述相似度计算单元56,用于比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待检索图片与对应的每个样本图片中的重复节点数目与所述较小的节点数目的比值,作为所述待检索图片的相似度。
本申请实施例基于图像检索的过滤技术是将上传图片与需要监控的样本图片作对比,如果上传图片与样本图片高度相似,那么上传图片将被送入图片排查单元,接受排查。该技术方案的优点是,速度快,精度高,同时人工排查也能进一步降低误检率。
本申请提供的实施例并不试图识别图像的内容,而是简单高效地将上传图像与样本图像作对比,并分析其相似程度作为上传图像的危险程度,对于危险程度高的图像,将进一步由人工排查。由于网上交易所涉及的图像大多数是商品图像,而商品图像被重复利用或简单修改后重复利用的可能性极高,利用图像检索和对比,可以监控到绝大多数违规图像。另外由于样本库是由人工实时维护的,当监控要求变化时,只需要修改样本图像库,即修改监控规范。对于不同的商品类目可定制不同的监控指标,解决了覆盖率的问题。同时,针对不同商品类目的特点,可分析出图片的特性,定制监控的模糊度,从而达到提供准确率的目的。
同样,本申请上述图片检索的思想还可以应用到图片搜索的领域,其中,需要预先在搜索引擎服务器端建立图片数据库,这个图片数据库中存储的图片,可以是登陆该网站的用户上传的图片,也可以是从其它系统中的导入的图片,还可以是通过网络爬虫从海量的互联网网页中抓取得到,还可能以其它方式得到的图片,再或者是上述几种来源中的一种或几种方式结合而来的图片,本申请中并不做限定。网络爬虫定时抓取互联网中的海量网页图片的技术已是公知的技术,这里不再介绍。针对所述图片数据库中的图片进行局部特征信息提取,并建立样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。当搜索引擎的客户端发出图片搜索的指令后,搜索引擎服务器针对待搜索图片进行解析,并在样本图片索引表中进行查询,从而获得与待搜索图片相同或相近似的图片,并反馈给搜索引擎客户端。
参见图6所示,本申请实施例的一种进行图片搜索的方法包括以下步骤:
步骤601:从获得的待搜索图片中提取若干局部特征。
步骤602:获得所述待搜索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
步骤603:统计所述待搜索图片与对应的每个样本图片重复的节点数目;
步骤604:利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
获得所述待搜索图片的相似度可以这样实现:
比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待搜索图片与对应的每个样本图片重复的节点数目与所述较小的节点数目的比值,作为所述待搜索图片的相似度。
当然,本申请也可以选择待检索图片对应的节点数目与从所述索引表中获得的对应的节点数目中的较大的节点数目作为相似度的计算数值。本申请对此并不做限定。
步骤605:如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
参见图7所示,本申请进行图片搜索的装置包括:
存储单元71,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元72,用于从获得的待搜索图片中提取若干局部特征;
节点确定单元73,用于获得所述待搜索图片中的局部特征对应的节点;
索引单元74,用于利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计单元75,用于统计所述待搜索图片与对应的每个样本图片的重复节点数目;
相似度计算单元76,用于利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
搜索输出单元77,用于如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片输出。
所述相似度计算单元76,可以用于比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待搜索图片与对应的每个样本图片的重复节点数目与所述较小的节点数目的比值,作为所述待搜索图片的相似度。
所述相似度计算单元76,可以用于比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;将所述待搜索图片与对应的每个样本图片的重复节点数目与所述较大的节点数目的比值,作为所述待搜索图片的相似度。
本申请上述方案应用到图片搜索过程中,如果获得一个待搜索图片,可以从待搜索图片中提取若干局部特征;利用所述聚类算法获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;计算得到所述待搜索图片与样本图片的相似度;如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果,图片搜素的准确率高。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (19)

1.一种建立样本图片索引表的方法,其特征在于,该方法包括以下步骤:
从样本图片中提取若干局部特征;
对所述样本图片的局部特征进行聚类,其中,将具有设定相似度的局部特征划分对应同一节点,每个节点对应一个节点标识;
设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
2.根据权利要求1所述的方法,其特征在于,所述从样本图片中提取若干局部特征是通过一种具有尺度不变性的局部特征提取算法进行的。
3.根据权利要求2所述的方法,其特征在于,所述提取算法为基于Linderberg尺度不变理论的特征检测子,或为Dvid Lowe的类SIFT的高维描述子的算法。
4.根据权利要求1所述的方法,其特征在于,所述局部特征为局部特征矢量,对所述样本图片的局部特征信息进行聚类,包括:
利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点。
5.一种进行图片过滤的方法,其特征在于,保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目,该方法还包括:
从获得的待检索图片中提取若干局部特征;
获得所述待检索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计所述待检索图片与对应的每个样本图片重复的节点数目;
利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
6.根据权利要求5所述的方法,其特征在于,获得所述待检索图片的相似度,包括:
比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;
将所述待检索图片与对应的每个样本图片重复的节点数目与所述较小的节点数目的比值,作为所述待检索图片的相似度。
7.根据权利要求5所述的方法,其特征在于,获得所述待检索图片的相似度,包括:
比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;
将所述待检索图片与对应的每个样本图片重复的节点数目与所述较大的节点数目的比值,作为所述待检索图片的相似度。
8.一种建立样本图片索引表的装置,其特征在于,该装置包括:
特征提取单元,用于从样本图片中提取若干局部特征信息;
聚类单元,用于对所述样本图片的局部特征信息进行聚类,其中,将具有设定相似度的局部特征划分对应同一节点,每个节点对应一个节点标识;
存储单元,用于设置样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到该节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目。
9.根据权利要求8所述的装置,其特征在于,所述特征提取单元是通过一种具有尺度不变性的局部特征提取算法从样本图片中提取若干局部特征信息;
所述提取算法为基于Linderberg尺度不变理论的特征检测子,或为DvidLowe的类SIFT的高维描述子的算法。
10.根据权利要求8所述的装置,其特征在于,所述局部特征信息为局部特征矢量,则所述聚类单元,用于利用设定的聚类算法计算每个样本图片的局部特征矢量之间的距离,将一定区域内距离小于设定间距阈值的局部特征划为对应同一节点。
11.一种进行图片过滤的装置,其特征在于,该装置包括:
存储单元,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元,用于从获得的待检索图片中提取若干局部特征;
节点确定单元,用于获得所述待检索图片中的局部特征对应的节点;
索引单元,用于利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计单元,用于统计所述待检索图片与对应的每个样本图片的重复节点数目;
相似度计算单元,用于利用从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待检索图片的相似度;
输出过滤单元,用于如果待检索图片与样本图片的相似度超过设定的阈值时,将该图片过滤出。
12.根据权利要求11所述的装置,其特征在于,所述相似度计算单元,用于比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待检索图片与对应的每个样本图片的重复节点数目与所述较小的节点数目的比值,作为所述待检索图片的相似度。
13.根据权利要求11所述的装置,其特征在于,所述相似度计算单元,用于比较从所述待检索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;将所述待检索图片与对应的每个样本图片的重复节点数目与所述较大的节点数目的比值,作为所述待检索图片的相似度。
14.一种进行图片搜索的方法,其特征在于,保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目,该方法还包括:
从获得的待搜索图片中提取若干局部特征;
获得所述待搜索图片中的局部特征对应的节点,利用每个所述局部特征对应的节点标识索引所述样本图片索引表获得对应的样本图片标识;
统计所述待搜索图片与对应的每个样本图片重复的节点数目;
利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
15.根据权利要求14所述的方法,其特征在于,获得所述待搜索图片的相似度,包括:
比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;
将所述待搜索图片与对应的每个样本图片重复的节点数目与所述较小的节点数目的比值,作为所述待搜索图片的相似度。
16.根据权利要求14所述的方法,其特征在于,获得所述待搜索图片的相似度,包括:
比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;
将所述待搜索图片与对应的每个样本图片重复的节点数目与所述较大的节点数目的比值,作为所述待搜索图片的相似度。
17.一种进行图片搜索的装置,其特征在于,该装置包括:
存储单元,用于保存样本图片索引表,所述样本图片索引表用于保存节点标识与聚类到对应节点的局部特征所属样本图片标识以及该局部特征在所属样本图片中出现次数的对应关系,以及保存每个样本图片所包括的节点标识以及节点数目;
提取单元,用于从获得的待搜索图片中提取若干局部特征;
节点确定单元,用于获得所述待搜索图片中的局部特征对应的节点;
索引单元,用于利用每个所述局部特征对应的节点标识索引所述样本图片表获得对应的样本图片标识;
统计单元,用于统计所述待搜索图片与对应的每个样本图片的重复节点数目;
相似度计算单元,用于利用从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,得到所述待搜索图片的相似度;
输出过滤单元,用于如果待搜索图片与样本图片的相似度超过设定的阈值时,将该样本图片作为搜索结果。
18.根据权利要求17所述的装置,其特征在于,所述相似度计算单元,用于比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较小的节点数目;将所述待搜索图片与对应的每个样本图片的重复节点数目与所述较小的节点数目的比值,作为所述待搜索图片的相似度。
19.根据权利要求17所述的装置,其特征在于,所述相似度计算单元,用于比较从所述待搜索图片提取的局部特征聚类后得到的节点数目,以及从所述索引表中获得的从对应样本图片提取的局部特征聚类后得到的节点数目,选择其中较大的节点数目;将所述待搜索图片与对应的每个样本图片的重复节点数目与所述较大的节点数目的比值,作为所述待搜索图片的相似度。
CN2009102601755A 2009-12-24 2009-12-24 一种建立样本图片索引表和图片过滤、搜索方法及装置 Active CN102110122B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN2009102601755A CN102110122B (zh) 2009-12-24 2009-12-24 一种建立样本图片索引表和图片过滤、搜索方法及装置
US13/056,001 US8577153B2 (en) 2009-12-24 2010-10-28 Method and system for sample image index creation and image filtering and search
PCT/US2010/054493 WO2011078911A1 (en) 2009-12-24 2010-10-28 Method and system for sample image index creation and image filtering and search
JP2012545942A JP5665879B2 (ja) 2009-12-24 2010-10-28 サンプル画像インデックスの作成ならびに画像フィルタリングおよび検索のための方法およびシステム
EP10839953.6A EP2517154A4 (en) 2009-12-24 2010-10-28 METHOD AND SYSTEM FOR CREATING AN INDEX OF SPECIMEN IMAGES, AND FOR FILTERING AND SEARCHING AN IMAGE
HK11108935.8A HK1155235A1 (en) 2009-12-24 2011-08-24 A method and device for establishing sample picture index table, picture filtering and searching

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102601755A CN102110122B (zh) 2009-12-24 2009-12-24 一种建立样本图片索引表和图片过滤、搜索方法及装置

Publications (2)

Publication Number Publication Date
CN102110122A true CN102110122A (zh) 2011-06-29
CN102110122B CN102110122B (zh) 2013-04-03

Family

ID=44174284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102601755A Active CN102110122B (zh) 2009-12-24 2009-12-24 一种建立样本图片索引表和图片过滤、搜索方法及装置

Country Status (6)

Country Link
US (1) US8577153B2 (zh)
EP (1) EP2517154A4 (zh)
JP (1) JP5665879B2 (zh)
CN (1) CN102110122B (zh)
HK (1) HK1155235A1 (zh)
WO (1) WO2011078911A1 (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207879A (zh) * 2012-01-17 2013-07-17 阿里巴巴集团控股有限公司 图像索引的生成方法及设备
CN103377287A (zh) * 2012-04-25 2013-10-30 腾讯科技(深圳)有限公司 一种投放物品信息的方法和装置
CN103473299A (zh) * 2013-09-06 2013-12-25 北京锐安科技有限公司 一种网站不良似然度获取方法和装置
CN103793434A (zh) * 2012-11-02 2014-05-14 北京百度网讯科技有限公司 一种基于内容的图片搜索方法和装置
CN104268445A (zh) * 2014-09-30 2015-01-07 小米科技有限责任公司 防止图片二次传播的方法及装置
CN104268446A (zh) * 2014-09-30 2015-01-07 小米科技有限责任公司 防止视频二次传播的方法及装置
CN104899744A (zh) * 2015-06-29 2015-09-09 汪新淮 钱币邮票收藏品交易系统与交易方法
CN105335047A (zh) * 2014-08-14 2016-02-17 小米科技有限责任公司 显示图片的方法及装置
CN105404631A (zh) * 2014-09-15 2016-03-16 腾讯科技(深圳)有限公司 图片识别方法和装置
CN105930499A (zh) * 2016-05-09 2016-09-07 深圳市数极科技有限公司 一种图片搜索方法及系统
CN106250907A (zh) * 2016-07-08 2016-12-21 大连大学 云计算环境基于过采样修正的大规模图像聚类方法
CN106844421A (zh) * 2016-11-30 2017-06-13 上海仙剑文化传媒股份有限公司 一种数字图片管理方法及系统
US9755616B2 (en) 2014-06-30 2017-09-05 Huawei Technologies Co., Ltd. Method and apparatus for data filtering, and method and apparatus for constructing data filter
CN108121781A (zh) * 2017-12-18 2018-06-05 辽宁师范大学 基于高效样本选取与参数优化的相关反馈图像检索方法
CN108171135A (zh) * 2017-12-21 2018-06-15 深圳云天励飞技术有限公司 人脸检测方法、装置及计算机可读存储介质
CN109165307A (zh) * 2018-09-19 2019-01-08 腾讯科技(深圳)有限公司 一种特征检索方法、装置和存储介质
CN110727815A (zh) * 2018-07-16 2020-01-24 浙江大华技术股份有限公司 一种更新以图搜图的图库的方法、设备及可读存储介质
CN111428179A (zh) * 2020-03-19 2020-07-17 北大方正集团有限公司 图片监测方法、装置及电子设备

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9768082B2 (en) * 2009-02-13 2017-09-19 Hermes Microvision Inc. Method and machine for examining wafers
CN103136228A (zh) 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种图片搜索方法以及图片搜索装置
JP6064392B2 (ja) * 2012-06-29 2017-01-25 株式会社リコー 検索装置、検索方法、検索プログラムおよび検索システム
US9626567B2 (en) * 2013-03-13 2017-04-18 Visible Measures Corp. Automated video campaign building
US10521817B2 (en) 2014-04-02 2019-12-31 Nant Holdings Ip, Llc Augmented pre-paid cards, systems and methods
CN107590491B (zh) * 2016-07-07 2021-08-06 阿里巴巴集团控股有限公司 一种图像处理方法及装置
KR102402096B1 (ko) * 2017-03-27 2022-05-26 삼성전자주식회사 이미지 내 오브젝트와 관련된 정보를 제공하는 전자 장치
CN109711298B (zh) * 2018-12-14 2021-02-12 南京甄视智能科技有限公司 基于faiss的高效人脸特征值检索的方法和系统
JP7269747B2 (ja) * 2019-02-05 2023-05-09 株式会社日立製作所 検出装置、検出方法、および検出プログラム
CN112182287B (zh) * 2020-09-10 2021-06-08 南京信息工程大学 一种基于时空视觉词组和分层匹配的视频拷贝检测方法
CN116630597A (zh) * 2023-06-08 2023-08-22 深圳市玩瞳科技有限公司 一种蜂巢形图像指标、其解码方法、装置和设备
CN116881485A (zh) * 2023-06-19 2023-10-13 北京百度网讯科技有限公司 生成图像检索索引的方法及装置、电子设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321232B1 (en) * 1998-12-18 2001-11-20 Xerox Corporation Method for creating a geometric hash tree in a document processing system
US6792164B2 (en) * 1999-11-16 2004-09-14 International Business Machines Corporation Method and apparatus for indexing and retrieving images from an image database based on a color query
CN101211355A (zh) * 2006-12-30 2008-07-02 中国科学院计算技术研究所 一种基于聚类的图像查询方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0545944A (ja) * 1991-08-14 1993-02-26 Mita Ind Co Ltd 画像形成装置
US5740269A (en) 1994-09-20 1998-04-14 Neopath, Inc. Method and apparatus for robust biological specimen classification
US6072904A (en) 1997-12-31 2000-06-06 Philips Electronics North America Corp. Fast image retrieval using multi-scale edge representation of images
US6564225B1 (en) * 2000-07-14 2003-05-13 Time Warner Entertainment Company, L.P. Method and apparatus for archiving in and retrieving images from a digital image library
KR100374791B1 (ko) 2000-11-22 2003-03-04 삼성전자주식회사 영상의 영역 구분 방법 및 장치
KR100788643B1 (ko) * 2001-01-09 2007-12-26 삼성전자주식회사 색과 질감의 조합을 기반으로 하는 영상 검색 방법
US7761453B2 (en) 2005-01-26 2010-07-20 Honeywell International Inc. Method and system for indexing and searching an iris image database
US7343046B2 (en) 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
JP2005293123A (ja) * 2004-03-31 2005-10-20 Nippon Telegraph & Telephone West Corp コンテンツフィルタリングシステム、その方法およびプログラム
US8086038B2 (en) * 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US7848566B2 (en) * 2004-10-22 2010-12-07 Carnegie Mellon University Object recognizer and detector for two-dimensional images using bayesian network based classifier
US7734067B2 (en) 2004-12-07 2010-06-08 Electronics And Telecommunications Research Institute User recognition system and method thereof
US7831599B2 (en) 2005-03-04 2010-11-09 Eastman Kodak Company Addition of new images to an image database by clustering according to date/time and image content and representative image comparison
JP4992072B2 (ja) * 2005-08-16 2012-08-08 国立大学法人東京工業大学 複数のxml文書の類似性検出システム、および、複数のxml文書の統合システム
JP4721830B2 (ja) * 2005-08-31 2011-07-13 トヨタ自動車株式会社 画像検索方法及び装置
US7725484B2 (en) 2005-11-18 2010-05-25 University Of Kentucky Research Foundation (Ukrf) Scalable object recognition using hierarchical quantization with a vocabulary tree
US7813561B2 (en) * 2006-08-14 2010-10-12 Microsoft Corporation Automatic classification of objects within images
DE102006043910B4 (de) 2006-09-19 2010-02-25 Siemens Ag Ergebnisfilter und Verfahren zur Selektion der Ergebnisdaten einer Applikation zur automatischen Mustererkennung
JP5139716B2 (ja) * 2007-05-16 2013-02-06 キヤノン株式会社 画像検索装置及び画像検索方法
US20090092299A1 (en) 2007-10-03 2009-04-09 Siemens Medical Solutions Usa, Inc. System and Method for Joint Classification Using Feature Space Cluster Labels
JP4881278B2 (ja) 2007-10-31 2012-02-22 株式会社東芝 物体認識装置及びその方法
US8144947B2 (en) * 2008-06-27 2012-03-27 Palo Alto Research Center Incorporated System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints
US8254697B2 (en) * 2009-02-02 2012-08-28 Microsoft Corporation Scalable near duplicate image search with geometric constraints
US8542950B2 (en) 2009-06-02 2013-09-24 Yahoo! Inc. Finding iconic images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321232B1 (en) * 1998-12-18 2001-11-20 Xerox Corporation Method for creating a geometric hash tree in a document processing system
US6792164B2 (en) * 1999-11-16 2004-09-14 International Business Machines Corporation Method and apparatus for indexing and retrieving images from an image database based on a color query
CN101211355A (zh) * 2006-12-30 2008-07-02 中国科学院计算技术研究所 一种基于聚类的图像查询方法

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207879B (zh) * 2012-01-17 2016-03-30 阿里巴巴集团控股有限公司 图像索引的生成方法及设备
CN103207879A (zh) * 2012-01-17 2013-07-17 阿里巴巴集团控股有限公司 图像索引的生成方法及设备
CN103377287A (zh) * 2012-04-25 2013-10-30 腾讯科技(深圳)有限公司 一种投放物品信息的方法和装置
CN103377287B (zh) * 2012-04-25 2016-09-07 腾讯科技(深圳)有限公司 一种投放物品信息的方法和装置
CN103793434A (zh) * 2012-11-02 2014-05-14 北京百度网讯科技有限公司 一种基于内容的图片搜索方法和装置
CN103473299A (zh) * 2013-09-06 2013-12-25 北京锐安科技有限公司 一种网站不良似然度获取方法和装置
CN103473299B (zh) * 2013-09-06 2017-02-08 北京锐安科技有限公司 一种网站不良似然度获取方法和装置
US9755616B2 (en) 2014-06-30 2017-09-05 Huawei Technologies Co., Ltd. Method and apparatus for data filtering, and method and apparatus for constructing data filter
CN105335047A (zh) * 2014-08-14 2016-02-17 小米科技有限责任公司 显示图片的方法及装置
CN105404631A (zh) * 2014-09-15 2016-03-16 腾讯科技(深圳)有限公司 图片识别方法和装置
CN105404631B (zh) * 2014-09-15 2021-01-29 腾讯科技(深圳)有限公司 图片识别方法和装置
CN104268446A (zh) * 2014-09-30 2015-01-07 小米科技有限责任公司 防止视频二次传播的方法及装置
CN104268445A (zh) * 2014-09-30 2015-01-07 小米科技有限责任公司 防止图片二次传播的方法及装置
CN104899744A (zh) * 2015-06-29 2015-09-09 汪新淮 钱币邮票收藏品交易系统与交易方法
CN104899744B (zh) * 2015-06-29 2018-03-16 汪新淮 钱币邮票收藏品交易系统与交易方法
CN105930499B (zh) * 2016-05-09 2019-11-22 深圳市数极科技有限公司 一种图片搜索方法及系统
CN105930499A (zh) * 2016-05-09 2016-09-07 深圳市数极科技有限公司 一种图片搜索方法及系统
CN106250907A (zh) * 2016-07-08 2016-12-21 大连大学 云计算环境基于过采样修正的大规模图像聚类方法
CN106844421A (zh) * 2016-11-30 2017-06-13 上海仙剑文化传媒股份有限公司 一种数字图片管理方法及系统
CN108121781A (zh) * 2017-12-18 2018-06-05 辽宁师范大学 基于高效样本选取与参数优化的相关反馈图像检索方法
CN108121781B (zh) * 2017-12-18 2021-09-24 辽宁师范大学 基于高效样本选取与参数优化的相关反馈图像检索方法
CN108171135A (zh) * 2017-12-21 2018-06-15 深圳云天励飞技术有限公司 人脸检测方法、装置及计算机可读存储介质
CN110727815A (zh) * 2018-07-16 2020-01-24 浙江大华技术股份有限公司 一种更新以图搜图的图库的方法、设备及可读存储介质
CN110727815B (zh) * 2018-07-16 2024-01-30 浙江大华技术股份有限公司 一种更新以图搜图的图库的方法、设备及可读存储介质
CN109165307A (zh) * 2018-09-19 2019-01-08 腾讯科技(深圳)有限公司 一种特征检索方法、装置和存储介质
CN111428179A (zh) * 2020-03-19 2020-07-17 北大方正集团有限公司 图片监测方法、装置及电子设备
CN111428179B (zh) * 2020-03-19 2023-09-19 新方正控股发展有限责任公司 图片监测方法、装置及电子设备

Also Published As

Publication number Publication date
WO2011078911A1 (en) 2011-06-30
US8577153B2 (en) 2013-11-05
HK1155235A1 (en) 2012-05-11
US20120275705A1 (en) 2012-11-01
CN102110122B (zh) 2013-04-03
JP2013515998A (ja) 2013-05-09
EP2517154A1 (en) 2012-10-31
JP5665879B2 (ja) 2015-02-04
EP2517154A4 (en) 2015-03-18

Similar Documents

Publication Publication Date Title
CN102110122B (zh) 一种建立样本图片索引表和图片过滤、搜索方法及装置
CN107577688B (zh) 基于媒体信息采集的原创文章影响力分析系统
CN112434208B (zh) 一种孤立森林的训练及其网络爬虫的识别方法与相关装置
CN107291910A (zh) 一种视频片段结构化查询方法、装置及电子设备
CN108734184B (zh) 一种对敏感图像进行分析的方法及装置
CN104866831B (zh) 特征加权的人脸识别算法
US10521748B2 (en) Retention risk determiner
CN101853299A (zh) 一种基于感性认知的图像检索结果排序方法
CN108304853B (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN111614690A (zh) 一种异常行为检测方法及装置
CN105574544A (zh) 一种数据处理方法和装置
CN107180093A (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
CN107122439A (zh) 一种视频片段查询方法及装置
CN104182539B (zh) 异常信息批量处理的方法及系统
CN109471934B (zh) 基于互联网的金融风险线索发掘方法
Yadav et al. Performance analysis of discrete wavelet transform based first-order statistical texture features for hardwood species classification
CN111461630B (zh) 派送快递包裹的监控方法、装置、设备及存储介质
CN114817518B (zh) 基于大数据档案识别的证照办理方法、系统及介质
KR101960863B1 (ko) 기술가치 평가 시스템
CN110968670A (zh) 一种流行商品的属性获取方法、装置、设备及存储介质
CN112506930B (zh) 一种基于机器学习技术的数据洞察系统
KR101664358B1 (ko) 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법
CN111666428B (zh) 网络媒体传播力评估方法
DE202022102520U1 (de) System zur Analyse von Werbung auf Online-Videoplattformen für digitales Marketing durch maschinelles Lernen, um ein breites Publikum zu erreichen
CN108038490A (zh) 一种基于互联网数据的p2p企业自动识别方法与系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1155235

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1155235

Country of ref document: HK