CN108629345B - 高维图像特征匹配方法和装置 - Google Patents

高维图像特征匹配方法和装置 Download PDF

Info

Publication number
CN108629345B
CN108629345B CN201710158472.3A CN201710158472A CN108629345B CN 108629345 B CN108629345 B CN 108629345B CN 201710158472 A CN201710158472 A CN 201710158472A CN 108629345 B CN108629345 B CN 108629345B
Authority
CN
China
Prior art keywords
dimensional image
low
images
image features
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710158472.3A
Other languages
English (en)
Other versions
CN108629345A (zh
Inventor
安山
陈宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710158472.3A priority Critical patent/CN108629345B/zh
Priority to PCT/CN2017/119489 priority patent/WO2018166273A1/zh
Priority to US16/494,632 priority patent/US11210555B2/en
Publication of CN108629345A publication Critical patent/CN108629345A/zh
Application granted granted Critical
Publication of CN108629345B publication Critical patent/CN108629345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/7625Hierarchical techniques, i.e. dividing or merging patterns to obtain a tree-like representation; Dendograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions

Abstract

本发明公开了一种高维图像特征匹配方法和装置,涉及图像检索领域。其中的方法包括:提取待检索图像的高维图像特征;将待检索图像的高维图像特征划分为多个低维图像特征;将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较;根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。本发明能够提高特征匹配的准确率,并且还能够提高高维图像特征匹配的效率。

Description

高维图像特征匹配方法和装置
技术领域
本发明涉及图像检索领域,尤其涉及一种高维图像特征匹配方法和装置。
背景技术
特征匹配问题通常定义为近似最近邻搜索问题(Approximate NearestNeighbor),即在数据库特征中搜索与检索特征欧式距离最近的特征。高维特征指超过1000维的图像特征,由于维度灾难(Curse of dimensionality)的存在,高维特征的匹配很困难。
图像的描述方法包括局部特征和全局特征两类。图像的局部特征通常是数百个维数较低的特征,图像全局特征通常是维数较高的单个特征。目前,可以利用穷举搜索(exaustive search)实现全局特征的匹配,穷举搜索能够保证欧氏距离下最近邻的精确匹配,但是效率极其低下。还可以利用通过学习二值码(learning binary codes)来进行匹配,该方法通过使用双线性映射,将高维特征转换为维度低但保留相似性的二值码,但对高维特征进行了双线性映射,可能存在映射误差,导致匹配错误。
发明内容
本发明要解决的一个技术问题是提供一种高维图像特征匹配方法和装置能够提高特征匹配的准确率。
根据本发明的一个实施例,提出一种高维图像特征匹配方法,包括:提取待检索图像的高维图像特征;将待检索图像的高维图像特征划分为多个低维图像特征;将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较;根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。
进一步地,数据库中图像的低维图像特征的各层聚类中心通过以下方法进行确定:提取数据库中图像的高维图像特征;将数据库中图像的高维图像特征划分为多个低维图像特征;对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。
进一步地,数据库中图像的各低维图像特征的各层聚类中心与倒排文件关联。
进一步地,对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心包括:对数据库中图像的低维图像特征组成的集合进行无监督训练,其中,定义聚类的分叉因子为k;在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心;根据点到最近中心的概率比值确定k个初始聚类中心;利用kmeans聚类算法将数据库中图像的低维图像特征组成的集合划分为k个集合,作为kmeans树的第一层;利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分,直到达到kmeans树的叶子层;根据聚类均值计算数据库中图像的低维图像特征的每一层的每个集合的聚类中心。
进一步地,将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较包括:将待检索图像的每个低维图像特征,从数据库中图像的低维图像特征的kmeans树的第一层开始,与每一层k个聚类中心比较,确定与待检索图像的每个低维图像特征距离最近的聚类中心;递归与距离最近的聚类中心的子聚类中心进行比较,直到达到kmeans树的叶子层。
进一步地,该方法还包括:利用TF-IDF词频-逆向文件频率算法对待检索图像与数据库中图像的低维图像特征相似度进行评分;利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。
根据本发明的另一个实施例,还提出一种高维图像特征匹配装置,包括:第一高维图像特征提取单元,用于提取待检索图像的高维图像特征;第一低维图像特征划分单元,用于将待检索图像的高维图像特征划分为多个低维图像特征;特征比较单元,用于将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较;特征匹配确定单元,用于根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。
进一步地,数据库中图像的低维图像特征的各层聚类中心通过以下单元进行确定:第二高维图像特征提取单元,用于提取数据库中图像的高维图像特征;第二低维图像特征划分单元,用于将数据库中图像的高维图像特征划分为多个低维图像特征;聚类中心确定单元,用于对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。
进一步地,数据库中图像的各低维图像特征的各层聚类中心与倒排文件关联。
进一步地,聚类中心确定单元用于对数据库中图像的低维图像特征组成的集合进行无监督训练,其中,定义聚类的分叉因子为k;在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心;根据点到最近中心的概率比值确定k个初始聚类中心;利用kmeans聚类算法将数据库中图像的低维图像特征组成的集合划分为k个集合,作为kmeans树的第一层;利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分,直到达到kmeans树的叶子层;根据聚类均值计算数据库中图像的低维图像特征的kmeans树的每一层的每个集合的聚类中心。
进一步地,特征匹配确定单元用于将待检索图像的每个低维图像特征,从数据库中图像的低维图像特征的kmeans树的第一层开始,与每一层k个聚类中心比较,确定与待检索图像的每个低维图像特征距离最近的聚类中心;递归与距离最近的聚类中心的子聚类中心进行比较,直到达到kmeans树的叶子层。
进一步地,特征匹配确定单元还用于利用TF-IDF词频-逆向文件频率算法对待检索图像与数据库中图像的低维图像特征相似度进行评分;利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。
根据本发明的另一个实施例,还提出一种高维图像特征匹配装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行上述的方法。
根据本发明的另一个实施例,还提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上述的方法的步骤。
与现有技术相比,本发明实施例通过将待检索图像的高维图像特征划分为多个低维图像特征,然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较,确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征,能够提高特征匹配的准确率。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
构成说明书的一部分的附图描述了本发明的实施例,并且连同说明书一起用于解释本发明的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
图1为本发明高维图像特征匹配方法的一个实施例的流程示意图。
图2为本发明高维图像特征匹配方法的离线训练过程的一个实施例的流程示意图。
图3为倒排文件示意图。
图4为本发明高维图像特征匹配方法的在线训练过程的一个实施例的流程示意图。
图5为本发明高维图像特征匹配方法的另一个实施例的流程示意图。
图6为本发明高维图像特征匹配装置的一个实施例的结构示意图。
图7为本发明高维图像特征匹配装置的另一个实施例的结构示意图。
图8为本发明高维图像特征匹配装置的再一个实施例的结构示意图。
图9为本发明高维图像特征匹配装置的又一个实施例的结构示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图1为本发明高维图像特征匹配方法的一个实施例的流程示意图。该方法包括以下步骤:
在步骤110,提取待检索图像的高维图像特征。其中,高维图像特征指超过1000维的图像特征,可以使用深度神经网络提取待检索图像的高维图像特征。深度神经网络每个输出层可获取的特征达到4096维,可以使用后两个输出层的特征线性组合为8192维特征来描述图像,即一幅图像可以由1个8192维特征表示。
在步骤120,将待检索图像的高维图像特征划分为多个低维图像特征。其中,将高维图像特征x划分为m个不同的低维图像特征uj,1≤j≤m,低维图像特征uj的维度为D*=D/m,其中D是m的倍数,划分公式如下:
x,…xD*|…|xD-D*+1,…xD→u1(x),…um(x) (1)
在步骤130,将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较。其中,可以预先提取数据库中图像的高维图像特征,将数据库中图像的高维图像特征划分为多个低维图像特征,然后对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心,最后将待检索图像的每个低维图像特征与各层聚类中心进行比较。
在步骤140,根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。例如,先对图像特征的相似度进行评分,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。
在该实施例中,将待检索图像的高维图像特征划分为多个低维图像特征,然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较,确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征,能够提高特征匹配的准确率。
本发明高维图像特征匹配方法包括离线训练过程和在线检索过程,其中,图2为本发明高维图像特征匹配方法的离线训练过程的一个实施例的流程示意图。
在步骤210,提取数据库中图像的高维图像特征。其中,可以使用深度神经网络提取数据库中图像的高维图像特征。
在步骤220,将数据库中图像的高维图像特征划分为多个低维图像特征。其中,数据库图像和待检索图像的高维图像特征划分方式可以相同。
在步骤230,对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。其中,可以对数据库中图像的低维图像特征组成的集合进行无监督训练,定义聚类的分叉因子为k,k为自然数。在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心,根据点到最近中心的概率比值确定k个初始聚类中心。然后利用kmeans聚类算法将数据库中图像的低维图像特征组成的集合划分为k个集合,作为kmeans树的第一层,然后利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分,直到达到kmeans树的叶子层,根据聚类均值计算数据库中图像的低维图像特征的每一层的每个集合的聚类中心。
为了在在线检索时能够快速查找到低维图像特征的聚类中心,该离线训练过程还可以包括步骤240,即将数据库中图像的各低维图像特征的各层聚类中心关联倒排文件。其中,可以将每个聚类中心定义为一个视觉词(visual word),将每个视觉词都关联一个倒排文件,其中,导频文件统计了视觉词汇在每篇文档中出现的频率,其中,倒排文件如图3所示,1、2…9表示视觉词。
在具体应用中,可以使用倒排文件频率(inverse document frequency)衡量每个视觉词wj。倒排文件频率计算公式如下:
Figure BDA0001247821230000081
其中,idf(i)为倒排文件频率,N是训练图像的数量,nj是视觉词wj在训练图像中出现的次数。
为了将图像It转换为词袋(bag-of-words)矢量vt∈RW,在每一层选择L2距离最小的中间结点,将图像特征矢量从kmeans树的第一层向叶子层进行遍历。计算图像It中每个词汇的词频(term frequency)如下所示:
Figure BDA0001247821230000082
其中,tf(i,It)为图像It中每个词汇的词频;niIt表示词汇在图像中出现的次数,nIt表示图像中词汇的总数。
矢量vt的第i项为:
Figure BDA0001247821230000083
在建立bag-of-words模型的同时维护一个倒排文件,为词汇库中的每个词汇wj存储包含该词汇的图像It的列表,这样在检索数据库时只需比较与待检索图像有相同词汇的图像。
在线训练过程如图4所示,在步骤410,提取待检索图像的高维图像特征。
在步骤420,将待检索图像的高维图像特征划分为多个低维图像特征。
在步骤430,将各个低维图像特征与各层聚类中心进行比较实现特征量化。将待检索图像的每个低维图像特征,从数据库中图像的低维图像特征的kmeans树的第一层开始,与每一层k个聚类中心比较,确定与待检索图像的每个低维图像特征距离最近的聚类中心,递归与距离最近的聚类中心的子聚类中心进行比较,直到达到kmeans树的叶子层,该过程实现了每个低维图像特征的量化。
如果kmeans树包含L层,则对于一个低维图像特征而言,量化共需要的计算成本为kL次距离计算,当k不是很大时,量化过程非常迅速。
在步骤440,利用TF-IDF(Term Frequency Inverse Document Frequency,词频-逆向文件频率)对待检索图像与数据库中图像的低维图像特征相似度进行评分。
其中,可以给kmeans树的每一层设定一个权值,然后对经过同一层的低维图像特征加上相应的分数。由于不同层所含信息量不同,所以权值也有所不同。当两个低维图像特征接近叶子层时这两个特征更为相似,该层的权值也较大,当接近于第一层时权值较小。将层数i的权值根据信息熵设定为:
Figure BDA0001247821230000091
di=mi×wi (6)
其中,N为数据库中图像数,Ni为数据库中至少有一个低维图像特征通过层数i的图像数。根据上述权值定义待检索矢量和数据库矢量:
qi=ni×wi (7)
其中mi、ni分别为待检索图像与数据库图像中通过层数i的低维图像特征个数。两幅图像特征间的相似性评分为:
Figure BDA0001247821230000092
其中,可以使用L1范数进行计算:
Figure BDA0001247821230000093
在步骤450,利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。
计算得到待检索图像与数据库图像的相似度评分之后,需要获取前N个评分对应的图像作为检索结果。常用方法是对评分进行排序,获得前N个的图像。这种方法在数据库图像较多时效率低下,即使使用快速排序方法,时间复杂度也过高,为O(nlogn)。如检索100万的图像数据库,排序所用时间超过35秒。
而在本该实施例中可以采用快速选择算法,寻找第N大的相似度评分,同时可获得未排序的前N大的相似度评分。通常N<10,因此使用插入排序法对这N个相似度评分进行排序,获得检索结果。快速选择算法复杂度为O(n),插入排序消耗时间可忽略不计,由此可大幅度提高检索效率。
在该实施例中,通过离线训练和在线检索,分别将数据库中图像和待检索图像的高维图像特征划分为多个低维图像特征,然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较,确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征,能够提高特征匹配的准确率,另外,由于利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征,因此还提高了高维图像特征匹配的效率。
图5为本发明高维图像特征匹配方法的另一个实施例的流程示意图。其中,实验所用计算机配置为Intel Xeon E5-2630,主频2.30GHz,64G内存。该方法包括以下步骤:
在步骤510,提取数据库中图像的高维图像特征。例如,使用深度神经网络,对20万女装图像提取20万高维图像特征。
在步骤512,提取待检索图像的高维图像特征。
在步骤520,将数据库中图像的高维图像特征划分为多个低维图像特征。例如,深度神经网络每个输出层可获取的特征达到4096维,线性组合为8192维特征,将这8192维特征划分为128个64维子特征。
在步骤522,将待检索图像的高维图像特征划分为多个低维图像特征。即将待检索图像的每个8192维特征同样划分为128个64维子特征。
在步骤530,对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。
其中,可以使用kmeans++方法选择kmeans聚类算法的初始聚类中心。kmeans++算法根据点到最近中心的概率比值选择初始中心,步骤如下:
(1)从数据点X中随机选择一个初始中心c1=x。
(2)设置D(x)作为从一个数据点x到最近中心的最短欧氏距离。
(3)选择下一个中心ci,其中ci=x'∈X,其概率值为D(x')2/ΣD(x)2。
(4)重复(2)和(3)直到选择所有的k个中心。
在一个实施例中,还可以选择固定栅格距离的点作为初始聚类中心,或随机初始化方法、遗传算法初始化方法等选择初始聚类中心。
kmeans聚类法是一种无监督聚类算法。该算法的步骤如下:
(1)从n个数据矢量中任意选择k个矢量作为初始聚类中心。
(2)对于其他矢量,根据它们到这些聚类中心的欧氏距离,分别将它们分配给与其最近的聚类。
(3)根据聚类均值计算新的聚类中心,聚类均值
Figure BDA0001247821230000111
为属于聚类i的矢量个数,px为属于聚类i的矢量。
(4)如此循环,直到目标函数值满足终止条件,最终将数据分为k类。其中,可以采用误差平方和准则函数作为目标函数:
Figure BDA0001247821230000112
其中,xj为数据矢量,Si为xj所处的聚类,ui为聚类Si中点的平均值。
在步骤540,将数据库中图像的各低维图像特征的各层聚类中心关联倒排文件,以便在在线检索时能够快速查找到低维图像特征的聚类中心。
在步骤550,将各个低维图像特征与各层聚类中心进行比较实现特征量化。
在步骤560,利用TF-IDF对待检索图像与数据库中图像的低维图像特征相似度进行评分。
在步骤570,利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。
在该实施例中,若检索返回的第一个结果为正确匹配,则记为结果准确,实验结果表面检索准确率高达99.9470%。检索时间小于0.015秒,其中步骤550的特征量化时间约为0.001秒,步骤560的评分时间约为0.010秒,步骤570的获取前8个评分图像时间约为0.003秒。
在另一个实施例中,使用深度神经网络,对100万女装图像提取100万8192维图像特征。将这8192维特征划分为128个64维子特征,使用上述实施例中的方法进行分层聚类。检索环节,使用所有的100万高维图像特征进行检索,每个8192维特征划分为128个64维子特征。检索准确率高达96.2927%。检索时间小于0.025秒,其中步骤550的特征量化时间约为0.002秒,步骤560的评分时间约为0.008秒,步骤570的获取前8个评分图像时间约为0.012秒。
通过上述各实施例中,将高维图像特征划分为多个低维图像特征,使之能够通过分层kmeans方法进行检索,由于使用kmeans++算法选择初始聚类中心,与随机选择初始聚类中心相比,提高了聚类效果和聚类效率,另外,使用快速选择算法结合插入排序法获取前N个评分对应图像,提高算法速度。
图6为本发明高维图像特征匹配装置的一个实施例的结构示意图。该装置包括第一高维图像特征提取单元610、第一低维图像特征划分单元620、特征比较单元630、特征匹配确定单元640。
第一高维图像特征提取单元610用于提取待检索图像的高维图像特征。其中,可以使用深度神经网络提取待检索图像的高维图像特征。
第一低维图像特征划分单元620用于将待检索图像的高维图像特征划分为多个低维图像特征。
特征比较单元630用于将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较。其中,可以预先提取数据库中图像的高维图像特征,将数据库中图像的高维图像特征划分为多个低维图像特征,然后对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心,然后将待检索图像的每个低维图像特征与各层聚类中心进行比较。
特征匹配确定单元640用于根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。例如,先对图像特征的相似度进行评分,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。
在该实施例中,将待检索图像的高维图像特征划分为多个低维图像特征,然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较,确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征,能够提高特征匹配的准确率,并且提高了高维图像特征匹配的效率。
图7为本发明高维图像特征匹配装置的另一个实施例的结构示意图。该装置包括第一高维图像特征提取单元740、第一低维图像特征划分单元750、特征比较单元760、特征匹配确定单元770。其中,数据库中图像的低维图像特征的各层聚类中心通过第二高维图像特征提取单元710、第二低维图像特征划分单元720和聚类中心确定单元730进行确定。
其中,第二高维图像特征提取单元710用于提取数据库中图像的高维图像特征。
第二低维图像特征划分单元720用于将数据库中图像的高维图像特征划分为多个低维图像特征。其中,数据库图像和待检索图像的高维图像特征划分方式可以相同。
聚类中心确定单元730用于对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。其中,可以对数据库中图像的低维图像特征组成的集合进行无监督训练,定义聚类的分叉因子为k,k为自然数。在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心,根据点到最近中心的概率比值确定k个初始聚类中心。然后利用kmeans聚类算法将数据库中图像的低维图像特征组成的集合划分为k个集合,作为kmeans树的第一层,然后利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分,直到达到kmeans树的叶子层,根据聚类均值计算数据库中图像的低维图像特征的每一层的每个集合的聚类中心。
第一高维图像特征提取单元740用于提取待检索图像的高维图像特征。
第一低维图像特征划分单元750用于将待检索图像的高维图像特征划分为多个低维图像特征。
特征比较单元760用于将各个低维图像特征与各层聚类中心进行比较实现特征量化。将待检索图像的每个低维图像特征,从数据库中图像的低维图像特征的kmeans树的第一层开始,与每一层k个聚类中心比较,确定与待检索图像的每个低维图像特征距离最近的聚类中心,递归与距离最近的聚类中心的子聚类中心进行比较,直到达到kmeans树的叶子层,该过程实现了每个低维图像特征的量化。
如果kmeans树包含L层,则对于一个低维图像特征而言,量化共需要的计算成本为kL次距离计算,当k不是很大时,量化过程非常迅速。
特征匹配确定单元770用于将待检索图像的每个低维图像特征,从数据库中图像的低维图像特征的kmeans树的第一层开始,与每一层k个聚类中心比较,确定与待检索图像的每个低维图像特征距离最近的聚类中心;递归与距离最近的聚类中心的子聚类中心进行比较,直到达到kmeans树的叶子层。
特征匹配确定单元770还用于利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。
其中,计算得到待检索图像与数据库图像的相似度评分之后,需要获取前N个评分对应的图像作为检索结果。常用方法是对评分进行排序,获得前N个的图像。这种方法在数据库图像较多时效率低下,即使使用快速排序方法,时间复杂度也过高,为O(nlogn)。如检索100万的图像数据库,排序所用时间超过35秒。
而在本该实施例中可以采用快速选择算法,寻找第N大的相似度评分,同时可获得未排序的前N大的相似度评分。通常N<10,因此使用插入排序法对这N个相似度评分进行排序,获得检索结果。快速选择算法复杂度为O(n),插入排序消耗时间可忽略不计,由此可大幅度提高检索效率。
为了在在线检索时能够快速查找到低维图像特征的聚类中心,还可以将数据库中图像的各低维图像特征的各层聚类中心关联倒排文件。
在该实施例中,通过离线训练和在线检索,分别将数据库中图像和待检索图像的高维图像特征划分为多个低维图像特征,然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较,确定待检索图像与数据库中图像的低维图像特征相似度,从而在数据库中检索出与待检索图像的高维图像特征匹配的特征,能够提高特征匹配的准确率,另外,由于利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征,因此还提高了高维图像特征匹配的效率。
图8为本发明高维图像特征匹配装置的再一个实施例的结构示意图。该装置包括存储器810和处理器820。其中:
存储器810可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储图1-4所对应实施例中的指令。
处理器820耦接至存储器810,可以作为一个或多个集成电路来实施,例如微处理器或微控制器。该处理器820用于执行存储器中存储的指令,能够提高特征匹配的准确率,并且还提高了高维图像特征匹配的效率。
在一个实施例中,还可以如图9所示,高维图像特征匹配装置900包括存储器910和处理器920。处理器920通过BUS总线930耦合至存储器910。该APP后台系统900还可以通过存储接口940连接至外部存储装置950以便调用外部数据,还可以通过网络接口960连接至网络或者另外一台计算机系统(未标出)。此处不再进行详细介绍。
在该实施例中,通过存储器存储数据指令,再通过处理器处理上述指令,能够提高特征匹配的准确率,并且还提高了高维图像特征匹配的效率。
在另一个实施例中,一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现图1、2、4、5所对应实施例中的方法的步骤。本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
至此,已经详细描述了本发明。为了避免遮蔽本发明的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本发明的方法以及装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

Claims (14)

1.一种高维图像特征匹配方法,包括:
提取待检索图像的高维图像特征;
将所述待检索图像的高维图像特征划分为多个低维图像特征,多个低维图像特征的维数之和等于高维图像特征的维数;
将所述待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较;
根据比较结果确定所述待检索图像与所述数据库中图像的低维图像特征相似度,利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与所述待检索图像的高维图像特征匹配的特征,其中,采用快速选择算法寻找第N大的相似度评分对应的图像,同时获得未排序的前N大的相似度评分对应的图像,使用插入排序法对N个相似度评分对应的图像进行排序。
2.根据权利要求1所述的方法,其中,所述数据库中图像的低维图像特征的各层聚类中心通过以下方法进行确定:
提取所述数据库中图像的高维图像特征;
将所述数据库中图像的高维图像特征划分为多个低维图像特征;
对所述数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。
3.根据权利要求2所述的方法,其中,所述数据库中图像的各低维图像特征的各层聚类中心与倒排文件关联。
4.根据权利要求2所述的方法,其中,对所述数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心包括:
对所述数据库中图像的低维图像特征组成的集合进行无监督训练,其中,定义聚类的分叉因子为k;
在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心;
根据点到最近中心的概率比值确定k个初始聚类中心;
利用kmeans聚类算法将所述数据库中图像的低维图像特征组成的集合划分为k个集合,作为kmeans树的第一层;
利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分,直到达到kmeans树的叶子层;
根据聚类均值计算所述数据库中图像的低维图像特征的每一层的每个集合的聚类中心。
5.根据权利要求4所述的方法,其中,将所述待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较包括:
将所述待检索图像的每个低维图像特征,从所述数据库中图像的低维图像特征的kmeans树的第一层开始,与每一层k个聚类中心比较,确定与所述待检索图像的每个低维图像特征距离最近的聚类中心;
递归与距离最近的聚类中心的子聚类中心进行比较,直到达到kmeans树的叶子层。
6.根据权利要求1-5任一所述的方法,还包括:
利用TF-IDF词频-逆向文件频率算法对所述待检索图像与所述数据库中图像的低维图像特征相似度进行评分。
7.一种高维图像特征匹配装置,包括:
第一高维图像特征提取单元,用于提取待检索图像的高维图像特征;
第一低维图像特征划分单元,用于将所述待检索图像的高维图像特征划分为多个低维图像特征,多个低维图像特征的维数之和等于高维图像特征的维数;
特征比较单元,用于将所述待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较;
特征匹配确定单元,用于根据比较结果确定所述待检索图像与所述数据库中图像的低维图像特征相似度,利用快速选择算法结合插入排序法获取评分最高的N个图像,将评分最高的N个图像的高维图像特征作为与所述待检索图像的高维图像特征匹配的特征,其中,采用快速选择算法寻找第N大的相似度评分对应的图像,同时获得未排序的前N大的相似度评分对应的图像,使用插入排序法对N个相似度评分对应的图像进行排序。
8.根据权利要求7所述的装置,其中,所述数据库中图像的低维图像特征的各层聚类中心通过以下单元进行确定:
第二高维图像特征提取单元,用于提取所述数据库中图像的高维图像特征;
第二低维图像特征划分单元,用于将所述数据库中图像的高维图像特征划分为多个低维图像特征;
聚类中心确定单元,用于对所述数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。
9.根据权利要求8所述的装置,其中,所述数据库中图像的各低维图像特征的各层聚类中心与倒排文件关联。
10.根据权利要求8所述的装置,其中,所述聚类中心确定单元用于对所述数据库中图像的低维图像特征组成的集合进行无监督训练,其中,定义聚类的分叉因子为k;在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心;根据点到最近中心的概率比值确定k个初始聚类中心;利用kmeans聚类算法将所述数据库中图像的低维图像特征组成的集合划分为k个集合,作为kmeans树的第一层;利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分,直到达到kmeans树的叶子层;根据聚类均值计算所述数据库中图像的低维图像特征的kmeans树的每一层的每个集合的聚类中心。
11.根据权利要求10的装置,其中,所述特征匹配确定单元用于将所述待检索图像的每个低维图像特征,从所述数据库中图像的低维图像特征的kmeans树的第一层开始,与每一层k个聚类中心比较,确定与所述待检索图像的每个低维图像特征距离最近的聚类中心;递归与距离最近的聚类中心的子聚类中心进行比较,直到达到kmeans树的叶子层。
12.根据权利要求7-11任一所述的装置,其中,所述特征匹配确定单元还用于利用TF-IDF词频-逆向文件频率算法对所述待检索图像与所述数据库中图像的低维图像特征相似度进行评分。
13.一种高维图像特征匹配装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至6任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至6任一项所述的方法的步骤。
CN201710158472.3A 2017-03-17 2017-03-17 高维图像特征匹配方法和装置 Active CN108629345B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201710158472.3A CN108629345B (zh) 2017-03-17 2017-03-17 高维图像特征匹配方法和装置
PCT/CN2017/119489 WO2018166273A1 (zh) 2017-03-17 2017-12-28 高维图像特征匹配方法和装置
US16/494,632 US11210555B2 (en) 2017-03-17 2017-12-28 High-dimensional image feature matching method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710158472.3A CN108629345B (zh) 2017-03-17 2017-03-17 高维图像特征匹配方法和装置

Publications (2)

Publication Number Publication Date
CN108629345A CN108629345A (zh) 2018-10-09
CN108629345B true CN108629345B (zh) 2021-07-30

Family

ID=63522754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710158472.3A Active CN108629345B (zh) 2017-03-17 2017-03-17 高维图像特征匹配方法和装置

Country Status (3)

Country Link
US (1) US11210555B2 (zh)
CN (1) CN108629345B (zh)
WO (1) WO2018166273A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10885627B2 (en) * 2018-04-03 2021-01-05 Nec Corporation Unsupervised neighbor-preserving embedding for image stream visualization and anomaly detection
CN109376940B (zh) * 2018-11-02 2021-08-17 中国水利水电科学研究院 获取降雨过程中的降雨时空分布规律的方法和装置
CN110472079B (zh) * 2019-07-08 2022-04-05 杭州未名信科科技有限公司 目标图像的检索方法、装置、设备及存储介质
CN111581413B (zh) * 2020-04-03 2023-02-28 北京联合大学 一种面向高维图像数据检索的数据过滤方法及系统
CN111651624B (zh) * 2020-06-11 2023-09-19 浙江大华技术股份有限公司 一种图像检索方法及装置
CN113297331B (zh) * 2020-09-27 2022-09-09 阿里云计算有限公司 数据存储方法及装置、数据查询方法及装置
CN116912925A (zh) * 2023-09-14 2023-10-20 齐鲁空天信息研究院 人脸识别方法、装置、电子设备及介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102856A (ja) 2006-10-20 2008-05-01 Matsushita Electric Ind Co Ltd パターン識別装置およびパターン識別方法
CN101211355B (zh) * 2006-12-30 2010-05-19 中国科学院计算技术研究所 一种基于聚类的图像查询方法
CN100483445C (zh) 2007-04-19 2009-04-29 上海交通大学 基于几何保存的人脸子空间识别方法
US8295575B2 (en) 2007-10-29 2012-10-23 The Trustees of the University of PA. Computer assisted diagnosis (CAD) of cancer using multi-functional, multi-modal in-vivo magnetic resonance spectroscopy (MRS) and imaging (MRI)
CN101989326B (zh) * 2009-07-31 2015-04-01 三星电子株式会社 人体姿态识别方法和装置
CN102004917B (zh) 2010-12-17 2012-04-18 南方医科大学 一种图像边缘近邻描述特征算子的提取方法
CN102123172B (zh) * 2011-02-25 2014-09-10 南京邮电大学 一种基于神经网络聚类优化的Web服务发现的实现方法
CN102073748B (zh) 2011-03-08 2012-07-25 武汉大学 一种基于视觉关键词的遥感影像语义检索方法
CN102760128A (zh) * 2011-04-26 2012-10-31 华东师范大学 一种基于智能客服机器人交互的电信领域套餐推荐方法
JP5923744B2 (ja) * 2012-05-24 2016-05-25 パナソニックIpマネジメント株式会社 画像検索システム、画像検索方法及び検索装置
CN103034963B (zh) * 2012-11-28 2017-10-27 东南大学 一种基于相关性的服务选择系统及选择方法
CN104008174B (zh) * 2014-06-04 2017-06-06 北京工业大学 一种海量图像检索的隐私保护索引生成方法
CN104239859B (zh) 2014-09-05 2017-09-26 西安电子科技大学 基于结构化因子分析的人脸识别方法
CN104765764A (zh) 2015-02-06 2015-07-08 南京理工大学 一种基于大规模图像检索方法
CN104699781B (zh) 2015-03-12 2018-07-17 西安电子科技大学 基于双层锚图散列的sar图像检索方法
CN104778284B (zh) * 2015-05-11 2017-11-21 苏州大学 一种空间图像查询方法和系统
CN106326288B (zh) * 2015-06-30 2019-12-03 阿里巴巴集团控股有限公司 图像搜索方法及装置
CN105095435A (zh) 2015-07-23 2015-11-25 北京京东尚科信息技术有限公司 一种图像高维特征的相似比较方法及装置
CN105912611B (zh) * 2016-04-05 2019-04-26 中国科学技术大学 一种基于cnn的快速图像检索方法

Also Published As

Publication number Publication date
US20200026958A1 (en) 2020-01-23
US11210555B2 (en) 2021-12-28
CN108629345A (zh) 2018-10-09
WO2018166273A1 (zh) 2018-09-20

Similar Documents

Publication Publication Date Title
CN108629345B (zh) 高维图像特征匹配方法和装置
CN110188223B (zh) 图像处理方法、装置及计算机设备
JP6544756B2 (ja) 画像の高次元特徴の類似性を比較するための方法及びデバイス
US9043316B1 (en) Visual content retrieval
CN107066555B (zh) 面向专业领域的在线主题检测方法
US11704487B2 (en) System and method for fashion attributes extraction
Yang et al. Re-ranking by multi-feature fusion with diffusion for image retrieval
CA3059929C (en) Text searching method, apparatus, and non-transitory computer-readable storage medium
US20150066957A1 (en) Image search device, image search method, program, and computer-readable storage medium
CN110825894A (zh) 数据索引建立、数据检索方法、装置、设备和存储介质
CN111859004A (zh) 检索图像的获取方法、装置、设备及可读存储介质
CN109299357B (zh) 一种老挝语文本主题分类方法
CN105760875B (zh) 基于随机森林算法的判别二进制图像特征相似实现方法
Faheema et al. Feature selection using bag-of-visual-words representation
Rustam et al. Correlated based SVM-RFE as feature selection for cancer classification using microarray databases
CN112182264A (zh) 地标信息的确定方法、装置、设备及可读存储介质
CN115827990B (zh) 搜索方法及装置
JP6017277B2 (ja) 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法
JP5833499B2 (ja) 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム
CN110209895B (zh) 向量检索方法、装置和设备
Cummins et al. Evolving general term-weighting schemes for information retrieval: Tests on larger collections
WO2015109781A1 (zh) 基于期望最大确定统计模型参数的方法和装置
JP7272846B2 (ja) 文書分析装置および文書分析方法
KR20220125422A (ko) 이미지 분류 기반 유명인 식별 방법 및 장치
Iscen et al. Scaling group testing similarity search

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant