CN112966718A - 图像识别方法、装置及通信设备 - Google Patents
图像识别方法、装置及通信设备 Download PDFInfo
- Publication number
- CN112966718A CN112966718A CN202110159671.2A CN202110159671A CN112966718A CN 112966718 A CN112966718 A CN 112966718A CN 202110159671 A CN202110159671 A CN 202110159671A CN 112966718 A CN112966718 A CN 112966718A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- sift
- cluster center
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000004891 communication Methods 0.000 title claims abstract description 38
- 238000004590 computer program Methods 0.000 claims description 23
- 238000012216 screening Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 description 7
- 238000012856 packing Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本申请适用于图像识别技术领域,提供了图像识别方法、装置及通信设备,包括:基于待识别图像的颜色直方图和预设的簇中心,对所述待识别图像的每个尺度不变特征变换SIFT特征进行匹配,所述预设的簇中心通过对样本图像的颜色直方图进行聚类后确定;从匹配得到的各个特征点对中删除不符合条件的特征点对;在符合条件的特征点对中,分别确定所述样本图像的SIFT特征所对应的样本图像的标识;将最多样本图像的SIFT特征所对应的样本图像的标识作为所述待识别图像的标识。通过上述方法,能够快速、准确地确定待识别图像的标识。
Description
技术领域
本申请属于图像识别技术领域,尤其涉及图像识别方法、装置、通信设备及计算机可读存储介质。
背景技术
图像识别技术,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。
现有的图像识别方法可基于深度学习实现,也可基于传统的特征匹配来实现。若希望基于深度学习进行图像识别,则需要采集大量数据训练模型,在新增图像后,也需要结合新增图像对模型再次进行训练,且模型再次训练的训练成本几乎和该模型第一次训练时的训练成本相同。若希望采用传统的特征匹配进行图像识别,则需要采集特征点,并搜索特征库中是否存在与采集的特征点相同的特征点,而待识别的特征点通常非常多,故需要花费较多的搜索时间。
故,需要提供一种新的方法,以解决上述技术问题。
发明内容
本申请实施例提供了一种图像识别方法,可以快速、准确地确定待识别图像的标识。
第一方面,本申请实施例提供了一种图像识别方法,包括:
基于待识别图像的颜色直方图和预设的簇中心,对所述待识别图像的每个尺度不变特征变换SIFT特征进行匹配,所述预设的簇中心通过对样本图像的颜色直方图进行聚类后确定;
从匹配得到的各个特征点对中删除不符合条件的特征点对,其中,一个特征点对包括一个第一特征和一个第二特征,所述第一特征为所述待识别图像的SIFT特征,所述第二特征为所述簇中心所对应的SIFT特征集合中的样本图像的SIFT特征,且所述第一特征与所述第二特征的距离最小;
在符合条件的特征点对中,分别确定所述样本图像的SIFT特征所对应的样本图像的标识;
将最多样本图像的SIFT特征所对应的样本图像的标识作为所述待识别图像的标识。
第二方面,本申请实施例提供了一种图像识别装置,包括:
特征匹配单元,用于基于待识别图像的颜色直方图和预设的簇中心,对所述待识别图像的每个尺度不变特征变换SIFT特征进行匹配,所述预设的簇中心通过对样本图像的颜色直方图进行聚类后确定;
特征删除单元,用于从匹配得到的各个特征点对中删除不符合条件的特征点对,其中,一个特征点对包括一个第一特征和一个第二特征,所述第一特征为所述待识别图像的SIFT特征,所述第二特征为所述簇中心所对应的SIFT特征集合中的样本图像的SIFT特征,且所述第一特征与所述第二特征的距离最小;
特征对应的样本图像的标识确定单元,用于在符合条件的特征点对中,分别确定所述样本图像的SIFT特征所对应的样本图像的标识;
待识别图像的标识确定单元,用于将最多样本图像的SIFT特征所对应的样本图像的标识作为所述待识别图像的标识。
第三方面,本申请实施例提供了一种通信设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在通信设备上运行时,使得通信设备执行上述第一方面所述的方法。
本申请实施例与现有技术相比存在的有益效果是:
本申请实施例中,由于对待识别图像的SIFT特征进行匹配是基于待识别图像的颜色直方图和预设的簇中心,也即是按照根据颜色直方图进行聚类得到的不同的簇中心进行匹配,而同属于一个簇的SIFT特征为匹配的特征的概率更高,因此,极大提高了匹配速度。同时,由于还从匹配得到的各个特征点对中删除不符合条件的特征点对,因此,减少了不符合条件的特征点对的干扰,且由于特征点对中的两个特征的距离最小,因此,特征点对中样本图像的SIFT特征所对应的样本图像的标识为待识别图像的标识的概率较高,从而将最多样本图像的SIFT特征所对应的样本图像的标识作为所述待识别图像的标识能够保证得到的识别结果的准确性。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1是本申请一实施例提供的第一种图像识别方法的流程示意图;
图2是本申请一实施例提供的第二种图像识别方法的流程示意图;
图3是本申请一实施例提供的一种预览界面的示意图;
图4是本申请一实施例提供的一种图像识别装置的结构示意图;
图5是本申请另一实施例提供的通信设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。
现有的图像识别方法中,若采用深度学习的方式实现,则无论是模型的首次训练还是模型的再次训练,均需要较大的训练成本,若直接采用传统的特征匹配的方式实现,则通常需要较长的搜索时间。考虑到本申请实施例需要识别的图像是随着时间的增加而不断增加,故在本申请实施例提供的图像识别方法中,采用改进后的特征匹配对图像进行识别,以避免不断对深度学习的模型进行多次训练。
下面结合附图对本申请实施例提供的图像识别方法进行描述。
图1示出了本申请实施例提供的第一种图像识别的流程图,该图像识别方法可应用于通信设备中,该通信设备可为服务器、用户终端等,详述如下:
步骤S11,基于待识别图像的颜色直方图和预设的簇中心,对待识别图像的每个尺度不变特征变换SIFT特征进行匹配,预设的簇中心通过对样本图像的颜色直方图进行聚类后确定。
其中,待识别图像为需要进行图像识别的图像,比如,可以为包装盒的正面图像或反面图像,进一步地,可以为同一公司生产的包装盒的正面图像或反面图像,该包装盒可以为机器人的包装盒。
其中,待识别图像的颜色直方图可以为红绿蓝(Red Green Blue,RGB)直方图,此时,该RGB直方图相当于3*像素值的向量,3为通道数。
本实施例中,对待识别图像的每个SIFT特征进行匹配,是指在各个预设的簇中心所对应的样本图像的SIFT特征中查找匹配的SIFT特征,该SIFT特征为采用SIFT算法提取到的特征。
在本实施例中,预先对样本图像的颜色直方图进行聚类运算,聚类中心的个数默认为3,当然,该聚类中心的个数可根据实际情况设定,比如,若所有的样本图像不是大面积黄色就是大面积蓝色,那么就可以设置聚类中心的个数为2。这里的样本图像为需要识别的图像,例如,若希望能够识别包装盒的图像,则样本图像也应包含包装盒的图像。通过对所有样本图像进行聚类运算后,得到与聚类中心的个数相等的簇中心,该簇中心即为上述预设的簇中心。本实施例中,还预先提取每一张样本图像的尺度不变特征变换(ScaleInvariant Feature Transform,SIFT)特征,这样,当得到n个簇中心后,样本图像的SIFT特征也被分别分到n个SIFT特征集合中,即一个簇中心与一个SIFT特征集合对应,一个SIFT特征集合用于存储其对应的簇中心所对应的样本图像的SIFT特征。上述的SIFT特征为采用SIFT算法所提取到的特征。在一些实施例中,假设限定识别某个公司生产的包装盒,考虑到包装盒的正面图像都有相同的图标(Logo)部分,而这部分信息对后续的SIFT特征匹配没有贡献(因为都是同一个公司的,所以该公司的识别结果并不是用户关心的,故无需得到Logo的识别结果),反而对匹配过程进行干扰,因此,为了提高匹配的准确率以及匹配速度,则将图像中与包装盒中Logo部分对应的图像信息抹去,比如,采用纯色(如白色)代替包装盒中Logo部分对应的图像信息。之后,再将图像信息处理后的图像作为样本图像。通过上述处理,解决了每个产品包装盒的相似区域带来的特征匹配时的干扰,提高了后续特征匹配的速度和准确率,且新增图像时,重新训练的成本较低。
在一些实施例中,上述预设的簇中心、SIFT特征集合中的SIFT特征均存入数据库中,该数据库可作为一个特征底库。
在一些实施例中,上述聚类运算为k均值聚类算法(k-means clusteringalgorithm,Kmeans),通过Kmeans聚类算法,能够快速得到聚类结果。
步骤S12,从匹配得到的各个特征点对中删除不符合条件的特征点对,其中,一个特征点对包括一个第一特征和一个第二特征,第一特征为待识别图像的SIFT特征,第二特征为簇中心所对应的SIFT特征集合中的样本图像的SIFT特征,且第一特征与第二特征的距离最小。
其中,不符合条件的特征点对是指距离不符合要求的特征点对,这里的距离可以为欧式距离。
在本实施例中,假设被选择的簇中心为簇中心Y,该Y所对应的SIFT特征集合为S,则匹配得到的特征点对中,第二特征为S中的SIFT特征。
步骤S13,在符合条件的特征点对中,分别确定样本图像的SIFT特征所对应的样本图像的标识。
其中,样本图像的标识可以用序列号表示,或者用文字表示,只需要不同的标识能够唯一表示样本图像即可。在一些实施例中,将各个SIFT特征与样本图像的标识的对应关系存入特征底库中。
本实施例中,从匹配得到的各个特征点对中删除不符合条件的特征点对后,将得到符合条件的特征点对,由于任一个特征点对中均有一个特征是样本图像的SIFT特征,而样本图像的SIFT特征与哪个样本图像对应是已知的,因此,可确定出特征点对中各个样本图像的SIFT特征所对应的样本图像的标识。
步骤S14,将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识。
若样本图像为机器人的包装盒,那么样本图像的标识可以为包装盒上的序列号,例如,若机器人的包装盒的序列号为111,那么该“111”用于指示该包装盒内的机器人对应的序列号是111。
由于特征点对中的两个特征的距离最近,因此,特征点对中的样本图像的SIFT特征所对应的样本图像的标识也为待识别图像的SIFT特征所对应的标识的概率较高,也即,最多样本图像的SIFT特征所对应的样本图像的标识为待识别图像的标识也较高。例如,假设S’中有10个特征点对,其中,有6个第二特征来自于标识为“id=1”的样本图像,有2个第二特征来自于标识为“id=2”的样本图像,有2个第二特征来自于标识为“id=3”的样本图像,那么认为待识别图像的标识为“id=1”。
在本申请实施例中,由于对待识别图像的SIFT特征进行匹配是基于待识别图像的颜色直方图和预设的簇中心,也即是按照根据颜色直方图进行聚类得到的不同的簇中心进行匹配,而同属于一个簇的SIFT特征为匹配的特征的概率更高,因此,极大提高了匹配速度。同时,由于还从匹配得到的各个特征点对中删除不符合条件的特征点对,因此,减少了不符合条件的特征点对的干扰,且由于特征点对中的两个特征的距离最小,因此,特征点对中样本图像的SIFT特征所对应的样本图像的标识为待识别图像的标识的概率较高,从而将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识能够保证得到的识别结果的准确性。
图2示出了本申请实施例提供的第二种图像识别方法的流程图,在本实施例中,主要对步骤S11进行细化,步骤S24~步骤26分别与步骤S12~步骤14相同,此处不再赘述。
步骤S21,计算待识别图像的颜色直方图与预设的簇中心的距离,得到簇心距离。
本实施例中,计算待识别图像的颜色直方图与预设的簇中心的距离,比如,若预设的簇中心有2个,那么,分别计算待识别图像的颜色直方图与预设的2个簇中心的距离,得到2个簇心距离。由于簇中心是通过对样本图像的颜色直方图进行聚类后确定,因此,一个簇中心也相当于一个颜色直方图,故可结合通道计算出两个颜色直方图之间的距离,得到簇心距离。当簇心距离越小,表明这两个颜色直方图对应的颜色越接近。
步骤S22,若最小的簇心距离小于预设的直方图距离,则在得到最小的簇心距离的簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配,其中,一个SIFT特征集合与一个簇中心对应,SIFT特征集合用于存储属于同一聚类的颜色直方图所对应的样本图像的SIFT特征。
其中,簇心距离的个数与簇中心的个数相等,预设的直方图距离(假设为T)根据大量数据测试后统计得到,大于T的簇心距离所对应的图像往往不能根据颜色直方图实现正确分类。
本实施例中,从各个簇心距离中确定最小的簇心距离,再将该最小的簇心距离与预设的直方图距离比较,而簇心距离越小表明两个颜色直方图的颜色越接近,也即,将颜色最接近的两个颜色直方图对应的簇心距离与预设的直方图距离比较(而颜色越接近表明两者为相同图像的概率越高,也即越有利于后续得到准确的识别结果),并在最小的簇心距离小于预设的直方图距离时,在得到最小的簇心距离的簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配。由于不会直接在所有簇中心所对应的SIFT特征集合中进行匹配,因此,减少了匹配的数据量,从而提高了匹配速度。
具体地,若待识别图像的颜色直方图与簇中心Y的距离为最小的簇心距离,即确定出待识别图像的颜色直方图与簇中心Y的颜色直方图很相似,则只在该簇中心Y所对应的SIFT特征集合中,查找与该待识别图像的SIFT特征匹配的SIFT特征,而不在其他簇中心所对应的SIFT特征集合中查找,从而极大提高了匹配速度。
需要指出的是,上述对每个待识别图像的SIFT特征进行匹配可采用暴力匹配法进行匹配,也可以采用通过其他匹配法进行匹配。
步骤S23,若最小的簇心距离不小于预设的直方图距离,则分别在各个簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配。
具体地,若最小的簇心距离不小于预设的直方图距离,表明没有找到与待识别图像的颜色直方图特别相似的颜色直方图,此时,通过扩大匹配范围来提高匹配结果的准确性。
需要指出的是,上述对每个待识别图像的SIFT特征进行匹配可采用暴力匹配法进行匹配,也可以通过其他匹配法进行匹配。
步骤S24,从匹配得到的各个特征点对中删除不符合条件的特征点对,其中,一个特征点对包括一个第一特征和一个第二特征,第一特征为待识别图像的SIFT特征,第二特征为被选择的簇中心所对应的SIFT特征集合中的样本图像的SIFT特征,且第一特征与第二特征的距离最小。
步骤S25,在符合条件的特征点对中,分别确定样本图像的SIFT特征所对应的样本图像的标识。
步骤S26,将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识。
本申请实施例中,根据最小的簇心距离与预设的直方图距离的比较结果,来选择对待识别图像的SIFT特征进行匹配的匹配范围的大小,从而在保证匹配准确度的基础上提高匹配速度。
在一些实施例中,SIFT特征可采用K维空间树(K-dimensional tree,KD-tree)进行匹配,此时,步骤S24包括:
在得到最小的簇心距离的簇中心所对应的KD-tree中,对每个待识别图像的SIFT特征进行匹配,KD-tree由得到最小的簇心距离的簇中心所对应的SIFT特征集合训练得到。
本实施例中,可在得到簇中心对应的SIFT特征集合后,根据每个SIFT特征集合中的SIFT特征训练出对应的KD-tree,也即,一个簇中心与一个SIFT特征集合对应,一个簇中心也与一个KD-tree对应。进一步地,训练得到的各个KD-tree也存储在特征底库中。由于通过KD-tree对待识别图像的SIFT特征进行匹配,因此,能够有效提高SIFT特征的匹配速度。
在一些实施例中,步骤S12(或步骤S24)包括:
A1、确定匹配得到的各个特征点对中距离最小的特征点对。
A2、根据距离最小的特征点对的距离以及对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对。
上述A1和A2中,考虑到特征点对的距离过大时,这些特征点对通常为不符合条件的特征点对,因此,可先确定各个特征点对中距离的最小值,则根据该距离的最小值和预设的权重值确定一个数值(比如两者相乘后确定一个数值),再将其余特征点对(即非最小距离对应的特征点对)的距离分别与该数值比较,并将大于该数值的距离所对应的特征点对判定为不符合条件的特征点对,再删除不符合条件的特征点对。由于删除了不符合条件的特征点对,因此,有利于提高后续得到的识别结果的准确性。
在一些实施例中,考虑到实际情况中,距离最小的特征点对的距离可能很小,此时,仅根据距离最小的特征点对的距离和对应的权重值有可能导致特征点对被过度删除,此时,可根据经验设置一个点对距离阈值,此时,步骤A2包括:
A21、确定距离最小的特征点对的距离和预设的点对距离阈值中的较大值。
例如,假设距离最小的特征点对的距离为min_d,预设的点对距离阈值为exp_d,则根据下式取两者的较大值:max(min_d,exp_d)。
A22、根据确定的较大值和对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对。
其中,这里的权重值可设置为2,或3等。
本实施例中,可将确定的较大值和对应的权重值相乘(或相加等),得到一个数值,其他特征点对的距离与该数值比较,若大于该数值,则判定该距离对应的特征点对不符合要求,并删除。
在一些实施例中,若本申请实施例的通信设备具有摄像头,则在步骤S11(或步骤S21)之前,包括:
B1、显示预览界面,预览界面包括一预设大小的提示框,提示框的大小小于预览界面的大小。
B2、将提示框内的图像作为待识别图像。
上述B1和B2中,当用户希望拍摄物体并打开通信设备的摄像头,则该通信设备的显示屏将显示预览界面,且该预览界面内的提示框小于该预览界面本身。该提示框的大小根据经验确定,例如,若待识别图像为包装盒,则根据包装盒的大小确定提示框的大小。其中,打开通信设备的摄像头的方式可以为启动该通信设备的某个公司开发的小程序,再通过该小程序打开该通信设备的摄像头。
在一些实施例中,通过提示信息提示用户调整待拍摄物体与摄像头的距离,以使待拍摄物体对应的图像在提示框内。当通信设备检测到提示框内的图像抖动较小,表明用户不再调整待拍摄物体与摄像头的距离,此时,该通信设备自动执行拍摄动作,并将提示框内的图像作为待识别图像。或者,若通信设备检测到用户触碰预览界面上的拍摄按钮,则执行拍摄动作,并将提示框内的图像作为待识别图像。
需要指出的是,上述的提示信息可以为文字提示信息,也可以为语音提示信息,当为文字提示信息时,该文字提示信息可显示在预览界面上,当为语音提示信息时,该语音提示信息可通过通信设备的麦克风输出。
如图3所示,在一些实施例中,在除了提示框的预览界面上显示蒙版,该蒙版不是全透明的蒙版,比如,为半透明的蒙版(即蒙版的透明度为50%),进一步地,为了突出提示框内的图像信息,该蒙版为半透明的灰色蒙版。当然,蒙版的透明度除了可以是50%,还可以是其他数值,只需保证蒙版的透明度不是100%(即全透明)即可。
在一些实施例中,若本申请实施例的通信设备为服务器,则在步骤S11(或步骤S21)之前,包括:
接收用户终端发送的待识别图像。
其中,用户终端得到待识别图像的方式可采用上述步骤B1和B2所提供的方式,此处不再赘述。
在一些实施例中,通过进一步筛选符合条件的特征点对,以提高得到的识别结果的准确性,具体地,步骤S14(或步骤S26)包括:
C1、通过预设的筛选方法从符合条件的特征点对中筛选出可信的特征点对。
其中,预设的筛选方法可为随机抽样一致算法(Random Sample Consensus,RANSAC),通过RANSAC对符合条件的特征点对进行筛选后,得到的剩余的特征点对即为可信的特征点对。
C2、若可信的特征点对的数量大于预设的可信特征点数量,则将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识。
上述C1和C2中,只有在可信的特征点对的数量大于预设的可信特征点对数量后,才将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识。由于可信的特征点对的数量较多时,表明上述得到的特征点对中的两个SIFT特征匹配成功,此时,将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识,能够进一步提高得到的识别结果的准确性。
在一些实施例中,输出得到的样本图像的标识。当然,若可信的特征点对的数量不大于预设的可信特征点数量,则拒绝识别该待识别图像,输出拒识标识,比如,输出重新获取待识别图像的指示。在一些实施例中,若本申请实施例的通信设备为服务器,则将样本图像的标识发送至用户终端,或者,将拒识标识发送至用户终端。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例的图像识别方法,图4示出了本申请实施例提供的图像识别装置的结构框图,该图像识别装置可应用于通信设备中,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图4,该图像识别装置4包括:特征匹配单元41、特征删除单元42、特征对应的样本图像的标识确定单元43、待识别图像的标识确定单元44,其中:
特征匹配单元41,用于基于待识别图像的颜色直方图和预设的簇中心,对待识别图像的每个尺度不变特征变换SIFT特征进行匹配,预设的簇中心通过对样本图像的颜色直方图进行聚类后确定。
特征删除单元42,用于从匹配得到的各个特征点对中删除不符合条件的特征点对,其中,一个特征点对包括一个第一特征和一个第二特征,第一特征为待识别图像的SIFT特征,第二特征为簇中心所对应的SIFT特征集合中的样本图像的SIFT特征,且第一特征与第二特征的距离最小。
特征对应的样本图像的标识确定单元43,用于在符合条件的特征点对中,分别确定样本图像的SIFT特征所对应的样本图像的标识。
待识别图像的标识确定单元44,用于将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识。
本申请实施例中,由于对待识别图像的SIFT特征进行匹配是基于待识别图像的颜色直方图和预设的簇中心,也即是按照根据颜色直方图进行聚类得到的不同的簇中心进行匹配,而同属于一个簇的SIFT特征为匹配的特征的概率更高,因此,极大提高了匹配速度。同时,由于还从匹配得到的各个特征点对中删除不符合条件的特征点对,因此,减少了不符合条件的特征点对的干扰,且由于特征点对中的两个特征的距离最小,因此,特征点对中样本图像的SIFT特征所对应的样本图像的标识为待识别图像的标识的概率较高,从而将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识能够保证得到的识别结果的准确性。
在一些实施例中,特征匹配单元41,包括:
簇心距离计算模块,用于计算待识别图像的颜色直方图与预设的簇中心的距离,得到簇心距离;
第一特征匹配模块,用于若最小的簇心距离小于预设的直方图距离,则在得到最小的簇心距离的簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配,其中,一个SIFT特征集合与一个簇中心对应,SIFT特征集合用于存储属于同一聚类的颜色直方图所对应的样本图像的SIFT特征;
第二特征匹配模块,用于若最小的簇心距离不小于预设的直方图距离,则分别在各个簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配。
在一些实施例中,第一特征匹配模块在得到最小的簇心距离的簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配时,具体用于:
在得到最小的簇心距离的簇中心所对应的KD-tree中,对待识别图像的每个SIFT特征进行匹配,KD-tree由得到最小的簇心距离的簇中心所对应的SIFT特征集合训练得到。
在一些实施例中,特征删除单元42,包括:
距离最小的特征点对确定模块,用于确定匹配得到的各个特征点对中距离最小的特征点对。
特征点对匹配模块,用于根据距离最小的特征点对的距离以及对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对。
在一些实施例中,特征点对匹配模块,包括:
距离较大值确定模块,用于确定距离最小的特征点对的距离和预设的点对距离阈值中的较大值;
不符合条件的特征点对确定模块,用于根据确定的较大值和对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对。
在一些实施例中,该图像识别装置4还包括:
预览界面显示单元,用于显示预览界面,预览界面包括一预设大小的提示框,提示框的大小小于预览界面的大小;
待识别图像确定单元,用于将提示框内的图像作为待识别图像。
在一些实施例中,待识别图像的标识确定单元44包括:
可信的特征点对筛选模块,用于通过预设的筛选方法从符合条件的特征点对中筛选出可信的特征点对。
标识确定模块,用于若可信的特征点对的数量大于预设的可信特征点数量,则将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图5为本申请一实施例提供的通信设备的结构示意图。如图5所示,该实施例的通信设备5包括:至少一个处理器50(图5中仅示出一个处理器)、存储器51以及存储在存储器51中并可在至少一个处理器50上运行的计算机程序52,处理器50执行计算机程序52时实现上述任意各个方法实施例中的步骤:
基于待识别图像的颜色直方图和预设的簇中心,对待识别图像的每个尺度不变特征变换SIFT特征进行匹配,预设的簇中心通过对样本图像的颜色直方图进行聚类后确定;
从匹配得到的各个特征点对中删除不符合条件的特征点对,其中,一个特征点对包括一个第一特征和一个第二特征,第一特征为待识别图像的SIFT特征,第二特征为簇中心所对应的SIFT特征集合中的样本图像的SIFT特征,且第一特征与第二特征的距离最小;
在符合条件的特征点对中,分别确定样本图像的SIFT特征所对应的样本图像的标识;
将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识。
可选地,基于待识别图像的颜色直方图和预设的簇中心,对待识别图像的每个尺度不变特征变换SIFT特征进行匹配,包括:
计算待识别图像的颜色直方图与预设的簇中心的距离,得到簇心距离;
若最小的簇心距离小于预设的直方图距离,则在得到最小的簇心距离的簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配,其中,一个SIFT特征集合与一个簇中心对应,SIFT特征集合用于存储属于同一聚类的颜色直方图所对应的样本图像的SIFT特征;
若最小的簇心距离不小于预设的直方图距离,则分别在各个簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配。
可选地,在得到最小的簇心距离的簇中心所对应的SIFT特征集合中,对待识别图像的每个SIFT特征进行匹配,包括:
在得到最小的簇心距离的簇中心所对应的KD-tree中,对待识别图像的每个SIFT特征进行匹配,KD-tree由得到最小的簇心距离的簇中心所对应的SIFT特征集合训练得到。
可选地,从匹配得到的各个特征点对中删除不符合条件的特征点对,包括:
确定匹配得到的各个特征点对中距离最小的特征点对;
根据距离最小的特征点对的距离以及对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对。
可选地,根据距离最小的特征点对的距离以及对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对,包括:
确定距离最小的特征点对的距离和预设的点对距离阈值中的较大值;
根据确定的较大值和对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对。
可选地,在基于待识别图像的颜色直方图和预设的簇中心,对待识别图像的每个尺度不变特征变换SIFT特征进行匹配之前,包括:
显示预览界面,预览界面包括一预设大小的提示框,提示框的大小小于预览界面的大小;
将提示框内的图像作为待识别图像。
可选地,将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识,包括:
通过预设的筛选方法从符合条件的特征点对中筛选出可信的特征点对;
若可信的特征点对的数量大于预设的可信特征点数量,则将最多样本图像的SIFT特征所对应的样本图像的标识作为待识别图像的标识。
所述通信设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该通信设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是通信设备5的举例,并不构成对通信设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),该处理器50还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51在一些实施例中可以是所述通信设备5的内部存储单元,例如通信设备5的硬盘或内存。所述存储器51在另一些实施例中也可以是所述通信设备5的外部存储设备,例如所述通信设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述通信设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种网络设备,该网络设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/通信设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种图像识别方法,其特征在于,包括:
基于待识别图像的颜色直方图和预设的簇中心,对所述待识别图像的每个尺度不变特征变换SIFT特征进行匹配,所述预设的簇中心通过对样本图像的颜色直方图进行聚类后确定;
从匹配得到的各个特征点对中删除不符合条件的特征点对,其中,一个特征点对包括一个第一特征和一个第二特征,所述第一特征为所述待识别图像的SIFT特征,所述第二特征为所述簇中心所对应的SIFT特征集合中的样本图像的SIFT特征,且所述第一特征与所述第二特征的距离最小;
在符合条件的特征点对中,分别确定所述样本图像的SIFT特征所对应的样本图像的标识;
将最多样本图像的SIFT特征所对应的样本图像的标识作为所述待识别图像的标识。
2.如权利要求1所述的图像识别方法,其特征在于,所述基于待识别图像的颜色直方图和预设的簇中心,对所述待识别图像的每个尺度不变特征变换SIFT特征进行匹配,包括:
计算待识别图像的颜色直方图与预设的簇中心的距离,得到簇心距离;
若最小的簇心距离小于预设的直方图距离,则在得到所述最小的簇心距离的簇中心所对应的SIFT特征集合中,对所述待识别图像的每个SIFT特征进行匹配,其中,一个SIFT特征集合与一个所述簇中心对应,所述SIFT特征集合用于存储属于同一聚类的颜色直方图所对应的样本图像的SIFT特征;
若最小的簇心距离不小于所述预设的直方图距离,则分别在各个所述簇中心所对应的SIFT特征集合中,对所述待识别图像的每个SIFT特征进行匹配。
3.如权利要求2所述的图像识别方法,其特征在于,所述在得到所述最小的簇心距离的簇中心所对应的SIFT特征集合中,对所述待识别图像的每个SIFT特征进行匹配,包括:
在得到所述最小的簇心距离的簇中心所对应的KD-tree中,对所述待识别图像的每个SIFT特征进行匹配,所述KD-tree由得到所述最小的簇心距离的簇中心所对应的SIFT特征集合训练得到。
4.如权利要求1所述的图像识别方法,其特征在于,所述从匹配得到的各个特征点对中删除不符合条件的特征点对,包括:
确定匹配得到的各个特征点对中距离最小的特征点对;
根据所述距离最小的特征点对的距离以及对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对。
5.如权利要求4所述的图像识别方法,其特征在于,所述根据所述距离最小的特征点对的距离以及对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对,包括:
确定所述距离最小的特征点对的距离和预设的点对距离阈值中的较大值;
根据确定的所述较大值和对应的权重值,从匹配得到的各个特征点对中删除不符合条件的特征点对。
6.如权利要求1至5任一项所述的图像识别方法,其特征在于,在所述基于待识别图像的颜色直方图和预设的簇中心,对所述待识别图像的每个尺度不变特征变换SIFT特征进行匹配之前,包括:
显示预览界面,所述预览界面包括一预设大小的提示框,所述提示框的大小小于所述预览界面的大小;
将所述提示框内的图像作为待识别图像。
7.如权利要求1至5任一项所述的图像识别方法,其特征在于,所述将最多样本图像的SIFT特征所对应的样本图像的标识作为所述待识别图像的标识,包括:
通过预设的筛选方法从所述符合条件的特征点对中筛选出可信的特征点对;
若所述可信的特征点对的数量大于预设的可信特征点数量,则将最多样本图像的SIFT特征所对应的样本图像的标识作为所述待识别图像的标识。
8.一种图像识别装置,其特征在于,包括:
特征匹配单元,用于基于待识别图像的颜色直方图和预设的簇中心,对所述待识别图像的每个尺度不变特征变换SIFT特征进行匹配,所述预设的簇中心通过对样本图像的颜色直方图进行聚类后确定;
特征删除单元,用于从匹配得到的各个特征点对中删除不符合条件的特征点对,其中,一个特征点对包括一个第一特征和一个第二特征,所述第一特征为所述待识别图像的SIFT特征,所述第二特征为所述簇中心所对应的SIFT特征集合中的样本图像的SIFT特征,且所述第一特征与所述第二特征的距离最小;
特征对应的样本图像的标识确定单元,用于在符合条件的特征点对中,分别确定所述样本图像的SIFT特征所对应的样本图像的标识;
待识别图像的标识确定单元,用于将最多样本图像的SIFT特征所对应的样本图像的标识作为所述待识别图像的标识。
9.一种通信设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110159671.2A CN112966718B (zh) | 2021-02-05 | 2021-02-05 | 图像识别方法、装置及通信设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110159671.2A CN112966718B (zh) | 2021-02-05 | 2021-02-05 | 图像识别方法、装置及通信设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112966718A true CN112966718A (zh) | 2021-06-15 |
CN112966718B CN112966718B (zh) | 2023-12-19 |
Family
ID=76274276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110159671.2A Active CN112966718B (zh) | 2021-02-05 | 2021-02-05 | 图像识别方法、装置及通信设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966718B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093203A (zh) * | 2013-01-21 | 2013-05-08 | 信帧电子技术(北京)有限公司 | 一种人体再识别方法以及人体再识别系统 |
CN107451200A (zh) * | 2017-07-06 | 2017-12-08 | 西安交通大学 | 使用随机量化词汇树的检索方法及基于其的图像检索方法 |
CN110047142A (zh) * | 2019-03-19 | 2019-07-23 | 中国科学院深圳先进技术研究院 | 无人机三维地图构建方法、装置、计算机设备及存储介质 |
CN110399890A (zh) * | 2019-07-29 | 2019-11-01 | 厦门美图之家科技有限公司 | 图像识别方法、装置、电子设备及可读存储介质 |
CN111626150A (zh) * | 2020-05-11 | 2020-09-04 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 商品识别方法 |
-
2021
- 2021-02-05 CN CN202110159671.2A patent/CN112966718B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093203A (zh) * | 2013-01-21 | 2013-05-08 | 信帧电子技术(北京)有限公司 | 一种人体再识别方法以及人体再识别系统 |
CN107451200A (zh) * | 2017-07-06 | 2017-12-08 | 西安交通大学 | 使用随机量化词汇树的检索方法及基于其的图像检索方法 |
CN110047142A (zh) * | 2019-03-19 | 2019-07-23 | 中国科学院深圳先进技术研究院 | 无人机三维地图构建方法、装置、计算机设备及存储介质 |
CN110399890A (zh) * | 2019-07-29 | 2019-11-01 | 厦门美图之家科技有限公司 | 图像识别方法、装置、电子设备及可读存储介质 |
CN111626150A (zh) * | 2020-05-11 | 2020-09-04 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 商品识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112966718B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109284729B (zh) | 基于视频获取人脸识别模型训练数据的方法、装置和介质 | |
US8792722B2 (en) | Hand gesture detection | |
US10949702B2 (en) | System and a method for semantic level image retrieval | |
US10824910B2 (en) | Image processing method, non-transitory computer readable storage medium and image processing system | |
CN111553428B (zh) | 用于训练判别模型的方法、装置、设备及可读存储介质 | |
EP2450808A2 (en) | Semantic visual search engine | |
CN107679449B (zh) | 嘴唇动作捕捉方法、装置及存储介质 | |
CN103353881B (zh) | 一种应用程序搜索方法及装置 | |
JP2018165926A (ja) | 類似画像検索装置 | |
CN112101360B (zh) | 一种目标检测方法、装置以及计算机可读存储介质 | |
WO2021114612A1 (zh) | 目标重识别方法、装置、计算机设备和存储介质 | |
CN113221918B (zh) | 目标检测方法、目标检测模型的训练方法及装置 | |
US20180247152A1 (en) | Method and apparatus for distance measurement | |
CN115170893B (zh) | 共视档位分类网络的训练方法、图像排序方法及相关设备 | |
WO2020135756A1 (zh) | 视频段的提取方法、装置、设备及计算机可读存储介质 | |
WO2020077869A1 (zh) | 图像检索方法、装置、终端及存储介质 | |
CN110909817B (zh) | 分布式聚类方法及系统、处理器、电子设备及存储介质 | |
Huo et al. | Semisupervised learning based on a novel iterative optimization model for saliency detection | |
CN112200844A (zh) | 生成图像的方法、装置、电子设备及介质 | |
CN111783812A (zh) | 违禁图像识别方法、装置和计算机可读存储介质 | |
US20210406568A1 (en) | Utilizing multiple stacked machine learning models to detect deepfake content | |
CN110619349A (zh) | 植物图像分类方法及装置 | |
CN108537149A (zh) | 图像处理方法、装置、存储介质及电子设备 | |
TWI714321B (zh) | 資料庫更新方法和裝置、電子設備、電腦儲存介質 | |
CN112148192A (zh) | 图像显示方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |