CN105787465A - 基于位置结构的图像识别方法 - Google Patents
基于位置结构的图像识别方法 Download PDFInfo
- Publication number
- CN105787465A CN105787465A CN201610159439.8A CN201610159439A CN105787465A CN 105787465 A CN105787465 A CN 105787465A CN 201610159439 A CN201610159439 A CN 201610159439A CN 105787465 A CN105787465 A CN 105787465A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- similarity
- length
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/167—Detection; Localisation; Normalisation using comparisons between temporally consecutive images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于位置结构的图像识别方法,包括以下步骤:获取输入图像串,并计算输入图像的图像长度;根据输入图像串的倒排索引,获得图像库中的同一个分支下的所有图像串,组成候选图像串集;遍历候选图像串集,计算其中每个图像的图像长度,采用后向匹配计算其中每个图像与输入图像的相似度;按照相似度对相似的图像串从高到低排序,选出相似度最高的n个图像串作为结果输出。本发明只是将两个图像中较短的特征向量进行循环比较,处理时间更快,而且准确率高。
Description
技术领域
本发明涉及一种图像识别方法,具体地涉及一种基于位置结构的图像识别方法。
背景技术
图像识别是计算机视觉领域中最活跃的领域之一,主要研究目标在于利用计算机的强大运算能力,帮助人类自动处理海量物理信息,识别各种不同模式的目标代替人的部分脑力劳动。图像识别广泛应用于地质勘探、图像遥感、机器人视觉、生物医学等多个领域,例如ATM取款机。
中国专利文献CN104252473公开了一种图像识别方法,从图像中提取特征向量,形成标志区域信息和标志区域内多个特征向量的特征信息,获得图像识别参照图像,然后通过比较待识别的图像与参照图像,当两个图像的相似度在设定误差值范围内时,则认为该两个图像为同一图像。该种方法存在以下缺陷:
1、需要将被比较的两个图像都向量化,所以要对两个图像都做一次循环比较,处理时间较长。
2、通常都是通过计算两个向量的余弦相似度来比较的,这样对于:“122,11,12(眼睛)125,15,12(鼻子)”、“122,11,12,125,15,12(眼睛鼻子)”,这两个特征向量,该方法就不能识别为百分之百相似。
发明内容
为了解决现有技术存在的问题,本发明目的是:提供一种基于位置结构的图像识别方法,本发明只是将两个图像中较短的特征向量进行循环比较,处理时间更快,而且准确率高。
本发明的技术方案是:
一种基于位置结构的图像识别方法,其特征在于,包括以下步骤:
S01:获取输入图像串,并计算输入图像的图像长度;
S02:根据输入图像串的倒排索引,获得图像库中的同一个分支下的所有图像串,组成候选图像串集;
S03:遍历候选图像串集,计算其中每个图像的图像长度;
S04:比较输入图像与候选图像的图像长度,将图像长度短的图像定义为图像B,图像长度长的图像定义为图像A;
S05:从图像B的最后一个字符开始遍历,判断该字符是否包含在图像A中,若包含则记录这个字符在图像B中的位置pos_B以及该字符在图像A中的位置pos_A,同时将end_point设置为该字符在图像B中的位置,然后继续判断图像B中下一个字符;如果不包含,则直接判断图像B中下一个字符;
S06:若下一个字符也包含在A中,则将end_point设置为该字符在图像B中的位置,根据相似度算法计算图像B中已经确定包含在图像A中的字符与图像A的相似度s1;如果下一个字符不包含在图像A中,则执行步骤S07;相似度算法的计算公式为:,其中,L_A、L_B为A和B的图像长度;
S07:对图像B中的剩余字符串重复步骤S06,得到相似度集合{s1,s2,…};
S08:图像B中的字符都遍历完成后,将相似度集合{s1,s2,…}中的最大值作为图像A和图像B的相似度S,如果相似度S大于设定阈值,则认为图像A和B为相似。
优选的,所述步骤S08中阈值为0.8。
优选的,在步骤S01之前还包括将图像向量化,提取较短的特征向量为图像特征。
与现有技术相比,本发明的优点是:
本发明只是将两个图像中较短的特征向量进行循环比较,处理时间更快;本发明采用后向匹配图像的相似度,后向匹配更能保留图像中的重要信息,使得相似度计算更加准确。
附图说明
下面结合附图及实施例对本发明作进一步描述:
图1为本发明基于位置结构的图像识别方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
实施例:
如图1所示,一种基于位置结构的图像识别方法,包括以下步骤:
(1)将图像向量化。例如,将图像A向量化为<101,102,205,255>,图B向量化为<11,102,205,255>。
(2)提取较短的特征向量为图像特征,比如对于上面的向量,假设得到的特征为<0,102,205,0>,<11,102,205,0>,可以将图像特征存储为样本库。
(3)获取输入图像串,并计算输入图像的图像长度;
(4)根据输入图像串的倒排索引,获得图像库中的同一个分支下的所有图像串,组成候选图像串集;
(5)遍历候选图像串集,计算其中每个图像的图像长度,计算其中每个图像与输入图像的相似度;
相似度计算方法:
比较输入图像与候选图像的图像长度,将图像长度短的图像定义为图像B,图像长度长的图像定义为图像A;
a)从图像B的最后一个字符开始遍历,判断该字符是否包含在图像A中,若包含则记录这个字符在图像B中的位置pos_B以及该字符在图像A中的位置pos_A,同时将end_point设置为该字符在图像B中的位置,然后继续判断图像B中下一个字符;如果不包含,则直接判断图像B中下一个字符;
b)若下一个字符也包含在A中,则将end_point设置为该字符在图像B中的位置,根据相似度算法计算图像B中已经确定包含在图像A中的字符与图像A的相似度s1;如果下一个字符不包含在图像A中,则执行步骤S07;相似度算法的计算公式为:,其中,L_A、L_B为A和B的图像长度;
c)对图像B中的剩余字符串重复步骤S06,得到相似度集合{s1,s2,…};
d)图像B中的字符都遍历完成后,将相似度集合{s1,s2,…}中的最大值作为图像A和图像B的相似度S,如果相似度S大于设定阈值,则认为图像A和B为相似,阈值一般设定为0.8。
(6)按照相似度对相似的图像串从高到低排序,选出相似度最高的n个图像串作为结果输出。
在获得相似图像的时候,之所以要从最后一个字符开始遍历,因为相较于前向匹配,这种后向匹配更能保留图像中的重要信息,使得相似度计算更加准确。因为在使用的场景中,比如图像信息,两个不同人正面脸的相似度要高于同一个人的正脸和侧脸的相似度。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (3)
1.一种基于位置结构的图像识别方法,其特征在于,包括以下步骤:
S01:获取输入图像串,并计算输入图像的图像长度;
S02:根据输入图像串的倒排索引,获得图像库中的同一个分支下的所有图像串,组成候选图像串集;
S03:遍历候选图像串集,计算其中每个图像的图像长度;
S04:比较输入图像与候选图像的图像长度,将图像长度短的图像定义为图像B,图像长度长的图像定义为图像A;
S05:从图像B的最后一个字符开始遍历,判断该字符是否包含在图像A中,若包含则记录这个字符在图像B中的位置pos_B以及该字符在图像A中的位置pos_A,同时将end_point设置为该字符在图像B中的位置,然后继续判断图像B中下一个字符;如果不包含,则直接判断图像B中下一个字符;
S06:若下一个字符也包含在A中,则将end_point设置为该字符在图像B中的位置,根据相似度算法计算图像B中已经确定包含在图像A中的字符与图像A的相似度s1;如果下一个字符不包含在图像A中,则执行步骤S07;相似度算法的计算公式为:,其中,L_A、L_B分别为A和B的图像长度;
S07:对图像B中的剩余字符串重复步骤S06,得到相似度集合{s1,s2,…};
S08:图像B中的字符都遍历完成后,将相似度集合{s1,s2,…}中的最大值作为图像A和图像B的相似度S,如果相似度S大于设定阈值,则认为图像A和B为相似。
2.根据权利要求1所述的基于位置结构的图像识别方法,其特征在于,所述步骤S08中阈值为0.8。
3.根据权利要求1所述的基于位置结构的图像识别方法,其特征在于,在步骤S01之前还包括将图像向量化,提取较短的特征向量为图像特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610159439.8A CN105787465A (zh) | 2016-03-21 | 2016-03-21 | 基于位置结构的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610159439.8A CN105787465A (zh) | 2016-03-21 | 2016-03-21 | 基于位置结构的图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105787465A true CN105787465A (zh) | 2016-07-20 |
Family
ID=56394147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610159439.8A Pending CN105787465A (zh) | 2016-03-21 | 2016-03-21 | 基于位置结构的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105787465A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102065203A (zh) * | 2009-12-17 | 2011-05-18 | 于培宁 | 一种存储处理图像序列的方法 |
CN104252473A (zh) * | 2013-06-27 | 2014-12-31 | 镇江睿泰信息科技有限公司 | 一种图像识别方法 |
CN104331899A (zh) * | 2014-11-24 | 2015-02-04 | 中国科学院电子学研究所 | 一种sar图像配准方法及装置 |
CN104809481A (zh) * | 2015-05-21 | 2015-07-29 | 中南大学 | 一种基于自适应色彩聚类的自然场景文本检测的方法 |
-
2016
- 2016-03-21 CN CN201610159439.8A patent/CN105787465A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102065203A (zh) * | 2009-12-17 | 2011-05-18 | 于培宁 | 一种存储处理图像序列的方法 |
CN104252473A (zh) * | 2013-06-27 | 2014-12-31 | 镇江睿泰信息科技有限公司 | 一种图像识别方法 |
CN104331899A (zh) * | 2014-11-24 | 2015-02-04 | 中国科学院电子学研究所 | 一种sar图像配准方法及装置 |
CN104809481A (zh) * | 2015-05-21 | 2015-07-29 | 中南大学 | 一种基于自适应色彩聚类的自然场景文本检测的方法 |
Non-Patent Citations (1)
Title |
---|
黄萍: "基于链码的民族图像编码与匹配的设计与实现", 《中国优秀硕士学位论文全文数据库》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6619634B2 (ja) | 画像処理装置及び画像処理方法 | |
Dekel et al. | Best-buddies similarity for robust template matching | |
CN103593464B (zh) | 基于视觉特征的视频指纹检测及视频序列匹配方法及系统 | |
US20150339516A1 (en) | Collation apparatus and method for the same, and image searching apparatus and method for the same | |
GB2549554A (en) | Method and system for detecting an object in an image | |
CN103207898B (zh) | 一种基于局部敏感哈希的相似人脸快速检索方法 | |
US11321966B2 (en) | Method and apparatus for human behavior recognition, and storage medium | |
US9367897B1 (en) | System for video super resolution using semantic components | |
US9064171B2 (en) | Detection device and method for transition area in space | |
JP6619635B2 (ja) | 画像処理装置及び画像処理方法 | |
CN105184238A (zh) | 一种人脸识别方法及系统 | |
US9679221B2 (en) | Object identification apparatus, object identification method, and program | |
Nguyen et al. | Few-shot object counting and detection | |
CN107305693B (zh) | 信息处理装置、信息处理方法及存储介质 | |
Ye et al. | Scene text detection via integrated discrimination of component appearance and consensus | |
US20220165048A1 (en) | Person re-identification device and method | |
JP5557189B2 (ja) | 位置推定装置、位置推定方法及びプログラム | |
CN108509963B (zh) | 基于深度学习的目标差异性检测方法和目标差异性检测设备 | |
Mehta et al. | Face detection and tagging using deep learning | |
Du et al. | Face association across unconstrained video frames using conditional random fields | |
Nguyen et al. | Multi-camera people tracking with mixture of realistic and synthetic knowledge | |
Zhou et al. | Discarding wide baseline mismatches with global and local transformation consistency | |
CN111008210B (zh) | 商品识别方法、装置、编解码器及存储装置 | |
CN105787465A (zh) | 基于位置结构的图像识别方法 | |
Klüssendorff et al. | Graph-based visual SLAM and visual odometry using an RGB-D camera |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20190726 |
|
AD01 | Patent right deemed abandoned |