CN104268519B - 基于模式匹配的图像识别终端及其识别方法 - Google Patents
基于模式匹配的图像识别终端及其识别方法 Download PDFInfo
- Publication number
- CN104268519B CN104268519B CN201410484636.8A CN201410484636A CN104268519B CN 104268519 B CN104268519 B CN 104268519B CN 201410484636 A CN201410484636 A CN 201410484636A CN 104268519 B CN104268519 B CN 104268519B
- Authority
- CN
- China
- Prior art keywords
- image
- pattern match
- identified
- pixel
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/752—Contour matching
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像识别技术,特别涉及基于模式匹配的图像识别及显示方法,是为了解决目前增强现实领域中图像识别在识别对象角度和距离发生改变时所产生的跟踪丢失率较大,且识别容错率较低,不能于有较大识别距离和较大空间要求的场景的问题。本发明提供一种基于模式匹配的图像识别的终端,包括:图像采集模块,用于采集获取视频数据,将采集的视频数据进行模数转换得到离散图像;图像预处理模块,将所述离散图像进行平滑处理;图像分割模块,将平湖处理后的图像进行分割,得到背景图像及被识别图像;模式匹配模块,将被识别图像与预设的模式匹配图像进行模式匹配,根据匹配结果确定被识别图像是否为目标对象的图像。本发明适用于图像识别。
Description
技术领域
本发明涉及图像识别技术,特别涉及基于模式匹配的图像识别及显示方法。
背景技术
模式匹配算法在目前的计算机领域中运用很广,从网络安全到增强现实都有涉及,其算法也多种多样,我们这里讨论一种基于模式匹配的图形图像识别算法,以及在增强现实领域应用的优化方法。
图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前,在图像识别的发展中,主要有三种识别方法:统计模式识别、结构模式识别、模糊模式识别。在增强现实技术领域,主要使用的是统计模式识别、结构模式识别这两种,例如法国Totalimmersion公司所发布的增强现实SDK中就使用的这两种算法。但是在实际使用中,该SDK在识别对象角度和距离发生改变时,所产生的跟踪丢失率较大,且识别容错率较低,不能于有较大识别距离和较大空间要求的场景。
发明内容
本发明的目的是为了解决目前增强现实领域中图像识别在识别对象角度和距离发生改变时所产生的跟踪丢失率较大,且识别容错率较低,不能于有较大识别距离和较大空间要求的场景的问题。
为达到上述目的,本发明提供一种基于模式匹配的图像识别方法,其特征在于,包括如下步骤:
A.将需要识别的目标对象的图像特征点矩阵作为模式匹配图像存储在系统中;
B.系统采集图像,将采集到的连续图像信号按照固定的采集频率变成离散图像信号;
C.对离散图像信号进行平滑处理并对平滑处理后的图像进行分割,得到背景图像及被识别图像;
D.将被识别图像与模式匹配图像进行模式匹配,若匹配,说明被识别图像即为目标对象的图像,程序结束,否则,跳转到步骤B。
进一步地,步骤D中,若被识别图像与模式匹配图像相匹配,则进一步包括步骤:
E.对被识别图像进行轮廓跟踪,判断识别被识别图像的位置、角度及远近变化;
F.三维处理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并叠加到帧图像中,最后进行显示。
具体地,步骤C中采用消噪声掩模法对图像进行平滑处理,具体操作为:设定一个模板算子,将模板嵌入到每一帧图像的每一个像素,将该像素的灰度值与其相关邻域的各像素灰度值求和并求其平均值,用平均值代替该像素的灰度值。
具体地,步骤C中,采用全局阀值法对图像进行分割,其具体操作为:设定一个灰度值的阀值,灰度值大于阀值的部分为背景图像,小于阀值的部分为被识别图像。
具体地,步骤C中,对背景图像进行二值化处理全部为1,表示亮,对被识别图像进行二值化处理全部为0,表示暗。图像二值化的具体操作为:f(x,y)大于或等于T时,g(x,y)取值为1,f(x,y)小于T时,g(x,y)取值为0,其中f(x,y)表示图像分割前图像中的坐标(x,y)像素的灰度值,g(x,y)表示图像分割后图像中的坐标(x,y)像素的灰度值,T为规定的全局阀值。二值化处理的目的是明确的从复杂的背景中标识出被识别图像,避免识别干扰,因为背景是什么内容算法并不关心。
具体地,步骤B中,系统采集的图像为8位灰度值图像,所述采集频率为每秒24帧。
针对上述方法,本发明还提供一种基于模式匹配的图像识别的终端,包括:
图像采集模块,用于采集获取视频数据,将采集的视频数据进行模数转换得到离散图像;
图像预处理模块,将所述离散图像进行平滑处理,实现衰减高频分量、增强低频分量的目的;
图像分割模块,将平湖处理后的图像进行分割,得到背景图像及被识别图像;
模式匹配模块,将被识别图像与预设的模式匹配图像进行模式匹配,根据匹配结果确定被识别图像是否为目标对象的图像。
进一步地,为更好地对目标对象的图像进行显示,还包括:
轮廓跟踪模块,用于对目标对象进行轮廓跟踪,判断识别目标图像的位置、角度及远近变化;
三维处理引擎,用于根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并叠加到帧图像中,最后将图像在显示模块上进行显示。
本发明的有益效果是:本发明的方法在图像采集过程中采取多组件协同采集,并对采集到的图像进行平滑处理,提高采集效率的同时也为后期图像分割提高了效率。识别过程首先消噪,提高了识别距离和准确度,轮廓跟踪提高了容错性,集成三维引擎提高了增强现实效果。
附图说明
图1为本发明的基于模式匹配的图像识别的终端的原理框图。
具体实施方式
下面结合附图及实施例对本发明的技术方案进行详细描述,实施例仅仅是为了帮助读者更好地理解本发明方案的核心内容,并不用以限制本发明的保护范围。
本发明针对目前增强现实领域中图像识别在识别对象角度和距离发生改变时所产生的跟踪丢失率较大,且识别容错率较低,不能于有较大识别距离和较大空间要求的场景的问题,提供一种基于模式匹配的图像识别方法,具体步骤如下:首先将需要识别的目标对象的图像作为模式匹配图像存储在系统中,使用过程中系统通过摄像头实时采集图像,并将采集到的连续图像信号按照固定的采集频率变成离散图像信号。其次,系统对离散图像信号进行平滑处理并对平滑处理后的图像进行分割,得到背景图像及被识别图像。然后,将被识别图像与模式匹配图像进行模式匹配,若匹配,说明被识别图像即为目标对象的图像,程序结束,否则继续采集图像后进行平滑处理及图像分割后进行模式匹配。
如图1所示,本发明提供的基于模式匹配的图像识别的终端,包括:图像采集模块、图像预处理模块、图像分割模块及模式匹配模块,各个模块的功能如下:
图像采集模块,用于采集获取视频数据,将采集的视频数据进行模数转换得到离散图像;
图像预处理模块,将所述离散图像进行平滑处理,实现衰减高频分量、增强低频分量的目的;
图像分割模块,将平湖处理后的图像进行分割,得到背景图像及被识别图像;
模式匹配模块,将被识别图像与预设的模式匹配图像进行模式匹配,根据匹配结果确定被识别图像是否为目标对象的图像。
在图像识别完成之后还需要进行显示,为提高增强现实的效果,本发明进一步对被识别图像进行轮廓跟踪,判断识别被识别图像的位置、角度及远近变化。之后使用三维处理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并叠加到帧图像中,最后进行显示。相应地,本发明提供的基于模式匹配的图像识别的终端还包括显示模块、轮廓跟踪模块及三维处理引擎,三维处理引擎为现有的处理技术,本领域普通技术人员根据其所要实现的功能即能予以实现。
轮廓跟踪模块及三维处理引擎的功能如下:
轮廓跟踪模块,用于对目标对象进行轮廓跟踪,判断识别目标图像的位置、角度及远近变化;
三维处理引擎,用于根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并叠加到帧图像中。
实施例
下面举一实例对本发明的基于模式匹配的图像识别的终端的图像识别方法进行进一步描述。
基于本发明的方法的口袋家居系统,终端为采用移动智能设备为硬件载体,使用大于500万像素的摄像头实时采集图像,识别特定的二维码图像,最大识别距离为6米,最大识别角度为145度。在最大识别距离和最大识别角度内,目标对象移动丢失率为3%,能在最大40平米的房间布置8款虚拟的三维家具模型。
将需要识别的目标对象的图像作为模式匹配图像存储在系统中之后进行如下的操作。
图像采集:通过移动终端设备的摄像头获取视频数据,将连续的图像信息按照固定的采集频率变成离散图像,此处频率为每秒24帧。我们采用VC++中的MCIAVI、DRAWDIB、AVIFILE、AVICAP等组件协同工作完成对实时图像数据的采集。
图像预处理:图像采集后进行平滑处理,主要采取的方法是消噪声掩模法,设定一个模板算子,如3x3,将模板嵌入到每一帧图像的每一个像素,将该像素的灰度值与其八邻域的各像素灰度值求和,再取平均值代替该像素的灰度值,实现衰减高频分量,增强低频分量的目的。
图像分割,图像分割是图像处理中的关键步骤,因为它去除了图像中大量无用的信息,为后续图像处理减少了负担。我们采用的方法是全局阀值法,阀值法是用于区分不同目标的灰度,即将整幅图像用统一的阀值划分标准,由于本系统采集进来的图像是8位灰度值图像,通过阀值分割,得到大于域值的部分被认为是背景,二值化处理全部为1,表示亮;得到小于域值的部分被认为是被识别图形或物体,二值化处理全部分0,表示暗。图像二值化的具体操作为:f(x,y)大于或等于T时,g(x,y)取值为1,f(x,y)小于T时,g(x,y)取值为0,其中f(x,y)表示图像分割前图像中的坐标(x,y)像素的灰度值,g(x,y)表示图像分割后图像中的坐标(x,y)像素的灰度值,T为规定的全局阀值。二值化处理的目的是明确的从复杂的背景中标识出被识别图像,避免识别干扰,因为背景是什么内容算法并不关心。
图像分割的目的是为了将背景图像及被识别图像进行分割,图像分割之后,将被识别图像与模式匹配图像进行模式匹配,若匹配,说明被识别图像即为目标对象的图像,程序结束,否则继续采集图像后进行平滑处理及图像分割后进行模式匹配。
在识别出图像之后进行轮廓跟踪,判断识别被识别图像的位置、角度及远近变化。轮廓跟踪的具体操作为:从图像的一个点作为起点,按照四邻域或八邻域关系逐像素点跟踪轮廓。同时在找到一个边缘点后,记录此时移动的方向,直到不能移动结束本次跟踪过程。三维处理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并叠加到帧图像中,最后进行显示。
Claims (7)
1.基于模式匹配的图像识别方法,其特征在于,包括如下步骤:
A.将需要识别的目标对象的图像特征点矩阵作为模式匹配图像存储在系统中;
B.系统采集图像,将采集到的连续图像信号按照固定的采集频率变成离散图像信号;
C.对离散图像信号进行平滑处理并对平滑处理后的图像进行分割,得到背景图像及被识别图像;
D.将被识别图像与模式匹配图像进行模式匹配,若匹配,说明被识别图像即为目标对象的图像,进入步骤E,否则,跳转到步骤B;
E.对被识别图像进行轮廓跟踪,判断识别被识别图像的位置、角度及远近变化;轮廓跟踪的具体操作为:从图像的一个点作为起点,按照四邻域或八邻域关系逐像素点跟踪轮廓,同时在找到一个边缘点后,记录此时移动的方向,直到不能移动结束本次跟踪过程;
F.三维处理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并叠加到帧图像中,最后进行显示。
2.如权利要求1所述的基于模式匹配的图像识别方法,其特征在于,步骤C中采用消噪声掩模法对图像进行平滑处理,具体操作为:设定一个模板算子,将模板嵌入到每一帧图像的每一个像素,将该像素的灰度值与其相关邻域的各像素灰度值求和并求其平均值,用平均值代替该像素的灰度值。
3.如权利要求1所述的基于模式匹配的图像识别方法,其特征在于,步骤C中,采用全局阀值法对图像进行分割,其具体操作为:设定一个灰度值的阀值,灰度值大于阀值的部分为背景图像,小于阀值的部分为被识别图像。
4.如权利要求3所述的基于模式匹配的图像识别方法,其特征在于,步骤C中,对背景图像进行二值化处理全部为1,表示亮,对被识别图像进行二值化处理全部为0,表示暗。
5.如权利要求1至4任意一项所述的基于模式匹配的图像识别方法,其特征在于,步骤B中,系统采集的图像为8位灰度值图像,所述采集频率为每秒24帧。
6.基于模式匹配的图像识别的终端,其特征在于,包括:
图像采集模块,用于采集获取视频数据,将采集的视频数据进行模数转换得到离散图像;
图像预处理模块,将所述离散图像进行平滑处理,实现衰减高频分量、增强低频分量的目的;
图像分割模块,将平湖处理后的图像进行分割,得到背景图像及被识别图像;
模式匹配模块,将被识别图像与预设的模式匹配图像进行模式匹配,根据匹配结果确定被识别图像是否为目标对象的图像;
轮廓跟踪模块,用于对目标对象进行轮廓跟踪,判断识别目标图像的位置、角度及远近变化;轮廓跟踪的具体操作为:从图像的一个点作为起点,按照四邻域或八邻域关系逐像素点跟踪轮廓,同时在找到一个边缘点后,记录此时移动的方向,直到不能移动结束本次跟踪过程;
三维处理引擎,用于根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并叠加到帧图像中。
7.如权利要求6所述的基于模式匹配的图像识别的终端,其特征在于,还包括显示模块,用于显示目标对象的图像信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410484636.8A CN104268519B (zh) | 2014-09-19 | 2014-09-19 | 基于模式匹配的图像识别终端及其识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410484636.8A CN104268519B (zh) | 2014-09-19 | 2014-09-19 | 基于模式匹配的图像识别终端及其识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104268519A CN104268519A (zh) | 2015-01-07 |
CN104268519B true CN104268519B (zh) | 2018-03-30 |
Family
ID=52160039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410484636.8A Active CN104268519B (zh) | 2014-09-19 | 2014-09-19 | 基于模式匹配的图像识别终端及其识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104268519B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106130886A (zh) * | 2016-07-22 | 2016-11-16 | 聂迪 | 扩展信息的展示方法及装置 |
CN108322693B (zh) * | 2018-03-01 | 2021-03-02 | 上海创视通软件技术有限公司 | 一种mcu端控制第三方终端辅流的方法及系统 |
CN108961375A (zh) * | 2018-06-20 | 2018-12-07 | 腾讯科技(深圳)有限公司 | 一种根据二维图像生成三维图像的方法及装置 |
US11448518B2 (en) | 2018-09-27 | 2022-09-20 | Phiar Technologies, Inc. | Augmented reality navigational overlay |
US10495476B1 (en) * | 2018-09-27 | 2019-12-03 | Phiar Technologies, Inc. | Augmented reality navigation systems and methods |
CN109840882B (zh) * | 2018-12-24 | 2021-05-28 | 中国农业大学 | 基于点云数据的站位匹配方法及装置 |
CN109716913B (zh) * | 2018-12-28 | 2020-10-09 | 民本农机有限公司 | 割草模式选择平台 |
CN110706250B (zh) * | 2019-09-27 | 2022-04-01 | 广东博智林机器人有限公司 | 一种对象的跟踪方法、装置、系统及存储介质 |
CN111027118B (zh) * | 2019-11-19 | 2024-01-19 | 广东博智林机器人有限公司 | 一种实测实量任务点搜索与任务派发方法及系统 |
CN112037158B (zh) * | 2020-07-22 | 2023-09-15 | 四川长宁天然气开发有限责任公司 | 一种基于页岩气田生产设备图像增强标注方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101976461A (zh) * | 2010-10-25 | 2011-02-16 | 北京理工大学 | 一种新的户外增强现实无标跟踪注册算法 |
CN102254345A (zh) * | 2011-06-30 | 2011-11-23 | 上海大学 | 基于云计算的自然特征注册方法 |
CN102332095A (zh) * | 2011-10-28 | 2012-01-25 | 中国科学院计算技术研究所 | 一种人脸运动跟踪方法和系统以及一种增强现实方法 |
CN103530649A (zh) * | 2013-10-16 | 2014-01-22 | 北京理工大学 | 一种适用于移动终端的视觉搜索方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8306262B2 (en) * | 2008-05-15 | 2012-11-06 | Arcsoft, Inc. | Face tracking method for electronic camera device |
-
2014
- 2014-09-19 CN CN201410484636.8A patent/CN104268519B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101976461A (zh) * | 2010-10-25 | 2011-02-16 | 北京理工大学 | 一种新的户外增强现实无标跟踪注册算法 |
CN102254345A (zh) * | 2011-06-30 | 2011-11-23 | 上海大学 | 基于云计算的自然特征注册方法 |
CN102332095A (zh) * | 2011-10-28 | 2012-01-25 | 中国科学院计算技术研究所 | 一种人脸运动跟踪方法和系统以及一种增强现实方法 |
CN103530649A (zh) * | 2013-10-16 | 2014-01-22 | 北京理工大学 | 一种适用于移动终端的视觉搜索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104268519A (zh) | 2015-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104268519B (zh) | 基于模式匹配的图像识别终端及其识别方法 | |
CN102542289B (zh) | 一种基于多高斯计数模型的人流量统计方法 | |
CN106709950B (zh) | 一种基于双目视觉的巡线机器人跨越障碍导线定位方法 | |
JP2915894B2 (ja) | ターゲット追跡方法及び装置 | |
CN105469094B (zh) | 一种路面二值图像的边缘矢量线提取方法 | |
CN101847265A (zh) | 一种在公交客流统计系统中使用的运动目标提取及多目标分割方法 | |
CN109086724B (zh) | 一种加速的人脸检测方法及存储介质 | |
CN108564579B (zh) | 一种基于时空相关的混凝土裂缝检测方法及检测装置 | |
CN105405138B (zh) | 基于显著性检测的水面目标跟踪方法 | |
CN111444778A (zh) | 一种车道线检测方法 | |
CN109781737A (zh) | 一种软管表面缺陷的检测方法及其检测系统 | |
CN102457724B (zh) | 一种图像运动检测系统及方法 | |
CN109708658B (zh) | 一种基于卷积神经网络的视觉里程计方法 | |
CN113763427B (zh) | 一种基于从粗到精遮挡处理的多目标跟踪方法 | |
CN104282027A (zh) | 一种基于Hough变换的圆检测方法 | |
CN105023231A (zh) | 基于视频识别和手机gps的公交数据获取方法 | |
CN105354547A (zh) | 一种结合纹理和彩色特征的行人检测方法 | |
CN113034526B (zh) | 一种抓取方法、抓取装置及机器人 | |
CN106446832B (zh) | 一种基于视频的实时检测行人的方法 | |
CN113920020B (zh) | 一种基于深度生成模型的人体点云实时修复方法 | |
CN108038849A (zh) | 一种识别性能优良的机器人视觉系统 | |
CN112200850B (zh) | 一种基于成熟特征点的orb提取方法 | |
CN112116561B (zh) | 基于图像处理融合网络权值的电网传输线检测方法及装置 | |
CN103971376A (zh) | 应用程序执行方法和装置 | |
CN111105394B (zh) | 一种检测发光小球特征信息的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180222 Address after: 610000 Chengdu, Chengdu, Sichuan, Jinniu District, Cao Jia lane, No. 1, No. 4, unit 1, 5 Applicant after: Yuan Ronghui Address before: 610000 Chengdu, Chengdu, Sichuan, Jinniu District, Cao Jia lane, No. 4, No. 4, unit 1, 5 Applicant before: Yuan Ronghui Applicant before: Feng Rui Applicant before: Li Ji |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |