CN104268519B

CN104268519B - 基于模式匹配的图像识别终端及其识别方法

Info

Publication number: CN104268519B
Application number: CN201410484636.8A
Authority: CN
Inventors: 袁荣辉; 冯睿; 李冀
Original assignee: Individual
Current assignee: Yuan Ronghui
Priority date: 2014-09-19
Filing date: 2014-09-19
Publication date: 2018-03-30
Anticipated expiration: 2034-09-19
Also published as: CN104268519A

Abstract

本发明涉及图像识别技术，特别涉及基于模式匹配的图像识别及显示方法，是为了解决目前增强现实领域中图像识别在识别对象角度和距离发生改变时所产生的跟踪丢失率较大，且识别容错率较低，不能于有较大识别距离和较大空间要求的场景的问题。本发明提供一种基于模式匹配的图像识别的终端，包括：图像采集模块，用于采集获取视频数据，将采集的视频数据进行模数转换得到离散图像；图像预处理模块，将所述离散图像进行平滑处理；图像分割模块，将平湖处理后的图像进行分割，得到背景图像及被识别图像；模式匹配模块，将被识别图像与预设的模式匹配图像进行模式匹配，根据匹配结果确定被识别图像是否为目标对象的图像。本发明适用于图像识别。

Description

基于模式匹配的图像识别终端及其识别方法

技术领域

本发明涉及图像识别技术，特别涉及基于模式匹配的图像识别及显示方法。

背景技术

模式匹配算法在目前的计算机领域中运用很广，从网络安全到增强现实都有涉及，其算法也多种多样，我们这里讨论一种基于模式匹配的图形图像识别算法，以及在增强现实领域应用的优化方法。

图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前，在图像识别的发展中，主要有三种识别方法：统计模式识别、结构模式识别、模糊模式识别。在增强现实技术领域，主要使用的是统计模式识别、结构模式识别这两种，例如法国Totalimmersion公司所发布的增强现实SDK中就使用的这两种算法。但是在实际使用中，该SDK在识别对象角度和距离发生改变时，所产生的跟踪丢失率较大，且识别容错率较低，不能于有较大识别距离和较大空间要求的场景。

发明内容

本发明的目的是为了解决目前增强现实领域中图像识别在识别对象角度和距离发生改变时所产生的跟踪丢失率较大，且识别容错率较低，不能于有较大识别距离和较大空间要求的场景的问题。

为达到上述目的，本发明提供一种基于模式匹配的图像识别方法，其特征在于，包括如下步骤：

A.将需要识别的目标对象的图像特征点矩阵作为模式匹配图像存储在系统中；

B.系统采集图像，将采集到的连续图像信号按照固定的采集频率变成离散图像信号；

C.对离散图像信号进行平滑处理并对平滑处理后的图像进行分割，得到背景图像及被识别图像；

D.将被识别图像与模式匹配图像进行模式匹配，若匹配，说明被识别图像即为目标对象的图像，程序结束，否则，跳转到步骤B。

进一步地，步骤D中，若被识别图像与模式匹配图像相匹配，则进一步包括步骤：

E.对被识别图像进行轮廓跟踪，判断识别被识别图像的位置、角度及远近变化；

F.三维处理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置，并叠加到帧图像中，最后进行显示。

具体地，步骤C中采用消噪声掩模法对图像进行平滑处理，具体操作为：设定一个模板算子，将模板嵌入到每一帧图像的每一个像素，将该像素的灰度值与其相关邻域的各像素灰度值求和并求其平均值，用平均值代替该像素的灰度值。

具体地，步骤C中，采用全局阀值法对图像进行分割，其具体操作为：设定一个灰度值的阀值，灰度值大于阀值的部分为背景图像，小于阀值的部分为被识别图像。

具体地，步骤C中，对背景图像进行二值化处理全部为1，表示亮，对被识别图像进行二值化处理全部为0，表示暗。图像二值化的具体操作为：f(x,y)大于或等于T时，g(x,y)取值为1，f(x,y)小于T时，g(x,y)取值为0，其中f(x,y)表示图像分割前图像中的坐标(x,y)像素的灰度值，g(x,y)表示图像分割后图像中的坐标(x,y)像素的灰度值，T为规定的全局阀值。二值化处理的目的是明确的从复杂的背景中标识出被识别图像，避免识别干扰，因为背景是什么内容算法并不关心。

具体地，步骤B中，系统采集的图像为8位灰度值图像，所述采集频率为每秒24帧。

针对上述方法，本发明还提供一种基于模式匹配的图像识别的终端，包括：

图像采集模块，用于采集获取视频数据，将采集的视频数据进行模数转换得到离散图像；

图像预处理模块，将所述离散图像进行平滑处理，实现衰减高频分量、增强低频分量的目的；

图像分割模块，将平湖处理后的图像进行分割，得到背景图像及被识别图像；

模式匹配模块，将被识别图像与预设的模式匹配图像进行模式匹配，根据匹配结果确定被识别图像是否为目标对象的图像。

进一步地，为更好地对目标对象的图像进行显示，还包括：

轮廓跟踪模块，用于对目标对象进行轮廓跟踪，判断识别目标图像的位置、角度及远近变化；

三维处理引擎，用于根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置，并叠加到帧图像中，最后将图像在显示模块上进行显示。

本发明的有益效果是：本发明的方法在图像采集过程中采取多组件协同采集，并对采集到的图像进行平滑处理，提高采集效率的同时也为后期图像分割提高了效率。识别过程首先消噪，提高了识别距离和准确度，轮廓跟踪提高了容错性，集成三维引擎提高了增强现实效果。

附图说明

图1为本发明的基于模式匹配的图像识别的终端的原理框图。

具体实施方式

下面结合附图及实施例对本发明的技术方案进行详细描述，实施例仅仅是为了帮助读者更好地理解本发明方案的核心内容，并不用以限制本发明的保护范围。

本发明针对目前增强现实领域中图像识别在识别对象角度和距离发生改变时所产生的跟踪丢失率较大，且识别容错率较低，不能于有较大识别距离和较大空间要求的场景的问题，提供一种基于模式匹配的图像识别方法，具体步骤如下：首先将需要识别的目标对象的图像作为模式匹配图像存储在系统中，使用过程中系统通过摄像头实时采集图像，并将采集到的连续图像信号按照固定的采集频率变成离散图像信号。其次，系统对离散图像信号进行平滑处理并对平滑处理后的图像进行分割，得到背景图像及被识别图像。然后，将被识别图像与模式匹配图像进行模式匹配，若匹配，说明被识别图像即为目标对象的图像，程序结束，否则继续采集图像后进行平滑处理及图像分割后进行模式匹配。

如图1所示，本发明提供的基于模式匹配的图像识别的终端，包括：图像采集模块、图像预处理模块、图像分割模块及模式匹配模块，各个模块的功能如下：

在图像识别完成之后还需要进行显示，为提高增强现实的效果，本发明进一步对被识别图像进行轮廓跟踪，判断识别被识别图像的位置、角度及远近变化。之后使用三维处理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置，并叠加到帧图像中，最后进行显示。相应地，本发明提供的基于模式匹配的图像识别的终端还包括显示模块、轮廓跟踪模块及三维处理引擎，三维处理引擎为现有的处理技术，本领域普通技术人员根据其所要实现的功能即能予以实现。

轮廓跟踪模块及三维处理引擎的功能如下：

三维处理引擎，用于根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置，并叠加到帧图像中。

实施例

下面举一实例对本发明的基于模式匹配的图像识别的终端的图像识别方法进行进一步描述。

基于本发明的方法的口袋家居系统，终端为采用移动智能设备为硬件载体，使用大于500万像素的摄像头实时采集图像，识别特定的二维码图像，最大识别距离为6米，最大识别角度为145度。在最大识别距离和最大识别角度内，目标对象移动丢失率为3％，能在最大40平米的房间布置8款虚拟的三维家具模型。

将需要识别的目标对象的图像作为模式匹配图像存储在系统中之后进行如下的操作。

图像采集：通过移动终端设备的摄像头获取视频数据，将连续的图像信息按照固定的采集频率变成离散图像，此处频率为每秒24帧。我们采用VC++中的MCIAVI、DRAWDIB、AVIFILE、AVICAP等组件协同工作完成对实时图像数据的采集。

图像预处理：图像采集后进行平滑处理，主要采取的方法是消噪声掩模法，设定一个模板算子，如3x3，将模板嵌入到每一帧图像的每一个像素，将该像素的灰度值与其八邻域的各像素灰度值求和，再取平均值代替该像素的灰度值，实现衰减高频分量，增强低频分量的目的。

图像分割，图像分割是图像处理中的关键步骤，因为它去除了图像中大量无用的信息，为后续图像处理减少了负担。我们采用的方法是全局阀值法，阀值法是用于区分不同目标的灰度，即将整幅图像用统一的阀值划分标准，由于本系统采集进来的图像是8位灰度值图像，通过阀值分割，得到大于域值的部分被认为是背景，二值化处理全部为1，表示亮；得到小于域值的部分被认为是被识别图形或物体，二值化处理全部分0，表示暗。图像二值化的具体操作为：f(x,y)大于或等于T时，g(x,y)取值为1，f(x,y)小于T时，g(x,y)取值为0，其中f(x,y)表示图像分割前图像中的坐标(x,y)像素的灰度值，g(x,y)表示图像分割后图像中的坐标(x,y)像素的灰度值，T为规定的全局阀值。二值化处理的目的是明确的从复杂的背景中标识出被识别图像，避免识别干扰，因为背景是什么内容算法并不关心。

图像分割的目的是为了将背景图像及被识别图像进行分割，图像分割之后，将被识别图像与模式匹配图像进行模式匹配，若匹配，说明被识别图像即为目标对象的图像，程序结束，否则继续采集图像后进行平滑处理及图像分割后进行模式匹配。

在识别出图像之后进行轮廓跟踪，判断识别被识别图像的位置、角度及远近变化。轮廓跟踪的具体操作为：从图像的一个点作为起点，按照四邻域或八邻域关系逐像素点跟踪轮廓。同时在找到一个边缘点后，记录此时移动的方向，直到不能移动结束本次跟踪过程。三维处理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置，并叠加到帧图像中，最后进行显示。

Claims

1.基于模式匹配的图像识别方法，其特征在于，包括如下步骤：

D.将被识别图像与模式匹配图像进行模式匹配，若匹配，说明被识别图像即为目标对象的图像，进入步骤E，否则，跳转到步骤B；

E.对被识别图像进行轮廓跟踪，判断识别被识别图像的位置、角度及远近变化；轮廓跟踪的具体操作为：从图像的一个点作为起点，按照四邻域或八邻域关系逐像素点跟踪轮廓，同时在找到一个边缘点后，记录此时移动的方向，直到不能移动结束本次跟踪过程；

2.如权利要求1所述的基于模式匹配的图像识别方法，其特征在于，步骤C中采用消噪声掩模法对图像进行平滑处理，具体操作为：设定一个模板算子，将模板嵌入到每一帧图像的每一个像素，将该像素的灰度值与其相关邻域的各像素灰度值求和并求其平均值，用平均值代替该像素的灰度值。

3.如权利要求1所述的基于模式匹配的图像识别方法，其特征在于，步骤C中，采用全局阀值法对图像进行分割，其具体操作为：设定一个灰度值的阀值，灰度值大于阀值的部分为背景图像，小于阀值的部分为被识别图像。

4.如权利要求3所述的基于模式匹配的图像识别方法，其特征在于，步骤C中，对背景图像进行二值化处理全部为1，表示亮，对被识别图像进行二值化处理全部为0，表示暗。

5.如权利要求1至4任意一项所述的基于模式匹配的图像识别方法，其特征在于，步骤B中，系统采集的图像为8位灰度值图像，所述采集频率为每秒24帧。

6.基于模式匹配的图像识别的终端，其特征在于，包括：

模式匹配模块，将被识别图像与预设的模式匹配图像进行模式匹配，根据匹配结果确定被识别图像是否为目标对象的图像；

轮廓跟踪模块，用于对目标对象进行轮廓跟踪，判断识别目标图像的位置、角度及远近变化；轮廓跟踪的具体操作为：从图像的一个点作为起点，按照四邻域或八邻域关系逐像素点跟踪轮廓，同时在找到一个边缘点后，记录此时移动的方向，直到不能移动结束本次跟踪过程；

7.如权利要求6所述的基于模式匹配的图像识别的终端，其特征在于，还包括显示模块，用于显示目标对象的图像信息。