CN109508721A

CN109508721A - 基于OpenCV的图形识别与颜色识别的实现

Info

Publication number: CN109508721A
Application number: CN201811322308.2A
Authority: CN
Inventors: 王莹; 付龙海; 王爱娟; 赵岐山; 王均双; 李照旭; 庞益喜; 陈强; 刘鹏; 张善龙; 张燕; 黄雪翡; 陈晓晓; 晁晓锋; 潘恭昊; 常昊
Original assignee: Yantai Vocational College
Current assignee: Yantai Vocational College
Priority date: 2018-11-08
Filing date: 2018-11-08
Publication date: 2019-03-22

Abstract

本发明公开了基于OpenCV的图形识别与颜色识别的实现，首先设置神经网络层数和神经元个数；创建训练模型；设置参数；开始训练；图形识别；图形的颜色识别。本发明的有益效果是能够高效、准确识别图形颜色。

Description

基于OpenCV的图形识别与颜色识别的实现

技术领域

本发明属于图像处理将技术领域，涉及一种基于OpenCV的图形识别与颜色识别的实现方法。

背景技术

人工神经网络(Artificial Neural Networks)是一种模仿生物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点(神经元)之间相互连接的权重，从而达到处理信息的目的。OpenCV的人工神经网络是机器学习算法中的其中一种，使用的是多层感知器(Multi-Layer Perception，MLP)，是常见的一种ANN算法。MLP算法一般包括三层，分别是一个输入层，一个输出层和一个或多个隐藏层的神经网络组成。每一层由一个或多个神经元互相连结。一个“神经元”的输出就可以是另一个“神经元”的输入。

发明内容

本发明的目的在于提供基于OpenCV的图形识别与颜色识别的实现，本发明的有益效果是能够高效、准确识别图形颜色。

本发明所采用的技术方案是按照以下步骤进行：

步骤1：设置神经网络层数和神经元个数；

步骤2：创建训练模型；

步骤3：设置参数；

步骤4：开始训练；

步骤5：图形识别；

步骤6：图形的颜色识别。

进一步，步骤5中采用的是水平、垂直直方图和低分辨率图像所组成的矢量，先实现直方图的提取，然后将图形从80X80像素变为10X10个像素，最后将这三个图组成一个一行的向量。

进一步，采用HSV颜色空间来进行颜色识别，首先将图形从BGR颜色空间转化为HSV颜色空间，将颜色的范围值从从上面的文件中读入，得到一个二值图imgThresholded，通过对此二值图的分析，就能进行颜色识别，以灰度图中的非零值做为基准，然后计算出每个颜色范围的二值图的非零值，最后计算出比值，将一个图形的所有颜色范围的比值保存到一起，找出最大值，以及最大值的位置，就能确定其颜色，对每一个图形做上面同样的处理，完成所有的图形颜色的识别。

具体实施方式

下面结合具体实施方式对本发明进行详细说明。

一幅图像中包含三角形、四边形、五角星等各种形状，不同颜色的图形，要做形状和颜色识别，需要通过下面的几个步骤：图形的分割、截图、转化为灰度图、边缘检测、膨胀、腐蚀、提取轮廓、抠图，保存图像

采用的是人工神经网络按照以下步骤进行：

步骤1：设置神经网络层数和神经元个数

Mat layers_size＝(Mat_<int>(1,3)<<input_num,hidden_num,output_num)；

其中输入层个数input_num＝120,隐藏层个数hidden_num＝40,输出层个数output_num＝要识别的图形个数，输入层个数要和特征的唯独匹配，特征值依据横向和纵向的投影(这里只图形的宽度和高度，图形归一化为80X80,这里取120)，输出层个数要与目标维度匹配，隐藏层的个数采用试错法来挑选合适的数值。

步骤2：创建训练模型：

cv::Ptr<cv::ml::ANN_MLP>ann_model＝cv::ml::ANN_MLP::create()；

步骤3：设置参数：

ann_model->setLayerSizes(layers_size)；

ann_model->setActivationFunction(cv::ml::ANN_MLP::SIGMOID_SYM,1,1)；

ann_model->setTrainMethod(cv::ml::ANN_MLP::TrainingMethods::BACKPROP)；ann_-model>setTermCriteria(cvTermCriteria(CV_TERMCRIT_ITER,30000,0.0001))；ann_-model>setBackpropWeightScale(0.1)；ann_-model>setBackpropMomentumScale(0.1)；

步骤4：开始训练：

ann_model->train(traindata)；保存训练

数据：

string modelPath＝"shape_train/ann_shape.xml"；

ann_model->save(modelPath)；traindata是训练的

数据，这些数据是通过下面的函数获取:

cv::ml::TrainData::create(samples_,

cv::ml::SampleTypes::ROW_SAMPLE,response)；

其中samples_是存放到硬盘中的图形的特征数据矩阵，response是标签N*M的矩阵，N表示训练样本数，M是类标签，如果第i行的样本属于第j类，那么该标签矩阵的(i,j)位置为1，在读取图形时，按分类好的目录读取图形，同时每一个图形按目录顺序分配相同的标签，例如matVec是目录0内的所有图形：

对每一个目录重复上面的动作。

最后：

步骤5：图形识别：

一幅图像中总存在着其独特的像素点，这些点可以认为就是这幅图像的特征，成为特征点。计算机视觉领域中的很重要的图像特征匹配就是一特征点为基础而进行的，所以，如何定义和找出一幅图像中的特征点就非常重要。

在计算机视觉领域，兴趣点(也称关键点或特征点)的概念已经得到了广泛的应用，包括目标识别、图像配准、视觉跟踪、三维重建等。这个概念的原理是，从图像中选取某些特征点并对图像进行局部分析，而非观察整幅图像。只要图像中有足够多可检测的兴趣点，并且这些兴趣点各不相同且特征稳定，能被精确地定位，上述方法就十分有效。

特征提取的算法有很多，最常用的有：SURF、ORB、SIFT、BRIEF等。

本发明采用的是水平、垂直直方图和低分辨率图像所组成的矢量，程序先实现直方图的提取，然后将图形从80X80像素变为10X10个像素(低分辨率)，最后将这三个图组成一个一行的向量。需要注意的是ann模型训练也用到特征矩阵，这两个地方必须使用同样的算法。

图形识别用下面的语句：

ann_model->predict(features,output)；

features为上面算法得到的特征，为了方便编程，features是要识别的所有图形的特征集合，也就是要组合成一个矩阵.

output为：cv::Mat output(shapesNum,kCharactersNumber,CV_32FC1)；

shapesNum为所抠出图形总数kCharactersNumber要识别图形总数

识别完成后output.row(output_index)中存放的是所对应图形的可能性值，output_index是所要识别的图形顺序，只要找出每个图形对应的最大值，以及相对应的编号，就能完成图形识别。

步骤6：图形的颜色识别

颜色识别和图形识别没有直接的关系，所以单独处理。采用HSV颜色空间来进行颜色识别

HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(Hexcone Model)。、这个模型中颜色的参数分别是：色调(H)，饱和度(S)，亮度(V)。

为了便于调试，将各个颜色的范围写到一个文件中，以方便修改；

以一个图形来展示程序的实现：

首先将图形从BGR颜色空间转化为HSV颜色空间

cvtColor(input,HSV,CV_BGR2HSV)；

将颜色的范围值从从上面的文件中读入，下限值读入到vector<Scalar>hsvLo；而上限值读入到vector<Scalar>hsvHi；中，一定要注意读入的顺序，上限和下限要匹配.

inRange(HSV,hsvLo[i],hsvHi[i],imgThresholded)；针对每一种颜色的上限和下限，通过此函数，得到一个二值图imgThresholded，通过对此二值图的分析，就能进行颜色识别，以灰度图中的非零值做为基准

Mat gray；cvtColor(input,gray,CV_BGR2GRAY)；inttotalNonZero＝countNonZero(gray)；

然后计算出每个颜色范围的二值图的非零值：int nonezero＝countNonZero(imgThresholded)；

最后计算出比值：

int ratio＝nonezero/totalNonZero；

将一个图形的所有颜色范围的比值保存到一起，找出最大值，以及最大值的位置，就能确定其颜色了.

对每一个图形做上面同样的处理，就完成所有的图形颜色的识别.

由于opencv很好的跨平台性，的程序在window7,window10,ubuntu,以及android等操作系统都能很好的运行，并且运行的结果一致.

以上所述仅是对本发明的较佳实施方式而已，并非对本发明作任何形式上的限制，凡是依据本发明的技术实质对以上实施方式所做的任何简单修改，等同变化与修饰，均属于本发明技术方案的范围内。

Claims

1.基于OpenCV的图形识别与颜色识别的实现，其特征在于按照以下步骤进行：

步骤1：设置神经网络层数和神经元个数；

步骤2：创建训练模型；

步骤3：设置参数；

步骤4：开始训练；

步骤5：图形识别；

步骤6：图形的颜色识别。

2.按照权利要求1所述基于OpenCV的图形识别与颜色识别的实现，其特征在于：

所述步骤5中采用的是水平、垂直直方图和低分辨率图像所组成的矢量，先实现直方图的提取，然后将图形从80X80像素变为10X10个像素，最后将这三个图组成一个一行的向量。

3.按照权利要求1所述基于OpenCV的图形识别与颜色识别的实现，其特征在于：

采用HSV颜色空间来进行颜色识别，首先将图形从BGR颜色空间转化为HSV颜色空间,将颜色的范围值从从上面的文件中读入，得到一个二值图imgThresholded，通过对此二值图的分析，就能进行颜色识别，以灰度图中的非零值做为基准，然后计算出每个颜色范围的二值图的非零值，最后计算出比值，将一个图形的所有颜色范围的比值保存到一起，找出最大值，以及最大值的位置，就能确定其颜色，对每一个图形做上面同样的处理，完成所有的图形颜色的识别。