CN115497099A - 一种基于圆周扫描式的单一字符图像匹配识别方法 - Google Patents
一种基于圆周扫描式的单一字符图像匹配识别方法 Download PDFInfo
- Publication number
- CN115497099A CN115497099A CN202211168172.0A CN202211168172A CN115497099A CN 115497099 A CN115497099 A CN 115497099A CN 202211168172 A CN202211168172 A CN 202211168172A CN 115497099 A CN115497099 A CN 115497099A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- value
- feature vector
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种基于圆周扫描式的单一字符图像匹配识别方法,包括:提取字符样本库中各字符样本特征向量Sii,将待识别的字符图像A转化为灰度图像B,将图像B转化为二值图像C,对图像C进行边缘切割,得到图像D;将图像D进行缩放,得到图像E;以图像E的中心点为圆心,以n度为步长进行圆周扫描,统计每个步长上的像素值为1和0的数量,得到待识别字符特征向量w;逐一计算待识别字符特征向量w与每个字符样本特征向量Sii的相关系数,得到相关系数统计量F;计算相关系数统计量F的均值和均方差,基于预设置信度判断待识别的单一字符图像A是否匹配成功。基于此,本发明可有效保证字符识别的准确率和识别效率。
Description
技术领域
本发明涉及计算机视觉与图像识别技术领域,具体涉及一种基于圆周扫描式的单一字符图像匹配识别方法。
背景技术
随着可见光、红外、雷达等各种传感器的广泛部署应用,各类专用业务系统产生了大量图像数据;另外,得益于移动互联网的普及,图像数据的生成速度也在加快。面对堆积如山的视频和照片,单一依赖人工进行图像识别的途径显然已经力不从心,必须借助计算机视觉与图像处理技术,进行自动化图像识别。字符识别是图像识别的重要内容之一,旨在采用智能化手段,对一幅图像中的最具代表性的字符特征进行提取、识别,进而达到对图像中的物体进行个体身份识别的目的;字符识别技术在智能交通管理、军事侦察和卫星影像数据处理等方面具有广泛的应用需求。
字符识别过程一般包括图像预处理、字符图像定位、字符图像分割和字符图像匹配识别四个步骤。针对字符图像分割(第三步骤)后得到的单一字符图片,传统采用待识别字符与标准字符库进行逐一图像矩阵比较,选择差异最小的作为匹配识别结果的字符图像匹配识别(第四步骤)方法。传统方法对质量较好、扰动较小的字符图片的识别成功率较高,但对于质量较差、扰动较大的字符图片很难正确识别,很难达到人眼识别的准确度;而且当字符图片尺寸增大时,图像矩阵比较成倍增加了计算量,使得识别效率降低。
发明内容
针对现有技术中存在的上述问题,本发明提供一种基于圆周扫描式的单一字符图像匹配识别方法,其在智能交通管理、军事侦察和卫星影像数据处理等方面具有广阔应用前景。
本发明公开了一种基于圆周扫描式的单一字符图像匹配识别方法,包括:
对字符样本库中的所有字符样本图像进行处理,提取字符样本特征向量Sii,得到字符样本特征向量组S;其中,S={Sii,ii=1,2,…LEN},LEN为字符样本库中字符样本图像的总数;
将待识别的单一字符图像A转化为灰度图像B;
将灰度图像B转化为二值图像C;
对二值图像C的边缘进行切割,去除空白区域,得到图像D;
将图像D缩放为M行N列像素大小,得到图像E;
以图像E的中心点为圆心,以n度为步长进行圆周扫描,分别统计每个步长上的像素值为1和0的数量,得到待识别字符特征向量w;其中,待识别字符特征向量w与字符样本特征向量Sii的大小一致,均为(360×2)/n行1列;
逐一计算待识别字符特征向量w与每一个字符样本特征向量Sii的相关系数,得到相关系数统计量F;
计算相关系数统计量F的均值和均方差,判断相关系数最小的字符样本图像的相关系数与均值的差是否小于负R倍均方差;若小于,则待识别的单一字符图像A匹配成功。
作为本发明的进一步改进,对字符样本库中的所有字符样本图像进行处理,提取字符样本特征向量Sii,得到字符样本特征向量组S;具体包括:
构建字符样本库;其中,字符样本库是专用业务系统中可能出现的字符全集的标准化数据和全集中某些字符的若干典型采样数据的集合,这些数据以文件方式存放在某个专用目录下;标准化数据是指包含特定字符集并以规定字型表示的字符图像数据;例如:飞机尾部侧翼喷涂的飞机编号由1个字母和4位数字组成,其特定字符集是不超过26个字母(A~Z)和10个数字(0~9)的集合,以黑体字型图片作为标准化数据。通常基于专用图像采集设备、特定拍摄场景和相同图像预处理过程多次采样得到的某个字符图像相似性很高,具有代表性,任选其中一个作为典型采样数据。某个字符的典型采样数据与其标准化数据会有一定差异,将典型采样数据也以图片文件方式加入到字符样本库中。某个字符样本图片文件的格式、大小、颜色无强制性要求,但主文件名首位必须是该字符,对于同一字符样本存在多个对应数据的,从主文件名第二位开始以数字加以区分。如:京.jpg,京1.jpg,京0.jpg,京01.jpg等等,均表示字符“京”的样本;
令ii=1,读取字符样本库中第ii个字符样本图像a;
将字符样本图像a转化为灰度图像b;
将灰度图像b转化为二值图像c;
对二值图像c的边缘进行切割,去除空白区域,得到图像d;
将图像d缩放为M行N列像素大小,得到图像e;
以图像e的中心点为圆心,以n度为步长进行圆周扫描,分别统计每个步长上的像素值为1和0的数量,得到字符样本特征向量Sii;
令ii=ii+1,重复上述操作,直至ii=LEN,输出字符样本特征向量组S={Sii,ii=1,2,…LEN}。
作为本发明的进一步改进,
将灰度图像B转化为二值图像C,具体包括:
取灰度图像B中像素值的最大值和最小值,分别记为B_max和B_min;
遍历灰度图像B中的所有像素点,将像素值大于或等于阀值BT的赋值为1,否则赋值为0,得到0-1二值图像C;
或,
将灰度图像b转化为二值图像c,具体包括:
取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min;
遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0-1二值图像c。
作为本发明的进一步改进,
对二值图像C的边缘进行切割,去除空白区域,得到图像D;具体包括:
获得二值图像C的像素尺寸,包括:高度mC,宽度nC;
令:top=1,bottom=mC,left=1,right=nC;
若二值图像C的top行的像素值的和为0且top<=mC时,则一直执行top=top+1;
若二值图像C的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom-1;
若二值图像C的left列的像素值的和为0且left<nC时,则一直执行left=left+1;
若二值图像C的right列的像素值的和为0且right>=1时,则一直执行right=right-1;
按照左上点坐标(left,top),高度hD=bottom-top,宽度wD=right-left,裁剪二值图像C,得到边缘切割后的图像D;
或,
对二值图像c的边缘进行切割,去除空白区域,得到图像d;具体包括:
获得二值图像c的像素尺寸,包括:高度mc,宽度nc;
令:top=1,bottom=mc,left=1,right=nc;
若二值图像c的top行的像素值的和为0且top<=mc时,则一直执行top=top+1;
若二值图像c的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom-1;
若二值图像c的left列的像素值的和为0且left<nc时,则一直执行left=left+1;
若二值图像c的right列的像素值的和为0且right>=1时,则一直执行right=right-1;
按照左上点坐标(left,top),高度hd=bottom-top,宽度wd=right-left,裁剪二值图像c,得到边缘切割后的图像d。
作为本发明的进一步改进,采用最近邻域插值法将图像D缩放为M行N列像素大小,得到图像E;或,采用最近邻域插值法将图像d缩放为M行N列像素大小,得到图像e。
作为本发明的进一步改进,以1度为步长进行圆周扫描。
作为本发明的进一步改进,
得到待识别字符特征向量w,具体包括:
获得图像E的像素尺寸,包括:高度hE、宽度wE,并令LL2=360*2,初始化特征向量w为LL2行1列,确定图像E的中心像素点坐标(xE,yE);其中:
遍历图像E的所有像素点,计算其坐标点相对于(xE,yE)的角度值Q,单位为度;并取整为ne,得到向量w的1值下标me=2*ne+1和0值下标me+1;若图像E的该点像素值大于或等于1,则w(me)值加1,否则w(me+1)值加1;
得到待识别字符特征向量w,大小为LL2行1列;
或,
得到字符样本特征向量Sii,具体包括:
获得图像e的像素尺寸,包括:高度he、宽度we,并令LL2=360*2,初始化特征向量wwe为LL2行1列,确定图像e的中心像素点坐标(x0,y0);其中:
遍历图像e的所有像素点,计算其坐标点相对于(x0,y0)的角度值Q,单位为度;并取整为ne,得到向量wwe的1值下标me=2*ne+1和0值下标me+1;若图像e的该点像素值大于或等于1,则wwe(me)值加1,否则wwe(me+1)值加1;
令Sii=wwe,得到第ii个字符样本特征向量Sii,大小为LL2行1列。
作为本发明的进一步改进,通过自定义函数CalAngel()计算某坐标点相对于(xE,yE)的角度值Q或某坐标点相对于(x0,y0)的角度值Q。
作为本发明的进一步改进,逐一计算待识别字符特征向量w与每一个字符样本特征向量Sii的相关系数,得到相关系数统计量F;具体包括:
令ii=1;
计算待识别字符特征向量w和第ii个字符样本特征向量Sii的皮尔逊相关系数Dis;
令Fii=1-Dis,得到待识别字符与第ii个字符样本的相关系数Fii;
令ii=ii+1,重复上述操作,直至ii=LEN,得到待识别字符与字符样本库中每一个字符样本的相关系数统计量F={Fii,ii=1,2,…LEN}。
作为本发明的进一步改进,计算相关系数统计量F的均值和均方差,判断相关系数最小的字符样本图像的相关系数与均值的差是否小于负R倍均方差;若小于,则待识别的单一字符图像A匹配成功;具体包括:
计算相关系数统计量F的均值men和均方差sgm;
查找相关系数统计量F中最小值首次出现的位置pp和最小值Fpp;
计算最小值Fpp与均值men的差值,若差值小于负R倍均方差,则最小值对应的字符样本库中第pp个字符样本图像与待识别的单一字符图像A匹配成功;否则认定待识别字符按照预设置信度匹配失败,无法识别;其中,R通常取值为2,表示成功识别的置信度为95.44%。
与现有技术相比,本发明的有益效果为:
本发明采用圆周扫描方式对字符图像分割后得到的单一字符图像进行特征提取,并通过与预设字符样本库的逐一特征对比,建立相关系数统计量,按照给定置信度判别字符图像识别结果;相比于传统方法,本发明中的字符样本库设置更加灵活,提取到的字符图像特征更加明显,字符图像识别方法更加科学严谨;通过大量试验实测数据表明,本发明通过对字符样本库建立、字符图像特征提取和字符匹配判别三个环节的创新设计,不但易于工程实现,而且可有效保证字符识别的准确率和识别效率。
附图说明
图1为本发明一种实施例公开的基于圆周扫描式的单一字符图像匹配识别方法的流程图;
图2为本发明一种实施例公开的采用CalAngel()函数计算一坐标点相对另一坐标点的角度值的流程图;
图3为本发明一种实施例公开的字符样本库所在目录中的文件显示图;
图4为本发明一种实施例公开的图片质量较好、扰动较小的字符样例;
图5为本发明一种实施例公开的图片质量较差、扰动较大的字符样例;
图6为图4中字符图片“201.jpg”和“801.jpg”的识别结果;
图7为图4中字符图片“D01.jpg”和“Q01.jpg”的识别结果;
图8为图4中字符图片“鄂01.jpg”和“琼01.jpg”的识别结果;
图9为图4中字符图片“皖01.jpg”和“新01.jpg”的识别结果;
图10为图5中字符图片“赣109.jpg”和“赣111.jpg”的识别结果;
图11为图5中字符图片“赣195.jpg”和“黑101.jpg”的识别结果;
图12为图5中字符图片“黑104.jpg”和“黑131.jpg”的识别结果;
图13为图5中字符图片“冀100.jpg”和“冀105.jpg”的识别结果;
图14为图5中字符图片“京101.jpg”和“蒙106.jpg”的识别结果。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明做进一步的详细描述:
实施例:
如图1所示,本发明提供一种基于圆周扫描式的单一字符图像匹配识别方法,该实施例基于Matlab实现,可应用于智能交通管理中的蓝标车牌识别系统中;包括:
S1、对字符样本库中的所有字符样本图像进行处理,提取字符样本特征向量Sii,得到字符样本特征向量组S;其中,S={Sii,ii=1,2,…LEN},LEN为字符样本库中字符样本图像的总数;
具体包括:
S11、构建字符样本库;其中,
本实施例的字符样本库是蓝标车牌识别系统中可能出现的字符全集的标准化数据和全集中某些字符的若干典型采样数据的集合,蓝标车牌识别系统中可能出现的字符全集包括31个省份简称、字母A~Z(不含I和O)和数字0~9。因蓝标车牌字符字型为特殊字体(防止伪造),本实施例中采用黑体字型替代。典型采样数据是系统正常工作时采样得到的与其标准化数据有一定差异的字符样本。这些数据以jpg文件格式存放在专用目录wordlib下,有效文件总数LEN=120个;字符样本图片文件的格式、大小、颜色无强制性要求,但主文件名首位必须是该字符,对于同一字符样本存在多个对应数据的,从主文件名第二位开始以数字加以区分;通过浏览器查看wordlib目录下的字符样本图片文件效果如图3所示。
S12、令ii=1。
S13、读取wordlib目录下的第ii个字符样本图像(其包含路径的文件名为a);若字符样本图像a为彩色,则将字符样本图像a转化为灰度图像b;
在Matlab中的执行语句是:
b=imread(a);
if ndims(b)==3b=rgb2gray(b);
end
S14、将灰度图像b转化为二值图像c,在Matlab中自定义的函数名是pls_gray2BW01();
具体包括:
S141、取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min;
在Matlab中的执行语句是:
g_max=double(max(max(b)));
g_min=double(min(min(b)));
S142、计算阀值T;
在Matlab中的执行语句是:
T=round(g_max-(g_max-g_min)/3);
S143、遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0-1二值图像c。
在Matlab中的执行语句是:
S15、对二值图像c的边缘进行切割,去除四周空白区域,得到图像d;在Matlab中自定义的函数名是qiege();
具体包括:
S151、获得图像c的像素尺寸;
在Matlab中的执行语句是:
[mc,nc]=size(c);
S152、令:top=1,bottom=mc,left=1,right=nc;
S153、如果图像c的top行的像素值的和为0,且top<=mc条件满足时,一直执行top=top+1;
在Matlab中的执行语句是:
while sum(c(top,:))==0&&top<=mc
top=top+1;
end
S154、如果图像c的bottom行的像素值的和为0,且bottom>1条件满足时,一直执行bottom=bottom-1;
在Matlab中的执行语句是:
while sum(c(bottom,:))==0&&bottom>1
bottom=bottom-1;
end
S155、如果图像c的left列的像素值的和为0,且left<nc条件满足时,一直执行left=left+1;
在Matlab中的执行语句是:
while sum(c(:,left))==0&&left<nc
left=left+1;
end
S156、如果图像c的right列的像素值的和为0,且right>=1条件满足时,一直执行right=right-1;
在Matlab中的执行语句是:
while sum(c(:,right))==0&&right>=1
right=right-1;
end
S157、按照左上点坐标(left,top),高度hd=bottom-top,宽度wd=right-left,裁剪图像c,得到边缘切割后的图像d。
在Matlab中的执行语句是:
hd=bottom-top;
wd=right-left;
d=imcrop(c,[left top wd hd]);
S16、采用最近邻域插值法将图像d缩放为M行N列像素大小,得到图像e;其中,本实施例中M取值hh=40,N取值ww=20。
在Matlab中的执行语句是:
e=imresize(d,[M N],'nearest');
S17、以图像e的中心点为圆心,以1度为步长进行圆周扫描,分别统计每个步长上的像素值为1和0的数量,得到大小为LL2=360*2=720行1列的特征向量Sii;在Matlab中自定义的函数名是BWtoCircle01();
具体包括:
S171、获得图像e的像素尺寸,并令LL2=360*2,初始化特征向量wwe,确定图像e的中心像素点坐标(x0,y0);
在Matlab中的执行语句是:
[he,we]=size(e);
LL2=360*2;
wwe=zeros(LL2,1);%初始化为LL2行1列的向量
y0=he/2;
x0=we/2;
S172、遍历图像e的所有像素点,计算其坐标点相对于(x0,y0)的角度值Q(单位为度),并取整为ne,得到向量wwe的1值下标me=2*ne+1和0值下标me+1;如果图像e的该点像素值大于或等于1,则wwe(me)值加1,否则wwe(me+1)值加1;
在Matlab中的执行语句是:
其中自定义函数CalAngel([x y])的功能是计算(x,y)点相对于原点的角度(单位为度),其实现过程如图2所示。
S173、令Sii=wwe,得到第ii个字符样本的特征向量(LL2行1列)。
S18、令ii=ii+1,如果ii<=LEN=120,则转至S13,否则,S1结束,得到字符样本特征向量组S={Sii,ii=1,2,…LEN}。
以上S1在Matlab中自定义的函数名是pls_cos_fun(),函数体内容如下:
function[S,imgNames,LEN]=pls_cos_fun(input_args)%读取wordlib目录下的字符样本文件,提取字符特征向量组S;
global hh;%全局变量M
global ww;%全局变量N
%hh=40;ww=20;%统一调整为高40*宽20个像素的图像
LL=hh*ww;
pname='wordlib';
pname=strcat(pname,'\');
pathfile=strcat(pname,'*.*');
imgNames=dir(pathfile);
LEN=length(imgNames);
for ii=1:LEN
fname=imgNames(ii).name;
a=strcat(pname,fname);
b=imread(a);%读入字符图片文件a
if ndims(b)==3b=rgb2gray(b);end%如果是彩色图像,则转为灰度图b
c=pls_gray2BW01(b);%将灰度图b转换为0-1二值图c
d=qiege(c);%切割二值图像c周边的空白区域
e=imresize(d,[hh ww],'nearest');%对图像d做缩放处理,得到图e:高M,宽N,缩放图像时采用最近邻域插值算法
[wwe,LL2]=BWtoCircle01(e);%对图e,进行圆周扫描,分别计算不同角度的1、0值和,返回LL2行1列的特征向量
S(:,:,ii)=wwe;
end
end
S2、选择并读取待识别的字符图像A,将其转化为灰度图像B;
在Matlab中的执行语句是:
[fn,pn,~]=uigetfile('*.*','选择待识别的字符图片');
A=[pn,fn];%包含路径的字符图片文件A
B=imread(A);%读取待识别的字符A。
if ndims(B)==3B=rgb2gray(B);end%如果B是彩色图像,则转为灰度图
S3、将字符灰度图像B转化为0-1二值图像C;在Matlab中自定义的函数名是pls_gray2BW01(),实现过程与S14相同。
S4:对二值图像C的边缘进行切割,去除空白区域,得到图像D;在Matlab中自定义的函数名是qiege(),实现过程与S15相同。
S5:采用最近邻域插值法将图像D缩放为M行N列像素大小,得到图像E;本实施例中M取值hh=40,N取值ww=20;
在Matlab中的执行语句是:
E=imresize(D,[M N],'nearest');
S6、以图像E的中心点为圆心,以1度为步长进行圆周扫描,分别统计每个步长上的像素值为1和0的数量,得到大小为720行1列的特征向量w;在Matlab中自定义的函数名是BWtoCircle01(),实现过程与S17相同。
S7、逐一计算待识别字符特征向量w与每一个字符样本特征向量Sii的相关系数,得到相关系数统计量F;
具体包括:
S71、令ii=1;
S72、计算待识别字符特征向量w和第ii个字符样本特征向量Sii的皮尔逊相关系数Dis;
在Matlab中的执行语句是:
Dis=corr(w,S(:,:,ii),'type','pearson');%计算皮尔逊相关系数
S73、令Fii=1-Dis,得到待识别字符与第ii个字符样本的相关系数Fii。
S74、令ii=ii+1,如果ii<=LEN=120,则转至S72,否则,S7结束,得到待识别字符与字符样本库中每一个字符样本的相关系数统计量F={Fii,ii=1,2,…LEN}。
S8、计算相关系数统计量F的均值和均方差,判断相关系数最小的字符样本图像的相关系数与均值的差是否小于负R倍均方差;若小于,则待识别的单一字符图像A匹配成功,否则认定待识别字符图像按照给定置信度匹配失败,无法识别。
具体包括:
S81、计算相关系数统计量F的均值men和均方差sgm;
在Matlab中的执行语句是:
men=mean(F);%求均值
sgm=std(F,0);%求均方差
S82、查找相关系数统计量F中最小值首次出现的位置pp和最小值Fpp=F(1,pp);
在Matlab中的执行语句是:
pos=find(F==min(F));%查找最小值在F中的位置
pp=pos(1);%取最小值首次出现的位置,F(1,pp)为最小值
S83、计算最小值Fpp与均值men的差值,如果小于负R倍均方差,则最小值对应的字符样本库中第pp个图像样本与待识别字符图像匹配成功,否则认定待识别字符按照给定置信度匹配失败,无法识别。本实施例中R取值为2,表示成功识别的置信度为95.44%。
Matlab中的执行语句是:
dis=F(1,pp)-men;
sgm2=-2*sgm;
if dis<=sgm2 title(imgNames(pp).name);%距离值最小,且差值小于或等于-2倍均方差,识别成功正确率95%以上,显示字符样本库中对应的文件名。
else title('匹配失败!');%距离值最小,但差值大于-2倍均方差,匹配成功正确率达不到95%,显示“匹配失败”
end
本实施例基于Matlab R2012a win64运行环境,其中,字符样本库所在目录wordlib中的文件显示如图3所示。从S2开始多次执行本实施例程序,分别选择质量较好、较差的两类待识别字符图片文件进行字符图像识别。图片质量较好、扰动较小的字符样例如图4所示;图片质量较差、扰动较大,但依然可以人工辨别的字符样例如图5所示。图6~图9是对8幅图片质量较好、扰动较小的字符样例的匹配识别情况,图10~图14是对10幅图片质量较差、扰动较大的字符样例的匹配识别情况,均匹配识别正确。
从以上样例识别过程来看,采用本发明所述方法,对质量较好的字符图片的识别成功率与传统方法差异不大,但对于质量较差的字符图片的识别优势明显,字符图像识别正确率显著提高,基本达到了人眼识别的准确度。
本发明通过对预设字符样本库的适当管理(在标准化数据之外,灵活引入典型采用数据)和基于圆周扫描式的单一字符图像特征提取,增大了两幅字符图片相关系数最小时成功匹配的概率;采取按照给定置信度判别字符图像识别结果的方法,保证了匹配识别结论的可信度。对比试验表明,该方法适用于基于专用图像采集设备、特定拍摄场景和相同图像预处理过程的专用业务系统,易于工程实现,综合性能比传统方法具有更优的字符识别效果;本发明所提供的方法的时间复杂度和空间复杂度都很低,可操作性和实用性很强。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。例如但不限于以下几点:
1、关于字符样本库的大小问题:样本库有效文件总数LEN一般应大于45,这样才能保证S7中得到的统计量F具有统计学特征。增加典型采样数据可以扩大样本库规模,也有利于提高专用业务系统中字符图像识别的成功率,但随着样本库总量的增加,也带来S7中相关系数计算量的增加,因此在实际应用中LEN的取值应平衡匹配识别成功率与识别效率的关系。
2、关于圆周扫描的圆心和步长参数选择问题:S6和S17中均以图像的中心点为圆心、以1度为步长扫描计算字符特征向量。在实际应用中,可以根据专用业务系统数据处理特点,灵活选择这两个参数;比如:可以选择图像中所有1值像素点的几何中心为圆心;为提高字符特征精细化程度,可以减小扫描步长等。
3、关于特征向量的比较问题:S7中借助皮尔逊相关系数比较两个特征向量之间的距离,距离越小,相关性越强,相似性越高。在实际应用中,也可以尝试其它方法比较两个向量之间的距离,比如欧式距离、方向余弦、曼哈顿距离、契比雪夫距离、闵可夫斯基距离、汉明距离、杰卡德距离等;以上距离的计算在Matlab中均可通过函数pdist()调用完成,本文不再赘述。
4、对于字符样本库已经固化的专用业务系统,可以将执行S18后得到的字符样本特征向量组S按照二进制文件方式进行存储,以后程序启动时,直接读入使用,这样可以极大提高系统开机速度。
5、对于统一缩放到M行N列的字符图像,其每个像素点坐标与其特征向量1值下标和0值下标有唯一的映射关系,因此,在经过S172首次计算后,可以将这种映射关系存储到一个全局变量结构中,以备S172剩余执行和S62执行时使用,这样可以有效提高程序运行速度。
Claims (10)
1.一种基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,包括:
对字符样本库中的所有字符样本图像进行处理,提取字符样本特征向量Sii,得到字符样本特征向量组S;其中,S={Sii,ii=1,2,…LEN},LEN为字符样本库中字符样本图像的总数;
将待识别的单一字符图像A转化为灰度图像B;
将灰度图像B转化为二值图像C;
对二值图像C的边缘进行切割,去除空白区域,得到图像D;
将图像D缩放为M行N列像素大小,得到图像E;
以图像E的中心点为圆心,以n度为步长进行圆周扫描,分别统计每个步长上的像素值为1和0的数量,得到待识别字符特征向量w;其中,待识别字符特征向量w与字符样本特征向量Sii的大小一致,均为(360×2)/n行1列;
逐一计算待识别字符特征向量w与每一个字符样本特征向量Sii的相关系数,得到相关系数统计量F;
计算相关系数统计量F的均值和均方差,判断相关系数最小的字符样本图像的相关系数与均值的差是否小于负R倍均方差;若小于,则待识别的单一字符图像A匹配成功。
2.如权利要求1所述的基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,对字符样本库中的所有字符样本图像进行处理,提取字符样本特征向量Sii,得到字符样本特征向量组S;具体包括:
构建字符样本库;其中,所述字符样本库包括对应业务系统可能出现的字符全集的标准化数据以及全集中某些字符的若干典型采样数据,标准化数据和典型采样数据共同作为字符样本图像,主文件名首位为该字符、从主文件名第二位开始以数字加以区分同一字符的不同样本图像;
令ii=1,读取字符样本库中第ii个字符样本图像a;
将字符样本图像a转化为灰度图像b;
将灰度图像b转化为二值图像c;
对二值图像c的边缘进行切割,去除空白区域,得到图像d;
将图像d缩放为M行N列像素大小,得到图像e;
以图像e的中心点为圆心,以n度为步长进行圆周扫描,分别统计每个步长上的像素值为1和0的数量,得到字符样本特征向量Sii;
令ii=ii+1,重复上述操作,直至ii=LEN,输出字符样本特征向量组S={Sii,ii=1,2,…LEN}。
4.如权利要求1或2所述的基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,
对二值图像C的边缘进行切割,去除空白区域,得到图像D;具体包括:
获得二值图像C的像素尺寸,包括:高度mC,宽度nC;
令:top=1,bottom=mC,left=1,right=nC;
若二值图像C的top行的像素值的和为0且top<=mC时,则一直执行top=top+1;
若二值图像C的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom-1;
若二值图像C的left列的像素值的和为0且left<nC时,则一直执行left=left+1;
若二值图像C的right列的像素值的和为0且right>=1时,则一直执行right=right-1;
按照左上点坐标(left,top),高度hD=bottom-top,宽度wD=right-left,裁剪二值图像C,得到边缘切割后的图像D;
或,
对二值图像c的边缘进行切割,去除空白区域,得到图像d;具体包括:
获得二值图像c的像素尺寸,包括:高度mc,宽度nc;
令:top=1,bottom=mc,left=1,right=nc;
若二值图像c的top行的像素值的和为0且top<=mc时,则一直执行top=top+1;
若二值图像c的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom-1;
若二值图像c的left列的像素值的和为0且left<nc时,则一直执行left=left+1;
若二值图像c的right列的像素值的和为0且right>=1时,则一直执行right=right-1;
按照左上点坐标(left,top),高度hd=bottom-top,宽度wd=right-left,裁剪二值图像c,得到边缘切割后的图像d。
5.如权利要求1或2所述的基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,采用最近邻域插值法将图像D缩放为M行N列像素大小,得到图像E;或,采用最近邻域插值法将图像d缩放为M行N列像素大小,得到图像e。
6.如权利要求1或2所述的基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,以1度为步长进行圆周扫描。
7.如权利要求6所述的基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,
得到待识别字符特征向量w,具体包括:
获得图像E的像素尺寸,包括:高度hE、宽度wE,并令LL2=360*2,初始化特征向量w为LL2行1列,确定图像E的中心像素点坐标(xE,yE);其中:
遍历图像E的所有像素点,计算其坐标点相对于(xE,yE)的角度值Q,单位为度;并取整为ne,得到向量w的1值下标me=2*ne+1和0值下标me+1;若图像E的该点像素值大于或等于1,则w(me)值加1,否则w(me+1)值加1;
得到待识别字符特征向量w,大小为LL2行1列;
或,
得到字符样本特征向量Sii,具体包括:
获得图像e的像素尺寸,包括:高度he、宽度we,并令LL2=360*2,初始化特征向量wwe为LL2行1列,确定图像e的中心像素点坐标(x0,y0);其中:
遍历图像e的所有像素点,计算其坐标点相对于(x0,y0)的角度值Q,单位为度;并取整为ne,得到向量wwe的1值下标me=2*ne+1和0值下标me+1;若图像e的该点像素值大于或等于1,则wwe(me)值加1,否则wwe(me+1)值加1;
令Sii=wwe,得到第ii个字符样本特征向量Sii,大小为LL2行1列。
8.如权利要求7所述的基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,通过自定义函数CalAngel()计算某坐标点相对于(xE,yE)的角度值Q或某坐标点相对于(x0,y0)的角度值Q。
9.如权利要求1或2所述的基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,逐一计算待识别字符特征向量w与每一个字符样本特征向量Sii的相关系数,得到相关系数统计量F;具体包括:
令ii=1;
计算待识别字符特征向量w和第ii个字符样本特征向量Sii的皮尔逊相关系数Dis;
令Fii=1-Dis,得到待识别字符与第ii个字符样本的相关系数Fii;
令ii=ii+1,重复上述操作,直至ii=LEN,得到待识别字符与字符样本库中每一个字符样本的相关系数统计量F={Fii,ii=1,2,…LEN}。
10.如权利要求1或2所述的基于圆周扫描式的单一字符图像匹配识别方法,其特征在于,计算相关系数统计量F的均值和均方差,判断相关系数最小的字符样本图像的相关系数与均值的差是否小于负R倍均方差;若小于,则待识别的单一字符图像A匹配成功;具体包括:
计算相关系数统计量F的均值men和均方差sgm;
查找相关系数统计量F中最小值首次出现的位置pp和最小值Fpp;
计算最小值Fpp与均值men的差值,若差值小于负R倍均方差,则最小值对应的字符样本库中第pp个字符样本图像与待识别的单一字符图像A匹配成功;否则认定待识别字符按照预设置信度匹配失败,无法识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211168172.0A CN115497099B (zh) | 2022-09-23 | 2022-09-23 | 一种基于圆周扫描式的单一字符图像匹配识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211168172.0A CN115497099B (zh) | 2022-09-23 | 2022-09-23 | 一种基于圆周扫描式的单一字符图像匹配识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115497099A true CN115497099A (zh) | 2022-12-20 |
CN115497099B CN115497099B (zh) | 2023-04-18 |
Family
ID=84469549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211168172.0A Active CN115497099B (zh) | 2022-09-23 | 2022-09-23 | 一种基于圆周扫描式的单一字符图像匹配识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115497099B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09128541A (ja) * | 1995-11-06 | 1997-05-16 | Fuji Elelctrochem Co Ltd | 円周上の文字検査方法 |
US20160155012A1 (en) * | 2013-07-24 | 2016-06-02 | Nec Corporation | Image Recognition Apparatus and Storage Medium |
CN105675626A (zh) * | 2016-02-26 | 2016-06-15 | 广东工业大学 | 一种轮胎模具的字符缺陷检测方法 |
KR101873024B1 (ko) * | 2017-08-21 | 2018-07-31 | 일성기계공업 주식회사 | 원단교정기에서의 원단패턴 정밀 검출장치 |
CN110852315A (zh) * | 2019-09-27 | 2020-02-28 | 武汉大学 | 环形文字快速识别方法及装置 |
CN111274974A (zh) * | 2020-01-21 | 2020-06-12 | 北京百度网讯科技有限公司 | 定位元素检测方法、装置、设备和介质 |
CN111914828A (zh) * | 2020-08-13 | 2020-11-10 | 安徽淘云科技有限公司 | 图像采集方法、装置、扫描笔和存储介质 |
US20210169336A1 (en) * | 2018-11-13 | 2021-06-10 | Enspectra Health, Inc. | Methods and systems for identifying tissue characteristics |
CN114299502A (zh) * | 2022-03-07 | 2022-04-08 | 科大智能物联技术股份有限公司 | 圆铸坯端面喷码字符倾斜矫正与识别方法、存储介质 |
-
2022
- 2022-09-23 CN CN202211168172.0A patent/CN115497099B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09128541A (ja) * | 1995-11-06 | 1997-05-16 | Fuji Elelctrochem Co Ltd | 円周上の文字検査方法 |
US20160155012A1 (en) * | 2013-07-24 | 2016-06-02 | Nec Corporation | Image Recognition Apparatus and Storage Medium |
CN105675626A (zh) * | 2016-02-26 | 2016-06-15 | 广东工业大学 | 一种轮胎模具的字符缺陷检测方法 |
KR101873024B1 (ko) * | 2017-08-21 | 2018-07-31 | 일성기계공업 주식회사 | 원단교정기에서의 원단패턴 정밀 검출장치 |
US20210169336A1 (en) * | 2018-11-13 | 2021-06-10 | Enspectra Health, Inc. | Methods and systems for identifying tissue characteristics |
CN110852315A (zh) * | 2019-09-27 | 2020-02-28 | 武汉大学 | 环形文字快速识别方法及装置 |
CN111274974A (zh) * | 2020-01-21 | 2020-06-12 | 北京百度网讯科技有限公司 | 定位元素检测方法、装置、设备和介质 |
CN111914828A (zh) * | 2020-08-13 | 2020-11-10 | 安徽淘云科技有限公司 | 图像采集方法、装置、扫描笔和存储介质 |
CN114299502A (zh) * | 2022-03-07 | 2022-04-08 | 科大智能物联技术股份有限公司 | 圆铸坯端面喷码字符倾斜矫正与识别方法、存储介质 |
Non-Patent Citations (2)
Title |
---|
NATSUDA KAOTHANTHONG ET AL.: "Improving Thai Optical Character Recognition using Circular-Scan Histogram" * |
岳晓峰: "计算机视觉技术及其在工业中应用的研究" * |
Also Published As
Publication number | Publication date |
---|---|
CN115497099B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qin et al. | Query adaptive similarity for large scale object retrieval | |
Paul et al. | Remote sensing optical image registration using modified uniform robust SIFT | |
EP2808827B1 (en) | System and method for OCR output verification | |
CN110853033B (zh) | 基于帧间相似度的视频检测方法和装置 | |
Cheng et al. | Robust affine invariant feature extraction for image matching | |
CN109343920B (zh) | 一种图像处理方法及其装置、设备和存储介质 | |
CN111651636A (zh) | 视频相似片段搜索方法及装置 | |
CN111191649A (zh) | 一种识别弯曲多行文本图像的方法与设备 | |
CN111783770B (zh) | 图像的矫正方法、装置和计算机可读存储介质 | |
US20200005078A1 (en) | Content aware forensic detection of image manipulations | |
CN111898428A (zh) | 一种基于orb的无人机特征点匹配方法 | |
CN110942473A (zh) | 一种基于特征点网格化匹配的运动目标跟踪检测方法 | |
JP4859061B2 (ja) | 画像の補正方法、補正プログラムおよび画像歪み補正装置 | |
CN110942002A (zh) | 一种基于旋转不变感知哈希的无人机航拍视频帧定位方法 | |
CN115497099B (zh) | 一种基于圆周扫描式的单一字符图像匹配识别方法 | |
CN112084365A (zh) | 基于OpenCV和CUDA加速的网络相机的实时图像检索方法 | |
CN110704667B (zh) | 一种基于语义信息的快速相似图检测方法 | |
CN111612063A (zh) | 一种图像匹配方法、装置、设备及计算机可读存储介质 | |
JP2009276937A (ja) | 辞書作成装置、認識装置、認識方法及び認識プログラム | |
CN112184843B (zh) | 图像数据压缩的冗余数据去除系统及方法 | |
CN115588204B (zh) | 一种基于ds证据理论的单一字符图像匹配识别方法 | |
CN115578734B (zh) | 一种基于金字塔特征的单一字符图像匹配识别方法 | |
Ren et al. | SAR image matching method based on improved SIFT for navigation system | |
CN111951211B (zh) | 一种目标检测方法、装置及计算机可读存储介质 | |
Zhao et al. | Robust Region Feature Extraction with Salient MSER and Segment Distance-weighted GLOH for Remote Sensing Image Registration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |