CN115588204A - 一种基于ds证据理论的单一字符图像匹配识别方法 - Google Patents

一种基于ds证据理论的单一字符图像匹配识别方法 Download PDF

Info

Publication number
CN115588204A
CN115588204A CN202211167652.5A CN202211167652A CN115588204A CN 115588204 A CN115588204 A CN 115588204A CN 202211167652 A CN202211167652 A CN 202211167652A CN 115588204 A CN115588204 A CN 115588204A
Authority
CN
China
Prior art keywords
character
image
sample
feature vector
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211167652.5A
Other languages
English (en)
Other versions
CN115588204B (zh
Inventor
高天睿
齐伟华
李红亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DIGITAL CHINA ADVANCED SYSTEMS SERVICES CO LTD
Original Assignee
DIGITAL CHINA ADVANCED SYSTEMS SERVICES CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DIGITAL CHINA ADVANCED SYSTEMS SERVICES CO LTD filed Critical DIGITAL CHINA ADVANCED SYSTEMS SERVICES CO LTD
Priority to CN202211167652.5A priority Critical patent/CN115588204B/zh
Publication of CN115588204A publication Critical patent/CN115588204A/zh
Application granted granted Critical
Publication of CN115588204B publication Critical patent/CN115588204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1918Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种基于DS证据理论的单一字符图像匹配识别方法,包括:将待识别的单一字符图像A经灰度、二值化、边缘切割和缩放转化,得到图像E;采用圆周扫描和隔行展开两种方式分别得到字符样本库中各字符样本特征向量S1ii和S2ii、图像E的待识别字符特征向量w1和w2;逐一计算w1与每一S1ii、w2与每一S2ii的欧式距离,得到距离序列F1和F2;分别选取F1和F2中较小的n个值对应的字符样本并求并集,得到备选字符集合H;基于DS证据理论,计算备选字符集合H中每一个字符元素的DS融合匹配概率,取融合匹配概率最大的字符元素,作为图像A的匹配结果。基于此,本发明可有效保证字符识别的准确率和识别效率。

Description

一种基于DS证据理论的单一字符图像匹配识别方法
技术领域
本发明涉及计算机视觉与图像识别技术领域,具体涉及一种基于DS证据理论的单一字符图像匹配识别方法。
背景技术
随着可见光、红外、雷达等各种传感器的广泛部署应用,各类专用业务系统产生了大量图像数据;另外,得益于移动互联网的普及,图像数据的生成速度也在加快。面对堆积如山的视频和照片,单一依赖人工进行图像识别的途径显然已经力不从心,必须借助计算机视觉与图像处理技术,进行自动化图像识别。字符识别是图像识别的重要内容之一,旨在采用智能化手段,对一幅图像中的最具代表性的字符特征进行提取、识别,进而达到对图像中的物体进行个体身份识别的目的;字符识别技术在智能交通管理、军事侦察和卫星影像数据处理等方面具有广泛的应用需求。
字符识别过程一般包括图像预处理、字符图像定位、字符图像分割和字符图像匹配识别四个步骤。针对字符图像分割(第三步骤)后得到的单一字符图片,传统采用待识别字符与标准字符库进行逐一图像矩阵比较,选择差异最小的作为匹配识别结果的字符图像匹配识别(第四步骤)方法。传统方法对质量较好、扰动较小的字符图片的识别成功率较高,但对于质量较差、扰动较大的字符图片很难正确识别,很难达到人眼识别的准确度;而且当字符图片尺寸增大时,图像矩阵比较成倍增加了计算量,使得识别效率降低。
发明内容
针对现有技术中存在的上述问题,本发明提供一种基于DS证据理论的单一字符图像匹配识别方法,其在智能交通管理、军事侦察和卫星影像数据处理等方面具有广阔应用前景。
本发明公开了一种基于DS证据理论的单一字符图像匹配识别方法,包括:
对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1ii和S2ii,得到字符样本特征向量组S1和S2;其中,S1={S1ii,ii=1,2,…LEN}和S2={S2ii,ii=1,2,…LEN},LEN为字符样本库中字符样本图像的总数;
将待识别的单一字符图像A转化为灰度图像B,将灰度图像B转化为二值图像C;对二值图像C的边缘进行切割,去除空白区域,得到图像D;将图像D缩放为M行N列像素大小,得到图像E;
采用圆周扫描和隔行展开两种方式分别得到图像E的待识别字符特征向量w1和w2;
分别逐一计算待识别字符特征向量w1与每一个字符样本特征向量S1ii、待识别字符特征向量w2与每一个字符样本特征向量S2ii的欧式距离,得到距离序列F1和F2;
分别选取距离序列F1和F2中较小的n个值对应的字符样本,得到样本集合H1和H2;求样本集合H1和H2的并集,得到备选字符集合H;
以备选字符集合H中每一个元素值为下标,分别取距离序列F1和F2中的对应值,构成备选字符距离序列P1和P2;根据备选字符距离序列P1和P2分别计算备选字符集合H中每个字符元素的基本匹配概率,得到基本概率序列Q1和Q2;
基于DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K;按照Dempster合成规则,计算备选字符集合H中每一个字符元素的DS融合匹配概率PHjj,得到融合匹配概率序列PH;
取融合匹配概率序列PH中融合匹配概率最大的字符元素,作为待识别的单一字符图像A的匹配结果。
作为本发明的进一步改进,对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1ii和S2ii,得到字符样本特征向量组S1和S2;具体包括:
构建字符样本库;其中,字符样本库是专用业务系统中可能出现的字符全集的标准化数据和全集中某些字符的若干典型采样数据的集合,这些数据以文件方式存放在某个专用目录下;标准化数据是指包含特定字符集并以规定字型表示的字符图像数据;例如:飞机尾部侧翼喷涂的飞机编号由1个字母和4位数字组成,其特定字符集是不超过26个字母(A~Z)和10个数字(0~9)的集合,以黑体字型图片作为标准化数据。通常基于专用图像采集设备、特定拍摄场景和相同图像预处理过程多次采样得到的某个字符图像相似性很高,具有代表性,任选其中一个作为典型采样数据。某个字符的典型采样数据与其标准化数据会有一定差异,将典型采样数据也以图片文件方式加入到字符样本库中。某个字符样本图片文件的格式、大小、颜色无强制性要求,但主文件名首位必须是该字符,对于同一字符样本存在多个对应数据的,从主文件名第二位开始以数字加以区分。如:京.jpg,京1.jpg,京0.jpg,京01.jpg等等,均表示字符“京”的样本;
令ii=1,读取字符样本库中第ii个字符样本图像a;
将字符样本图像a转化为灰度图像b;
将灰度图像b转化为二值图像c;
对二值图像c的边缘进行切割,去除空白区域,得到图像d;
将图像d缩放为M行N列像素大小,得到图像e;
以图像e的中心点为圆心,以1度为步长进行圆周扫描,分别统计每个步长上的像素值为1的数量,得到LL1行1列的字符样本特征向量S1ii
将图像e构成的像素矩阵隔行展开,得到LL2行1列的字符样本特征向量S2ii;其中,LL2=N*M/2;
令ii=ii+1,重复上述操作,直至ii=LEN,输出字符样本特征向量组S1={S1ii,ii=1,2,…LEN}和S2={S2ii,ii=1,2,…LEN}。
作为本发明的进一步改进,
将灰度图像B转化为二值图像C,具体包括:
取灰度图像B中像素值的最大值和最小值,分别记为B_max和B_min;
计算阀值
Figure BDA0003862042860000031
并取整;
遍历灰度图像B中的所有像素点,将像素值大于或等于阀值BT的赋值为1,否则赋值为0,得到0-1二值图像C;
或,
将灰度图像b转化为二值图像c,具体包括:
取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min;
计算阀值
Figure BDA0003862042860000032
并取整;
遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0-1二值图像c。
作为本发明的进一步改进,
对二值图像C的边缘进行切割,去除空白区域,得到图像D;具体包括:
获得二值图像C的像素尺寸,包括:高度mC,宽度nC;
令:top=1,bottom=mC,left=1,right=nC;
若二值图像C的top行的像素值的和为0且top<=mC时,则一直执行top=top+1;
若二值图像C的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom-1;
若二值图像C的left列的像素值的和为0且left<nC时,则一直执行left=left+1;
若二值图像C的right列的像素值的和为0且right>=1时,则一直执行right=right-1;
按照左上点坐标(left,top),高度hD=bottom-top,宽度wD=right-left,裁剪二值图像C,得到边缘切割后的图像D;
或,
对二值图像c的边缘进行切割,去除空白区域,得到图像d;具体包括:
获得二值图像c的像素尺寸,包括:高度mc,宽度nc;
令:top=1,bottom=mc,left=1,right=nc;
若二值图像c的top行的像素值的和为0且top<=mc时,则一直执行top=top+1;
若二值图像c的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom-1;
若二值图像c的left列的像素值的和为0且left<nc时,则一直执行left=left+1;
若二值图像c的right列的像素值的和为0且right>=1时,则一直执行right=right-1;
按照左上点坐标(left,top),高度hd=bottom-top,宽度wd=right-left,裁剪二值图像c,得到边缘切割后的图像d。
作为本发明的进一步改进,采用最近邻域插值法将图像D缩放为M行N列像素大小,得到图像E;或,采用最近邻域插值法将图像d缩放为M行N列像素大小,得到图像e。
作为本发明的进一步改进,
得到待识别字符特征向量w1,具体包括:
获得图像E的像素尺寸,包括:高度hE、宽度wE,并令LL1=360,初始化向量w1为LL1行1列,确定图像E的中心像素点坐标(xE,yE);其中:
Figure BDA0003862042860000051
Figure BDA0003862042860000052
遍历图像E的所有像素点,计算其坐标点相对于(xE,yE)的角度值Q,单位为度;并取整为ne,得到向量w1的下标值me=ne+1;若图像E的该点像素值大于或等于1,则w1(me)值加1;
得到待识别字符特征向量w1,大小为360行1列;
得到待识别字符特征向量w2,具体包括:
令LL2=hE*wE/2,初始化向量Lt为0行0列;
逐一复制图像E构成的像素矩阵的偶数行像素值到向量Lt的末尾,最终组成LL2列1行的向量,然后将Lt转置后赋值为w2,得到图像E的待识别字符特征向量w2;
或,
得到字符样本特征向量S1ii,具体包括:
获得图像e的像素尺寸,包括:高度he、宽度we,并令LL1=360,初始化特征向量Ct为LL1行1列,确定图像e的中心像素点坐标(x0,y0);其中:
Figure BDA0003862042860000053
Figure BDA0003862042860000054
遍历图像e的所有像素点,计算其坐标点相对于(x0,y0)的角度值Q,单位为度;并取整为ne,得到向量Ct的下标值me=ne+1;若图像e的该点像素值大于或等于1,则Ct(me)值加1
令S1ii=Ct,得到第ii个字符样本特征向量S1ii,大小为360行1列;
得到字符样本特征向量S2ii,具体包括:
令LL2=he*we/2,初始化特征向量Lt为0行0列;
逐一复制图像e构成的像素矩阵的偶数行像素值到向量Lt的末尾,最终组成LL2列1行的向量,然后将Lt转置后赋值为S2ii,得到图像e的字符样本特征向量S2ii
进一步,上述通过自定义函数CalAngel()计算某坐标点相对于(xE,yE)的角度值Q或某坐标点相对于(x0,y0)的角度值Q。
作为本发明的进一步改进,分别逐一计算待识别字符特征向量w1与每一个字符样本特征向量S1ii、待识别字符特征向量w2与每一个字符样本特征向量S2ii的欧式距离,得到距离序列F1和F2;具体包括:
令ii=1;
计算待识别字符特征向量w1和第ii个字符样本特征向量S1ii的欧氏距离F1ii
计算待识别字符特征向量w2和第ii个字符样本特征向量S2ii的欧氏距离F2ii
令ii=ii+1,重复上述操作,直至ii=LEN,得到待识别字符与字符样本库中每一个字符样本的欧氏距离序列F1={F1ii,ii=1,2,…LEN}和F2={F2ii,ii=1,2,…LEN}。
作为本发明的进一步改进,分别选取距离序列F1和F2中较小的n个值对应的字符样本,得到样本集合H1和H2;求样本集合H1和H2的并集,得到备选字符集合H;具体包括:
对距离序列F1进行升序排列,记录前n个值对应的字符样本,组成样本集合H1;
对距离序列F2进行升序排列,记录前n个值对应的字符样本,组成样本集合H2;
求集合H1和H2的并集,得到备选字符集合H。
作为本发明的进一步改进,以备选字符集合H中每一个元素值为下标,分别取距离序列F1和F2中的对应值,构成备选字符距离序列P1和P2;根据备选字符距离序列P1和P2分别计算备选字符集合H中每个字符元素的基本匹配概率,得到基本概率序列Q1和Q2;具体包括:
以备选字符集合H中每一个元素值为下标,取距离序列F1中的对应值,构成备选字符距离序列P1;设备选字符集合H中的元素个数为m,m≤n,备选字符距离序列P1表示为P1={P1jj,jj=1,2,…m};
以备选字符集合H中每一个元素值为下标,取距离序列F2中的对应值,构成备选字符距离序列P2;设集合H中的元素个数为m,备选字符距离序列P2表示为P2={P2jj,jj=1,2,…m};
令:
Figure BDA0003862042860000071
得到基本概率序列Q1={Q1jj,jj=1,2,…m};
令:
Figure BDA0003862042860000072
得到基本概率序列Q2={Q2jj,jj=1,2,…m}。
作为本发明的进一步改进,基于DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K;按照Dempster合成规则,计算备选字符集合H中每一个字符元素的DS融合匹配概率PHjj,得到融合匹配概率序列PH;具体包括:
基于DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K:
Figure BDA0003862042860000073
按照Dempster合成规则,计算备选字符集合H中每一个字符元素的DS融合匹配概率PHjj
Figure BDA0003862042860000074
得到融合匹配概率序列PH={PHjj,jj=1,2,…m}。
作为本发明的进一步改进,取融合匹配概率序列PH中融合匹配概率最大的字符元素,作为待识别的单一字符图像A的匹配结果;具体包括:
取融合匹配概率序列PH中的最大值所对应的下标,记为r,1≤r≤m;
取备选字符集合H中第r个元素值,记为s,1≤s≤LEN;
字符样本库中第s个文件的主文件名首位字符,即为待识别的单一字符图像A的匹配识别结果。
与现有技术相比,本发明的有益效果为:
本发明对字符图像分割后得到的单一字符图像采用两种方式进行字符图像特征提取,通过与预设字符样本库的对比,得到基于这两种特征度量的备选字符样本集合,然后按照DS证据理论,计算基本匹配概率和融合匹配概率,认定备选字符样本集合中融合匹配概率最大的字符元素即为匹配识别结果。相比于传统方法,本发明中的字符样本库设置更加灵活,字符图像特征提取方式多样化,字符匹配识别方法更加科学严谨;通过大量试验实测数据表明,本发明通过对字符样本库建立、多样化字符图像特征提取和字符匹配判别三个环节的创新设计,不但易于工程实现,而且可有效保证字符识别的准确率和识别效率。
附图说明
图1为本发明一种实施例公开的基于DS证据理论的单一字符图像匹配识别方法的流程图;
图2为本发明一种实施例公开的采用CalAngel()函数计算一坐标点相对另一坐标点的角度值的流程图;
图3为本发明一种实施例公开的字符样本库所在目录中的文件显示图;
图4为本发明一种实施例公开的图片质量较好、扰动较小的字符样例;
图5为本发明一种实施例公开的图片质量较差、扰动较大的字符样例;
图6为图4中字符图片“鄂01.jpg”的识别结果;
图7为图4中字符图片“皖01.jpg”的识别结果;
图8为图5中字符图片“赣111.jpg”的识别结果;
图9为图5中字符图片“黑104.jpg”的识别结果;
图10为图5中字符图片“冀97.jpg”的识别结果;
图11为图5中字符图片“冀105.jpg”的识别结果;
图12为图5中字符图片“蒙23.jpg”的识别结果;
图13为图5中字符图片“蒙53.jpg”的识别结果。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明做进一步的详细描述:
实施例:
如图1所示,一种基于DS证据理论的单一字符图像匹配识别方法,该单一字符图像匹配识别方法,该实施例基于Matlab实现,可应用于智能交通管理中的蓝标车牌识别系统中;包括:
S1:对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1ii和S2ii,得到字符样本特征向量组S1和S2;其中,S1={S1ii,ii=1,2,…LEN}和S2={S2ii,ii=1,2,…LEN},LEN为字符样本库中字符样本图像的总数;
具体包括:
S1.1:本实施例的字符样本库是蓝标车牌识别系统中可能出现的字符全集的标准化数据和全集中某些字符的若干典型采样数据的集合。蓝标车牌识别系统中可能出现的字符全集包括31个省份简称、字母A~Z(不含I和O)和数字0~9。因蓝标车牌字符字型为特殊字体(防止伪造),本实施例中采用黑体字型替代。典型采样数据是系统正常工作时采样得到的与其标准化数据有一定差异的字符样本。这些数据以jpg文件格式存放在专用目录wordlib下,有效文件总数LEN=120个。字符样本图片文件的格式、大小、颜色无强制性要求,但主文件名首位必须是该字符,对于同一字符样本存在多个对应数据的,从主文件名第二位开始以数字加以区分;通过浏览器查看wordlib目录下的字符样本图片文件效果如图3所示。
S1.2:令ii=1。
S1.3:读取wordlib目录下的第ii个字符样本图像(其包含路径的文件名为a),如果是彩色图像,则将其转化为灰度图像b。
在Matlab中的执行语句是:
b=imread(a);
if ndims(b)==3b=rgb2gray(b);
end
S1.4:将字符灰度图像b转化为0-1二值图像c。
在Matlab中自定义的函数名是pls_gray2BW01(),具体包括:
S1.4.1:取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min。
在Matlab中的执行语句是:
g_max=double(max(max(b)));
g_min=double(min(min(b)));
S1.4.2:计算阀值T。
在Matlab中的执行语句是:
T=round(g_max-(g_max-g_min)/3);
S1.4.3:遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0-1二值图像c。
在Matlab中的执行语句是:
Figure BDA0003862042860000101
S1.5:对二值图像c的边缘进行切割,去除四周空白区域,得到图像d。
在Matlab中自定义的函数名是qiege(),具体包括:
S1.5.1:获得图像c的像素尺寸,包括:高度mc,宽度nc。
在Matlab中的执行语句是:
[mc,nc]=size(c);
S1.5.2:令:top=1,bottom=mc,left=1,right=nc。
S1.5.3:如果图像c的top行的像素值的和为0,且top<=mc条件满足时,一直执行top=top+1。
在Matlab中的执行语句是:
while sum(c(top,:))==0&&top<=mc
top=top+1;
end
S1.5.4:如果图像c的bottom行的像素值的和为0,且bottom>1条件满足时,一直执行bottom=bottom-1。
在Matlab中的执行语句是:
while sum(c(bottom,:))==0&&bottom>1
bottom=bottom-1;
end
S1.5.5:如果图像c的left列的像素值的和为0,且left<nc条件满足时,一直执行left=left+1。
在Matlab中的执行语句是:
while sum(c(:,left))==0&&left<nc
left=left+1;
end
S1.5.6:如果图像c的right列的像素值的和为0,且right>=1条件满足时,一直执行right=right-1。
在Matlab中的执行语句是:
while sum(c(:,right))==0&&right>=1
right=right-1;
end
S1.5.7:按照左上点坐标(left,top),高度hd=bottom-top,宽度wd=right-left,裁剪图像c,得到边缘切割后的图像d。
在Matlab中的执行语句是:
hd=bottom-top;
wd=right-left;
d=imcrop(c,[left top wd hd]);
S1.6:采用最近邻域插值法将图像d缩放为M行N列像素大小,得到图像e。本实施例中M取值hh=40,N取值ww=20。
在Matlab中的执行语句是:
e=imresize(d,[M N],'nearest');
S1.7:按照圆周扫描方式提取字符样本特征向量S1ii:以图像e的中心点为圆心,以1度为步长进行圆周扫描,分别统计每个步长上的像素值为1的数量,得到LL1(LL1=360)行1列的字符样本特征向量S1ii
在Matlab中自定义的函数名是BWtoCircle_1(),具体包括:
S1.7.1:获得图像e的像素尺寸,包括:高度he、宽度we;并令LL1=360,初始化特征向量Ct为LL1行1列,确定图像e的中心像素点坐标(x0,y0)。
在Matlab中的执行语句是:
[he,we]=size(e);
LL1=360;
Ct=zeros(LL1,1);%初始化为LL1行1列的向量
y0=he/2;
x0=we/2;
S1.7.2:遍历图像e的所有像素点,计算其坐标点相对于(x0,y0)的角度值Q(单位为度),并取整为ne,得到向量Ct的下标值me=ne+1。如果图像e的该点像素值大于或等于1,则Ct(me)值加1。
在Matlab中的执行语句是:
Figure BDA0003862042860000121
Figure BDA0003862042860000131
其中自定义函数CalAngel([x y])的功能是计算(x,y)点相对于原点的角度(单位为度),其实现过程如图2所示。
S1.7.3:令S1ii=Ct,得到第ii个字符样本特征向量S1ii(LL1行1列)。
S1.8:将图像e构成的像素矩阵隔行展开,得到LL2行1列的字符样本特征向量S2ii;其中,LL2=N*M/2。
在Matlab中自定义的函数名是BWtoLine_2(),具体包括:
S1.8.1:令LL2=he*we/2,初始化特征向量Lt为0行0列。
在Matlab中的执行语句是:
[he,we]=size(e);
LL2=he*we/2;%隔行展开
Lt=zeros(0,0);
S1.8.2:逐一复制图像e构成的像素矩阵的偶数行像素值到向量Lt的末尾,最终组成LL2列1行的向量,然后将Lt转置后赋值为S2 ii,得到图像e的字符样本特征向量S2 ii(LL2行1列)。
在Matlab中的执行语句是:
Figure BDA0003862042860000132
S1.8.3:令S2ii=LINE,得到第ii个字符样本特征向量S2ii(LL2行1列)。
S1.9:令ii=ii+1,如果ii<=LEN=120,则转S1.3,否则,S1结束,得到字符样本特征向量组S1={S1ii,ii=1,2,…LEN}和S2={S2ii,ii=1,2,…LEN}。
以上S1在Matlab中自定义的函数名是pls_cos_fun(),函数体内容如下:
function[S1,S2,imgNames,LEN]=pls_cos_fun(input_args)%读取wordlib目录下的字符样本文件,提取字符特征向量组S1和S2;
global hh;%全局变量M
global ww;%全局变量N
%hh=40;ww=20;%统一调整为高40*宽20个像素的图像
LL=hh*ww;
pname='wordlib';
pname=strcat(pname,'\');
pathfile=strcat(pname,'*.*');
imgNames=dir(pathfile);
LEN=length(imgNames);
for ii=1:LEN
fname=imgNames(ii).name;
a=strcat(pname,fname);
b=imread(a);%读入字符图片文件a
if ndims(b)==3b=rgb2gray(b);end%如果是彩色图像,则转为灰度图b
c=pls_gray2BW01(b);%将灰度图b转换为0-1二值图像c
d=qiege(c);%切割二值图像c周边的空白区域
e=imresize(d,[hh ww],'nearest');%对图像d做缩放处理,得到图e:高M,宽N,缩放图像时采用最近邻域插值算法
[Ct,LL1]=BWtoCircle_1(e);%对图e,进行圆周扫描,计算单位步长上的1值和,返回LL1行1列的扫描特征向量
[Lt,LL2]=BWtoLine_2(e);%对图e隔行展开,只取偶数行,返回LL2行1列的隔行特征向量。
S1(:,:,ii)=Ct;%扫描特征向量组
S2(:,:,ii)=Lt;%隔行特征向量组
end
end
S2:将待识别的单一字符图像A转化为灰度图像B,将灰度图像B转化为二值图像C;对二值图像C的边缘进行切割,去除空白区域,得到图像D;采用最近邻域插值法将图像D缩放为M行N列像素大小,得到图像E。
具体包括:
S2.1:读取待识别字符样图片文件,设其包含路径的文件名为A,如果是彩色图像,则将其转化为灰度图像B。
在Matlab中的执行语句是:
[fn,pn,~]=uigetfile('*.*','选择待识别的字符图片');
A=[pn,fn];%包含路径的字符图片文件A
B=imread(A);%读取待识别的字符A。
if ndims(B)==3B=rgb2gray(B);end%如果B是彩色图像,则转为灰度图
S2.2:将字符灰度图像B转化为0-1二值图像C。
在Matlab中自定义的函数名是pls_gray2BW01(),实现过程与S1.4相同。
S2.3:对二值图像C的边缘进行切割,去除空白区域,得到图像D。
在Matlab中自定义的函数名是qiege(),实现过程与S1.5相同。
S2.4:采用最近邻域插值法将图像D缩放为M行N列像素大小,得到图像E。本实施例中M取值hh=40,N取值ww=20。
在Matlab中的执行语句是:
E=imresize(D,[M N],'nearest');
S3:采用圆周扫描和隔行展开两种方式分别得到图像E的待识别字符特征向量w1和w2。
具体包括:
S3.1:按照圆周扫描方式得到图像E的待识别字符特征向量w1。方法是以图像E的中心点为圆心,以1度为步长进行圆周扫描,统计每个步长上的像素值为1的数量,得到大小为LL1=360行1列的特征向量w1。在Matlab中自定义的函数名是BWtoCircle_1(),实现过程与S1.7相同。
S3.2:按照隔行展开方式得到图像E的待识别字符特征向量w2。方法是将图像E构成的像素矩阵隔行展开,得到大小为N*M/2行1列的特征向量w2。在Matlab中自定义的函数名是BWtoLine_2(),实现过程与S1.8相同。
S4:逐一计算待识别字符特征向量w1与字符样本特征向量组S1中的每一个向量的欧式距离,得到距离序列F1;逐一计算待识别字符特征向量w2与字符样本特征向量组S2中的每一个向量的欧式距离,得到距离序列F2。
具体包括:
S4.1:令ii=1。
S4.2:计算待识别字符特征向量w1和第ii个字符样本特征向量S1ii的欧氏距离F1ii
在Matlab中的执行语句是:
F1(ii)=pdist([w1 S1(:,:,ii)]','euclidean');%计算两个向量的欧氏距离
S4.3:计算待识别字符特征向量w2和第ii个字符样本特征向量S2ii的欧氏距离F2ii
在Matlab中的执行语句是:
F2(ii)=pdist([w2 S2(:,:,ii)]','euclidean');%计算两个向量的欧氏距离
S4.4:令ii=ii+1,如果ii<=LEN,则转S4.2,否则,S4结束,得到待识别字符与字符样本库中每一个字符样本的欧氏距离序列F1和F2;其中,F1={F1ii,ii=1,2,…LEN}和F2={F2ii,ii=1,2,…LEN}。
S5:选取距离序列F1中较小的n个值对应的字符样本,得到样本集合H1;选取距离序列F2中较小的n个值对应的字符样本,得到样本集合H2;求集合H1和H2的并集,得到备选字符集合H。
本实施例中设n=4,具体包括:
S5.1:对距离序列F1进行升序排列,记录前n个值对应的字符样本,组成样本集合H1。
在Matlab中的执行语句是:
[FS,ID]=sort(F1);%对F1进行升序排列,FS是升序排列后的数列,ID是FS中每个元素在F1中的下标值集合
H1=ID(1:n);%取ID集合中的前n个元素,组成样本集合H1
S5.2:对距离序列F2进行升序排列,记录前n个值对应的字符样本,组成字符样本集合H2。
在Matlab中的执行语句是:
[FS,ID]=sort(F2);%对F2进行升序排列,FS是升序排列后的数列,ID是FS中每个元素在F2中的下标值集合
H2=ID(1:n);%取ID集合中的前n个元素,组成字符样本集合H2
S5.3:求集合H1和H2的并集,得到备选字符集合H。
在Matlab中的执行语句是:
H=union(H1,H2);%取H1和H2的并集,构成备选字符集合H
S6:以集合H中每一个元素值为下标,分别取F1和F2中的对应值,构成备选字符距离序列P1和P2;根据P1计算集合H中每个字符元素的基本匹配概率,得到基本概率序列Q1;根据P2计算集合H中每个字符元素的基本匹配概率,得到基本概率序列Q2。
具体包括:
S6.1:以集合H中每一个元素值为下标,取距离序列F1中的对应值,构成备选字符距离序列P1。
在Matlab中的执行语句是:
P1=F1(H);
S6.2:以集合H中每一个元素值为下标,取距离序列F2中的对应值,构成备选字符距离序列P2。
在Matlab中的执行语句是:
P2=F2(H);
S6.3:令:
Figure BDA0003862042860000171
得到基本概率序列Q1={Q1jj,jj=1,2,…m}。
在Matlab中的执行语句是:
Figure BDA0003862042860000172
Figure BDA0003862042860000181
S6.3:令:
Figure BDA0003862042860000182
得到基本概率序列Q2={Q2jj,jj=1,2,…m}。
在Matlab中的执行语句是:
Figure BDA0003862042860000183
S7:按照DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K;按照Dempster合成规则,计算集合H中每一个字符元素的DS融合匹配概率。
具体包括:
S7.1:通过基本概率序列Q1和Q2计算归一化系数K。
Figure BDA0003862042860000184
在Matlab中的执行语句是:
Figure BDA0003862042860000185
S7.2:按照Dempster合成规则,计算集合H中每一个字符元素的DS融合匹配概率,得到融合匹配概率序列PH={PHjj,jj=1,2,…m}。其中:
Figure BDA0003862042860000186
在Matlab中的执行语句是:
for iii=1:m
PH(iii)=Q1(iii)*Q2(iii)/K;
end
S8:取融合匹配概率序列PH中融合匹配概率最大的字符元素,作为待识别的单一字符图像A的匹配结果。
具体包括:
S8.1:取PH中的最大值所对应的下标,记为r(1≤r≤m)。
在Matlab中的执行语句是:
r=find(PH==max(PH));
S8.2:取备选字符集合H中第r个元素值,记为s(1≤s≤LEN)。
在Matlab中的执行语句是:
s=H(r(1));
S8.3:字符样本库中第s个文件的主文件名首位字符,即为待识别字符A的匹配识别结果。
本实施例基于Matlab R2012a win64运行环境,其中,字符样本库所在目录wordlib中的文件显示如图3所示。从S2开始多次执行本实施例程序,分别选择质量较好、较差的两类待识别字符图片文件进行字符匹配识别。图片质量较好、扰动较小的字符样例如图4所示;图片质量较差、扰动较大,但依然可以人工辨别的字符样例如图5所示。图6~图7是对2幅图片质量较好、扰动较小的字符样例的匹配识别情况,图8~图13是对6幅图片质量较差、扰动较大的字符样例的匹配识别情况,均匹配识别正确。
从以上样例识别过程来看,采用本发明的识别方法,对质量较好的字符图片的识别成功率与传统方法差异不大,但对于质量较差的字符图片的识别优势明显,字符匹配识别正确率显著提高,基本达到了人眼识别的准确度。
本发明通过对预设字符样本库的适当管理(在标准化数据之外,灵活引入典型采用数据),增大了备选字符欧氏距离较小时成功匹配的概率;采用两种方式进行字符图像特征提取,得到基于这两种特征度量的备选字符样本集合,然后按照DS证据理论,计算基本匹配概率和融合匹配概率,认定备选字符样本集合中融合匹配概率最大的字符元素即为匹配识别结果,保证了匹配识别结论的科学性和可信度。对比试验表明,该方法适用于基于专用图像采集设备、特定拍摄场景和相同图像预处理过程的专用业务系统,易于工程实现,综合性能比传统方法具有更优的字符识别效果。本发明所提供的方法的时间复杂度和空间复杂度都很低,可操作性和实用性很强。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。例如但不限于以下几点:
1、关于字符样本库的大小问题:在样本库中增加典型采样数据有利于提高专用业务系统中字符匹配识别的成功率,但随着样本库总量的增加,也带来S4中欧氏距离序列计算量的增加,因此在实际应用中LEN的取值应平衡匹配识别成功率与识别效率的关系。
2、本发明中采用圆周扫描和隔行展开2种方式得到图像的特征向量,在实际执行过程中,也可以采用其他方式进行特征提取,且按照DS证据理论,可以提取大于2种特征向量,计算大于2种基本概率,按照Dempster合成规则同样可以得到融合匹配概率。
3、关于圆周扫描方式进行特征提取中的圆心和步长参数选择问题:本发明以图像的中心点为圆心、以1度为步长扫描计算字符特征向量。在实际应用中,可以根据专用业务系统数据处理特点,灵活选择这两个参数。比如:可以选择图像中所有1值像素点的几何中心为圆心;为提高字符特征精细化程度,可以减小扫描步长等;为提高运行速度,可以增大扫描步长等。
4、本发明在隔行展开方式进行特征提取时,选择了复制偶数行像素值。在实际应用中,可以根据需要选择奇数行,或者选择偶数/奇数列等。
5、关于特征向量的比较问题:本发明借助欧氏距离比较两个特征向量,距离越小,相似性越高。在实际应用中,也可以尝试其它方法比较两个向量之间的距离,比如方向余弦、曼哈顿距离、契比雪夫距离、闵可夫斯基距离、汉明距离、杰卡德距离等。以上距离的计算在Matlab中均可通过函数pdist()调用完成,本文不再赘述。
5、对于字符样本库已经固化的专用业务系统,可以将执行S1.9后得到的字符样本特征向量组S1和S2按照二进制文件方式进行存储,以后程序启动时,直接读入使用,这样可以极大提高系统开机速度。
6、对于统一缩放到M行N列的字符图像,其每个像素点坐标与其特征向量下标值有唯一的映射关系,因此,在经过S1.7.2首次计算后,可以将这种映射关系存储到一个全局变量结构中,以备S1.7.2剩余执行和S3.1.2执行时使用,这样可以有效提高程序运行速度。

Claims (10)

1.一种基于DS证据理论的单一字符图像匹配识别方法,其特征在于,包括:
对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1ii和S2ii,得到字符样本特征向量组S1和S2;其中,S1={S1ii,ii=1,2,…LEN}和S2={S2ii,ii=1,2,…LEN},LEN为字符样本库中字符样本图像的总数;
将待识别的单一字符图像A转化为灰度图像B,将灰度图像B转化为二值图像C;对二值图像C的边缘进行切割,去除空白区域,得到图像D;将图像D缩放为M行N列像素大小,得到图像E;
采用圆周扫描和隔行展开两种方式分别得到图像E的待识别字符特征向量w1和w2;
分别逐一计算待识别字符特征向量w1与每一个字符样本特征向量S1ii、待识别字符特征向量w2与每一个字符样本特征向量S2ii的欧式距离,得到距离序列F1和F2;
分别选取距离序列F1和F2中较小的n个值对应的字符样本,得到样本集合H1和H2;求样本集合H1和H2的并集,得到备选字符集合H;
以备选字符集合H中每一个元素值为下标,分别取距离序列F1和F2中的对应值,构成备选字符距离序列P1和P2;根据备选字符距离序列P1和P2分别计算备选字符集合H中每个字符元素的基本匹配概率,得到基本概率序列Q1和Q2;
基于DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K;按照Dempster合成规则,计算备选字符集合H中每一个字符元素的DS融合匹配概率PHjj,得到融合匹配概率序列PH;
取融合匹配概率序列PH中融合匹配概率最大的字符元素,作为待识别的单一字符图像A的匹配结果。
2.如权利要求1所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1ii和S2ii,得到字符样本特征向量组S1和S2;具体包括:
构建字符样本库;其中,所述字符样本库包括对应业务系统可能出现的字符全集的标准化数据以及全集中某些字符的若干典型采样数据,标准化数据和典型采样数据共同作为字符样本图像,主文件名首位为该字符、从主文件名第二位开始以数字加以区分同一字符的不同样本图像;
令ii=1,读取字符样本库中第ii个字符样本图像a;
将字符样本图像a转化为灰度图像b;
将灰度图像b转化为二值图像c;
对二值图像c的边缘进行切割,去除空白区域,得到图像d;
将图像d缩放为M行N列像素大小,得到图像e;
以图像e的中心点为圆心,以1度为步长进行圆周扫描,分别统计每个步长上的像素值为1的数量,得到LL1行1列的字符样本特征向量S1ii
将图像e构成的像素矩阵隔行展开,得到LL2行1列的字符样本特征向量S2ii
令ii=ii+1,重复上述操作,直至ii=LEN,输出字符样本特征向量组S1={S1ii,ii=1,2,…LEN}和S2={S2ii,ii=1,2,…LEN}。
3.如权利要求1或2所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,
将灰度图像B转化为二值图像C,具体包括:
取灰度图像B中像素值的最大值和最小值,分别记为B_max和B_min;
计算阀值
Figure FDA0003862042850000021
并取整;
遍历灰度图像B中的所有像素点,将像素值大于或等于阀值BT的赋值为1,否则赋值为0,得到0-1二值图像C;
或,
将灰度图像b转化为二值图像c,具体包括:
取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min;
计算阀值
Figure FDA0003862042850000022
并取整;
遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0-1二值图像c。
4.如权利要求1或2所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,
对二值图像C的边缘进行切割,去除空白区域,得到图像D;具体包括:
获得二值图像C的像素尺寸,包括:高度mC,宽度nC;
令:top=1,bottom=mC,left=1,right=nC;
若二值图像C的top行的像素值的和为0且top<=mC时,则一直执行top=top+1;
若二值图像C的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom-1;
若二值图像C的left列的像素值的和为0且left<nC时,则一直执行left=left+1;
若二值图像C的right列的像素值的和为0且right>=1时,则一直执行right=right-1;
按照左上点坐标(left,top),高度hD=bottom-top,宽度wD=right-left,裁剪二值图像C,得到边缘切割后的图像D;
或,
对二值图像c的边缘进行切割,去除空白区域,得到图像d;具体包括:
获得二值图像c的像素尺寸,包括:高度mc,宽度nc;
令:top=1,bottom=mc,left=1,right=nc;
若二值图像c的top行的像素值的和为0且top<=mc时,则一直执行top=top+1;
若二值图像c的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom-1;
若二值图像c的left列的像素值的和为0且left<nc时,则一直执行left=left+1;
若二值图像c的right列的像素值的和为0且right>=1时,则一直执行right=right-1;
按照左上点坐标(left,top),高度hd=bottom-top,宽度wd=right-left,裁剪二值图像c,得到边缘切割后的图像d。
5.如权利要求1或2所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,
得到待识别字符特征向量w1,具体包括:
获得图像E的像素尺寸,包括:高度hE、宽度wE,并令LL1=360,初始化向量w1为LL1行1列,确定图像E的中心像素点坐标(xE,yE);其中:
Figure FDA0003862042850000041
Figure FDA0003862042850000042
遍历图像E的所有像素点,计算其坐标点相对于(xE,yE)的角度值Q,单位为度;并取整为ne,得到向量w1的下标值me=ne+1;若图像E的该点像素值大于或等于1,则w1(me)值加1;
得到待识别字符特征向量w1,大小为360行1列;
得到待识别字符特征向量w2,具体包括:
令LL2=hE*wE/2,初始化向量Lt为0行0列;
逐一复制图像E构成的像素矩阵的偶数行像素值到向量Lt的末尾,最终组成LL2列1行的向量,然后将Lt转置后赋值为w2,得到图像E的待识别字符特征向量w2;
或,
得到字符样本特征向量S1ii,具体包括:
获得图像e的像素尺寸,包括:高度he、宽度we,并令LL1=360,初始化特征向量Ct为LL1行1列,确定图像e的中心像素点坐标(x0,y0);其中:
Figure FDA0003862042850000043
Figure FDA0003862042850000044
遍历图像e的所有像素点,计算其坐标点相对于(x0,y0)的角度值Q,单位为度;并取整为ne,得到向量Ct的下标值me=ne+1;若图像e的该点像素值大于或等于1,则Ct(me)值加1
令S1ii=Ct,得到第ii个字符样本特征向量S1ii,大小为360行1列;
得到字符样本特征向量S2ii,具体包括:
令LL2=he*we/2,初始化特征向量Lt为0行0列;
逐一复制图像e构成的像素矩阵的偶数行像素值到向量Lt的末尾,最终组成LL2列1行的向量,然后将Lt转置后赋值为S2ii,得到图像e的字符样本特征向量S2ii
6.如权利要求1所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,分别逐一计算待识别字符特征向量w1与每一个字符样本特征向量S1ii、待识别字符特征向量w2与每一个字符样本特征向量S2ii的欧式距离,得到距离序列F1和F2;具体包括:
令ii=1;
计算待识别字符特征向量w1和第ii个字符样本特征向量S1ii的欧氏距离F1 ii
计算待识别字符特征向量w2和第ii个字符样本特征向量S2ii的欧氏距离F2 ii
令ii=ii+1,重复上述操作,直至ii=LEN,得到待识别字符与字符样本库中每一个字符样本的欧氏距离序列F1={F1ii,ii=1,2,…LEN}和F2={F2ii,ii=1,2,…LEN}。
7.如权利要求1所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,分别选取距离序列F1和F2中较小的n个值对应的字符样本,得到样本集合H1和H2;求样本集合H1和H2的并集,得到备选字符集合H;具体包括:
对距离序列F1进行升序排列,记录前n个值对应的字符样本,组成样本集合H1;
对距离序列F2进行升序排列,记录前n个值对应的字符样本,组成样本集合H2;
求集合H1和H2的并集,得到备选字符集合H。
8.如权利要求7所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,以备选字符集合H中每一个元素值为下标,分别取距离序列F1和F2中的对应值,构成备选字符距离序列P1和P2;根据备选字符距离序列P1和P2分别计算备选字符集合H中每个字符元素的基本匹配概率,得到基本概率序列Q1和Q2;具体包括:
以备选字符集合H中每一个元素值为下标,取距离序列F1中的对应值,构成备选字符距离序列P1;设备选字符集合H中的元素个数为m,m≤n,备选字符距离序列P1表示为P1={P1jj,jj=1,2,…m};
以备选字符集合H中每一个元素值为下标,取距离序列F2中的对应值,构成备选字符距离序列P2;设集合H中的元素个数为m,备选字符距离序列P2表示为P2={P2jj,jj=1,2,…m};
令:
Figure FDA0003862042850000061
得到基本概率序列Q1={Q1jj,jj=1,2,…m};
令:
Figure FDA0003862042850000062
得到基本概率序列Q2={Q2jj,jj=1,2,…m}。
9.如权利要求8所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,基于DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K;按照Dempster合成规则,计算备选字符集合H中每一个字符元素的DS融合匹配概率PHjj,得到融合匹配概率序列PH;具体包括:
基于DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K:
Figure FDA0003862042850000063
按照Dempster合成规则,计算备选字符集合H中每一个字符元素的DS融合匹配概率PHjj
Figure FDA0003862042850000064
得到融合匹配概率序列PH={PHjj,jj=1,2,…m}。
10.如权利要求1所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,取融合匹配概率序列PH中融合匹配概率最大的字符元素,作为待识别的单一字符图像A的匹配结果;具体包括:
取融合匹配概率序列PH中的最大值所对应的下标,记为r,1≤r≤m;
取备选字符集合H中第r个元素值,记为s,1≤s≤LEN;
字符样本库中第s个文件的主文件名首位字符,即为待识别的单一字符图像A的匹配识别结果。
CN202211167652.5A 2022-09-23 2022-09-23 一种基于ds证据理论的单一字符图像匹配识别方法 Active CN115588204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211167652.5A CN115588204B (zh) 2022-09-23 2022-09-23 一种基于ds证据理论的单一字符图像匹配识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211167652.5A CN115588204B (zh) 2022-09-23 2022-09-23 一种基于ds证据理论的单一字符图像匹配识别方法

Publications (2)

Publication Number Publication Date
CN115588204A true CN115588204A (zh) 2023-01-10
CN115588204B CN115588204B (zh) 2023-06-13

Family

ID=84772779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211167652.5A Active CN115588204B (zh) 2022-09-23 2022-09-23 一种基于ds证据理论的单一字符图像匹配识别方法

Country Status (1)

Country Link
CN (1) CN115588204B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000651A (zh) * 2006-12-28 2007-07-18 上海电力学院 一种多源纹理图像的识别方法
CN101359370A (zh) * 2007-08-01 2009-02-04 鸿富锦精密工业(深圳)有限公司 识别图像中目标物体的方法与装置
CN108319958A (zh) * 2018-03-16 2018-07-24 福州大学 一种基于特征融合匹配的行驶证检测和识别方法
CN108550165A (zh) * 2018-03-18 2018-09-18 哈尔滨工程大学 一种基于局部不变特征的图像匹配方法
CN109800762A (zh) * 2019-01-28 2019-05-24 安阳工学院 一种基于动态匹配因子的模糊车牌识别算法
CN109902565A (zh) * 2019-01-21 2019-06-18 深圳市烨嘉为技术有限公司 多特征融合的人体行为识别方法
CN110766016A (zh) * 2019-10-21 2020-02-07 广西师范大学 一种基于概率神经网络的喷码字符识别方法
CN110852315A (zh) * 2019-09-27 2020-02-28 武汉大学 环形文字快速识别方法及装置
WO2020063314A1 (zh) * 2018-09-25 2020-04-02 京东数字科技控股有限公司 字符切分识别方法、装置、电子设备、存储介质
CN111507356A (zh) * 2020-04-20 2020-08-07 恒银金融科技股份有限公司 一种金融票据小写金额手写字符的分割方法
CN113869300A (zh) * 2021-09-30 2021-12-31 江西省通讯终端产业技术研究院有限公司 基于多视觉融合的工件表面缺陷和字符识别的方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000651A (zh) * 2006-12-28 2007-07-18 上海电力学院 一种多源纹理图像的识别方法
CN101359370A (zh) * 2007-08-01 2009-02-04 鸿富锦精密工业(深圳)有限公司 识别图像中目标物体的方法与装置
CN108319958A (zh) * 2018-03-16 2018-07-24 福州大学 一种基于特征融合匹配的行驶证检测和识别方法
CN108550165A (zh) * 2018-03-18 2018-09-18 哈尔滨工程大学 一种基于局部不变特征的图像匹配方法
WO2020063314A1 (zh) * 2018-09-25 2020-04-02 京东数字科技控股有限公司 字符切分识别方法、装置、电子设备、存储介质
CN109902565A (zh) * 2019-01-21 2019-06-18 深圳市烨嘉为技术有限公司 多特征融合的人体行为识别方法
CN109800762A (zh) * 2019-01-28 2019-05-24 安阳工学院 一种基于动态匹配因子的模糊车牌识别算法
CN110852315A (zh) * 2019-09-27 2020-02-28 武汉大学 环形文字快速识别方法及装置
CN110766016A (zh) * 2019-10-21 2020-02-07 广西师范大学 一种基于概率神经网络的喷码字符识别方法
CN111507356A (zh) * 2020-04-20 2020-08-07 恒银金融科技股份有限公司 一种金融票据小写金额手写字符的分割方法
CN113869300A (zh) * 2021-09-30 2021-12-31 江西省通讯终端产业技术研究院有限公司 基于多视觉融合的工件表面缺陷和字符识别的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUN WANG等: "Development and validation of an ensemble classifier for real-time recognition of cow behavior patterns from accelerometer data and location data", PLOS ONE *
刘如松;: "基于样本间最小欧氏距离的多特征融合识别算法研究", 计算机与数字工程 *

Also Published As

Publication number Publication date
CN115588204B (zh) 2023-06-13

Similar Documents

Publication Publication Date Title
Jakubović et al. Image feature matching and object detection using brute-force matchers
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
EP2989607B1 (en) Method and device for performing super-resolution on an input image
EP2724295B1 (en) System and method for identifying scale invariant features of object outlines on images
Qin et al. Query adaptive similarity for large scale object retrieval
Lee et al. Object detection with sliding window in images including multiple similar objects
CN108288012B (zh) 一种基于手机实现的艺术品备案验证方法及其系统
CN102782708A (zh) 用于图像辨识的描述符小块的快速子空间投影
WO2019065703A1 (ja) 情報処理装置
WO2001054054A9 (en) Word recognition using silhouette bar codes
WO2021218706A1 (zh) 文本识别方法、装置、设备及存储介质
CN110942473A (zh) 一种基于特征点网格化匹配的运动目标跟踪检测方法
Zhang et al. Convmatch: Rethinking network design for two-view correspondence learning
JP4859061B2 (ja) 画像の補正方法、補正プログラムおよび画像歪み補正装置
JPH05174149A (ja) 画像認識装置
JP6758250B2 (ja) 局所特徴表現学習装置、及び方法
WO2019065702A1 (ja) 情報処理装置
CN110704667B (zh) 一种基于语义信息的快速相似图检测方法
CN105224619B (zh) 一种适用于视频/图像局部特征的空间关系匹配方法及系统
Chen et al. IGS-Net: Seeking good correspondences via interactive generative structure learning
Sharma et al. Feature-level fusion for object segmentation using mutual information
CN115588204A (zh) 一种基于ds证据理论的单一字符图像匹配识别方法
CN116469172A (zh) 一种多时间尺度下的骨骼行为识别视频帧提取方法及系统
CN115497099B (zh) 一种基于圆周扫描式的单一字符图像匹配识别方法
CN113657225B (zh) 一种目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant