CN102509115B - 一种分层带回溯查找机制的票据类型识别方法 - Google Patents

一种分层带回溯查找机制的票据类型识别方法 Download PDF

Info

Publication number
CN102509115B
CN102509115B CN201110374402.4A CN201110374402A CN102509115B CN 102509115 B CN102509115 B CN 102509115B CN 201110374402 A CN201110374402 A CN 201110374402A CN 102509115 B CN102509115 B CN 102509115B
Authority
CN
China
Prior art keywords
template
recognition
characteristic
layer
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110374402.4A
Other languages
English (en)
Other versions
CN102509115A (zh
Inventor
刘冠强
高昊江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
The north, capital infotech share company limited
Original Assignee
BEIJING JING NORTH INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING JING NORTH INFORMATION TECHNOLOGY CO LTD filed Critical BEIJING JING NORTH INFORMATION TECHNOLOGY CO LTD
Priority to CN201110374402.4A priority Critical patent/CN102509115B/zh
Publication of CN102509115A publication Critical patent/CN102509115A/zh
Application granted granted Critical
Publication of CN102509115B publication Critical patent/CN102509115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种分层带回溯查找机制的票据类型识别方法,属于票据类型模式识别领域。本发明包含多个识别特征层,根据票据图像在特征层间回溯查找最匹配的票据类型模板。每个特征层包含多个特征匹配阈值区间,特征匹配过程按照阈值区间从小到大的顺序执行,一旦某区间的匹配结果集非空,就转到下一特征层继续进行匹配;若某层内所有区间的匹配结果集都为空,则回溯到上一层的下一个阈值区间进行匹配。其中,在表头文字特征的匹配过程中,引入表头长度阈值λ,当表头长度小于λ时,进行完整匹配;当表头长度大于λ时,进行局部匹配。本发明有效解决了传统方法由于特征匹配阈值设置不当导致的票据图像识别速度较慢和拒识率较高的问题。

Description

一种分层带回溯查找机制的票据类型识别方法
技术领域
本发明涉及模式识别领域,尤其涉及票据类型模式识别领域,特别的,本发明涉及一种分层带回溯查找机制的票据类型识别方法。
背景技术
模式识别(Pattern Recognition)是指对表征事物或现象的各种形式(数值、文字、逻辑关系等)的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。票据类型识别是模式识别的一个应用领域。票据类型识别常常是涉及票据影像的业务处理系统的重要组成部分;常见的票据包括转帐支票、存款凭条、取款凭条等,票据类型识别是指计算机系统通过分析纸质票据扫描成的票据影像,自动判断该票据所属的票据类型的过程。通过票据类型识别可以辅助完成票据影像类型索引的建立。
票据类型识别主要包含两部分内容:识别模板库和识别算法。识别模板库包含多个识别模板,其中每个识别模板定义了某种票据所包含的标准特征信息。通常情况下,识别模板库由模板定制人员通过模板定制工具手工制作。识别算法的输入包括识别模板库和待识别票据图像。针对待识别票据图像,识别算法首先提取待识别图像的特征,然后将提取得到的特征与识别模板库中识别模板包含的标准特征信息进行匹配,最后确定待识别票据图像的类型。如何选择票据特征匹配方法和有效地组织各票据特征进行识别是票据类型识别方法需要重点解决的问题。
特征匹配方法将待识别票据图像上提取到的特征与识别模板库中识别模板包含的标准特征信息进行匹配,计算得出待识别图像与某个识别模板的偏差量;用于判断某个识别模板是否为待识别图像的候选模板的偏差量值称为特征匹配阈值。识别模板与待识别图像的偏差量小于特征匹配阈值,则认为该识别模板为待识别图像的一个候选模板;反之,待识别图像拒绝该识别模板。
如何组织票据的各种特征进行识别对票据类型识别方法有较大的影响。现有的票据类型识别方法组织各票据特征的方式主要有两种。第一种方式称为“全局式”,该方法设置一个全局的特征匹配阈值。全局式方法首先针对每个票据特征,计算待识别图像与所有识别模板的偏差量;然后利用某种组合规则(如加权平均)得出待识别图像与所有识别模板的偏差量;如果最小偏差量小于全局特征匹配阈值,将其相应的识别模板作为结果,否则拒识。第二种方式称为“分层过滤式”,该方法为每个票据特征定义1个特征匹配阈值。首先在第1个特征上计算待识别图像与所有识别模板的偏差量,如果某个识别模板与待识别图像的偏差量小于该特征的特征匹配阈值,则将识别模板加入到候选模板集中;然后匹配在第2,...,i,...,n个特征上进行,第i个特征输入的识别模板为第i-1个特征输出的候选模板集;这样经过各个特征的匹配过滤得出识别结果或拒识。
票据凭证的表头文字是票据的重要特征,基本上是票据类型识别方法必须包含的票据特征。现有的票据类型识别方法通常采取以下方法进行表头文字特征的匹配:首先对待识别的整张票据图像进行文字识别,如果文字识别结果中包含某个识别模板的表头文字,则该识别模板被作为待识别票据图像的一个候选模板。
“全局式”特征组合方法由于在每个特征上都需要计算所有识别模板与待识别图像的偏差量,必然导致识别时间较长。另外,由于需要对各个特征上的偏差量进行组合处理,该方法还需要对各特征的偏差量进行归一化处理。“分层过滤式”特征组合方法针对每个特征设置1个特征匹配阈值,特征匹配阈值设置起来比较困难。为了保持较高的识别率,该方法会尽量把每个特征的特征匹配阈值放大,但是这样会导致送入下一个特征的候选模板集中包含较多的识别模板,导致识别时间较长;如果调小每个特征的特征匹配阈值,可能导致正确的识别模板在较早的特征进行匹配时被拒绝掉,从而引起拒识率的升高。
现有的票据类型识别方法在进行表头文字特征的匹配时往往采用较严格的策略,即待识别图像的文字OCR识别结果必须完全包含某个识别模板的表头文字,该识别模板才可以作为待识别图像的候选模板,否则会拒绝该识别模板。这样对于含有较长表头的识别模板(如表头文字为“中国XX银行有价单证重要空白凭证零星入库领用单”),可能导致由于1个字识别错误,从而拒绝正确的识别模板的现象。
发明内容
本发明的目的是提出一种快速的、具有较高识别率的票据类型识别方法。本发明通过针对每个票据特征引入特征匹配阈值区间的方法,解决了现有票据类型识别方法特征匹配阈值设置不当可能导致的识别速度较慢或拒绝率较高的缺点。另外,本发明通过在表头文字的特征匹配过程中引入表头长度阈值和局部匹配机制较大的提高了识别率。
本发明公开了一种分层带回溯查找机制的票据类型识别方法,包括如下步骤:
S1、将票据特征分为多个识别特征层Lj,每个特征层包含多个特征匹配阈值区间,特征匹配阈值代表允许的待识别图像与识别模板的偏差量;
S2、依次对每个特征层进行特征匹配;
S3、特征匹配过程按照阈值区间从小到大的顺序执行,首先在较小的特征匹配阈值区间进行;
S4、如果得到的匹配结果集(匹配结果集又称为候选模板集)非空,则进入下一个特征层进行特征匹配;如果候选模板集为空,则移向下一个较大的特征匹配阈值区间进行特征匹配;
S5、如果在允许的最大特征匹配阈值区间候选模板集仍为空,则回溯到上一级的特征层的下一个特征匹配阈值区间进行特征匹配;
S6、循环步骤S3-S5,直到得出识别模板或拒识。
进一步,每个特征层Lj定义一个特征偏差量函数Fj(I,ti),用于计算票据图像I与识别模板ti之间的偏差,其中I为票据图像,ti为识别模板;
每个特征层Lj定义pj个特征匹配阈值
Figure BDA0000111092530000041
其中pj>1;这些特征匹配阈值形成pj-1个阈值区间Ajk=[ajk,aj(k+1)),其中k=1,2,...,pj-1;
满足阈值区间Ajk的候选模板集合记为Tjk={ti|Fj(I,ti)∈Ajk,ti∈T},其中T={t1,t2,...,tm}为识别模板库。
进一步,每个特征层Lj的特征匹配阈值按着从小到大的顺序设定,其中最大的特征匹配阈值代表识别模板与待识别图像之间可接受的最大偏差量;
每个特征层Lj定义函数其中选择层利用票据图像的辅助特征进行识别,决策层利用票据图像的关键特征进行识别;
特征层安排顺序为先选择层,再决策层。
进一步,在特征匹配过程中,每个特征层需要记录获得非空候选模板集的阈值区间的位置,以方便下级的特征层回溯到该特征时,从记录位置的下一个阈值区间进行特征匹配;
经过决策层特征匹配后,如果候选模板集中仅包含一个模板,则返回该模板作为识别结果;如果经过选择层特征匹配后,候选模板集中仅包含一个模板,则需要进入下级特征层进行进一步的匹配验证。
进一步,在决策层利用票据图像的表头文字关键特征进行匹配的过程中,引入表头长度阈值λ,当表头长度小于λ时,进行完整匹配;当表头长度大于λ时,进行局部匹配。
进一步,当识别模板的表头长度小于λ时,要求识别模板的表头文字是待识别图像文字识别结果的子串;
当识别模板的表头长度大于λ时,允许识别模板部分表头文字是待识别图像文字识别结果的子串;
识别模板ti的某个表头
Figure BDA0000111092530000051
与待识别图像的文字识别结果ITCI的匹配度
Figure BDA0000111092530000052
定义为:
Figure BDA0000111092530000053
其中
Figure BDA0000111092530000054
MaxSubStr(A,B)计算B中包含的最大的A的子串,StrLen(A)计算字符串A的长度;
识别模板的某个表头
Figure BDA0000111092530000055
与待识别图像之间的偏差量定义为:
设识别模板共定义了ρ个表头文字,则表头文字特征层的特征偏差函数定义为: F ( I , t i ) = 1 - Σ k = 1 ρ MTitle ( TSC k t , ITC I ) ρ .
进一步,所述识别方法共分三个识别特征层:L1、L2和L3,其中L1和L2为选择层,L3为决策层,它们分别选择票据的尺寸、网格线和表头文字作为特征。
附图说明
图1是本发明算法不需要回溯查找时的一种匹配过程;
图2是本发明算法进行回溯查找时的一种匹配过程。
具体实施方式
术语定义
为了精确地对本发明提出的票据类型识别方法进行描述,首先对本发明涉及的各类术语给出定义。
识别模板与识别模板库
集合S的元素个数记为Num(S)
识别模板库记为T={t1,t2,...,tm},其中ti为识别模板:
(1)ti的高度和宽度分别记为ht和wt
(2)ti的网格线分为两大类:
a.水平网格线 HL t = { HL 1 t , HL 2 t , . . . , HL u t } , 第k个水平网格线的定义为: HL k t ≡ ( y k t , x 1 k t , x 2 k t ) , 其中
Figure BDA0000111092530000064
为水平网格线的y坐标, ( x 1 k t < x 2 k t ) 分别为水平网格线的起始和结束点x坐标;
b.垂直网格线 VL t = { VL 1 t , VL 2 t , . . . , VL v t } , 第k个垂直网格线的定义如下: VL k t &equiv; ( x k t , y 1 k t , y 2 k t ) , 其中
Figure BDA0000111092530000073
为垂直网格线的x坐标,
Figure BDA0000111092530000074
( y 1 k t < y 2 k t ) 分别为垂直网格线的起始和结束点y坐标;
(3)表头文字集合记为 TSC t = { TSC 1 t , TSC 2 t , . . . , TSC &rho; t } , 表头文字所对应的矩形区域记为 TSR t = { TSR 1 t , TSR 2 t , . . . , TSR &rho; t } .
待识别票据图像
待识别的票据图像记为I:
(1)I的高度和宽度分别记为hI和wI
(2)在I上检测水平网格线和垂直网格线:
a.水平网格线 HL I = { HL 1 I , HL 2 I , . . . , HL d I } , 第k个水平网格线的定义如下: HL k I &equiv; ( y k I , x 1 k I , x 2 k I ) , 其中为水平网格线的y坐标,
Figure BDA00001110925300000711
( x 1 k I < x 2 k I ) 分别为水平网格线的起始和结束点x坐标;
b.垂直网格线 VL I = { VL 1 I , VL 2 I , . . . , VL q I } , 第k个垂直网格线的定义如下: VL k I &equiv; ( x k I , y 1 k I , y 2 k I ) , 其中为垂直网格线的x坐标,
Figure BDA00001110925300000716
( y 1 k I < y 2 k I ) 分别为垂直网格线的起始和结束点y坐标;
(3)在I上进行文字识别,识别结果记为ITCI
特征层与特征偏差函数
识别算法共分为n个特征层{L1,L2,...,Ln},其中Lj为第j层:
(1)特征层分为选择层和决策层:
a.选择层利用票据图像的辅助特征进行识别;
b.决策层利用票据图像的关键特征进行识别。
引入函数D(Lj),描述识别层Lj是否为选择层、决策层:
Figure BDA0000111092530000081
(2)Lj定义1个特征偏差量函数Fj(I,ti):其中I为票据图像,ti为识别模板;Fj(I,ti)用于计算票据图像I与识别模板ti之间的偏差;
(3)Lj定义pj个特征匹配阈值
Figure BDA0000111092530000082
其中pj>1;这些特征匹配阈值形成pj-1个阈值区间Ajk=[ajk,aj(k+1)),其中k=1,2,...,pj-1;另外,限制特征匹配最多进行到Lj的第qj个阈值区间,其中0<qj≤pj-1;
(4)满足特征阈值区间Ajk的候选模板集合记为Tjk={ti|Fj(I,ti)∈Ajk,ti∈T};
(5)为了控制特征层是否参与识别,引入启用函数E(Lj):
票据特征
本发明提出的票据类型识别方法共包含3个特征层:L1、L2和L3,它们分别选择票据的尺寸、网格线和表头文字作为特征(其中L1和L2为选择层,L3为决策层)。
票据尺寸
尺寸是票据凭证的一个基本特征,同一类票据凭证具有相同的尺寸。
L1的特征偏差函数通过票据图像的尺寸进行定义:
F1(I,ti)=|hI-ht|+|wI-wt|
F1(I,ti)定义为待识别图像I与识别模板ti的高度和宽度之差相加之和,代表待识别图像I与识别模板ti的尺寸偏差量;F1(I,ti)越小,表明待识别图像I与识别模板ti尺寸越相似;F1(I,ti)越大,表明两者尺寸相差越大。
票据网格线
大部分凭证上都具有网格线,网格线是票据凭证的一个重要特征。由于凭证上大部分网格线为水平网格线和垂直网格线,为了加快识别速度,本发明在进行网格线匹配时仅考虑水平和垂直网格线。
待识别图像I与识别模板ti水平网格线之间的偏差通过y坐标和x方向中心位置之间的偏差来计算,
Figure BDA0000111092530000092
定义如下:
MLine ( HL k I , HL k t ) = | y k I - y k t | + | x 2 k I + x 1 k I 2 - x 2 k t + x 1 k t 2 |
待识别图像I与识别模板ti垂直网格线之间的偏差通过x坐标和y方向中心位置之间的偏差来计算,
Figure BDA0000111092530000095
定义如下:
MLine ( VL k I , VL k t ) = | x k I - x k t | + | y 2 k I + y 1 k I 2 - y 2 k t + y 1 k t 2 |
所有网格线之间的偏差值,我们通过偏差的均值进行定义:
&Sigma; k = 1 u MLine ( HL k I , HL k t ) + &Sigma; k = 1 v MLine ( VL k I , VL k t ) u + v
L2层特征偏差函数F2(I,ti)的计算过程如下:
(1)在待识别图像I上检测水平网格线HLI和垂直网格线VLI
(2)在HLI和VLI中查找与识别模板ti水平网格线HLt和垂直网格线VLt相对应的网格线;
(21)如果识别模板ti没有定义水平网格线和垂直网格线(即
Figure BDA0000111092530000098
并且
Figure BDA0000111092530000099
),则需要让ti直接成为待识别图像I的候选模板,因此定义F2(I,ti)为第一个阈值区间中的某个值,从而保证了ti成为I的候选模板;
 F2(I,ti)=δ,其中δ∈A21
(22)如果识别模板ti定义了网格线,并且在识别图像I上找到了与识别模板ti相对应的网格线,定义F2(I,ti)为网格线的平均偏差:
F 2 ( I , t i ) = &Sigma; k = 1 u MLine ( HL k I , HL k t ) + &Sigma; k = 1 v MLine ( VL k I , VL k t ) u + v
(23)其它(即虽然识别模板ti定义了网格线,但是在识别图像I未找到与识别模板ti相对应的网格线),此时需要拒绝识别模板ti,因此定义F2(I,ti)为大于最大特征匹配阈值的某个值:
F2(I,ti)=ω,其中 &omega; > a 2 ( p 2 )
因此L2层的特征偏差函数定义如下:
F 2 ( I , t i ) &delta; , &delta; &Element; A 21 ( 21 ) &Sigma; k = 1 u MLine ( HL k I , HL k t ) + &Sigma; k = 1 v MLine ( VL k I , VL k t ) u + v ( 22 ) &omega; , &omega; > a 2 ( p 2 ) ( 23 )
票据表头文字
票据凭证的表头文字是票据的重要特征,基本上是票据类型识别方法必须使用的票据特征。
首先引入字符串子串IsSubStr(A,B)、最大子串MaxSubStr(A,B)和长度StrLen(A)函数的定义:
Figure BDA0000111092530000104
MaxSubStr(A,B):计算B中包含的最大的A的子串
StrLen(A):计算字符串A的长度
为了允许表头文字的局部匹配,我们引入表头长度阈值λ;当识别模板的表头长度小于λ时,进行完整匹配,从而降低误识率;当识别模板的表头长度大于λ时,进行局部匹配,从而最大程度地提高识别率。
识别模板ti的某个表头
Figure BDA0000111092530000111
与待识别图像的文字识别结果ITCI的匹配度
Figure BDA0000111092530000112
定义如下:
Figure BDA0000111092530000113
Figure BDA0000111092530000114
的长度小于λ时,只进行完整匹配:当识别模板的表头文字
Figure BDA0000111092530000115
为待识别图像文字识别结果ITCI的子串时,令
Figure BDA0000111092530000116
否则令 MTitle ( TSC k t , ITC I ) = 0 .
Figure BDA0000111092530000118
的长度大于λ时允许进行局部匹配:令
Figure BDA0000111092530000119
等于待识别图像文字识别结果ITCI中包含的
Figure BDA00001110925300001110
的最大子串的长度与
Figure BDA00001110925300001111
的长度之比。
所有表头 TSC t = { TSC 1 t , TSC 2 t , . . . , TSC &rho; t } 与ITCI的匹配度定义为匹配度的均值:
&Sigma; k = 1 &rho; MTitle ( TSC k t , ITC I ) &rho;
这里计算得出的是匹配度,匹配度越大表明待识别图像I与识别模板ti的越相似;反之,两者相差越大。可以看出匹配度与特征偏差量是成反比的,因此为了定义特征偏差函数,需要对上述的匹配度进行适当的处理。
L3层特征偏差函数F3(I,ti)的计算过程如下:
(1)对待识别图像I进行文字OCR识别。为了加快识别速度,计算上个特征层的候选模板集中所有表头文字矩形区域的并集在待识别图像I的子区域TSR上进行OCR识别,得出文字识别结果ITCI
(2)进行特征匹配
(21)如果识别模板ti没有定义表头文字(即
Figure BDA0000111092530000121
),则需要让ti直接成为待识别图像I的候选模板,因此定义F3(I,ti)为第一个阈值区间中的某个值,从而保证了ti成为I的候选模板;
F3(I,ti)=δ,其中δ∈A31
(22)识别模板ti定义了表头文字,但是识别图像I的文字识别结果与所有模板表头文字都不匹配(即 &Sigma; k = 1 &rho; MTitle ( TSC k t , ITC I ) = 0 ),此时需要拒绝识别模板ti,因此定义F3(I,ti)为大于最大特征匹配阈值的某个值:
F3(I,ti)=ω,其中 &omega; > a 3 ( p 3 )
(23)其它,此时定义F3(I,ti)为1减去表头匹配度均值:
F 3 ( I , t i ) = 1 - &Sigma; k = 1 &rho; MTitle ( TSC k t , ITC I ) &rho;
则L3特征偏差函数的定义如下:
F 3 ( I , t i ) = &delta; , &delta; &Element; A 31 ( 21 ) &omega; , &omega; > a 3 ( p 3 ) ( 22 ) 1 - &Sigma; k = 1 &rho; MTitle ( TSC k t , ITC I ) &rho; ( 23 )
方法具体实现流程步骤
本发明提出一种分层的带回溯机制的票据类型识别方法,该方法包含多个特征层,每个特征层设定多个特征匹配阈值,这些特征匹配阈值形成多个阈值区间,其方法步骤如下:
输入:票据图像I,识别模板库T={t1,t2,...,tm}以及算法的配置参数(包括特征层的特征匹配阈值、表头长度阈值λ等)
输出:与票据图像匹配的模板集R
(0)加载识别模板库T={t1,t2...ti...tm}及各类算法参数,这些参数包括:
各识别层特征匹配阈值、表头匹配长度阈值λ等。
(1)令j=1,k=1,R=T;
(2)计算E(Lj)
(21)如果E(Lj)=1,转(3);
(22)如果E(Lj)=0并且j<n,令j=j+1,k=1,转(2);
(23)否则,转(4)。
(3)计算Lj层中满足当前特征区间Ajk的模板集合Tjk={ti|Fj(I,ti)∈Ajk,ti∈R};
(31)如果
Figure BDA0000111092530000131
(311)如果k<qj&&j<n,令k=k+1,转向(2);
(312)如果k>=qj&&j>1,令j=j-1,k=V(Lj)+1,如果k<=qj转向(2);
(313)否则,令R=Tjk,转向(4)。
(32)如果
Figure BDA0000111092530000132
(321)令V(Lj)=k;
(322)如果Num(Tjk)>1&&j<n,令j=j+1,k=1,R=Tjk,转向(2);
(323)如果Num(Tjk)=1&&j<n&&D(Lj)=0,令j=j+1,k=1,R=Tjk,转向(2);
(324)否则,令R=Tjk,转向(4)。
(4)返回R,退出
本发明提出的票据类型识别方法具有以下关键特点:
(1).每个特征层Lj的特征匹配过程,首先在较小的阈值区间进行;如果候选模板集非空,则进入下一个特征层进行特征匹配;如果候选模板集为空,则移向较大的阈值区间进行特征匹配;如果在可能的最大阈值区间(第qj个区间)候选模板集仍为空,则回溯到上一级的特征层进行特征匹配。
图1和图2为算法进行特征匹配过程的样例示意图,它们涉及3个特征层,3个特征层分别包含3、4、4个阈值区间。图1和图2中的编号代表特征匹配顺序,箭头代表特征匹配的进行方向,其中深黑色箭头代表回溯过程。图1所示的匹配过程不涉及回溯,算法在最后一个特征层的第一个阈值区间得到识别结果,这是大部分比较规范的票据凭证所走的匹配过程;图2所示本发明的匹配过程涉及回溯过程,算法在最后一个特征层的最后一个阈值区间没有得到识别结果,从而回溯到第2个特征层的第2个阈值区间进行特征匹配,最后在第3个特征层的第2个阈值空间得到识别结果。
(2).在特征匹配过程中,每个特征层需要记录获得非空候选模板集的阈值区间的位置(这里记为V(Lj)),以方便下级的特征层回溯到该特征时,从记录位置的下一个阈值区间进行特征匹配。
(3).在某个决策层匹配时,如果候选模板集中仅包含一个模板,则返回该模板作为识别结果;如果是选择层进行匹配时,候选模板集中仅包含一个模板,则还需要进入下级特征层进行进一步的匹配验证。合理的特征层安排顺序为先选择层,再决策层。
(4).通过引入启用函数E(Lj),可以方便的禁用或启用某特征层。
本发明的关键点
本发明针对每个特征层设定多个特征匹配阈值,这些特征匹配阈值形成多个阈值区间。每个特征层的特征匹配阈值按着从小到大的顺寻设定,其中最大的特征匹配阈值代表识别模板与待识别图像之间可接受的最大偏差量。每个特征层的特征匹配过程首先在较小的阈值区间进行;如果得到的候选模板集非空,则进入下一个特征层进行特征匹配;如果候选模板集为空,则移向较大的阈值区间进行特征匹配;如果在允许的最大阈值区间候选模板集仍为空,则回溯到上一级的特征层的下一个匹配阈值区间进行特征匹配。
另外,本发明在票据表头文字的匹配过程中引入表头长度阈值λ,允许表头文字的局部匹配。当识别模板的表头长度小于λ时,进行完整匹配,从而降低误识率;当识别模板的表头长度大于λ时,进行局部匹配,从而最大程度地提高识别率。本发明的这种表头文字匹配机制可以大大提高具有较长表头文字的票据凭证的识别率。
本发明的有益效果
本发明提出的基于特征阈值区间的带回溯机制的特征组合方式对于大部分比较规范的票据凭证,能够以较快的速度得出识别结果;对于不规范的票据凭证也可以通过回溯机制得出识别结果。本发明的这种特征组合方法有效的克服了现有票据类型识别方法特征匹配阈值选取不当导致的识别速度较慢和拒识率较高的问题。
本发明引入的表头长度阈值和局部匹配机制在提高具有较长表头文字的票据凭证的识别率的同时,最大程度地降低了具有较短表头文字的票据凭证的误识率。本发明的这种机制可以有效的解决现有票据类型识别方法可能导致的具有较长表头的票据凭证识别率低的问题。
上述仅为本发明的较佳实施例及所运用技术原理,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围的内。

Claims (6)

1.一种分层带回溯查找机制的票据类型识别方法,其特征在于,包括如下步骤:
S1、将票据特征分为多个识别特征层Lj,其中j=1,2,3,每个特征层包含多个特征匹配阈值区间,特征匹配阈值代表允许的待识别图像与识别模板的偏差量;
S2、依次对每个特征层进行特征匹配;
S3、特征匹配过程按照阈值区间从小到大的顺序执行,首先在较小的特征匹配阈值区间进行;
S4、如果得到的称为候选模板集的匹配结果集非空,则进入下一个特征层进行特征匹配;如果候选模板集为空,则移向下一个较大的特征匹配阈值区间进行特征匹配;
S5、如果在允许的最大特征匹配阈值区间候选模板集仍为空,则回溯到上一级的特征层的下一个特征匹配阈值区间进行特征匹配;
S6、循环步骤S3-S5,直到得出识别模板或拒识;
其中,每个特征层Lj定义一个特征偏差量函数Fj(I,ti),用于计算票据图像I与识别模板ti之间的偏差,其中I为票据图像,ti为识别模板;
每个特征层Lj定义pj个特征匹配阈值
Figure FDA0000449863270000011
其中pj>1,j=1,2,3;每个特征层Lj的特征匹配阈值按着从小到大的顺序设定,其中最大的特征匹配阈值代表可接受的待识别图像与票据类型模板的最大偏差量;这些特征匹配阈值形成pj-1个阈值区间Ajk=[ajk,aj(k+1)),其中k=1,2,...,pj-1;
满足阈值区间Ajk的候选模板集合记为Tjk={ti|Fj(I,ti)∈Ajk,ti∈T,1≤i≤m},其中T={t1,t2,...,tm}为识别模板库,m为识别模板库中模板的数量,m为大于0的自然数;“ti”为识别模板库T={t1,t2,...,tm}中的识别模板,i的取值范围为1≤i≤m。
2.如权利要求1所述的方法,其特征在于:
每个特征层Lj定义函数
Figure FDA0000449863270000021
其中选择层利用票据图像的辅助特征进行识别,决策层利用票据图像的关键特征进行识别;
特征层安排顺序为先选择层,再决策层。
3.如权利要求2所述的方法,其特征在于:
所述待识别票据图像共分三个识别特征层:L1、L2和L3,其中L1和L2为选择层,L3为决策层,它们分别选择票据的尺寸、网格线和表头文字作为特征。
4.如权利要求1-3之一所述的方法,其特征在于:
在特征匹配过程中,每个特征层需要记录获得非空候选模板集的阈值区间的位置,以方便下级的特征层回溯到该特征时,从记录位置的下一个阈值区间进行特征匹配;
经过决策层特征匹配后,如果候选模板集中仅包含一个模板,则返回该模板作为识别结果;如果经过选择层特征匹配后,候选模板集中仅包含一个模板,则需要进入下一特征层进行进一步的匹配验证。
5.如权利要求4所述的方法,其特征在于:
在决策层利用票据图像的表头文字关键特征进行匹配的过程中,引入表头长度阈值λ,当表头长度小于λ时,进行完整匹配;当表头长度大于λ时,进行局部匹配。
6.如权利要求5所述的方法,其特征在于:
计算上个特征层的匹配结果模板集中所有表头文字矩形区域的并集TSR,在待识别图像的TSR区域上进行OCR识别,得出待识别图像的文字识别结果;
当识别模板的表头长度小于λ时,要求识别模板的表头文字是待识别图像文字识别结果的子串;
当识别模板的表头长度大于λ时,允许识别模板的部分表头文字是待识别图像文字识别结果的子串;
识别模板ti的某个表头
Figure FDA0000449863270000036
t与待识别图像的文字识别结果ITCI的匹配度
Figure FDA0000449863270000037
定义为:
Figure FDA0000449863270000031
其中
Figure FDA0000449863270000032
MaxSubStr(A,B)计算B中包含的最大的A的子串,StrLen(A)计算字符串A的长度;
识别模板的某个表头与待识别图像之间的偏差量定义为:
Figure FDA0000449863270000034
设识别模板共定义了ρ个表头文字,则表头文字特征层的特征偏差函数定义为: F ( I , t i ) = 1 - &Sigma; k = 1 &rho; MTitle ( TSC k t , ITC I ) &rho; .
CN201110374402.4A 2011-11-22 2011-11-22 一种分层带回溯查找机制的票据类型识别方法 Active CN102509115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110374402.4A CN102509115B (zh) 2011-11-22 2011-11-22 一种分层带回溯查找机制的票据类型识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110374402.4A CN102509115B (zh) 2011-11-22 2011-11-22 一种分层带回溯查找机制的票据类型识别方法

Publications (2)

Publication Number Publication Date
CN102509115A CN102509115A (zh) 2012-06-20
CN102509115B true CN102509115B (zh) 2014-06-25

Family

ID=46221196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110374402.4A Active CN102509115B (zh) 2011-11-22 2011-11-22 一种分层带回溯查找机制的票据类型识别方法

Country Status (1)

Country Link
CN (1) CN102509115B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005793B (zh) * 2015-07-15 2018-02-27 广州敦和信息技术有限公司 一种发票字条自动识别录入的方法及装置
CN109784235A (zh) * 2018-12-29 2019-05-21 广东益萃网络科技有限公司 纸质表单的自动录入方法、装置、计算机设备和存储介质
CN110188755B (zh) * 2019-05-30 2021-09-07 北京百度网讯科技有限公司 一种图像识别的方法、装置和计算机可读存储介质
CN112085885A (zh) * 2020-09-24 2020-12-15 理光图像技术(上海)有限公司 票证识别装置以及票证信息管理系统
CN112308141B (zh) * 2020-10-30 2023-04-07 长城信息股份有限公司 一种扫描票据分类方法、系统及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1383094A (zh) * 2001-04-25 2002-12-04 株式会社日立制作所 帐票识别方法
US20080273802A1 (en) * 2006-01-13 2008-11-06 Fujitsu Limited Program and apparatus for forms processing
CN101447017A (zh) * 2008-11-27 2009-06-03 浙江工业大学 一种基于版面分析的选票快速识别统计方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1383094A (zh) * 2001-04-25 2002-12-04 株式会社日立制作所 帐票识别方法
US20080273802A1 (en) * 2006-01-13 2008-11-06 Fujitsu Limited Program and apparatus for forms processing
CN101447017A (zh) * 2008-11-27 2009-06-03 浙江工业大学 一种基于版面分析的选票快速识别统计方法及系统

Also Published As

Publication number Publication date
CN102509115A (zh) 2012-06-20

Similar Documents

Publication Publication Date Title
CN102054178B (zh) 一种基于局部语义概念的国画图像识别方法
CN102509115B (zh) 一种分层带回溯查找机制的票据类型识别方法
CN106203395B (zh) 基于多任务深度学习的人脸属性识别方法
CN110033000A (zh) 一种票据图像的文本检测与识别方法
CN104115194B (zh) 纸张号码读取系统以及纸张号码读取方法
CN103034848B (zh) 一种表单类型的识别方法
CN104408449B (zh) 智能移动终端场景文字处理方法
CN101604384B (zh) 个性化指纹识别方法
CN106372581A (zh) 构建及训练人脸识别特征提取网络的方法
CN107563280A (zh) 基于多模型的人脸识别方法和装置
CN106688011A (zh) 用于多类别物体检测的方法和系统
CN106228166B (zh) 字符图像的识别方法
JP4715664B2 (ja) 車両検索システム
CN101719222A (zh) 分类器训练方法和装置以及人脸认证方法和装置
JP5372183B2 (ja) 硬貨分類装置および硬貨分類方法
CN107545243A (zh) 基于深度卷积模型的黄种人脸识别方法
CN101777130A (zh) 一种指纹图像相似度评价方法
CN110929746A (zh) 一种基于深度神经网络的电子卷宗标题定位提取与分类方法
CN109242047A (zh) 基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法
CN113191348B (zh) 一种基于模板的文本结构化提取方法及工具
Piekarczyk Hierarchical random graph model for off-line handwritten signatures recognition
CN106991049A (zh) 一种软件缺陷预测方法及预测系统
CN103824060A (zh) 指纹细节点的提取方法
CN106951819A (zh) 基于稀疏概率分布和多阶段类别筛选的单样本人脸识别方法
CN112037180B (zh) 染色体分割方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: NORTHKING INFORMATION TECHNOLOGY CO., LTD.

Free format text: FORMER NAME: BEIJING NORTH KING INFORMATION TECHNOLOGY CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 100089 Beijing, West Third Ring Road North, No. 25, green building, room 701, Haidian District

Patentee after: The north, capital infotech share company limited

Address before: 100089 Beijing, West Third Ring Road North, No. 25, green building, room 701, Haidian District

Patentee before: Beijing Jing North Information Technology Co.,Ltd.

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160421

Address after: 214174 Jiangsu city of Wuxi province Huishan wisdom Road Economic Development Zone No. 18 room 2108

Patentee after: Wuxi NORTHKING Information Technology Co. Ltd.

Address before: 100089 Beijing, West Third Ring Road North, No. 25, green building, room 701, Haidian District

Patentee before: The north, capital infotech share company limited

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170911

Address after: 100089 Beijing, West Third Ring Road North, No. 25, green building, level 7, Haidian District

Patentee after: The north, capital infotech share company limited

Address before: 214174 Jiangsu city of Wuxi province Huishan wisdom Road Economic Development Zone No. 18 room 2108

Patentee before: Wuxi NORTHKING Information Technology Co. Ltd.