CN106875546B - 一种增值税发票的识别方法 - Google Patents

一种增值税发票的识别方法 Download PDF

Info

Publication number
CN106875546B
CN106875546B CN201710073714.9A CN201710073714A CN106875546B CN 106875546 B CN106875546 B CN 106875546B CN 201710073714 A CN201710073714 A CN 201710073714A CN 106875546 B CN106875546 B CN 106875546B
Authority
CN
China
Prior art keywords
character
invoice
zero
image
pixel value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710073714.9A
Other languages
English (en)
Other versions
CN106875546A (zh
Inventor
王新年
廖玉钦
王慧玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN201710073714.9A priority Critical patent/CN106875546B/zh
Publication of CN106875546A publication Critical patent/CN106875546A/zh
Application granted granted Critical
Publication of CN106875546B publication Critical patent/CN106875546B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/20Testing patterns thereon
    • G07D7/2016Testing patterns thereon using feature extraction, e.g. segmentation, edge detection or Hough-transformation
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/20Testing patterns thereon
    • G07D7/2008Testing patterns thereon using pre-processing, e.g. de-blurring, averaging, normalisation or rotation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明提供一种增值税发票的识别方法,其特征在于,包括如下步骤:对输入的发票图像进行预处理;对发票图像进行选项区域定位;字符分割;字符区域分为9块;提取每个图像块的HOG特征,得到9个一维的HOG特征序列;特征序列分别与模板做比对,得到差异系数;根据差异系数的大小,为这9块赋予不同权重,生成权重矩阵;将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;对每个切分后的字符重复上述步骤直至完成发票各项内容的识别。本发明有效地实现对增值税发票中的汉字模块识别,同时对形近字区分能力增强,具有光照不变性和旋转不变性,抗干扰能力更强,对模糊字符有着较好的识别能力。

Description

一种增值税发票的识别方法
技术领域
本发明涉及一种增值税发票的识别方法,特别是针对形近字有着较高的辨别能力。
背景技术
现有技术中,对于增值税发票识别,通常采用如下方式:通过表格模板定制,设置识别区域,识别属性,调用专用的字符,进行选项区域识别,根据识别属性进行识别后处理,最后输出结构化的识别结果;或者在使用清华TH-OCR技术的基础上,对发票进行多项预处理操作,具体有纠偏、偏色校正、滤色、降噪、二值化、增强识别单元对比度等功能,这些功能可灵活配置、自由组合,为之后识别输出最优的图像质量。
目前,对于增值税发票识别存在以下问题:
1、目前增值税发票识别中通常只识别数字,缺少对增值税发票中汉字的识别模块;
2、对于形近字的区分能力相对较弱,容易出现误识的情况;
3、增值税发票纸质为复写纸,打印时字符笔画容易粘连,造成识别困难。
发明内容
根据上述提出的技术问题,而提供一种增值税发票的识别方法。本发明主要利用通过对输入图像的预处理、票据选项定位、字符分割、字符区域分块、提取HOG特征、对比识别、块权重分配到输出核对,对增值税发票进行识别,从而有效的实现对增值税发票中的汉字模块识别,同时对形近字区分能力增强。
本发明采用的技术手段如下:
一种增值税发票的识别方法,其特征在于,包括如下步骤:
S1、对输入的发票图像进行预处理:提取原始彩色发票图像的r分量,作为灰度图像,对灰度图像进行中值滤波操作,减少噪点,对灰度图像进行Radon变换,进行倾斜校正;
S2、对发票图像进行选项区域定位:寻找标记点,进行选项区域定位,截取各选项区域,分别二值化处理得到黑底白字图像;
S3、字符分割:将各选项区域的字符通过投影法分割开来,得到单个字符的最小外接矩形,便于后续的识别处理;
S4、字符区域分块:将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块;
S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列;
S6、将步骤S5中的特征序列分别与模板做比对,比对公式如下:
其中,An为待识别字符块的HOG特征序列,为An的均值;Bn为模板字符块HOG特征序列,为Bn的均值;r为待识别字符块与模板字符块的相关系数,当-1≤r<0时,An与Bn为负相关;当0<r≤1时,An与Bn为正相关;当r=0时,An与Bn不相关;其差异系数d用1-r来表示;
S7、将候选字符中的9个块,进行加权求和,根据差异系数d的取值范围,为其赋予不同权重,生成权重矩阵,其权重分配方式如下:
S8、将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;
S9、对每个切分后的字符重复上述步骤S4至S8,直至完成发票各项内容的识别。
进一步地,所述步骤S2中,具体包括:
S21、寻找标记点,将发票矩形框的四个顶点定位,取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影;投影值第一个和最后一个向下尖峰处,即为矩形顶点位置,从而确定矩形框的位置;
S22、进行选项区域定位,发票各选项区域位置是固定的,根据矩形框位置,与发票各选项区域的相对位置关系,将各区域坐标计算出来;
S23、用S22中计算出的坐标,在步骤S1处理完的灰度图像上,截取各选项区域,并分别二值化处理,得到黑底白字的二值图像。
进一步地,所述步骤S3中,字符通过投影法分割具体为,分别获取各字符的左右边界,进行垂直分割;再将分割出的每个块,进行水平投影,去除零点,即字符上方和下方多余部分;保留非零点,即字符。
进一步地,根据不同区域内容不同,具体的切分方式也相应不同:
①只有一行字的情况:
先垂直投影,再从左向右水平扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为字符左边界,遍历所有点,得到所有字符的左边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为字符右边界,遍历所有点,得到所有字符右边界,使用这些边界信息,进行垂直分割;
②有多行文字的情况:
首先进行水平分割,将多行字分割成多个单行字,这样后面的步骤同①一样,水平分割做法:先水平投影,再从上往下扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为行的上边界,遍历所有点,得到所有行的上边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为行的边界,遍历所有点,得到所有行的下边界,使用这些边界信息,将图像分割为单行字,再重复步骤①,将单行字分割成单个字符。
进一步地,所述步骤S6中,其比对过程为:
S61、读取一个待识别字符,从左至右,从上之下,从第1块开始进行模板匹配,然后依次对第2、3、4块,直至第9块进行匹配;
S62、当前模板9块匹配结束,读取下一个模板,重复步骤S61,直至所有模板相似度计算完毕;
S63、设定相似度阈值T,统计每个模板字符的9块相似度,若相似度小于该阈值的块数大于等于6,则该模板字符必定不是正确结果,不进行操作;若小于6块,则将该模板存入候选字符。
本发明具有以下优点:
1、本发明不仅对增值税发票中的数字部分进行识别,如买方税号、售方税号等,还对发票中的汉字进行了识别,如买方名称、售方名称等;
2、本发明考虑到汉字的结构特点,将字符划分为9宫格,并提出“差异越大,权重越大”的加权求和思想,对形近字有良好的区分度;
3、本发明具有光照不变性和旋转不变性,抗干扰能力更强,对模糊字符有着较好的识别能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明识别方法的流程框图。
图2为本发明对发票图像进行处理示意图,其中,a为倾斜图像,b为倾斜校正后的图像。
图3为本发明票据选项定位时寻找标记点的示意图。
图4为本发明字符区域分块后得到的图像块示意图。
图5为图3寻找标记点后分别进行水平投影和垂直投影的图像。
图6为本发明字符比对与识别过程流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种增值税发票的识别方法,包括如下步骤:
S1、对输入的发票图像进行预处理,其包括以下步骤:提取原始彩色发票图像的r分量,作为灰度图像;灰度图像进行中值滤波操作,减少噪点;对灰度图像进行Radon变换,进行倾斜校正,其结果如图2所示。
S2、对发票图像进行选项区域定位。其包括以下步骤:
S21、寻找标记点,如图3所示,将发票矩形框的四个顶点定位,具体做法是:取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影。如图5所示,投影值第一个和最后一个向下尖峰处,即为矩形顶点位置。这样便可确定矩形框的位置;
S22、进行选项区域定位,发票各选项区域位置是固定的,根据矩形框位置,与发票各选项区域的相对位置关系,将各区域坐标计算出来;
S23、用这些坐标,在步骤S1处理完的灰度图像上,截取各选项区域,并分别二值化处理,得到黑底白字的二值图像。
S3、字符分割:将各选项区域的字符分割开来,得到单个字符的最小外接矩形,方便后续的识别处理。核心思想是投影法,分别获取各字符的左右边界,进行垂直分割;再将分割出的每个块,进行水平投影,去除零点,即字符上方和下方多余部分;保留非零点,即字符。根据不同区域内容不同,具体的切分方式也相应不同:
①只有一行字:
先垂直投影,再从左向右水平扫描。若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为字符左边界,遍历所有点,得到所有字符的左边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为字符右边界,遍历所有点,得到所有字符右边界。使用这些边界信息,进行垂直分割;
②有多行文字:
首先进行水平分割,将多行字分割成多个单行字,这样后面的步骤同①一样。水平分割做法:先水平投影,再从上往下扫描。若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为行的上边界,遍历所有点,得到所有行的上边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为行的边界,遍历所有点,得到所有行的下边界。使用这些边界信息,将图像分割为单行字,再重复步骤①,将单行字分割成单个字符。
S4、字符区域分块(尺寸规范化):将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块。如图4所示。
S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列。
S6、将这些序列分别与模板做比对,比对公式如下:
其中,An为待识别字符块的HOG特征序列,为An的均值;Bn为模板字符块HOG特征序列,为Bn的均值。r为待识别字符块与模板字符块的相关系数,当-1≤r<0时,An与Bn为负相关;当0<r≤1时,An与Bn为正相关;当r=0时,An与Bn不相关。那么,其差异系数d可用1-r来表示。
如图6所示,其比对过程为:
S61、读取一个待识别字符,从左至右,从上之下,从第1块开始进行模板匹配,然后依次对第2、3、4块,直至第9块进行匹配;
S62、当前模板9块匹配结束,读取下一个模板,重复步骤S61,直至所有模板相似度计算完毕;
S63、设定相似度阈值T,统计每个模板字符的9块相似度,若相似度小于该阈值的块数大于等于6,则该模板字符必定不是正确结果,不进行操作;若小于6块,则将该模板存入候选字符。
S7、将候选字符中的9个块,进行加权求和,根据差异系数d的取值范围,为其赋予不同权重,生成权重矩阵。其权重分配方式如下:
S8、将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符即为匹配结果。
S9、对每个切分后的字符重复上述步骤S4至S8,即完成发票各项内容的识别。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (5)

1.一种增值税发票的识别方法,其特征在于,包括如下步骤:
S1、对输入的发票图像进行预处理:提取原始彩色发票图像的R分量,作为灰度图像,对灰度图像进行中值滤波操作,减少噪点,对灰度图像进行Radon变换,进行倾斜校正;
S2、对发票图像进行选项区域定位:寻找标记点,进行选项区域定位,截取各选项区域,分别二值化处理得到黑底白字图像;
S3、字符分割:将各选项区域的字符通过投影法分割开来,得到单个字符的最小外接矩形,便于后续的识别处理;
S4、字符区域分块:将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块;
S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列;
S6、将步骤S5中的特征序列分别与模板做比对,比对公式如下:
其中,An为待识别字符块的HOG特征序列,为An的均值;Bn为模板字符块HOG特征序列,为Bn的均值;r为待识别字符块与模板字符块的相关系数,当-1≤r<0时,An与Bn为负相关;当0<r≤1时,An与Bn为正相关;当r=0时,An与Bn不相关;其差异系数d用1-r来表示;
S7、将候选字符中的9个块,进行加权求和,根据差异系数d的取值范围,为其赋予不同权重,生成权重矩阵,其权重分配方式如下:
S8、将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;
S9、对每个切分后的字符重复上述步骤S4至S8,直至完成发票各项内容的识别。
2.根据权利要求1所述的增值税发票的识别方法,其特征在于,所述步骤S2中,具体包括:
S21、寻找标记点,将发票矩形框的四个顶点定位,取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影;投影值第一个和最后一个向下尖峰处,即为矩形顶点位置,从而确定矩形框的位置;
S22、进行选项区域定位,发票各选项区域位置是固定的,根据矩形框位置,与发票各选项区域的相对位置关系,将各区域坐标计算出来;
S23、用S22中计算出的坐标,在步骤S1处理完的灰度图像上,截取各选项区域,并分别二值化处理,得到黑底白字的二值图像。
3.根据权利要求1所述的增值税发票的识别方法,其特征在于,所述步骤S3中,字符通过投影法分割具体为,分别获取各字符的左右边界,进行垂直分割;再将分割出的每个块,进行水平投影,去除零点,即字符上方和下方多余部分;保留非零点,即字符。
4.根据权利要求3所述的增值税发票的识别方法,其特征在于,根据不同区域内容不同,具体的切分方式也相应不同:
①只有一行字的情况:
先垂直投影,再从左向右水平扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为字符左边界,遍历所有点,得到所有字符的左边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为字符右边界,遍历所有点,得到所有字符右边界,使用这些边界信息,进行垂直分割;
②有多行文字的情况:
首先进行水平分割,将多行字分割成多个单行字,这样后面的步骤同①一样,水平分割做法:先水平投影,再从上往下扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为行的上边界,遍历所有点,得到所有行的上边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为行的边界,遍历所有点,得到所有行的下边界,使用这些边界信息,将图像分割为单行字,再重复步骤①,将单行字分割成单个字符。
5.根据权利要求1所述的增值税发票的识别方法,其特征在于,所述步骤S6中,其比对过程为:
S61、读取一个待识别字符,从左至右,从上之下,从第1块开始进行模板匹配,然后依次对第2、3、4块,直至第9块进行匹配;
S62、当前模板9块匹配结束,读取下一个模板,重复步骤S61,直至所有模板相似度计算完毕;
S63、设定相似度阈值T,统计每个模板字符的9块相似度,若相似度小于该阈值的块数大于等于6,则该模板字符必定不是正确结果,不进行操作;若小于6块,则将该模板存入候选字符。
CN201710073714.9A 2017-02-10 2017-02-10 一种增值税发票的识别方法 Active CN106875546B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710073714.9A CN106875546B (zh) 2017-02-10 2017-02-10 一种增值税发票的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710073714.9A CN106875546B (zh) 2017-02-10 2017-02-10 一种增值税发票的识别方法

Publications (2)

Publication Number Publication Date
CN106875546A CN106875546A (zh) 2017-06-20
CN106875546B true CN106875546B (zh) 2019-02-05

Family

ID=59166505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710073714.9A Active CN106875546B (zh) 2017-02-10 2017-02-10 一种增值税发票的识别方法

Country Status (1)

Country Link
CN (1) CN106875546B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358232B (zh) * 2017-06-28 2020-12-29 中山大学新华学院 基于插件的发票识别方法
CN107832757B (zh) * 2017-11-03 2021-08-31 深圳航天信息有限公司 一种发票图像的识别方法
CN108171863A (zh) * 2017-12-28 2018-06-15 国网山东省电力公司蒙阴县供电公司 增值税发票的检验方法及装置
CN108549843A (zh) * 2018-03-22 2018-09-18 南京邮电大学 一种基于图像处理的增值税发票识别方法
CN109145879B (zh) * 2018-09-30 2021-01-12 金蝶软件(中国)有限公司 一种打印字体识别的方法、设备及存储介质
CN109543770A (zh) * 2018-11-30 2019-03-29 合肥泰禾光电科技股份有限公司 点阵字符识别方法及装置
CN109858980B (zh) * 2019-01-10 2023-04-28 上海启业信息技术有限公司 基于开源ocr上的高速扫描增值税发票勾选认证系统及方法
CN110276881A (zh) * 2019-05-10 2019-09-24 广东工业大学 一种基于卷积循环神经网络的纸币序列号识别方法
CN110634222B (zh) * 2019-08-27 2021-07-09 河海大学 一种银行票据信息识别方法
CN110533003B (zh) * 2019-09-06 2022-09-20 兰州大学 一种穿线法车牌数字识别方法及设备
CN110738119B (zh) * 2019-09-16 2022-07-01 深圳市国信合成科技有限公司 一种票据识别方法、装置、设备及可读介质
CN110895690A (zh) * 2019-10-11 2020-03-20 南京邮电大学 一种基于openCV形态学的发票定位方法
CN110751136A (zh) * 2019-11-04 2020-02-04 北京亿信华辰软件有限责任公司武汉分公司 一种增值税发票信息的提取方法
CN111046874A (zh) * 2019-12-12 2020-04-21 北京小白世纪网络科技有限公司 一种基于模板匹配的单号识别方法
CN110991974A (zh) * 2019-12-20 2020-04-10 贵州黔岸科技有限公司 基于gps的运输成本智能核算系统及方法
CN112241739A (zh) * 2020-12-17 2021-01-19 北京沃东天骏信息技术有限公司 识别文本错误的方法、装置、设备和计算机可读介质
CN112528895B (zh) * 2020-12-17 2023-09-12 恒银金融科技股份有限公司 一种金融票据图像票号处变造检测的计算方法
CN113255641A (zh) * 2020-12-31 2021-08-13 深圳怡化电脑股份有限公司 一种图像识别的方法及装置、电子设备、存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070078509A (ko) * 2006-01-27 2007-08-01 노틸러스효성 주식회사 지로 장표 수납기의 문자인식방법
CN102800148A (zh) * 2012-07-10 2012-11-28 中山大学 一种人民币序列号识别方法
CN103268363A (zh) * 2013-06-06 2013-08-28 哈尔滨工业大学 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法
CN103310211A (zh) * 2013-04-26 2013-09-18 四川大学 一种基于图像处理的填注标记识别方法
CN103761799A (zh) * 2014-01-13 2014-04-30 王波 一种基于纹理图像特征的票据防伪方法和装置
CN104298989A (zh) * 2014-08-20 2015-01-21 深圳大学 基于斑马线红外图像特征的鉴伪方法及其系统
CN105354566A (zh) * 2015-10-26 2016-02-24 江苏国光信息产业股份有限公司 用于冠字号识别的字符污染去除方法
CN105654094A (zh) * 2015-11-25 2016-06-08 小米科技有限责任公司 特征提取方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070078509A (ko) * 2006-01-27 2007-08-01 노틸러스효성 주식회사 지로 장표 수납기의 문자인식방법
CN102800148A (zh) * 2012-07-10 2012-11-28 中山大学 一种人民币序列号识别方法
CN103310211A (zh) * 2013-04-26 2013-09-18 四川大学 一种基于图像处理的填注标记识别方法
CN103268363A (zh) * 2013-06-06 2013-08-28 哈尔滨工业大学 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法
CN103761799A (zh) * 2014-01-13 2014-04-30 王波 一种基于纹理图像特征的票据防伪方法和装置
CN104298989A (zh) * 2014-08-20 2015-01-21 深圳大学 基于斑马线红外图像特征的鉴伪方法及其系统
CN105354566A (zh) * 2015-10-26 2016-02-24 江苏国光信息产业股份有限公司 用于冠字号识别的字符污染去除方法
CN105654094A (zh) * 2015-11-25 2016-06-08 小米科技有限责任公司 特征提取方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
增值税发票自动识别算法研究;廖玉钦;《中国优秀硕士学位论文全文数据库-2018年》;20180331(第6期);第57-62页

Also Published As

Publication number Publication date
CN106875546A (zh) 2017-06-20

Similar Documents

Publication Publication Date Title
CN106875546B (zh) 一种增值税发票的识别方法
Shahab et al. ICDAR 2011 robust reading competition challenge 2: Reading text in scene images
CN104751187B (zh) 抄表图像自动识别方法
CN102567300B (zh) 图片文档的处理方法及装置
LeBourgeois Robust multifont OCR system from gray level images
EP1052593A2 (en) Form search apparatus and method
CN103942797B (zh) 基于直方图和超像素的场景图像文字检测方法及系统
CN102663378B (zh) 连笔手写字符的识别方法
Wakahara et al. Binarization of color character strings in scene images using k-means clustering and support vector machines
CN110969129A (zh) 一种端到端税务票据文本检测与识别方法
CN107423735B (zh) 一种利用水平梯度和饱和度的车牌定位方法
CN107195069A (zh) 一种人民币冠字号自动识别方法
CN106446925A (zh) 一种基于图像处理的海豚身份识别的方法
CN109086772A (zh) 一种扭曲粘连字符图片验证码的识别方法及系统
Zhang et al. A combined algorithm for video text extraction
Bijalwan et al. Automatic text recognition in natural scene and its translation into user defined language
Liu et al. A novel multi-oriented chinese text extraction approach from videos
Kobchaisawat et al. Thai text localization in natural scene images using convolutional neural network
JP2011248702A (ja) 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体
CN112686265A (zh) 一种基于层级轮廓提取的象形文字分割方法
CN105354570A (zh) 一种车牌左右边界精确定位的方法及系统
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
CN105447457A (zh) 一种基于自适应特征的车牌字符识别方法
CN110516674A (zh) 一种文本图像的手写汉字分割方法及系统
US20100272359A1 (en) Method for resolving contradicting output data from an optical character recognition (ocr) system, wherein the output data comprises more than one recognition alternative for an image of a character

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant