CN106875546A - 一种增值税发票的识别方法 - Google Patents
一种增值税发票的识别方法 Download PDFInfo
- Publication number
- CN106875546A CN106875546A CN201710073714.9A CN201710073714A CN106875546A CN 106875546 A CN106875546 A CN 106875546A CN 201710073714 A CN201710073714 A CN 201710073714A CN 106875546 A CN106875546 A CN 106875546A
- Authority
- CN
- China
- Prior art keywords
- character
- invoice
- zero
- image
- pixel value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
- G07D7/2016—Testing patterns thereon using feature extraction, e.g. segmentation, edge detection or Hough-transformation
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
- G07D7/2008—Testing patterns thereon using pre-processing, e.g. de-blurring, averaging, normalisation or rotation
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
Abstract
本发明提供一种增值税发票的识别方法,其特征在于,包括如下步骤:对输入的发票图像进行预处理;对发票图像进行选项区域定位;字符分割;字符区域分为9块;提取每个图像块的HOG特征,得到9个一维的HOG特征序列;特征序列分别与模板做比对,得到差异系数;根据差异系数的大小,为这9块赋予不同权重,生成权重矩阵;将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;对每个切分后的字符重复上述步骤直至完成发票各项内容的识别。本发明有效地实现对增值税发票中的汉字模块识别,同时对形近字区分能力增强,具有光照不变性和旋转不变性,抗干扰能力更强,对模糊字符有着较好的识别能力。
Description
技术领域
本发明涉及一种增值税发票的识别方法,特别是针对形近字有着较高的辨别能力。
背景技术
现有技术中,对于增值税发票识别,通常采用如下方式:通过表格模板定制,设置识别区域,识别属性,调用专用的字符,进行选项区域识别,根据识别属性进行识别后处理,最后输出结构化的识别结果;或者在使用清华TH-OCR技术的基础上,对发票进行多项预处理操作,具体有纠偏、偏色校正、滤色、降噪、二值化、增强识别单元对比度等功能,这些功能可灵活配置、自由组合,为之后识别输出最优的图像质量。
目前,对于增值税发票识别存在以下问题:
1、目前增值税发票识别中通常只识别数字,缺少对增值税发票中汉字的识别模块;
2、对于形近字的区分能力相对较弱,容易出现误识的情况;
3、增值税发票纸质为复写纸,打印时字符笔画容易粘连,造成识别困难。
发明内容
根据上述提出的技术问题,而提供一种增值税发票的识别方法。本发明主要利用通过对输入图像的预处理、票据选项定位、字符分割、字符区域分块、提取HOG特征、对比识别、块权重分配到输出核对,对增值税发票进行识别,从而有效的实现对增值税发票中的汉字模块识别,同时对形近字区分能力增强。
本发明采用的技术手段如下:
一种增值税发票的识别方法,其特征在于,包括如下步骤:
S1、对输入的发票图像进行预处理:提取原始彩色发票图像的r分量,作为灰度图像,对灰度图像进行中值滤波操作,减少噪点,对灰度图像进行Radon变换,进行倾斜校正;
S2、对发票图像进行选项区域定位:寻找标记点,进行选项区域定位,截取各选项区域,分别二值化处理得到黑底白字图像;
S3、字符分割:将各选项区域的字符通过投影法分割开来,得到单个字符的最小外接矩形,便于后续的识别处理;
S4、字符区域分块:将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块;
S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列;
S6、将步骤S5中的特征序列分别与模板做比对,比对公式如下:
其中,An为待识别字符块的HOG特征序列,为An的均值;Bn为模板字符块HOG特征序列,为Bn的均值;r为待识别字符块与模板字符块的相关系数,当-1≤r<0时,An与Bn为负相关;当0<r≤1时,An与Bn为正相关;当r=0时,An与Bn不相关;其差异系数d用1-r来表示;
S7、将候选字符中的9个块,进行加权求和,根据差异系数d的取值范围,为其赋予不同权重,生成权重矩阵,其权重分配方式如下:
S8、将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;
S9、对每个切分后的字符重复上述步骤S4至S8,直至完成发票各项内容的识别。
进一步地,所述步骤S2中,具体包括:
S21、寻找标记点,将发票矩形框的四个顶点定位,取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影;投影值第一个和最后一个向下尖峰处,即为矩形顶点位置,从而确定矩形框的位置;
S22、进行选项区域定位,发票各选项区域位置是固定的,根据矩形框位置,与发票各选项区域的相对位置关系,将各区域坐标计算出来;
S23、用S22中计算出的坐标,在步骤S1处理完的灰度图像上,截取各选项区域,并分别二值化处理,得到黑底白字的二值图像。
进一步地,所述步骤S3中,字符通过投影法分割具体为,分别获取各字符的左右边界,进行垂直分割;再将分割出的每个块,进行水平投影,去除零点,即字符上方和下方多余部分;保留非零点,即字符。
进一步地,根据不同区域内容不同,具体的切分方式也相应不同:
①只有一行字的情况:
先垂直投影,再从左向右水平扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为字符左边界,遍历所有点,得到所有字符的左边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为字符右边界,遍历所有点,得到所有字符右边界,使用这些边界信息,进行垂直分割;
②有多行文字的情况:
首先进行水平分割,将多行字分割成多个单行字,这样后面的步骤同①一样,水平分割做法:先水平投影,再从上往下扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为行的上边界,遍历所有点,得到所有行的上边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为行的边界,遍历所有点,得到所有行的下边界,使用这些边界信息,将图像分割为单行字,再重复步骤①,将单行字分割成单个字符。
进一步地,所述步骤S6中,其比对过程为:
S61、读取一个待识别字符,从左至右,从上之下,从第1块开始进行模板匹配,然后依次对第2、3、4块,直至第9块进行匹配;
S62、当前模板9块匹配结束,读取下一个模板,重复步骤S61,直至所有模板相似度计算完毕;
S63、设定相似度阈值T,统计每个模板字符的9块相似度,若相似度小于该阈值的块数大于等于6,则该模板字符必定不是正确结果,不进行操作;若小于6块,则将该模板存入候选字符。
本发明具有以下优点:
1、本发明不仅对增值税发票中的数字部分进行识别,如买方税号、售方税号等,还对发票中的汉字进行了识别,如买方名称、售方名称等;
2、本发明考虑到汉字的结构特点,将字符划分为9宫格,并提出“差异越大,权重越大”的加权求和思想,对形近字有良好的区分度;
3、本发明具有光照不变性和旋转不变性,抗干扰能力更强,对模糊字符有着较好的识别能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明识别方法的流程框图。
图2为本发明对发票图像进行处理示意图,其中,a为倾斜图像,b为倾斜校正后的图像。
图3为本发明票据选项定位时寻找标记点的示意图。
图4为本发明字符区域分块后得到的图像块示意图。
图5为图3寻找标记点后分别进行水平投影和垂直投影的图像。
图6为本发明字符比对与识别过程流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种增值税发票的识别方法,包括如下步骤:
S1、对输入的发票图像进行预处理,其包括以下步骤:提取原始彩色发票图像的r分量,作为灰度图像;灰度图像进行中值滤波操作,减少噪点;对灰度图像进行Radon变换,进行倾斜校正,其结果如图2所示。
S2、对发票图像进行选项区域定位。其包括以下步骤:
S21、寻找标记点,如图3所示,将发票矩形框的四个顶点定位,具体做法是:取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影。如图5所示,投影值第一个和最后一个向下尖峰处,即为矩形顶点位置。这样便可确定矩形框的位置;
S22、进行选项区域定位,发票各选项区域位置是固定的,根据矩形框位置,与发票各选项区域的相对位置关系,将各区域坐标计算出来;
S23、用这些坐标,在步骤S1处理完的灰度图像上,截取各选项区域,并分别二值化处理,得到黑底白字的二值图像。
S3、字符分割:将各选项区域的字符分割开来,得到单个字符的最小外接矩形,方便后续的识别处理。核心思想是投影法,分别获取各字符的左右边界,进行垂直分割;再将分割出的每个块,进行水平投影,去除零点,即字符上方和下方多余部分;保留非零点,即字符。根据不同区域内容不同,具体的切分方式也相应不同:
①只有一行字:
先垂直投影,再从左向右水平扫描。若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为字符左边界,遍历所有点,得到所有字符的左边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为字符右边界,遍历所有点,得到所有字符右边界。使用这些边界信息,进行垂直分割;
②有多行文字:
首先进行水平分割,将多行字分割成多个单行字,这样后面的步骤同①一样。水平分割做法:先水平投影,再从上往下扫描。若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为行的上边界,遍历所有点,得到所有行的上边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为行的边界,遍历所有点,得到所有行的下边界。使用这些边界信息,将图像分割为单行字,再重复步骤①,将单行字分割成单个字符。
S4、字符区域分块(尺寸规范化):将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块。如图4所示。
S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列。
S6、将这些序列分别与模板做比对,比对公式如下:
其中,An为待识别字符块的HOG特征序列,为An的均值;Bn为模板字符块HOG特征序列,为Bn的均值。r为待识别字符块与模板字符块的相关系数,当-1≤r<0时,An与Bn为负相关;当0<r≤1时,An与Bn为正相关;当r=0时,An与Bn不相关。那么,其差异系数d可用1-r来表示。
如图6所示,其比对过程为:
S61、读取一个待识别字符,从左至右,从上之下,从第1块开始进行模板匹配,然后依次对第2、3、4块,直至第9块进行匹配;
S62、当前模板9块匹配结束,读取下一个模板,重复步骤S61,直至所有模板相似度计算完毕;
S63、设定相似度阈值T,统计每个模板字符的9块相似度,若相似度小于该阈值的块数大于等于6,则该模板字符必定不是正确结果,不进行操作;若小于6块,则将该模板存入候选字符。
S7、将候选字符中的9个块,进行加权求和,根据差异系数d的取值范围,为其赋予不同权重,生成权重矩阵。其权重分配方式如下:
S8、将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符即为匹配结果。
S9、对每个切分后的字符重复上述步骤S4至S8,即完成发票各项内容的识别。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (5)
1.一种增值税发票的识别方法,其特征在于,包括如下步骤:
S1、对输入的发票图像进行预处理:提取原始彩色发票图像的r分量,作为灰度图像,对灰度图像进行中值滤波操作,减少噪点,对灰度图像进行Radon变换,进行倾斜校正;
S2、对发票图像进行选项区域定位:寻找标记点,进行选项区域定位,截取各选项区域,分别二值化处理得到黑底白字图像;
S3、字符分割:将各选项区域的字符通过投影法分割开来,得到单个字符的最小外接矩形,便于后续的识别处理;
S4、字符区域分块:将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块;
S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列;
S6、将步骤S5中的特征序列分别与模板做比对,比对公式如下:
其中,An为待识别字符块的HOG特征序列,为An的均值;Bn为模板字符块HOG特征序列,为Bn的均值;r为待识别字符块与模板字符块的相关系数,当-1≤r<0时,An与Bn为负相关;当0<r≤1时,An与Bn为正相关;当r=0时,An与Bn不相关;其差异系数d用1-r来表示;
S7、将候选字符中的9个块,进行加权求和,根据差异系数d的取值范围,为其赋予不同权重,生成权重矩阵,其权重分配方式如下:
S8、将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;
S9、对每个切分后的字符重复上述步骤S4至S8,直至完成发票各项内容的识别。
2.根据权利要求1所述的增值税发票的识别方法,其特征在于,所述步骤S2中,具体包括:
S21、寻找标记点,将发票矩形框的四个顶点定位,取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影;投影值第一个和最后一个向下尖峰处,即为矩形顶点位置,从而确定矩形框的位置;
S22、进行选项区域定位,发票各选项区域位置是固定的,根据矩形框位置,与发票各选项区域的相对位置关系,将各区域坐标计算出来;
S23、用S22中计算出的坐标,在步骤S1处理完的灰度图像上,截取各选项区域,并分别二值化处理,得到黑底白字的二值图像。
3.根据权利要求1所述的增值税发票的识别方法,其特征在于,所述步骤S3中,字符通过投影法分割具体为,分别获取各字符的左右边界,进行垂直分割;再将分割出的每个块,进行水平投影,去除零点,即字符上方和下方多余部分;保留非零点,即字符。
4.根据权利要求3所述的增值税发票的识别方法,其特征在于,根据不同区域内容不同,具体的切分方式也相应不同:
①只有一行字的情况:
先垂直投影,再从左向右水平扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为字符左边界,遍历所有点,得到所有字符的左边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为字符右边界,遍历所有点,得到所有字符右边界,使用这些边界信息,进行垂直分割;
②有多行文字的情况:
首先进行水平分割,将多行字分割成多个单行字,这样后面的步骤同①一样,水平分割做法:先水平投影,再从上往下扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为行的上边界,遍历所有点,得到所有行的上边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为行的边界,遍历所有点,得到所有行的下边界,使用这些边界信息,将图像分割为单行字,再重复步骤①,将单行字分割成单个字符。
5.根据权利要求1所述的增值税发票的识别方法,其特征在于,所述步骤S6中,其比对过程为:
S61、读取一个待识别字符,从左至右,从上之下,从第1块开始进行模板匹配,然后依次对第2、3、4块,直至第9块进行匹配;
S62、当前模板9块匹配结束,读取下一个模板,重复步骤S61,直至所有模板相似度计算完毕;
S63、设定相似度阈值T,统计每个模板字符的9块相似度,若相似度小于该阈值的块数大于等于6,则该模板字符必定不是正确结果,不进行操作;若小于6块,则将该模板存入候选字符。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710073714.9A CN106875546B (zh) | 2017-02-10 | 2017-02-10 | 一种增值税发票的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710073714.9A CN106875546B (zh) | 2017-02-10 | 2017-02-10 | 一种增值税发票的识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106875546A true CN106875546A (zh) | 2017-06-20 |
CN106875546B CN106875546B (zh) | 2019-02-05 |
Family
ID=59166505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710073714.9A Active CN106875546B (zh) | 2017-02-10 | 2017-02-10 | 一种增值税发票的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106875546B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358232A (zh) * | 2017-06-28 | 2017-11-17 | 中山大学新华学院 | 基于插件的发票识别方法、及识别与管理系统 |
CN107832757A (zh) * | 2017-11-03 | 2018-03-23 | 深圳航天信息有限公司 | 一种发票图像的识别方法 |
CN108171863A (zh) * | 2017-12-28 | 2018-06-15 | 国网山东省电力公司蒙阴县供电公司 | 增值税发票的检验方法及装置 |
CN108549843A (zh) * | 2018-03-22 | 2018-09-18 | 南京邮电大学 | 一种基于图像处理的增值税发票识别方法 |
CN109145879A (zh) * | 2018-09-30 | 2019-01-04 | 金蝶软件(中国)有限公司 | 一种打印字体识别的方法、设备及存储介质 |
CN109543770A (zh) * | 2018-11-30 | 2019-03-29 | 合肥泰禾光电科技股份有限公司 | 点阵字符识别方法及装置 |
CN109858980A (zh) * | 2019-01-10 | 2019-06-07 | 上海启业信息技术有限公司 | 基于开源ocr上的高速扫描增值税发票勾选认证系统及方法 |
CN110276881A (zh) * | 2019-05-10 | 2019-09-24 | 广东工业大学 | 一种基于卷积循环神经网络的纸币序列号识别方法 |
CN110533003A (zh) * | 2019-09-06 | 2019-12-03 | 兰州大学 | 一种穿线法车牌数字识别算法及设备 |
CN110634222A (zh) * | 2019-08-27 | 2019-12-31 | 河海大学 | 一种银行票据信息识别方法 |
CN110738119A (zh) * | 2019-09-16 | 2020-01-31 | 深圳市国信合成科技有限公司 | 一种票据识别方法、装置、设备及可读介质 |
CN110751136A (zh) * | 2019-11-04 | 2020-02-04 | 北京亿信华辰软件有限责任公司武汉分公司 | 一种增值税发票信息的提取方法 |
CN110895690A (zh) * | 2019-10-11 | 2020-03-20 | 南京邮电大学 | 一种基于openCV形态学的发票定位方法 |
CN110991974A (zh) * | 2019-12-20 | 2020-04-10 | 贵州黔岸科技有限公司 | 基于gps的运输成本智能核算系统及方法 |
CN111046874A (zh) * | 2019-12-12 | 2020-04-21 | 北京小白世纪网络科技有限公司 | 一种基于模板匹配的单号识别方法 |
CN112241739A (zh) * | 2020-12-17 | 2021-01-19 | 北京沃东天骏信息技术有限公司 | 识别文本错误的方法、装置、设备和计算机可读介质 |
CN112528895A (zh) * | 2020-12-17 | 2021-03-19 | 恒银金融科技股份有限公司 | 一种金融票据图像票号处变造检测的计算方法 |
CN113255641A (zh) * | 2020-12-31 | 2021-08-13 | 深圳怡化电脑股份有限公司 | 一种图像识别的方法及装置、电子设备、存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070078509A (ko) * | 2006-01-27 | 2007-08-01 | 노틸러스효성 주식회사 | 지로 장표 수납기의 문자인식방법 |
CN102800148A (zh) * | 2012-07-10 | 2012-11-28 | 中山大学 | 一种人民币序列号识别方法 |
CN103268363A (zh) * | 2013-06-06 | 2013-08-28 | 哈尔滨工业大学 | 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法 |
CN103310211A (zh) * | 2013-04-26 | 2013-09-18 | 四川大学 | 一种基于图像处理的填注标记识别方法 |
CN103761799A (zh) * | 2014-01-13 | 2014-04-30 | 王波 | 一种基于纹理图像特征的票据防伪方法和装置 |
CN104298989A (zh) * | 2014-08-20 | 2015-01-21 | 深圳大学 | 基于斑马线红外图像特征的鉴伪方法及其系统 |
CN105354566A (zh) * | 2015-10-26 | 2016-02-24 | 江苏国光信息产业股份有限公司 | 用于冠字号识别的字符污染去除方法 |
CN105654094A (zh) * | 2015-11-25 | 2016-06-08 | 小米科技有限责任公司 | 特征提取方法及装置 |
-
2017
- 2017-02-10 CN CN201710073714.9A patent/CN106875546B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070078509A (ko) * | 2006-01-27 | 2007-08-01 | 노틸러스효성 주식회사 | 지로 장표 수납기의 문자인식방법 |
CN102800148A (zh) * | 2012-07-10 | 2012-11-28 | 中山大学 | 一种人民币序列号识别方法 |
CN103310211A (zh) * | 2013-04-26 | 2013-09-18 | 四川大学 | 一种基于图像处理的填注标记识别方法 |
CN103268363A (zh) * | 2013-06-06 | 2013-08-28 | 哈尔滨工业大学 | 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法 |
CN103761799A (zh) * | 2014-01-13 | 2014-04-30 | 王波 | 一种基于纹理图像特征的票据防伪方法和装置 |
CN104298989A (zh) * | 2014-08-20 | 2015-01-21 | 深圳大学 | 基于斑马线红外图像特征的鉴伪方法及其系统 |
CN105354566A (zh) * | 2015-10-26 | 2016-02-24 | 江苏国光信息产业股份有限公司 | 用于冠字号识别的字符污染去除方法 |
CN105654094A (zh) * | 2015-11-25 | 2016-06-08 | 小米科技有限责任公司 | 特征提取方法及装置 |
Non-Patent Citations (1)
Title |
---|
廖玉钦: "增值税发票自动识别算法研究", 《中国优秀硕士学位论文全文数据库-2018年》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358232A (zh) * | 2017-06-28 | 2017-11-17 | 中山大学新华学院 | 基于插件的发票识别方法、及识别与管理系统 |
CN107832757A (zh) * | 2017-11-03 | 2018-03-23 | 深圳航天信息有限公司 | 一种发票图像的识别方法 |
CN108171863A (zh) * | 2017-12-28 | 2018-06-15 | 国网山东省电力公司蒙阴县供电公司 | 增值税发票的检验方法及装置 |
CN108549843A (zh) * | 2018-03-22 | 2018-09-18 | 南京邮电大学 | 一种基于图像处理的增值税发票识别方法 |
CN109145879B (zh) * | 2018-09-30 | 2021-01-12 | 金蝶软件(中国)有限公司 | 一种打印字体识别的方法、设备及存储介质 |
CN109145879A (zh) * | 2018-09-30 | 2019-01-04 | 金蝶软件(中国)有限公司 | 一种打印字体识别的方法、设备及存储介质 |
CN109543770A (zh) * | 2018-11-30 | 2019-03-29 | 合肥泰禾光电科技股份有限公司 | 点阵字符识别方法及装置 |
CN109858980B (zh) * | 2019-01-10 | 2023-04-28 | 上海启业信息技术有限公司 | 基于开源ocr上的高速扫描增值税发票勾选认证系统及方法 |
CN109858980A (zh) * | 2019-01-10 | 2019-06-07 | 上海启业信息技术有限公司 | 基于开源ocr上的高速扫描增值税发票勾选认证系统及方法 |
CN110276881A (zh) * | 2019-05-10 | 2019-09-24 | 广东工业大学 | 一种基于卷积循环神经网络的纸币序列号识别方法 |
CN110634222B (zh) * | 2019-08-27 | 2021-07-09 | 河海大学 | 一种银行票据信息识别方法 |
CN110634222A (zh) * | 2019-08-27 | 2019-12-31 | 河海大学 | 一种银行票据信息识别方法 |
CN110533003A (zh) * | 2019-09-06 | 2019-12-03 | 兰州大学 | 一种穿线法车牌数字识别算法及设备 |
CN110533003B (zh) * | 2019-09-06 | 2022-09-20 | 兰州大学 | 一种穿线法车牌数字识别方法及设备 |
CN110738119A (zh) * | 2019-09-16 | 2020-01-31 | 深圳市国信合成科技有限公司 | 一种票据识别方法、装置、设备及可读介质 |
CN110895690A (zh) * | 2019-10-11 | 2020-03-20 | 南京邮电大学 | 一种基于openCV形态学的发票定位方法 |
CN110751136A (zh) * | 2019-11-04 | 2020-02-04 | 北京亿信华辰软件有限责任公司武汉分公司 | 一种增值税发票信息的提取方法 |
CN111046874A (zh) * | 2019-12-12 | 2020-04-21 | 北京小白世纪网络科技有限公司 | 一种基于模板匹配的单号识别方法 |
CN110991974A (zh) * | 2019-12-20 | 2020-04-10 | 贵州黔岸科技有限公司 | 基于gps的运输成本智能核算系统及方法 |
CN112528895A (zh) * | 2020-12-17 | 2021-03-19 | 恒银金融科技股份有限公司 | 一种金融票据图像票号处变造检测的计算方法 |
CN112241739A (zh) * | 2020-12-17 | 2021-01-19 | 北京沃东天骏信息技术有限公司 | 识别文本错误的方法、装置、设备和计算机可读介质 |
CN112528895B (zh) * | 2020-12-17 | 2023-09-12 | 恒银金融科技股份有限公司 | 一种金融票据图像票号处变造检测的计算方法 |
CN113255641A (zh) * | 2020-12-31 | 2021-08-13 | 深圳怡化电脑股份有限公司 | 一种图像识别的方法及装置、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106875546B (zh) | 2019-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106875546A (zh) | 一种增值税发票的识别方法 | |
CN104751187B (zh) | 抄表图像自动识别方法 | |
Shahab et al. | ICDAR 2011 robust reading competition challenge 2: Reading text in scene images | |
CN101615252B (zh) | 一种自适应图像文本信息提取方法 | |
CN108596166A (zh) | 一种基于卷积神经网络分类的集装箱箱号识别方法 | |
EP1052593A2 (en) | Form search apparatus and method | |
JP5492205B2 (ja) | 印刷媒体ページの記事へのセグメント化 | |
CN104408449B (zh) | 智能移动终端场景文字处理方法 | |
Wakahara et al. | Binarization of color character strings in scene images using k-means clustering and support vector machines | |
CN104751142A (zh) | 一种基于笔划特征的自然场景文本检测算法 | |
CN101777124A (zh) | 一种提取视频文本信息的方法及装置 | |
CN102024144A (zh) | 集装箱箱号自动识别方法 | |
CN104809481A (zh) | 一种基于自适应色彩聚类的自然场景文本检测的方法 | |
CN110969129A (zh) | 一种端到端税务票据文本检测与识别方法 | |
CN103034848A (zh) | 一种表单类型的识别方法 | |
CN110503054A (zh) | 文本图像的处理方法及装置 | |
CN105825216A (zh) | 一种复杂背景图像中的文本定位方法 | |
Ali et al. | An efficient character segmentation algorithm for recognition of Arabic handwritten script | |
Shivakumara et al. | Gradient-angular-features for word-wise video script identification | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 | |
Garlapati et al. | A system for handwritten and printed text classification | |
CN109685061A (zh) | 适用于结构化的数学公式的识别方法 | |
CN106682667A (zh) | 非常见字体的图像文字ocr识别系统 | |
CN107145888A (zh) | 视频字幕实时翻译方法 | |
CN105447477A (zh) | 基于公式库的公式识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |