CN112329773A - 一种增值税发票文字识别系统及其识别方法 - Google Patents

一种增值税发票文字识别系统及其识别方法 Download PDF

Info

Publication number
CN112329773A
CN112329773A CN202011230467.7A CN202011230467A CN112329773A CN 112329773 A CN112329773 A CN 112329773A CN 202011230467 A CN202011230467 A CN 202011230467A CN 112329773 A CN112329773 A CN 112329773A
Authority
CN
China
Prior art keywords
image
character
module
invoice
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011230467.7A
Other languages
English (en)
Other versions
CN112329773B (zh
Inventor
陈吉
谭晓梅
李牧
汤昌健
赵飞扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Shuyixin Credit Management Co ltd
Original Assignee
Chongqing Shuyixin Credit Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Shuyixin Credit Management Co ltd filed Critical Chongqing Shuyixin Credit Management Co ltd
Priority to CN202011230467.7A priority Critical patent/CN112329773B/zh
Publication of CN112329773A publication Critical patent/CN112329773A/zh
Application granted granted Critical
Publication of CN112329773B publication Critical patent/CN112329773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F17/00Coin-freed apparatus for hiring articles; Coin-freed facilities or services
    • G07F17/42Coin-freed apparatus for hiring articles; Coin-freed facilities or services for ticket printing or like apparatus, e.g. apparatus for dispensing of printed paper tickets or payment cards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Multimedia (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明属于文字识别技术领域,具体涉及一种增值税发票文字识别系统,包括图像采集设备、处理主机和计算机,图像采集设备与处理主机之间连接有信号线,处理主机与计算机之间通过数据连接线相连接,图像采集设备包括有基座、支撑杆、连杆和高清摄像头,支撑杆上侧设有直线驱动机构,直线驱动机构对称设有驱动杆,驱动杆前端设有推板,推板设有镜框,镜框设有与高清摄像头相匹配的空槽,空槽装配有蓝色透光板,处理主机设有图像储存模块、智能对比模块、识别模块以及排版输出模块,图像储存模块与智能对比模块电性连接,智能对比模块与识别模块电性连接,识别模块内部设有文字特征识别模块和文字库模块,计算机设有显示模块。

Description

一种增值税发票文字识别系统及其识别方法
技术领域
本发明属于文字识别技术领域,具体涉及一种增值税发票文字识别系统及其识别方法。
背景技术
文字识别技术是一种利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。随着科技的发展与技术的进步,文字识别开始应用在生活和工作的方方面面。
增值税发票指的是一切单位和个人在购销商品、提供或接受服务以及从事其他经营活动中,所开具和收取的业务凭证,是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据,在财务工作中,财务人员通常需要对增值税发票整理和录入管理系统中,传统的方式通常采用人工对发票的内容进行录入,使财务人员的工作量增大,为减轻财务人员的工作量,文字识别技术开始运用在发票识别上,通过相应的文字识别装置对发票的文字进行识别。
然而在发票文字的识别中,通常将发票的红色的票面名目和黑色的机打信息同时进行识别,在输出识别结果时,容易将票面名目内容与机打信息内容混淆,造成识别不清楚。
发明内容
本发明的目的是:旨在提供一种增值税发票文字识别系统及其识别方法,以解决现有的发票文字的识别中,通常将发票的红色的票面名目和黑色的机打信息同时进行识别,在输出识别结果时,容易将票面名目内容与机打信息内容混淆,造成识别不清楚的问题。
为实现上述技术目的,本发明采用的技术方案如下:
一种增值税发票文字识别系统,包括图像采集设备、处理主机和计算机,所述图像采集设备与处理主机之间连接有信号线,所述处理主机与计算机之间通过数据连接线相连接,所述图像采集设备包括有基座、支撑杆、连杆和高清摄像头,所述支撑杆上侧设有直线驱动机构,所述直线驱动机构对称设有驱动杆,所述驱动杆前端设有推板,所述推板设有镜框,所述镜框设有与高清摄像头相匹配的空槽,所述空槽装配有蓝色透光板,所述处理主机设有图像储存模块、智能对比模块、识别模块以及排版输出模块,所述图像储存模块与智能对比模块电性连接,所述智能对比模块与识别模块电性连接,所述识别模块内部设有文字特征识别模块和文字库模块,所述计算机设有显示模块。
进一步限定,所述直线驱动机构为电缸,所述直线驱动机构还设有电源开关和控制器,所述控制器用于自动控制直线驱动机构往返运动以及控制高清摄像头拍照采集发票图像。这样的方式,电缸的精确度高,能够实现高精度直线运动,人们能够通过打开电源开关,通过控制器对电缸和高清摄像头进行控制,简单方便。
进一步限定,所述信号线接口为HDMI接口,所述图像储存模块为只读储存器,用于对高清摄像头拍摄的发票图像进行存储。
进一步限定,所述文字特征识别模块用于识别文字特征,所述文字特征包括有字形结构特征和笔画特征,所述文字库模块中的文字根据文字特征进行分类储存。
一种增值税发票文字识别系统,所述增值税发票文字识别系统包括以下识别方法:
S1.将待识别的发票放置于基座上,按下电源开关,此时,控制器控制直线驱动机构不启动,由高清摄像头对待识别发票进行拍照,得到第一图像,由信号线将第一图像的数据信息传输至图像储存模块中进行存储;
S2.高清摄像头拍摄第一图像后,控制器控制直线驱动机构启动,驱动杆带动推板运动,使镜框往高清摄像头下方运动,直至空槽中的蓝色透光板运动至高清摄像头下方,控制器即可控制直线驱动机构停止工作,再由高清摄像头对待识别发票进行二次拍照,得到第二图像,由信号线将第二图像的数据信息传输至图像储存模块中进行存储,同时,得到第二图像后,控制器控制直线驱动机构启动回到初始位置;
S3.处理主机中的智能对比模块读取图像储存模块中的第一图像和第二图像,将第一图像和第二图像进行对比,划分票面名目识别区域和票面机打信息识别区域;
S4.识别模块分别对票面名目识别区域和票面机打信息识别区域内的文字内容进行识别。
S5.文字内容识别完成后,排版输出模块将票面名目识别区域中的名目文字内容与票面机打信息识别区域中的机打信息内容排版输出至计算机的显示模块即可。
进一步限定,所述步骤S3中包括有以下子步骤:
S301.智能对比模块提取第一图像和第二图像中的发票区域,由于第一图像由高清摄像头直接拍摄得到,因此第一图像中发票的名目显示为红色,发票的机打信息显示为黑色,同理,第二图像由高清摄像头通过蓝色透光板拍摄得到,蓝色透光板能够吸收掉其他颜色的光线而透过蓝光,但是发票的名目为红色会吸收绝大部分的蓝光,因此第二图像中发票的名目和发票的机打信息均显示为黑色,同时第一图像和第二图像为高清摄像头同一空间位置拍摄得到,所以第一图像中的发票区域和第二图像中的发票区域能够充分的重合,
S302.智能对比模块将第一图像和第二图像中的发票区域进行重合后,进行如下判定:
①第一图像的红色像素点集和第二图像的黑色像素点集相重合的部分为票面名目识别区域;
②第一图像的黑色像素点集和第二图像的黑色像素点集相重合的部分为票面机打信息识别区域。
进一步限定,所述步骤S4中包括有以下子步骤:
S401.识别模块提取票面名目识别区域和票面机打信息识别区域,将票面名目识别区域内和票面机打信息识别区域内的文字词语分割为单个的文字,识别模块通过文字特征识别模块对单个的文字进行识别;
S402.单个的文字通过文字特征识别模块提取特征,并与文字库模块中的文字进行对比,其中,文字特征识别模块先进行字形结构特征识别,字形结构特征识别完成后再进行笔画特征识别,具体的识别方式如下:
①当字形特征识别为左右结构时,笔画特征识别由左至右进行识别;
②当字形特征识别为上下结构时,笔画特征识别由上至下进行识别;
③当字形特征识别为包围结构时,笔画特征识别由外到内进行识别;
④当字形特征识别为其他结构时,笔画特征识别由左至右进行识别;
S403.文字特征识别模块每识别单个的文字的一个笔画特征,文字库模块中即可根据识别的笔画特征从中提取满足已识别的笔画特征的文字,随着单个的文字的笔画特征识别越多,与之相匹配的文字越少,直至文字库模块中相匹配的文字只有一个或者单个的文字的笔画特征全部识别得到相匹配的一个文字后即停止识别,输出文字内容。
本发明相比现有技术具有以下优点:
通过高清摄像头分别在自然光和蓝光的情况下对发票进行拍摄,能够得到两张不同显色的票面图像,通过智能对比模块读取图像储存模块中的图片进行对比,将自然光下红色区域与蓝光情况下的黑色区域的重合内容划分为票面名目识别区域,将自然光下黑色区域与蓝光情况下的黑色区域的重合内容划分为票面机打信息识别区域,再通过识别模块分开对票面名目识别区域和票面机打信息识别区域进行识别,从而避免识别过程中将票面名目和机打信息所混淆,最后再由排版输出模块输出识别结果,使票据的文字识别不会发生混淆,票面名目和机打信息能够准确的区分。
附图说明
本发明可以通过附图给出的非限定性实施例进一步说明;
图1为本发明一种增值税发票文字识别系统及其识别方法实施例的系统连接结构示意图;
图2为本发明一种增值税发票文字识别系统及其识别方法实施例的图像采集设备和处理主机结构示意图;
图3为本发明一种增值税发票文字识别系统及其识别方法实施例的处理主机连接结构示意图;
图4为本发明一种增值税发票文字识别系统及其识别方法实施例的识别流程示意图;
图5为本发明一种增值税发票文字识别系统及其识别方法实施例的识别模块识别文字的流程示意图;
图6为本发明一种增值税发票文字识别系统及其识别方法实施例的识别模块识别文字特征的流程示意图;
图7为本发明一种增值税发票文字识别系统及其识别方法实施例的智能对比模块判定示意图;
主要元件符号说明如下:
图像采集设备1、处理主机2、信号线11、基座12、支撑杆13、直线驱动机构131、驱动杆132、电源开关133、控制器134、连杆14、高清摄像头15、推板16、镜框161、空槽162、蓝色透光板163。
具体实施方式
为了使本领域的技术人员可以更好地理解本发明,下面结合附图和实施例对本发明技术方案进一步说明。
如图1-图7所示,本发明的一种增值税发票文字识别系统,包括图像采集设备1、处理主机2和计算机,图像采集设备1与处理主机2之间连接有信号线11,处理主机2与计算机之间通过数据连接线相连接,图像采集设备1包括有基座12、支撑杆13、连杆14和高清摄像头15,支撑杆13上侧设有直线驱动机构131,直线驱动机构131对称设有驱动杆132,驱动杆132前端设有推板16,推板16设有镜框161,镜框161设有与高清摄像头15相匹配的空槽162,空槽162装配有蓝色透光板163,处理主机2设有图像储存模块、智能对比模块、识别模块以及排版输出模块,图像储存模块与智能对比模块电性连接,智能对比模块与识别模块电性连接,识别模块内部设有文字特征识别模块和文字库模块,计算机设有显示模块。
具体的,直线驱动机构131为电缸,直线驱动机构131还设有电源开关133和控制器134,控制器134用于自动控制直线驱动机构131往返运动以及控制高清摄像头15拍照采集发票图像。这样的方式,电缸的精确度高,能够实现高精度直线运动,人们能够通过打开电源开关133,通过控制器134对电缸和高清摄像头15进行控制,简单方便。
具体的,信号线11接口为HDMI接口,图像储存模块为只读储存器,用于对高清摄像头15拍摄的发票图像进行存储。
具体的,文字特征识别模块用于识别文字特征,文字特征包括有字形结构特征和笔画特征,文字库模块中的文字根据文字特征进行分类储存。
一种增值税发票文字识别系统,增值税发票文字识别系统包括以下识别方法:
S1.将待识别的发票放置于基座12上,按下电源开关133,此时,控制器134控制直线驱动机构131不启动,由高清摄像头15对待识别发票进行拍照,得到第一图像,由信号线11将第一图像的数据信息传输至图像储存模块中进行存储;
S2.高清摄像头15拍摄第一图像后,控制器134经过0.5s-1s的延迟,控制直线驱动机构131启动,驱动杆132带动推板16运动,使镜框161往高清摄像头15下方运动,直至空槽162中的蓝色透光板163运动至高清摄像头15下方,控制器134即可控制直线驱动机构131停止工作,再由高清摄像头15对待识别发票进行二次拍照,得到第二图像,由信号线11将第二图像的数据信息传输至图像储存模块中进行存储,同时,得到第二图像后,控制器134控制直线驱动机构131启动回到初始位置;
S3.处理主机2中的智能对比模块读取图像储存模块中的第一图像和第二图像,将第一图像和第二图像进行对比,划分票面名目识别区域和票面机打信息识别区域;
具体的流程如下:
S301.智能对比模块提取第一图像和第二图像中的发票区域,由于第一图像由高清摄像头15直接拍摄得到,因此第一图像中发票的名目显示为红色,发票的机打信息显示为黑色,同理,第二图像由高清摄像头15通过蓝色透光板163拍摄得到,蓝色透光板163能够吸收掉其他颜色的光线而透过蓝光,但是发票的名目为红色会吸收绝大部分的蓝光,因此第二图像中发票的名目和发票的机打信息均显示为黑色,同时第一图像和第二图像为高清摄像头15同一空间位置拍摄得到,所以第一图像中的发票区域和第二图像中的发票区域能够充分的重合,
S302.智能对比模块将第一图像和第二图像中的发票区域进行重合后,进行如下判定:
①第一图像的红色像素点集和第二图像的黑色像素点集相重合的部分为票面名目识别区域;
②第一图像的黑色像素点集和第二图像的黑色像素点集相重合的部分为票面机打信息识别区域。
S4.识别模块分别对票面名目识别区域和票面机打信息识别区域内的文字内容进行识别。
具体的流程如下:
S401.识别模块提取票面名目识别区域和票面机打信息识别区域,将票面名目识别区域内和票面机打信息识别区域内的文字词语分割为单个的文字,识别模块通过文字特征识别模块对单个的文字进行识别;
S402.单个的文字通过文字特征识别模块提取特征,并与文字库模块中的文字进行对比,其中,文字特征识别模块先进行字形结构特征识别,字形结构特征识别完成后再进行笔画特征识别,具体的识别方式如下:
①当字形特征识别为左右结构时,笔画特征识别由左至右进行识别;
②当字形特征识别为上下结构时,笔画特征识别由上至下进行识别;
③当字形特征识别为包围结构时,笔画特征识别由外到内进行识别;
④当字形特征识别为其他结构时,笔画特征识别由左至右进行识别;
S403.文字特征识别模块每识别单个的文字的一个笔画特征,文字库模块中即可根据识别的笔画特征从中提取满足已识别的笔画特征的文字,随着单个的文字的笔画特征识别越多,与之相匹配的文字越少,直至文字库模块中相匹配的文字只有一个或者单个的文字的笔画特征全部识别得到相匹配的一个文字后即停止识别,输出文字内容。
S5.文字内容识别完成后,排版输出模块将票面名目识别区域中的名目文字内容与票面机打信息识别区域中的机打信息内容进行匹配,排版输出至计算机的显示模块即可。
采用上述的技术方案,高清摄像头15第一次拍摄发票时,控制器134控制直线驱动机构131不启动,在自然光线下进行拍摄,票面名目颜色为红色,机打信息颜色为黑色,高清摄像头15第二次拍摄发票时,控制器134控制直线驱动机构131启动,使驱动杆132带动推板16运动,使镜框161往高清摄像头15下方运动,直至空槽162中的蓝色透光板163运动至高清摄像头15下方,在蓝色透光板163的作用下,能够吸收其他的色彩光线,使高清摄像头15在蓝色的光线下进行拍摄,此时,票面名目不会显红而显示黑色,机打信息颜色同样显示为黑色,两次拍摄的图像能够保存于图像储存模块中,智能对比模块读取图像储存模块中的图片进行对比,划分识别区域,通过识别模块分开进行识别,避免识别过程中将票面名目和机打信息所混淆,最后再由排版输出模块输出识别结果,使票据的文字识别不会发生混淆,票面名目和机打信息能够准确的区分。
上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (7)

1.一种增值税发票文字识别系统,包括图像采集设备(1)、处理主机(2)和计算机,所述图像采集设备(1)与处理主机(2)之间连接有信号线(11),所述处理主机(2)与计算机之间通过数据连接线相连接,其特征在于:所述图像采集设备(1)包括有基座(12)、支撑杆(13)、连杆(14)和高清摄像头(15),所述支撑杆(13)上侧设有直线驱动机构(131),所述直线驱动机构(131)对称设有驱动杆(132),所述驱动杆(132)前端设有推板(16),所述推板(16)设有镜框(161),所述镜框(161)设有与高清摄像头(15)相匹配的空槽(162),所述空槽(162)装配有蓝色透光板(163),所述处理主机(2)设有图像储存模块、智能对比模块、识别模块以及排版输出模块,所述图像储存模块与智能对比模块电性连接,所述智能对比模块与识别模块电性连接,所述识别模块内部设有文字特征识别模块和文字库模块,所述计算机设有显示模块。
2.根据权利要求1所述的一种增值税发票文字识别系统,其特征在于:所述直线驱动机构(131)为电缸,所述直线驱动机构(131)还设有电源开关(133)和控制器(134),所述控制器(134)用于自动控制直线驱动机构(131)往返运动以及控制高清摄像头(15)拍照采集发票图像。
3.根据权利要求1所述的一种增值税发票文字识别系统,其特征在于:所述信号线(11)接口为HDMI接口,所述图像储存模块为只读储存器,用于对高清摄像头(15)拍摄的发票图像进行存储。
4.根据权利要求1所述的一种增值税发票文字识别系统,其特征在于:所述文字特征识别模块用于识别文字特征,所述文字特征包括有字形结构特征和笔画特征,所述文字库模块中的文字根据文字特征进行分类储存。
5.根据权利要求1-4任意一项所述的一种增值税发票文字识别系统,其特征在于:所述增值税发票文字识别系统包括以下识别方法:
S1.将待识别的发票放置于基座(12)上,按下电源开关(133),此时,控制器(134)控制直线驱动机构(131)不启动,由高清摄像头(15)对待识别发票进行拍照,得到第一图像,由信号线(11)将第一图像的数据信息传输至图像储存模块中进行存储;
S2.高清摄像头(15)拍摄第一图像后,控制器(134)控制直线驱动机构(131)启动,驱动杆(132)带动推板(16)运动,使镜框(161)往高清摄像头(15)下方运动,直至空槽(162)中的蓝色透光板(163)运动至高清摄像头(15)下方,控制器(134)即可控制直线驱动机构(131)停止工作,再由高清摄像头(15)对待识别发票进行二次拍照,得到第二图像,由信号线(11)将第二图像的数据信息传输至图像储存模块中进行存储,同时,得到第二图像后,控制器(134)控制直线驱动机构(131)启动回到初始位置;
S3.处理主机(2)中的智能对比模块读取图像储存模块中的第一图像和第二图像,将第一图像和第二图像进行对比,划分票面名目识别区域和票面机打信息识别区域;
S4.识别模块分别对票面名目识别区域和票面机打信息识别区域内的文字内容进行识别。
S5.文字内容识别完成后,排版输出模块将票面名目识别区域中的名目文字内容与票面机打信息识别区域中的机打信息内容排版输出至计算机的显示模块即可。
6.根据权利要求4任意一项所述的一种增值税发票文字识别系统的识别方法,其特征在于:所述步骤S3中包括有以下子步骤:
S301.智能对比模块提取第一图像和第二图像中的发票区域,由于第一图像由高清摄像头(15)直接拍摄得到,因此第一图像中发票的名目显示为红色,发票的机打信息显示为黑色,同理,第二图像由高清摄像头(15)通过蓝色透光板(163)拍摄得到,蓝色透光板(163)能够吸收掉其他颜色的光线而透过蓝光,但是发票的名目为红色会吸收绝大部分的蓝光,因此第二图像中发票的名目和发票的机打信息均显示为黑色,同时第一图像和第二图像为高清摄像头(15)同一空间位置拍摄得到,所以第一图像中的发票区域和第二图像中的发票区域能够充分的重合,
S302.智能对比模块将第一图像和第二图像中的发票区域进行重合后,进行如下判定:
①第一图像的红色像素点集和第二图像的黑色像素点集相重合的部分为票面名目识别区域;
②第一图像的黑色像素点集和第二图像的黑色像素点集相重合的部分为票面机打信息识别区域。
7.根据权利要求4任意一项所述的一种增值税发票文字识别系统的识别方法,其特征在于:所述步骤S4中包括有以下子步骤:
S401.识别模块提取票面名目识别区域和票面机打信息识别区域,将票面名目识别区域内和票面机打信息识别区域内的文字词语分割为单个的文字,识别模块通过文字特征识别模块对单个的文字进行识别;
S402.单个的文字通过文字特征识别模块提取特征,并与文字库模块中的文字进行对比,其中,文字特征识别模块先进行字形结构特征识别,字形结构特征识别完成后再进行笔画特征识别,具体的识别方式如下:
①当字形特征识别为左右结构时,笔画特征识别由左至右进行识别;
②当字形特征识别为上下结构时,笔画特征识别由上至下进行识别;
③当字形特征识别为包围结构时,笔画特征识别由外到内进行识别;
④当字形特征识别为其他结构时,笔画特征识别由左至右进行识别;
S403.文字特征识别模块每识别单个的文字的一个笔画特征,文字库模块中即可根据识别的笔画特征从中提取满足已识别的笔画特征的文字,随着单个的文字的笔画特征识别越多,与之相匹配的文字越少,直至文字库模块中相匹配的文字只有一个或者单个的文字的笔画特征全部识别得到相匹配的一个文字后即停止识别,输出文字内容。
CN202011230467.7A 2020-11-06 2020-11-06 一种增值税发票文字识别系统及其识别方法 Active CN112329773B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011230467.7A CN112329773B (zh) 2020-11-06 2020-11-06 一种增值税发票文字识别系统及其识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011230467.7A CN112329773B (zh) 2020-11-06 2020-11-06 一种增值税发票文字识别系统及其识别方法

Publications (2)

Publication Number Publication Date
CN112329773A true CN112329773A (zh) 2021-02-05
CN112329773B CN112329773B (zh) 2024-03-08

Family

ID=74316338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011230467.7A Active CN112329773B (zh) 2020-11-06 2020-11-06 一种增值税发票文字识别系统及其识别方法

Country Status (1)

Country Link
CN (1) CN112329773B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554033A (zh) * 2021-09-18 2021-10-26 深圳市一号互联科技有限公司 智能文本机器人的文本识别方法、装置及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020067850A (ko) * 2001-02-19 2002-08-24 주식회사 한국인식기술 문서인식시스템 및 그 방법
CN202694374U (zh) * 2012-05-15 2013-01-23 深圳长城开发科技股份有限公司 一种用于发票识别的便携式装置
JP2013020302A (ja) * 2011-07-07 2013-01-31 Takanao Handa 帳票認識システム
CN104573951A (zh) * 2014-12-31 2015-04-29 国家电网公司 电力票据智能编译引擎及其使用方法
CN108549843A (zh) * 2018-03-22 2018-09-18 南京邮电大学 一种基于图像处理的增值税发票识别方法
CN110348441A (zh) * 2019-07-10 2019-10-18 深圳市华云中盛科技有限公司 增值税发票识别方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020067850A (ko) * 2001-02-19 2002-08-24 주식회사 한국인식기술 문서인식시스템 및 그 방법
JP2013020302A (ja) * 2011-07-07 2013-01-31 Takanao Handa 帳票認識システム
CN202694374U (zh) * 2012-05-15 2013-01-23 深圳长城开发科技股份有限公司 一种用于发票识别的便携式装置
CN104573951A (zh) * 2014-12-31 2015-04-29 国家电网公司 电力票据智能编译引擎及其使用方法
CN108549843A (zh) * 2018-03-22 2018-09-18 南京邮电大学 一种基于图像处理的增值税发票识别方法
CN110348441A (zh) * 2019-07-10 2019-10-18 深圳市华云中盛科技有限公司 增值税发票识别方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李巍: "物资公司增值税发票智能管理系统的设计", 电子技术与软件工程, no. 1, 31 January 2016 (2016-01-31), pages 60 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554033A (zh) * 2021-09-18 2021-10-26 深圳市一号互联科技有限公司 智能文本机器人的文本识别方法、装置及系统
CN113554033B (zh) * 2021-09-18 2021-12-10 深圳市一号互联科技有限公司 智能文本机器人的文本识别方法、装置及系统

Also Published As

Publication number Publication date
CN112329773B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
CN103984930B (zh) 基于视觉的数字仪表识别系统及其识别方法
CN107526987B (zh) 使用移动终端上的成像组件的装置、系统和方法
CN102956132A (zh) 手语翻译系统、手语翻译装置及手语翻译方法
CN202948454U (zh) 一种图形条码识读装置
CN112329773A (zh) 一种增值税发票文字识别系统及其识别方法
CN101738827B (zh) 一种usb数字工业相机
JP2023543640A (ja) 酒ラベル識別方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体
CN109636862A (zh) 图像处理方法、系统、终端、存储介质及书写板装置
CN204143555U (zh) 身份识别自助终端及对应的房产证明打印终端
CN110390254B (zh) 基于人脸的性格分析方法、装置、计算机设备及存储介质
CN205068431U (zh) 一种自动对焦装置
CN206378672U (zh) 一种具备光学变焦和3d成像的相机系统
CN108256406A (zh) 一种通过眼睛定位引导来实现脸部识别的数据处理方法及其装置
GB2613753A (en) Wine product positioning method and apparatus, wine product information management method and apparatus, and device and storage medium
CN217690140U (zh) 一种防伪业务终端
CN207586958U (zh) 扫描笔
CN206610308U (zh) 一种通过眼睛定位引导来实现脸部识别的数据处理装置
CN103327214B (zh) 基于计算机视觉的便携式智能文档影像采集系统及方法
CN108898100A (zh) 一种大面积光学滚动指纹采集方法及装置
CN113642567A (zh) 一种任意切换点读、手写、扫描的智能装置及方法
CN104239841A (zh) 具有取景单元的二维码识读器、识读系统及方法
CN208400245U (zh) 一种图书流通管理系统
CN210515378U (zh) 一种支持多种检票模式的检票柱
CN205883451U (zh) 面向立体监控的海量视频数据智能监测分析平台
CN110910516A (zh) 一种支持多种检票模式的检票柱

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant