CN107790403B - 一种财务票据的分拣系统及财务票据的分拣方法 - Google Patents
一种财务票据的分拣系统及财务票据的分拣方法 Download PDFInfo
- Publication number
- CN107790403B CN107790403B CN201710972494.3A CN201710972494A CN107790403B CN 107790403 B CN107790403 B CN 107790403B CN 201710972494 A CN201710972494 A CN 201710972494A CN 107790403 B CN107790403 B CN 107790403B
- Authority
- CN
- China
- Prior art keywords
- bill
- module
- sorting
- correction
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B07—SEPARATING SOLIDS FROM SOLIDS; SORTING
- B07C—POSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
- B07C5/00—Sorting according to a characteristic or feature of the articles or material being sorted, e.g. by control effected by devices which detect or measure such characteristic or feature; Sorting by manually actuated devices, e.g. switches
- B07C5/34—Sorting according to other particular properties
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Sorting Of Articles (AREA)
Abstract
本发明公开了一种财务票据的分拣系统及财务票据的分拣方法,该财务票据的分拣系统包含票据上传模块、票据预处理模块、票据分拣池、票据分类定义模块、票据模板定义模块、全图纠偏模块、OCR识别模块;其中,所述票据分类定义模块中包含票据分类定义列表,且所述票据分类定义列表包含以下单元:分类字段、满足规则、发票模板、识别属性。本发明的财务票据的分拣系统及财务票据的分拣方法通过匹配单据的采集模板从而直接进入全图纠偏,可通过设定相关模板来判断当前票据是否需要进行OCR识别,并将不需要进行OCR识别的票据直接分流到全图纠偏环节,减少了不必要的处理流程和人工操作上的浪费,同时也提高了OCR识别的准确率。
Description
技术领域
本发明涉及计算机图像识别技术领域,特别涉及一种财务票据的分拣系统及财务票据的分拣方法。
背景技术
OCR技术是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。将OCR识别技术应用于云财务平台系统,可以自动提取票据要素,从而减轻操作员的工作量并减少重复劳动,因此大多数公司的财务系统中均采用了此技术。
但是,财务处理中单据种类繁多,OCR仅对标准、数量较多的几类单据研发了识别,想要全部覆盖需要漫长的过程,且小微企业自制单据、手写单据较多,且不规范,短时间内无法自动识别。
同时,现有的财务票据处理系统中,订单的票据预处理完成后全部票据均需进入OCR识别,因此容易造成大量票据积压在OCR识别中,导致OCR服务器识别速度和效率降低。
发明内容
本发明的目的是克服上述背景技术中不足,提供一种财务票据的分拣系统及财务票据的分拣方法,可通过匹配单据的采集模板从而直接进入全图纠偏,可根据设定来判断当前票据是否需要进行OCR识别,并将不需要进行OCR识别的票据直接分流到全图纠偏环节,减少了不必要的处理流程和人工操作上的浪费,同时也提高了OCR识别的准确率。
为了达到上述的技术效果,本发明采取以下技术方案:
一种财务票据的分拣系统,包含票据上传模块、票据预处理模块、票据分拣池、票据分类定义模块、票据模板定义模块、全图纠偏模块、OCR识别模块;其中,所述票据分类定义模块中包含票据分类定义列表,且所述票据分类定义列表包含以下单元:分类字段、满足规则、发票模板、识别属性;
所述票据上传模块与票据预处理模块相连,票据预处理模块与票据分拣池相连,票据分拣池与票据分类定义模块相连,票据分类定义模块与票据模板定义模块相连,票据模板定义模块分别与全图纠偏模块、OCR识别模块相连,OCR识别模块与全图纠偏模块相连。
同时,本发明还公开了一种财务票据的分拣方法,包含上述的一种财务票据的分拣系统,且具体包含以下步骤:
A.在所述票据分类定义模块中增加票据分类定义字段;
B.在票据模板定义模块中给每个模板配置一个是否识别的识别属性,且识别属性包含识别与不识别两种属性;
C.所述票据上传模块获取上传的票据,并将获取的票据传递至票据预处理模块;
D.所述票据预处理模块对收到的票据进行预处理,并将完成预处理的票据传至票据分拣池;
E.在所述票据分拣池中对进入票据分拣池的票据进行固定字段的纠偏并输出被纠偏后的字段,其中,所述固定字段由多个纠偏分类字段构成,对同一票据的多次纠偏时,每次纠偏仅在前次纠偏基础上增加一个纠偏分类字段;
F.所述票据分类定义模块获取步骤E中输出的被纠偏后的字段,并在票据分类定义列表中匹配该票据目前满足的规则及对应的发票模板;
G.若步骤F中匹配到的发票模板的数量超过1个,则将该票据再次返回票据分拣池进行固定字段的纠偏,直至匹配到的发票模板的数量为1个时将该票据传至票据模板定义模块;
H.票据模板定义模块根据票据分类定义列表中该票据对应的发票模板的识别属性来将该票据传递至全图纠偏模块或OCR识别模块,其中,将识别属性为识别的票据传递至OCR识别模块,将识别属性为不识别的票据传递至全图纠偏模块。
进一步地,所述纠偏分类字段中包含单据名称、代开标识。
本发明与现有技术相比,具有以下的有益效果:
本发明的一种财务票据的分拣系统及财务票据的分拣方法,可通过匹配单据的采集模板从而直接进入全图纠偏,且可根据相关设定来具体判断当前票据是否需要进行OCR识别,并将不需要进行OCR识别的票据直接分流到全图纠偏环节,减少了不必要的处理流程和人工操作上的浪费,同时也提高了OCR识别的准确率。
附图说明
图1是本发明的财务票据的分拣系统的示意图;
图2是本发明的财务票据的分拣方法的示意图。
具体实施方式
下面结合本发明的实施例对本发明作进一步的阐述和说明。
实施例:
实施例1:
如图1所示,一种财务票据的分拣系统,包含票据上传模块、票据预处理模块、票据分拣池、票据分类定义模块、票据模板定义模块、全图纠偏模块、OCR识别模块。其中,所述票据分类定义模块中包含票据分类定义列表,且所述票据分类定义列表具体如下表所示:
所述票据上传模块与票据预处理模块相连,票据预处理模块与票据分拣池相连,票据分拣池与票据分类定义模块相连,票据分类定义模块与票据模板定义模块相连,票据模板定义模块分别与全图纠偏模块、OCR识别模块相连,OCR识别模块与全图纠偏模块相连。
实施例2
如图2所示,一种财务票据的分拣方法,基于实施例1中的一种财务票据的分拣系统,具体包含以下步骤:
A.在所述票据分类定义模块中增加票据分类定义字段;
B.在票据模板定义模块中给每个模板配置一个是否识别的属性;
C.创建一个订单并上传订单票据,所述票据上传模块获取上传的票据,并将获取的票据传递至票据预处理模块;
D.所述票据预处理模块对收到的票据进行切图预处理,并将完成切图预处理的票据传至票据分拣池抢单;
E.在所述票据分拣池中对进入票据分拣池抢单的票据根据票据分类定义模块中的“票据分类定义字段”进行固定字段的纠偏,并输出被纠偏后的字段,其中,所述固定字段由多个纠偏分类字段构成,对同一票据的多次纠偏时,每次纠偏仅在前次纠偏基础上增加一个纠偏分类字段;
F.所述票据分类定义模块获取步骤E中输出的被纠偏后的字段,并在票据分类定义列表中匹配该票据目前满足的规则及对应的发票模板;
G.若步骤F中匹配到的发票模板的数量超过1个,则将该票据再次返回票据分拣池进行固定字段的纠偏,直至匹配到的发票模板的数量为1个时将该票据传至票据模板定义模块;
H.票据模板定义模块根据票据分类定义列表中该票据对应的发票模板的识别属性来将该票据传递至全图纠偏模块或OCR识别模块,其中,将识别属性为是的票据传递至OCR识别模块,将识别属性为否的票据传递至全图纠偏模块。
本实施例中,若票据首次进入票据池抢单时显示的是“票据分类定义字段”模板中的第一个纠偏分类字段“单据名称”,该字段被纠偏为“四川增值税专用发票”并输出,输出提交后,后台程序根据票据分类定义列表在票据分类定义模块中去匹配发票模板,则此时,有“一般增值税专用发票”“代开增值税专用发票”两个发票模板满足。
故因发票模板不唯一,票据将再次被提交到票据分拣池中进行二次纠偏,本次纠偏有则两个纠偏分类字段“单据名称”和“代开标识”,“单据名称”字段被纠偏为“四川增值税专用发票”并输出,
若“代开标识”被纠偏为“代开”并输出,则根据票据分类定义列表可匹配到唯一模板“代开增值税专用发票”,其中,在票据分类定义列表中“代开增值税专用发票”的识别属性是“否”,故该票据直接进入全图纠偏模块,且纠偏模板是“代开增值税专用发票”。
若“代开标识”被纠偏为“空”并输出,则根据票据分类定义列表可匹配到唯一模板“代开交通运输专用发票”,其中,在票据分类定义列表中“代开交通运输专用发票”的识别属性是“是”,故该票据将进入OCR识别模块进行OCR识别。
因此,本发明的财务票据的分拣方法中,可通过在票据分拣池中对票据进行前期识别及分拣,将不需要进行OCR识别的票据直接分流到全图纠偏环节,从而减少OCR识别模块中不必要的识别工作,同时也提高了OCR识别的准确率,可有效提升整体工作效率。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (3)
1.一种财务票据的分拣系统,其特征在于,包含票据上传模块、票据预处理模块、票据分拣池、票据分类定义模块、票据模板定义模块、全图纠偏模块、OCR识别模块;其中,所述票据分类定义模块中包含票据分类定义列表,且所述票据分类定义列表包含以下单元:分类字段、满足规则、发票模板、识别属性;
所述票据上传模块与票据预处理模块相连,票据预处理模块与票据分拣池相连,票据分拣池与票据分类定义模块相连,票据分类定义模块与票据模板定义模块相连,票据模板定义模块分别与全图纠偏模块、OCR识别模块相连,OCR识别模块与全图纠偏模块相连。
2.一种财务票据的分拣方法,其特征在于,包含如权利要求1所述的一种财务票据的分拣系统,且具体包含以下步骤:
A.在所述票据分类定义模块中增加票据分类定义字段;
B.在票据模板定义模块中给每个模板配置一个是否识别的识别属性;
C.所述票据上传模块获取上传的票据,并将获取的票据传递至票据预处理模块;
D.所述票据预处理模块对收到的票据进行切图预处理,并将完成切图预处理的票据传至票据分拣池;
E.在所述票据分拣池中对进入票据分拣池的票据根据票据分类定义模块中的票据分类定义字段进行固定字段的纠偏并输出被纠偏后的字段,其中,所述固定字段由多个纠偏分类字段构成,对同一票据的多次纠偏时,每次纠偏仅在前次纠偏基础上增加一个纠偏分类字段;
F.所述票据分类定义模块获取步骤E中输出的被纠偏后的字段,并在票据分类定义列表中匹配该票据目前满足的规则及对应的发票模板;
G.若步骤F中匹配到的发票模板的数量超过1个,则将该票据再次返回票据分拣池进行固定字段的纠偏,直至匹配到的发票模板的数量为1个时将该票据传至票据模板定义模块;
H.票据模板定义模块根据票据分类定义列表中该票据对应的发票模板的识别属性来将该票据传递至全图纠偏模块或OCR识别模块,其中,将识别属性为识别的票据传递至OCR识别模块,将识别属性为不识别的票据传递至全图纠偏模块。
3.根据权利要求2所述的一种财务票据的分拣方法,其特征在于,所述纠偏分类字段中包含单据名称、代开标识。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710972494.3A CN107790403B (zh) | 2017-10-18 | 2017-10-18 | 一种财务票据的分拣系统及财务票据的分拣方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710972494.3A CN107790403B (zh) | 2017-10-18 | 2017-10-18 | 一种财务票据的分拣系统及财务票据的分拣方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107790403A CN107790403A (zh) | 2018-03-13 |
CN107790403B true CN107790403B (zh) | 2019-07-19 |
Family
ID=61534144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710972494.3A Active CN107790403B (zh) | 2017-10-18 | 2017-10-18 | 一种财务票据的分拣系统及财务票据的分拣方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107790403B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109409326A (zh) * | 2018-11-09 | 2019-03-01 | 四川长虹电器股份有限公司 | 一种基于增值税发票电子数据自动记账生成凭证的方法 |
CN115496749B (zh) * | 2022-11-14 | 2023-01-31 | 江苏智云天工科技有限公司 | 基于目标检测训练预处理的产品缺陷检测方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567764A (zh) * | 2012-01-13 | 2012-07-11 | 中国工商银行股份有限公司 | 一种提高电子影像识别效率的票据凭证及系统 |
JP2013073439A (ja) * | 2011-09-28 | 2013-04-22 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識方法 |
JP2014194599A (ja) * | 2013-03-28 | 2014-10-09 | Hammock:Kk | Ocrシステム |
CN105678612A (zh) * | 2015-12-30 | 2016-06-15 | 远光软件股份有限公司 | 移动端原始凭证电子化智能填单系统及方法 |
CN106296378A (zh) * | 2016-07-26 | 2017-01-04 | 四川长虹电器股份有限公司 | 基于xbrl的智能财务云平台系统、构建方法及业务实现方法 |
CN106649420A (zh) * | 2015-11-02 | 2017-05-10 | 富士施乐株式会社 | 图像处理设备和图像处理方法 |
-
2017
- 2017-10-18 CN CN201710972494.3A patent/CN107790403B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013073439A (ja) * | 2011-09-28 | 2013-04-22 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識方法 |
CN102567764A (zh) * | 2012-01-13 | 2012-07-11 | 中国工商银行股份有限公司 | 一种提高电子影像识别效率的票据凭证及系统 |
JP2014194599A (ja) * | 2013-03-28 | 2014-10-09 | Hammock:Kk | Ocrシステム |
CN106649420A (zh) * | 2015-11-02 | 2017-05-10 | 富士施乐株式会社 | 图像处理设备和图像处理方法 |
CN105678612A (zh) * | 2015-12-30 | 2016-06-15 | 远光软件股份有限公司 | 移动端原始凭证电子化智能填单系统及方法 |
CN106296378A (zh) * | 2016-07-26 | 2017-01-04 | 四川长虹电器股份有限公司 | 基于xbrl的智能财务云平台系统、构建方法及业务实现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107790403A (zh) | 2018-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108960223B (zh) | 基于票据智能识别自动生成凭证的方法 | |
CN109858453B (zh) | 一种通用的多引擎票据识别系统及方法 | |
US6243501B1 (en) | Adaptive recognition of documents using layout attributes | |
US7809615B2 (en) | Enhanced automated capture of invoices into an electronic payment system | |
US20160055376A1 (en) | Method and system for identification and extraction of data from structured documents | |
US20070033118A1 (en) | Document Scanning and Data Derivation Architecture. | |
CN114117171A (zh) | 一种基于赋能思维的工程档案智能收整方法及系统 | |
US10740638B1 (en) | Data element profiles and overrides for dynamic optical character recognition based data extraction | |
WO2006002009A2 (en) | Document management system with enhanced intelligent document recognition capabilities | |
CN108764302B (zh) | 一种基于颜色特征和词袋特征的票据图像分类方法 | |
CN103617415A (zh) | 一种自动识别发票的装置和方法 | |
CN107790403B (zh) | 一种财务票据的分拣系统及财务票据的分拣方法 | |
CN108921240A (zh) | 一种发票编码识别分拣系统 | |
CN112182148A (zh) | 一种基于全文检索的标准辅助编写方法 | |
CN115830620B (zh) | 一种基于ocr的档案文本数据处理方法及系统 | |
CN109886257A (zh) | 一种ocr系统中采用深度学习矫正发票图片分割结果的方法 | |
CN117669510A (zh) | 一种基于图片序列识别的法院材料电子目录编排方法 | |
CN115984885A (zh) | 一种用于营销现场作业的工单管理方法及系统 | |
CN102332088B (zh) | 一种基于游程特征的选票符号机器视觉识别方法 | |
CN114549014A (zh) | 基于自动和人工审核结合的供应链金融风控办法及系统 | |
TWM610766U (zh) | 雲端記帳系統 | |
CN106557465A (zh) | 一种词权重类别的获得方法及装置 | |
CN117726298A (zh) | 一种基于机器学习的报销流程审核方法及装置 | |
CN112686238B (zh) | 一种基于深度学习的航运单识别方法 | |
CN118781605A (zh) | 船舶证书的处理方法、装置和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |