CN109919153A - 基于手写识别人工智能技术的自动单据录入系统及方法 - Google Patents

基于手写识别人工智能技术的自动单据录入系统及方法 Download PDF

Info

Publication number
CN109919153A
CN109919153A CN201910136872.3A CN201910136872A CN109919153A CN 109919153 A CN109919153 A CN 109919153A CN 201910136872 A CN201910136872 A CN 201910136872A CN 109919153 A CN109919153 A CN 109919153A
Authority
CN
China
Prior art keywords
document
unit
handwriting recognition
picture
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910136872.3A
Other languages
English (en)
Inventor
张勇斌
郑志强
齐元胜
刘玉琴
梁荣华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Graphic Communication
Original Assignee
Beijing Institute of Graphic Communication
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Graphic Communication filed Critical Beijing Institute of Graphic Communication
Priority to CN201910136872.3A priority Critical patent/CN109919153A/zh
Publication of CN109919153A publication Critical patent/CN109919153A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了一种基于手写识别人工智能技术的自动单据录入系统及方法,该系统包括单据录入机、云端手写手写识别平台、业务系统。本发明还公开了一种基于手写识别人工智能技术的自动单据录入方法。本发明通过云端手写识别平台在大量数据训练的基础上,能够实现对印刷字100%识别,手写字80%以上识别。在手写字字体清晰端正的情况下,手写字识别也能达到近乎100%的识别。单据录入机根据企业需要,可以将自动录入的电子单据上传给企业的业务系统。

Description

基于手写识别人工智能技术的自动单据录入系统及方法
技术领域
本发明属于数据录入技术领域,具体地说,涉及一种基于手写识别人工智能技术的自动单据录入系统及方法。
背景技术
目前在大型集贸市场交易过程中,交易双方都存在种类繁多的纸质销售和收购单据,对中大型交易双方来说,这些单据的重要性不言而喻。交易的一方或双方在交易完成后将原始单据数据做电子化录入,进行计算机汇总和分析。电子化录入通过人工完成,繁杂的数据录入对于单据录入人员来说是一种单调繁重的工作,这种手工录入方法不仅速度慢,效率低下,并且常常会出错,一般会在录入完成后进行人工复查。这种录入方法不仅人工成本高,时间成本也很高,对于大业务量的交易方来说是一项费时费力的固定支出。如何实现快速、高效、准确率高、自动化的数据录入,是目前交易过程中急需解决的技术问题。
发明内容
本发明的目的在于克服现有技术中存在的问题,提供一种基于手写识别人工智能技术的自动单据录入系统及方法,将自动化单据录入机和云端手写识别系统集成起来,完成原始单据数据自动录入,电子单据自动生成,从而极大提高单据录入的效率,同时减少录入错误。
其具体技术方案为:
一种基于手写识别人工智能技术的自动单据录入系统,包括单据录入机1、云端手写手写识别平台12、业务系统15;
所述单据录入机1完成原始单据的自动录入,并生成电子单据。它由摄像单元2、单据识别单元5、电子化单据模板单元6、手写识别处理单元11组成。单据录入机将这些软件和硬件单元完整的集成于一套硬件设备中;
所述云端手写识别平台12位于企业内网或者外网的云平台上。它能够对图片中的印刷字、手写字进行自动识别,是一套完整的人工智能系统;
所述业务系统15收到单据录入机发来的电子单据后,进行归档,并根据企业业务需要进行入库及后续分析处理。
进一步,摄像单元2主要由高清摄像头和软件组成,自动完成摄像对焦,自动完成原始单据尺寸匹配。该单元通过拍照得到原始单据的高清晰度原始单据图片,并将原始单据图片发送给单据识别单元。
单据识别单元5将来自摄像单元的原始单据图片与电子化单据模板单元中预存的电子单据模板进行匹配比对,当原始单据图片中的单据与某个预存模板匹配的时候,单据识别单元根据所匹配的模板自动生成临时电子单据,同时对单据图片进行单元分割,提取其中的手写部分。单据识别单元缓存临时电子单据,并将手写部分发送给手写识别处理单元,并等待来自手写识别处理单元的识别结果通知。
单元分割功能模块9,用于在单据识别单元成功进行单据模板匹配后进行,该功能的目的是根据预设模板对单据区块的定义,对原始单据图片进行图形区块切割、图形区块属性标签赋值中文、英文、数字、图形、混合等等。由于原始单据有大量的手写部分,比如数量,种类,名称,价格等等,而这些手写部分不能通过模板匹配完成自动输入。为此,在单元分割功能完成图形区块切割后,单据识别单元需要将其中的手写部分发送给手写识别处理单元进行处理,并等待来自手写识别处理单元的识别结果通知。
手写识别处理单元11收到来自单据识别单元的手写部分后,根据其对应的区块属性标签进行分类,将具有中文、英文和数字属性标签的切割图形上传给云端手写识别平台进行手写文字识别。在云端手写识别平台返回文字识别结果后,手写识别处理单元将结果填入单据识别单元生成的临时电子单据,从而生成最终的电子单据。到此完成单据录入机的自动单据录入功能。
一种基于手写识别人工智能技术的自动单据录入方法,包括以下步骤:
通过单据录入机1的摄像单元2对原始单据3进行拍照,得到原始单据图片4,单据录入机预存大量事先定制好的电子化单据模板单元6,单据录入机中的单据识别单元5对单据图片自动进行电子单据模板匹配7,匹配成功后自动生成临时电子单据8,同时单据识别单元对单据图片进行单元分割,并提取出其中的手写部分10,单据录入机的手写识别处理单元11将手写部分发送到位于互联网或企业内网上的云端手写识别平台12进行文字识别中英文和数字,云端手写识别平台将文字识别结果13返回给手写识别处理单元,手写识别处理单元将文字识别结果填入临时单子单据,从而生成电子单据14。到此完成单据的自动录入功能。由于交易方往往要基于单据做汇总和分析,单据录入机还会将电子单据发送给企业的业务系统15,业务系统对来自单据录入机的电子单据进行归档,并根据企业业务需要进行入库及后续分析处理。
与现有技术相比,本发明的有益效果为:
云端手写识别平台在大量数据训练的基础上,能够实现对印刷字100%识别,手写字80%以上识别。在手写字字体清晰端正的情况下,手写字识别也能达到近乎100%的识别。单据录入机根据企业需要,可以将自动录入的电子单据上传给企业的业务系统。
附图说明
图1是本发明基于手写识别人工智能技术的自动单据录入系统的原理图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案作进一步详细地说明。
参照图1,本发明实现过程概括为:通过单据录入机1的摄像单元2对原始单据3进行拍照,得到原始单据图片4,单据录入机预存大量事先定制好的电子化单据模板单元6,单据录入机中的单据识别单元5对单据图片自动进行电子单据模板匹配7,匹配成功后自动生成临时电子单据8,同时单据识别单元对单据图片进行单元分割,并提取出其中的手写部分10,单据录入机的手写识别处理单元11将手写部分发送到位于互联网或企业内网上的云端手写识别平台12进行文字识别中英文和数字,云端手写识别平台将文字识别结果13返回给手写识别处理单元,手写识别处理单元将文字识别结果填入临时单子单据,从而生成电子单据14。到此完成单据的自动录入功能。由于交易方往往要基于单据做汇总和分析,单据录入机还会将电子单据发送给企业的业务系统15,业务系统对来自单据录入机的电子单据进行归档,并根据企业业务需要进行入库及后续分析处理。
本发明所述的快速单据自动录入系统由单据录入机1、云端手写手写识别平台12、业务系统15可选组成。
单据录入机1完成原始单据的自动录入,并生成电子单据。它由摄像单元、单据识别单元、电子化单据模板单元、手写识别处理单元组成。单据录入机将这些软件和硬件单元完整的集成于一套硬件设备中。
摄像单元2主要由高清摄像头和软件组成,自动完成摄像对焦,自动完成原始单据尺寸匹配。该单元通过拍照得到原始单据的高清晰度原始单据图片,并将原始单据图片发送给单据识别单元。
单据识别单元5将来自摄像单元的原始单据图片与电子化单据模板单元中预存的电子单据模板进行匹配比对,当原始单据图片中的单据与某个预存模板匹配的时候,单据识别单元根据所匹配的模板自动生成临时电子单据,同时对单据图片进行单元分割,提取其中的手写部分。单据识别单元缓存临时电子单据,并将手写部分发送给手写识别处理单元,并等待来自手写识别处理单元的识别结果通知。
单元分割功能模块9,该功能是在单据识别单元成功进行单据模板匹配后进行,该功能的目的是根据预设模板对单据区块的定义,对原始单据图片进行图形区块切割、图形区块属性标签赋值中文、英文、数字、图形、混合等等。由于原始单据有大量的手写部分,比如数量,种类,名称,价格等等,而这些手写部分不能通过模板匹配完成自动输入。为此,在单元分割功能完成图形区块切割后,单据识别单元需要将其中的手写部分发送给手写识别处理单元进行处理,并等待来自手写识别处理单元的识别结果通知。
手写识别处理单元11收到来自单据识别单元的手写部分后,根据其对应的区块属性标签进行分类,将具有中文、英文和数字属性标签的切割图形上传给云端手写识别平台进行手写文字识别。在云端手写识别平台返回文字识别结果后,手写识别处理单元将结果填入单据识别单元生成的临时电子单据,从而生成最终的电子单据。到此完成单据录入机的自动单据录入功能。
云端手写识别平台12位于企业内网或者外网的云平台上。它能够对图片中的印刷字、手写字进行自动识别,是一套完整的人工智能系统AI。云端手写识别平台在大量数据训练的基础上,能够实现对印刷字100%识别,手写字80%以上识别。在手写字字体清晰端正的情况下,手写字识别也能达到近乎100%的识别。
单据录入机根据企业需要,可以将自动录入的电子单据上传给企业的业务系统。
业务系统15收到单据录入机发来的电子单据后,进行归档,并根据企业业务需要进行入库及后续分析处理。
以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。

Claims (3)

1.一种基于手写识别人工智能技术的自动单据录入系统,其特征在于,包括单据录入机(1)、云端手写手写识别平台(12)、业务系统(15);
所述单据录入机(1)完成原始单据的自动录入,并生成电子单据;它由摄像单元(2)、单据识别单元(5)、电子化单据模板单元(6)、单元分割功能模块(9)、手写识别处理单元(11)组成;单据录入机将这些软件和硬件单元完整的集成于一套硬件设备中;
所述云端手写识别平台(12)位于企业内网或者外网的云平台上;它能够对图片中的印刷字、手写字进行自动识别,是一套完整的人工智能系统;
所述业务系统(15)收到单据录入机发来的电子单据后,进行归档,并根据企业业务需要进行入库及后续分析处理。
2.根据权利要求1所述的基于手写识别人工智能技术的自动单据录入系统,其特征在于,摄像单元(2)主要由高清摄像头和软件组成,自动完成摄像对焦,自动完成原始单据尺寸匹配;该单元通过拍照得到原始单据的高清晰度原始单据图片,并将原始单据图片发送给单据识别单元;
单据识别单元(5)将来自摄像单元的原始单据图片与电子化单据模板单元中预存的电子单据模板进行匹配比对,当原始单据图片中的单据与某个预存模板匹配的时候,单据识别单元根据所匹配的模板自动生成临时电子单据,同时对单据图片进行单元分割,提取其中的手写部分;单据识别单元缓存临时电子单据,并将手写部分发送给手写识别处理单元,并等待来自手写识别处理单元的识别结果通知;
单元分割功能模块(9)其用途是:单据识别单元成功进行单据模板匹配后进行,根据预设模板对单据区块的定义,单元分割功能对原始单据图片进行图形区块切割、图形区块属性标签赋值;由于原始单据有大量的手写部分,而这些手写部分不能通过模板匹配完成自动输入;为此,在单元分割功能完成图形区块切割后,单据识别单元需要将其中的手写部分发送给手写识别处理单元进行处理,并等待来自手写识别处理单元的识别结果通知;
手写识别处理单元(11)收到来自单据识别单元的手写部分后,根据其对应的区块属性标签进行分类,将具有中文、英文和数字属性标签的切割图形上传给云端手写识别平台进行手写文字识别;在云端手写识别平台返回文字识别结果后,手写识别处理单元将结果填入单据识别单元生成的临时电子单据,从而生成最终的电子单据;到此完成单据录入机的自动单据录入功能。
3.一种基于手写识别人工智能技术的自动单据录入方法,其特征在于,包括以下步骤:
通过单据录入机(1)的摄像单元(2)对原始单据(3)进行拍照,得到原始单据图片(4),单据录入机预存大量事先定制好的电子化单据模板单元(6),单据录入机中的单据识别单元(5)对单据图片自动进行电子单据模板匹配(7),匹配成功后自动生成临时电子单据(8),同时单据识别单元对单据图片进行单元分割,并提取出其中的手写部分(10),单据录入机的手写识别处理单元(11)将手写部分发送到位于互联网或企业内网上的云端手写识别平台(12)进行文字识别,云端手写识别平台将文字识别结果(13)返回给手写识别处理单元,手写识别处理单元将文字识别结果填入临时单子单据,从而生成电子单据(14),到此完成单据的自动录入功能,由于交易方往往要基于单据做汇总和分析,单据录入机还会将电子单据发送给企业的业务系统(15),业务系统对来自单据录入机的电子单据进行归档,并根据企业业务需要进行入库及后续分析处理。
CN201910136872.3A 2019-02-22 2019-02-22 基于手写识别人工智能技术的自动单据录入系统及方法 Pending CN109919153A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910136872.3A CN109919153A (zh) 2019-02-22 2019-02-22 基于手写识别人工智能技术的自动单据录入系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910136872.3A CN109919153A (zh) 2019-02-22 2019-02-22 基于手写识别人工智能技术的自动单据录入系统及方法

Publications (1)

Publication Number Publication Date
CN109919153A true CN109919153A (zh) 2019-06-21

Family

ID=66962175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910136872.3A Pending CN109919153A (zh) 2019-02-22 2019-02-22 基于手写识别人工智能技术的自动单据录入系统及方法

Country Status (1)

Country Link
CN (1) CN109919153A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414632A (zh) * 2019-06-27 2019-11-05 亳州职业技术学院 一种针对手写物流单据的信息识别存储方法
CN111966794A (zh) * 2020-03-31 2020-11-20 复旦大学附属中山医院 一种诊疗数据的识别方法、系统和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993005481A1 (en) * 1991-08-30 1993-03-18 Trw Financial Systems, Inc. Method and apparatus for converting documents between paper medium and electronic media
CN102156855A (zh) * 2011-03-30 2011-08-17 信雅达系统工程股份有限公司 基于影像切割的银行凭证数据采集方法
CN105184329A (zh) * 2015-08-27 2015-12-23 鲁东大学 一种基于云平台的脱机手写识别方法
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统
CN106407883A (zh) * 2016-08-10 2017-02-15 北京工业大学 一种复杂表格及其内部手写数字识别方法
CN107463866A (zh) * 2016-06-06 2017-12-12 青岛大学 一种用于成绩评价的识别手写实验报告的方法
CN108363943A (zh) * 2017-12-27 2018-08-03 苏州工业园区报关有限公司 基于智能化识别技术的通关机器人

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993005481A1 (en) * 1991-08-30 1993-03-18 Trw Financial Systems, Inc. Method and apparatus for converting documents between paper medium and electronic media
CN102156855A (zh) * 2011-03-30 2011-08-17 信雅达系统工程股份有限公司 基于影像切割的银行凭证数据采集方法
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统
CN105184329A (zh) * 2015-08-27 2015-12-23 鲁东大学 一种基于云平台的脱机手写识别方法
CN107463866A (zh) * 2016-06-06 2017-12-12 青岛大学 一种用于成绩评价的识别手写实验报告的方法
CN106407883A (zh) * 2016-08-10 2017-02-15 北京工业大学 一种复杂表格及其内部手写数字识别方法
CN108363943A (zh) * 2017-12-27 2018-08-03 苏州工业园区报关有限公司 基于智能化识别技术的通关机器人

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414632A (zh) * 2019-06-27 2019-11-05 亳州职业技术学院 一种针对手写物流单据的信息识别存储方法
CN111966794A (zh) * 2020-03-31 2020-11-20 复旦大学附属中山医院 一种诊疗数据的识别方法、系统和装置

Similar Documents

Publication Publication Date Title
EP3437019B1 (en) Optical character recognition in structured documents
US10572725B1 (en) Form image field extraction
US9552516B2 (en) Document information extraction using geometric models
JP5379085B2 (ja) スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
EP1936536B1 (en) System and method for performing classification through generative models of features occuring in an image
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
US9298685B2 (en) Automatic creation of multiple rows in a table
JP2011018316A (ja) 文書区分識別用の区分モデルを生成するための方法及びプログラム、文書の区分を識別するための方法及びプログラム、及び画像処理システム
CN108197119A (zh) 基于知识图谱的纸质档案数字化方法
CN113723270A (zh) 基于rpa及ai的文件处理方法及装置
CN105184329A (zh) 一种基于云平台的脱机手写识别方法
CN109919153A (zh) 基于手写识别人工智能技术的自动单据录入系统及方法
CN109271616B (zh) 一种基于标准文献题录特征值的智能提取方法
CN114912417A (zh) 业务数据处理方法、装置、设备及存储介质
CN112508000B (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
JP6856916B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN113780116A (zh) 发票分类方法、装置、计算机设备和存储介质
WO2007070010A1 (en) Improvements in electronic document analysis
Zeng et al. STAR: Zero-shot Chinese character recognition with stroke-and radical-level decompositions
CN112348022B (zh) 一种基于深度学习的自由格式文档识别方法
Zhao et al. Barcode character defect detection method based on Tesseract-OCR
CN111241955B (zh) 一种票据信息提取方法及系统
CN113657373A (zh) 一种文书自动编目方法
CN117332761B (zh) 一种pdf文档智能识别标注系统
WO2021140682A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination