CN111523349A - 一种纠偏处理的方法、装置、计算机存储介质及终端 - Google Patents
一种纠偏处理的方法、装置、计算机存储介质及终端 Download PDFInfo
- Publication number
- CN111523349A CN111523349A CN201910105567.8A CN201910105567A CN111523349A CN 111523349 A CN111523349 A CN 111523349A CN 201910105567 A CN201910105567 A CN 201910105567A CN 111523349 A CN111523349 A CN 111523349A
- Authority
- CN
- China
- Prior art keywords
- shooting
- neural network
- sample image
- preset
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
一种纠偏处理的方法、装置、计算机存储介质及终端,包括:按照预设策略对纸质文档进行拍摄,获得样本图像;对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。本发明实施例采用神经网络进行是否偏斜的判断,提升了纠偏处理的效率。
Description
技术领域
本文涉及但不限于办公应用技术,尤指一种纠偏处理的方法、装置、计算机存储介质及终端。
背景技术
文档纠编是对电子文档发生偏斜时进行纠正的处理技术,文档纠编应用领域包括但不限于银行、电信、公安、公积金、财税、证券等行业,这些行业将包括:票据、证件、收据及合同在内的拍摄图像作为存档图像。在拍摄过程中,由于摆放不当、纸张折叠及其他各种因素,拍摄得到的图像总是偏斜,需要进行纠偏处理。
在对文档进行纠偏处理之前,需要确定文档是否发生偏斜;目前,相关技术中,对文档是否发生偏斜的判断,效率较低,且无法保证判断的准确性。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供一种纠偏处理的方法、装置、计算机存储介质及终端,能够提升纠偏处理的效率。
本发明实施例提供了一种纠偏处理的方法,包括:
按照预设策略对纸质文档进行拍摄,获得样本图像;
对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
可选的,所述按照预设策略对纸质文档进行拍摄包括:
对预先选定的一种或一种以上排版的纸质文档,分别根据预设的拍摄角度进行拍摄后,获得所述样本图像。
可选的,所述对拍摄获得的样本图像进行偏斜标记包括:
对拍摄获得的所述样本图像,根据是否发生偏斜,分别采用相应的区分标识进行标记。
可选的,所述对电子文档进行是否偏斜的判断处理包括:
将所述电子文档以页为单位,分别转换预设格式的图片;
将转换获得的各图片输入到训练完成的神经网络,以确定各图片对应的电子文档是否发生偏斜。
可选的,所述神经网络包括:张量流TensorFlow。
可选的,所述对电子文档进行是否偏斜的判断处理之后,所述方法还包括:
通过预设的交互界面,反馈显示是否偏斜的判断结果。
另一方面,本发明实施例还提供一种纠偏处理的装置,包括:样本单元、训练单元及判断单元;其中,
样本单元用于:按照预设策略对纸质文档进行拍摄,获得样本图像;
训练单元用于:对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
判断单元用于:根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
可选的,所述样本单元具体用于:
对预先选定的一种或一种以上排版的纸质文档,分别根据预设的拍摄角度进行拍摄后,获得所述样本图像。
可选的,所述训练单元具体用于:
对拍摄获得的所述样本图像,根据是否发生偏斜,分别采用相应的区分标识进行标记;
将标记后的样本图像,输入到预设的神经网络进行训练。
可选的,所述判断单元具体用于:
将所述电子文档以页为单位,分别转换预设格式的图片;
将转换获得的各图片输入到训练完成的神经网络,以确定各图片对应的电子文档是否发生偏斜。
可选的,所述神经网络包括:张量流TensorFlow。
可选的,所述装置还包括反馈单元,用于:
反馈显示是否偏斜的判断结果。
再一方面,本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述纠偏处理的方法。
还一方面,本发明实施例还提供一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
按照预设策略对纸质文档进行拍摄,获得样本图像;
对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
与相关技术相比,本申请技术方案包括:按照预设策略对纸质文档进行拍摄,获得样本图像;对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。本发明实施例采用神经网络进行是否偏斜的判断,提升了纠偏处理的效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例纠偏处理的方法的流程图;
图2为本发明实施例纠偏处理的装置的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1为本发明实施例纠偏处理的方法的流程图,如图1所示,包括:
步骤101、按照预设策略对纸质文档进行拍摄,获得样本图像;
可选的,本发明实施例按照预设策略对纸质文档进行拍摄包括:
对预先选定的一种或一种以上排版的纸质文档,分别根据预设的拍摄角度进行拍摄后,获得所述样本图像。
需要说明的是,本发明实施例一种或一种以上排版的纸质文档包括:全文字的纸质文档、全图像的纸质文档、即包含文字又包含图像的纸质文档。本发明实施例可以根据文字的多少、图像的大小及分布,确定多种排版的纸质文档。本发明实施例拍摄角度可以是预先设定的随机的角度,也可以是预先设置的拍摄角度满足预设规则的角度,例如、拍摄角度组成的集合为等差数列结合,相邻等差数列的差可以是预先设定的角度,例如、0.5度,可以由本领域技术人员进行分析确定。
步骤102、对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
可选的,本发明实施例对拍摄获得的样本图像进行偏斜标记包括:
对拍摄获得的所述样本图像,根据是否发生偏斜,分别采用相应的区分标识进行标记。
需要说明的是,本发明实施例区分标识可以是编码标识,例如、对发生偏斜的样本图像采用0进行标记,对未发生偏斜的样本图像采用1进行标记。另外,本发明实施例样本图像是否发生偏斜可以在拍摄之前人为设定,即拍摄之前,样本图像的偏斜就已经确定。
步骤103、根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
可选的,本发明实施例对电子文档进行是否偏斜的判断处理包括:
将所述电子文档以页为单位,分别转换预设格式的图片;
将转换获得的各图片输入到训练完成的神经网络,以确定各图片对应的电子文档是否发生偏斜。
需要说明的是,本发明实施例,预设格式可以包括本领域技术人员预先设定的任意格式。训练完成后的神经网络如何实现偏斜判断,可以参照神经网络的相关理论确定,在此不做赘述。
可选的,本发明实施例神经网络包括:张量流(TensorFlow)。
需要说明的是,TensorFlow是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU)、服务器及移动设备等。此外,TensorFlow只是本发明实施例的可选实施例,本发明实施例可以采用其他可以适用于本发明实施例的神经网络进行样本图像的训练。
可选的,对电子文档进行是否偏斜的判断处理之后,本发明实施例方法还包括:
通过预设的交互界面,反馈显示是否偏斜的判断结果。
可选的,本发明实施例方法还包括:确定电子文档发生偏斜时,按照预设的纠偏方式对电子文档进行纠偏处理。
需要说明的是,纠偏处理的方法可以是相关技术中已有的处理方法。
与相关技术相比,本申请技术方案包括:按照预设策略对纸质文档进行拍摄,获得样本图像;对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。本发明实施例采用神经网络进行是否偏斜的判断,提升了纠偏处理的效率。
图2为本发明实施例纠偏处理的装置的结构框图,如图2所示,包括:样本单元、训练单元及判断单元;其中,
样本单元用于:按照预设策略对纸质文档进行拍摄,获得样本图像;
可选的,本发明实施例样本单元具体用于:
对预先选定的一种或一种以上排版的纸质文档,分别根据预设的拍摄角度进行拍摄后,获得所述样本图像。
需要说明的是,本发明实施例一种或一种以上排版的纸质文档包括:全文字的纸质文档、全图像的纸质文档、即包含文字又包含图像的纸质文档。本发明实施例可以根据文字的多少、图像的大小及分布,确定多种排版的纸质文档。本发明实施例拍摄角度可以是预先设定的随机的角度,也可以是预先设置的拍摄角度满足预设规则的角度,例如、拍摄角度组成的集合为等差数列结合,相邻等差数列的差可以是预先设定的角度,例如、0.5度,可以由本领域技术人员进行分析确定。
训练单元用于:对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
可选的,本发明实施例训练单元具体用于:
对拍摄获得的所述样本图像,根据是否发生偏斜,分别采用相应的区分标识进行标记;
将标记后的样本图像,输入到预设的神经网络进行训练。
需要说明的是,本发明实施例区分标识可以是编码标识,例如、对发生偏斜的样本图像采用0进行标记,对未发生偏斜的样本图像采用1进行标记。另外,本发明实施例样本图像是否发生偏斜可以在拍摄之前人为设定,即拍摄之前,样本图像的偏斜就已经确定。
判断单元用于:根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
可选的,本发明实施例判断单元具体用于:
将所述电子文档以页为单位,分别转换预设格式的图片;
将转换获得的各图片输入到训练完成的神经网络,以确定各图片对应的电子文档是否发生偏斜。
需要说明的是,本发明实施例,预设格式可以包括本领域技术人员预先设定的任意格式。训练完成后的神经网络如何实现偏斜判断,可以参照神经网络的相关理论确定,在此不做赘述。
可选的,本发明实施例神经网络包括:张量流(TensorFlow)。
需要说明的是,TensorFlow是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU)、服务器及移动设备等。此外,TensorFlow只是本发明实施例的可选实施例,本发明实施例可以采用其他可以适用于本发明实施例的神经网络进行样本图像的训练。
可选的,本发明实施例装置还包括反馈单元,用于:
反馈显示是否偏斜的判断结果。
需要说明的是,本发明实施例判断结果可以通过预设的交互界面显示。
可选的,本发明实施例装置还可以包括处理单元,用于:确定电子文档发生偏斜时,按照预设的纠偏方式对电子文档进行纠偏处理。
需要说明的是,纠偏处理的方法可以是相关技术中已有的处理方法。
与相关技术相比,本申请技术方案包括:按照预设策略对纸质文档进行拍摄,获得样本图像;对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。本发明实施例采用神经网络进行是否偏斜的判断,提升了纠偏处理的效率。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述纠偏处理的方法。
本发明实施例还提供一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
按照预设策略对纸质文档进行拍摄,获得样本图像;
对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的每个模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (14)
1.一种纠偏处理的方法,其特征在于,包括:
按照预设策略对纸质文档进行拍摄,获得样本图像;
对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
2.根据权利要求1所述的方法,其特征在于,所述按照预设策略对纸质文档进行拍摄包括:
对预先选定的一种或一种以上排版的纸质文档,分别根据预设的拍摄角度进行拍摄后,获得所述样本图像。
3.根据权利要求1所述的方法,其特征在于,所述对拍摄获得的样本图像进行偏斜标记包括:
对拍摄获得的所述样本图像,根据是否发生偏斜,分别采用相应的区分标识进行标记。
4.根据权利要求1所述的方法,其特征在于,所述对电子文档进行是否偏斜的判断处理包括:
将所述电子文档以页为单位,分别转换预设格式的图片;
将转换获得的各图片输入到训练完成的神经网络,以确定各图片对应的电子文档是否发生偏斜。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述神经网络包括:张量流TensorFlow。
6.根据权利要求1~4任一项所述的方法,其特征在于,所述对电子文档进行是否偏斜的判断处理之后,所述方法还包括:
通过预设的交互界面,反馈显示是否偏斜的判断结果。
7.一种纠偏处理的装置,其特征在于,包括:样本单元、训练单元及判断单元;其中,
样本单元用于:按照预设策略对纸质文档进行拍摄,获得样本图像;
训练单元用于:对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
判断单元用于:根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
8.根据权利要求7所述的装置,其特征在于,所述样本单元具体用于:
对预先选定的一种或一种以上排版的纸质文档,分别根据预设的拍摄角度进行拍摄后,获得所述样本图像。
9.根据权利要求7所述的装置,其特征在于,所述训练单元具体用于:
对拍摄获得的所述样本图像,根据是否发生偏斜,分别采用相应的区分标识进行标记;
将标记后的样本图像,输入到预设的神经网络进行训练。
10.根据权利要求7所述的装置,其特征在于,所述判断单元具体用于:
将所述电子文档以页为单位,分别转换预设格式的图片;
将转换获得的各图片输入到训练完成的神经网络,以确定各图片对应的电子文档是否发生偏斜。
11.根据权利要求7~10任一项所述的装置,其特征在于,所述神经网络包括:张量流TensorFlow。
12.根据权利要求7~10任一项所述的装置,其特征在于,所述装置还包括反馈单元,用于:
反馈显示是否偏斜的判断结果。
13.一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1~6中任一项所述的纠偏处理的方法。
14.一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
按照预设策略对纸质文档进行拍摄,获得样本图像;
对拍摄获得的样本图像进行偏斜标记后,输入到预设的神经网络进行训练;
根据训练完成的神经网络,对电子文档进行是否偏斜的判断处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910105567.8A CN111523349A (zh) | 2019-02-01 | 2019-02-01 | 一种纠偏处理的方法、装置、计算机存储介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910105567.8A CN111523349A (zh) | 2019-02-01 | 2019-02-01 | 一种纠偏处理的方法、装置、计算机存储介质及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111523349A true CN111523349A (zh) | 2020-08-11 |
Family
ID=71900286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910105567.8A Pending CN111523349A (zh) | 2019-02-01 | 2019-02-01 | 一种纠偏处理的方法、装置、计算机存储介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111523349A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229470A (zh) * | 2017-12-22 | 2018-06-29 | 北京市商汤科技开发有限公司 | 文字图像处理方法、装置、设备及存储介质 |
CN109241968A (zh) * | 2018-09-25 | 2019-01-18 | 广东工业大学 | 图像内容倾斜角度预测网络训练方法及修正方法、系统 |
-
2019
- 2019-02-01 CN CN201910105567.8A patent/CN111523349A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229470A (zh) * | 2017-12-22 | 2018-06-29 | 北京市商汤科技开发有限公司 | 文字图像处理方法、装置、设备及存储介质 |
CN109241968A (zh) * | 2018-09-25 | 2019-01-18 | 广东工业大学 | 图像内容倾斜角度预测网络训练方法及修正方法、系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10748029B2 (en) | Spatial transformer modules | |
US11816165B2 (en) | Identification of fields in documents with neural networks without templates | |
WO2019174130A1 (zh) | 票据识别方法、服务器及计算机可读存储介质 | |
US9652690B2 (en) | Automatically capturing and cropping image of check from video sequence for banking or other computing application | |
CN108846385B (zh) | 基于卷积-反卷积神经网络的图像识别、校正方法和装置 | |
US9171359B1 (en) | Method and system for auto-correcting perspective distortion in document images | |
US11514548B1 (en) | Machine-learning for enhanced machine reading of non-ideal capture conditions | |
US11017498B2 (en) | Ground truth generation from scanned documents | |
CN107980139A (zh) | 文档扫描器 | |
EP3182365A2 (en) | Writing board detection and correction | |
CN112396047B (zh) | 训练样本生成方法、装置、计算机设备和存储介质 | |
CN111104941B (zh) | 图像方向纠正方法、装置及电子设备 | |
CN108648189A (zh) | 图像模糊检测方法、装置、计算设备及可读存储介质 | |
CN110647832A (zh) | 获取证件中信息的方法和装置、电子设备和存储介质 | |
de Elias et al. | Optical mark recognition: Advances, difficulties, and limitations | |
US9747509B2 (en) | Automatically capturing and cropping image of check from video sequence for banking or other computing application | |
CN112418206B (zh) | 基于位置检测模型的图片分类方法及其相关设备 | |
CN114140649A (zh) | 票据分类方法、票据分类装置、电子设备和存储介质 | |
CN112560855A (zh) | 图像信息提取方法、装置、电子设备及存储介质 | |
CN112651399A (zh) | 检测倾斜图像中同行文字的方法及其相关设备 | |
CN111523349A (zh) | 一种纠偏处理的方法、装置、计算机存储介质及终端 | |
CN113011410A (zh) | 字符识别模型的训练方法、字符识别方法及装置 | |
CN113362249A (zh) | 文字图像合成方法、装置、计算机设备及存储介质 | |
US6983084B2 (en) | Method of aligning page images | |
CN111753809A (zh) | 一种用于手写签名矫正的方法与设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |