CN114091876A - 自动化校验和切割转换银行回单的方法及工具 - Google Patents
自动化校验和切割转换银行回单的方法及工具 Download PDFInfo
- Publication number
- CN114091876A CN114091876A CN202111343091.5A CN202111343091A CN114091876A CN 114091876 A CN114091876 A CN 114091876A CN 202111343091 A CN202111343091 A CN 202111343091A CN 114091876 A CN114091876 A CN 114091876A
- Authority
- CN
- China
- Prior art keywords
- receipt
- picture
- bank
- bank receipt
- cutting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012795 verification Methods 0.000 claims abstract description 8
- 238000004806 packaging method and process Methods 0.000 claims abstract description 7
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Character Input (AREA)
Abstract
本发明涉及单据校验和归档技术领域,特别涉及自动化校验和切割转换银行回单的方法及工具,输入银行回单和资金流水单,将PDF格式的银行回单转换成图片格式的银行回单,在图片格式的银行回单上建立坐标系,获取图片格式的银行回单切割数据,对银行回单图片进行切割,对每张单独的银行回单图片进行命名,对未识别出回单编号的图片进行人工校验,对每一张完整的子回单图片按资金流水单上的顺序排列,压缩打包,校验完成进行存档。与现有技术相比,本发明的自动化校验和切割转换银行回单的方法及工具效率大大提升,并且保证较高的自动化校验准确率,用自动化程序代替人工操作银行整份回单的切割转换和识别过程,通用性强。
Description
【技术领域】
本发明涉及单据校验和归档技术领域,特别涉及自动化校验和切割转换银行回单的方法及工具。
【背景技术】
在金融类项目业务流程中有一个将资金流水单和银行回单进行校验和归档的流程,该流程之前靠人工单笔单笔的校验,一个项目下面可能是拆分几百到上千的子流水单,而银行反馈的银行回单是一整份的pdf文件并且各个银行的回单格式存在明显差异,这样人工操作起来费时费力。
目前已有的工具需要人工肉眼在多达几百上千页的pdf文件中寻找目标单号对应的银行回单,并且pdf单页中也可能存在多份的电子回单,这时需要在pdf中的目标页中再进行部分截图;然而银行回单pdf中的子单号是无序和不可编辑的,只能靠人工肉眼在整份pdf中寻找目标区域进行切图操作,对于一份完整的pdf回单少则上百份多则上千份左右,处理一份都需要一个人花上一整天时间,而后还需要在项目所在平台进行图片上传,然后在项目平台进行相关要素信息校验,还需要一个人花费半天的时间,整体效率很低下,人工成本很高,随着业务量的增加相关工作人员已经很难再承受这一环节的工作量。
【发明内容】
为了克服上述问题,本发明提出一种可有效解决上述问题的自动化校验和切割转换银行回单的方法及工具。
本发明解决上述技术问题提供的一种技术方案是:提供一种自动化校验和切割转换银行回单的方法及工具,包括如下步骤:
步骤S1,输入完整的银行回单和资金流水单;
步骤S2,将PDF格式的银行回单转换成图片格式的银行回单;
步骤S3,在图片格式的银行回单上建立XY坐标系;
步骤S4,获取图片格式的银行回单切割数据;
步骤S5,对银行回单图片进行切割,得到单独的银行回单图片,并对每张单独的银行回单图片进行命名;
步骤S6,对未识别出回单编号的图片进行人工校验;
步骤S7,对每一张完整的子回单图片按资金流水单上的顺序排列,并压缩打包,校验完成进行存档。
优选地,所述步骤S2中,格式转换前添加PDF字库。
优选地,所述步骤S2中,将转换成图片格式的银行回单进行正置处理。
优选地,所述步骤S4中,包括如下步骤:
步骤S41,对图片格式的银行回单整体使用OCR识别技术得到图片中的文字和数字内容以及获取文字和数字在图片中的坐标信息;
步骤S42,根据识别到的文字和数字判断一张图片中的有效子回单数量;
步骤S43,得到图片中有效子回单的数量后,再根据文字和数字的坐标信息定位每个有效子回单在本图片中的位置;
步骤S44,返回每个有效子回单的位置信息和对应的回单编号。
优选地,所述每个有效子回单在本图片中的位置是有效子回单距离本图片上边框和下边框的距离以及有效子回单本身的高度。
优选地,所述步骤S2中,转换后图片格式的银行回单与PDF格式的银行回单内容相同,具有相同页数以及相同的排版。
优选地,所述步骤S3中,以银行回单图片的左上角顶点为原点建立XY坐标系。
优选地,所述步骤S5,根据步骤S44中返回的有效子回单位置信息和对应的回单编号,对银行回单图片进行切割。
优选地,所述步骤S5中,对每张单独的银行回单图片进行命名可根据金融类项目业务系统对应的文件夹和文件名按进行命名。
优选地,所述自动化校验和切割转换银行回单的工具,包括:
图片转换模块,用于将PDF格式的整份银行回单转换成图片格式的银行回单;
文字识别模块,用于识别银行回单图片中的目标文字和目标数字并且提取目标文字和目标数字的坐标信息;
坐标定位模块,用于建立坐标系并且标定银行回单图片中文字和数字的坐标信息;
图片切割模块,用于根据目标文字和目标数字的坐标信息在图片中定位目标区域,并将目标区域切割保存为单独的银行回单图片;
报警模块,用于对未识别出目标区域的图片进行标记,并且报警提示需要人工校验;
自动排序模块,用于将多份单独的银行回单图片根据回单编号在资金流水单上的顺序排列;
压缩传送模块,用于提取切割好的单独的银行回单图片,与对应的资金流水单打包压缩存档。
与现有技术相比,本发明的自动化校验和切割转换银行回单的方法及工具自动化程度高,原来需要一个人一整天才能完成的工作,使用本发明只需要程序半小时自动化完成,效率大大提升,并且保证较高的自动化校验准确率,用自动化程序代替人工操作银行整份回单的切割转换和识别过程,通用性强,支持大多数银行反馈的回单pdf处理。
【附图说明】
图1为本发明自动化校验和切割转换银行回单的方法的整体步骤流程图;
图2为本发明自动化校验和切割转换银行回单的方法的步骤S4流程图。
【具体实施方式】
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施实例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅限于指定视图上的相对位置,而非绝对位置。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
请参阅图1和图2,本发明的自动化校验和切割转换银行回单的工具,用于对资金流水单和银行回单进行校验和归档,包括:
图片转换模块,用于将PDF格式的整份银行回单转换成图片格式的银行回单,图片格式的银行回单页数与PDF格式的整份银行回单页数相同;
文字识别模块,用于识别银行回单图片中的目标文字和目标数字并且提取目标文字和目标数字的坐标信息,文字识别模块基于OCR识别技术;
坐标定位模块,用于建立坐标系并且标定银行回单图片中文字和数字的坐标信息;
图片切割模块,用于根据目标文字和目标数字的坐标信息在图片中定位目标区域,并将目标区域切割保存为单独的银行回单图片,目标区域指一张完整的子回单区域;
报警模块,用于对未识别出目标区域的图片进行标记,并且报警提示需要人工校验;
自动排序模块,用于将多份单独的银行回单图片根据回单编号在资金流水单上的顺序排列;
压缩传送模块,用于提取切割好的单独的银行回单图片,与对应的资金流水单打包压缩存档。
本发明的自动化校验和切割转换银行回单的方法,采用自动化校验和切割转换银行回单的工具,包括如下步骤:
步骤S1,输入完整的银行回单和资金流水单。
所述步骤S1中,完整的银行回单为PDF格式,里面包括有多个子回单,每一子回单中具有唯一的回单编号。所述资金流水单为文字数据格式,里面包括有多个流水单号,每一流水单号与一个回单编号相对应,每一子回单是对与其对应的流水单号的详细说明。
步骤S2,将PDF格式的银行回单转换成图片格式的银行回单。
所述步骤S2中,格式转换前需要先添加PDF字库,保证转换时文字不会失真变形,再通过图片转换模块将银行回单的PDF格式转换为图片格式,便于后续对图片进行切割。转换后图片格式的银行回单与PDF格式的银行回单内容相同,具有相同页数以及相同的排版。所述步骤S2中,将转换成图片格式的银行回单进行正置处理,保证图片内文字和数字是正向的,以便于后续做图片切割。
步骤S3,在图片格式的银行回单上建立XY坐标系。
所述步骤S3中,以银行回单图片的左上角顶点为原点建立XY坐标系,方便定位文字和数字的坐标信息。
步骤S4,获取图片格式的银行回单切割数据。
所述步骤S4中,包括如下步骤:
步骤S41,对图片格式的银行回单整体使用OCR识别技术得到图片中的文字和数字内容以及获取文字和数字在图片中的坐标信息;
步骤S42,根据识别到的文字和数字判断一张图片中的有效子回单数量,由于一张图片中可能含有1-3张子回单,并且有可能存在只有开头和结尾的干扰样本,所以需要判断出有效子回单数量,有效子回单是指一张完整的子回单;
步骤S43,得到图片中有效子回单的数量后,再根据文字和数字的坐标信息定位每个有效子回单在本图片中的位置,主要是有效子回单距离本图片上边框和下边框的距离以及有效子回单本身的高度;
步骤S44,返回每个有效子回单的位置信息和对应的回单编号;
步骤S5,根据步骤S44中返回的有效子回单位置信息和对应的回单编号,对银行回单图片进行切割,得到单独的银行回单图片,并对每张单独的银行回单图片进行命名,每张单独的银行回单图片为一张完整的子回单图片。
所述步骤S5中,对每张单独的银行回单图片进行命名可根据金融类项目业务系统对应的文件夹和文件名按一定规则+单号进行命名。
步骤S6,对未识别出回单编号的图片进行人工校验。
步骤S7,对每一张完整的子回单图片按资金流水单上的顺序排列,并压缩打包,校验完成进行存档。
与现有技术相比,本发明的自动化校验和切割转换银行回单的方法及工具自动化程度高,原来需要一个人一整天才能完成的工作,使用本发明只需要程序半小时自动化完成,并且保证较高的自动化校验准确率,用自动化程序代替人工操作银行整份回单的切割转换和识别过程,通用性强,支持大多数银行反馈的回单pdf处理。
以上所述仅为本发明的较佳实施例,并非因此限制本发明的专利范围,凡是在本发明的构思之内所作的任何修改,等同替换和改进等均应包含在本发明的专利保护范围内。
Claims (10)
1.自动化校验和切割转换银行回单的方法,其特征在于,采用自动化校验和切割转换银行回单的工具,包括如下步骤:
步骤S1,输入完整的银行回单和资金流水单;
步骤S2,将PDF格式的银行回单转换成图片格式的银行回单;
步骤S3,在图片格式的银行回单上建立XY坐标系;
步骤S4,获取图片格式的银行回单切割数据;
步骤S5,对银行回单图片进行切割,得到单独的银行回单图片,并对每张单独的银行回单图片进行命名;
步骤S6,对未识别出回单编号的图片进行人工校验;
步骤S7,对每一张完整的子回单图片按资金流水单上的顺序排列,并压缩打包,校验完成进行存档。
2.如权利要求1所述的自动化校验和切割转换银行回单的方法,其特征在于,所述步骤S2中,格式转换前添加PDF字库。
3.如权利要求1所述的自动化校验和切割转换银行回单的方法,其特征在于,所述步骤S2中,将转换成图片格式的银行回单进行正置处理。
4.如权利要求1所述的自动化校验和切割转换银行回单的方法,其特征在于,所述步骤S4中,包括如下步骤:
步骤S41,对图片格式的银行回单整体使用OCR识别技术得到图片中的文字和数字内容以及获取文字和数字在图片中的坐标信息;
步骤S42,根据识别到的文字和数字判断一张图片中的有效子回单数量;
步骤S43,得到图片中有效子回单的数量后,再根据文字和数字的坐标信息定位每个有效子回单在本图片中的位置;
步骤S44,返回每个有效子回单的位置信息和对应的回单编号。
5.如权利要求4所述的自动化校验和切割转换银行回单的方法,其特征在于,所述每个有效子回单在本图片中的位置是有效子回单距离本图片上边框和下边框的距离以及有效子回单本身的高度。
6.如权利要求1所述的自动化校验和切割转换银行回单的方法,其特征在于,所述步骤S2中,转换后图片格式的银行回单与PDF格式的银行回单内容相同,具有相同页数以及相同的排版。
7.如权利要求1所述的自动化校验和切割转换银行回单的方法,其特征在于,所述步骤S3中,以银行回单图片的左上角顶点为原点建立XY坐标系。
8.如权利要求4所述的自动化校验和切割转换银行回单的方法,其特征在于,所述步骤S5,根据步骤S44中返回的有效子回单位置信息和对应的回单编号,对银行回单图片进行切割。
9.如权利要求1所述的自动化校验和切割转换银行回单的方法,其特征在于,所述步骤S5中,对每张单独的银行回单图片进行命名可根据金融类项目业务系统对应的文件夹和文件名按进行命名。
10.自动化校验和切割转换银行回单的工具,其特征在于,包括:
图片转换模块,用于将PDF格式的整份银行回单转换成图片格式的银行回单;
文字识别模块,用于识别银行回单图片中的目标文字和目标数字并且提取目标文字和目标数字的坐标信息;
坐标定位模块,用于建立坐标系并且标定银行回单图片中文字和数字的坐标信息;
图片切割模块,用于根据目标文字和目标数字的坐标信息在图片中定位目标区域,并将目标区域切割保存为单独的银行回单图片;
报警模块,用于对未识别出目标区域的图片进行标记,并且报警提示需要人工校验;
自动排序模块,用于将多份单独的银行回单图片根据回单编号在资金流水单上的顺序排列;
压缩传送模块,用于提取切割好的单独的银行回单图片,与对应的资金流水单打包压缩存档。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111343091.5A CN114091876A (zh) | 2021-11-12 | 2021-11-12 | 自动化校验和切割转换银行回单的方法及工具 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111343091.5A CN114091876A (zh) | 2021-11-12 | 2021-11-12 | 自动化校验和切割转换银行回单的方法及工具 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114091876A true CN114091876A (zh) | 2022-02-25 |
Family
ID=80300690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111343091.5A Pending CN114091876A (zh) | 2021-11-12 | 2021-11-12 | 自动化校验和切割转换银行回单的方法及工具 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114091876A (zh) |
-
2021
- 2021-11-12 CN CN202111343091.5A patent/CN114091876A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840519B (zh) | 一种自适应的智能单据识别录入装置及其使用方法 | |
CN110097329B (zh) | 信息审核方法、装置、设备及计算机可读存储介质 | |
US20160055376A1 (en) | Method and system for identification and extraction of data from structured documents | |
US20050289182A1 (en) | Document management system with enhanced intelligent document recognition capabilities | |
US8064703B2 (en) | Property record document data validation systems and methods | |
US8340425B2 (en) | Optical character recognition with two-pass zoning | |
US10055801B2 (en) | Systems and methods for generating structured data based on scanned documents | |
US10225431B2 (en) | System and method for importing scanned construction project documents | |
WO1997005561A1 (fr) | Processeur de supports et procede de traitement de supports | |
US20210192129A1 (en) | Method, system and cloud server for auto filing an electronic form | |
CN109598228B (zh) | 将纸质文件电子化著录归档的方法和系统 | |
WO2008058871A1 (en) | Automated generation of form definitions from hard-copy forms | |
US8824803B2 (en) | Automated field position linking of indexed data to digital images | |
CN116524527A (zh) | 一种表格图像文本识别方法及系统 | |
US9396389B2 (en) | Techniques for detecting user-entered check marks | |
US11620842B2 (en) | Automated data extraction and document generation | |
US9805258B2 (en) | Systems and methods for separating documents | |
CN114091876A (zh) | 自动化校验和切割转换银行回单的方法及工具 | |
JP3463008B2 (ja) | 媒体処理方法及び媒体処理装置 | |
CN111241955B (zh) | 一种票据信息提取方法及系统 | |
JP3463009B2 (ja) | 媒体処理方法及び媒体処理装置 | |
CN112348022B (zh) | 一种基于深度学习的自由格式文档识别方法 | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
AU2010291063A1 (en) | Method and apparatus for segmenting images | |
CN115640952B (zh) | 一种数据导入上传的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |