CN107798087A - 数据录入方法、系统、计算机设备及可读存储介质 - Google Patents
数据录入方法、系统、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN107798087A CN107798087A CN201710979562.9A CN201710979562A CN107798087A CN 107798087 A CN107798087 A CN 107798087A CN 201710979562 A CN201710979562 A CN 201710979562A CN 107798087 A CN107798087 A CN 107798087A
- Authority
- CN
- China
- Prior art keywords
- data
- file
- scanning
- scan
- scanned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种数据录入方法、数据录入系统、计算机设备、计算机可读存储介质。其中,数据录入方法包括:从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;确定待扫描文件的扫描维度;对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;比较扫描数据和原始数据库的数据;在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标文件,本发明通过多系统协作的方式,解决了纸质文件单据录入效率的问题以及人工维护导致数据不一致的问题,简化了文件单据数字化的业务流程,减少了人工操作。
Description
技术领域
本发明涉及数据录入技术领域,具体而言,涉及一种数据录入方法、数据录入系统、计算机设备、计算机可读存储介质。
背景技术
在互联网经济的推动下,企业每天都会有海量的数据产生,越来越多的纸质单据需要录入管理系统,以便于复杂业务逻辑处理和深度挖掘分析。在传统的ERP系统中,用户通常是通过手工输入的方式将纸质单据录入到系统,但这种方式效率低且准确度不高,为了准确高效录入纸质单据,ERP系统引入扫描设备代替人工录入,通过扫描设备将纸质单据全部信息扫描到系统,再经过人工核对、修正、验伪等一系列操作之后形成正式电子数据保存到系统。虽然这种方式在一定程度上提高了效率和准确度,但是仍然存在些许不足:(1)为了保证数据完整性,目前采用全票面信息扫描方式对纸质单据进行扫描,识别信息量大,对扫描设备的文字识别性能及传输网络带宽要求极高,普通设备响应速度慢;(2)扫描结果需要人工反复核对修改,对于纸质单据量大的企业来说,人工维护工作量巨大;(3)对于有验伪环节的场景,目前普遍采用实时访问来源系统方式解决,对于目标系统来说响应压力大;(4)纸质单据本身源于其他系统,数据来源系统具有最精确原始数据,反复生产已有数据极易产生数据不统一问题。
因此,如何解决由于系统间信息传送量大引起的扫描服务响应速度慢、由于扫描设备识别性能问题导致的大量非必要人工修正操作以及由于原始数据反复生产,导致的同一数据在多系统不统一成为亟待解决的问题。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明第一个方面在于提出一种数据录入方法。
本发明的第二个方面在于提出一种数据录入系统。
本发明的第三个方面在于提出一种计算机设备。
本发明的第四个方面在于提出一种计算机可读存储介质。
有鉴于此,根据本发明的一个方面,提出了一种数据录入方法,包括:从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;确定待扫描文件的扫描维度;对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;比较扫描数据和原始数据库的数据;在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据。
本发明提供的数据录入方法,从数据源系统中同步原始数据至目标系统,在目标系统中形成了具有原始数据的原始数据库,业务员收到纸质文件单据实际上是数据源系统中电子数据的纸质表现形式,因此,数据源系统具有最精确的原始数据,直接从数据源系统同步电子的原始数据,保证了目标系统中的原始数据库中的数据的准确性。然后确定纸质文件单据的扫描维度,对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据,只是对扫描文件中与扫描维度相关的内容进行了扫描,而不是对扫描文件全部数据扫描,减小了扫描设备需要识别的信息量,减轻了对扫描设备的文字识别性能及传输网络带宽要求,提高了扫描服务的响应速度。比较扫描数据和原始数据库的数据,在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据,直接根据原始数据库中电子的原始数据生成目标文件单据,避免了原始数据反复生产,减小了脏数据产生的可能性,保证了数据的统一性、精确性。
根据本发明的上述数据录入方法,还可以具有以下技术特征:
在上述技术方案中,优选地,从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库,具体包括:定时从数据源系统获取原始数据;将原始数据转换为目标系统所需的数据形式;存储转化后的原始数据,生成原始数据库。
在该技术方案中,从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库过程,具体包括:定时从数据源系统获取原始数据,根据实际业务需求,设定定时时间,以合适的数据传输量进行传输,在保证数据传输速度的基础上,避免了系统间一直处于数据传输状态,减轻了系统负担。然后,在同步过程中,将每一条原始数据转换为目标系统所需的数据形式,保证了原始数据符合目标系统中数据形式。再将转化后的原始数据存储,在目标系统中形成了具有精准原始数据的原始数据库。
在上述任一技术方案中,优选地,确定待处理文件的扫描维度,具体包括:根据待扫描文件的类型确定待扫描数据的核心数据要素;将核心数据要素确定为扫描维度。
在该技术方案中,确定待处理文件的扫描维度的过程,具体包括:根据待扫描文件的类型确定待扫描数据的核心数据要素,文件单据类型不同,文件的核心数据要素不同,将核心数据要素确定为扫描维度,对扫描文件单据的核心数据要素进行扫描,一方面,保证了扫描设备扫描了文件单据最主要的数据信息;另一方面,避免了扫描整个文件单据,减少了扫描设备的识别任务量、降低了对传输网络宽带的要求、提高了扫描服务的响应速度以及系统的易用性。
在上述任一技术方案中,优选地,在扫描数据未匹配到原始数据库的数据信息时,比较扫描数据和数据源系统中原始数据;若原始数据包含扫描数据,根据原始数据添加补充数据至扫描数据,以生成目标数据。
在该技术方案中,在目标系统中对纸质文件单据验伪过程中,也只是用核心数据要素的数据扫描生成的扫描数据和原始数据库的数据信息匹配,减小了目标系统的负担。在扫描数据未匹配到原始数据库的数据信息时,说明此时纸质文件单据有可能是伪文件单据,那么进一步比较扫描数据和数据源系统中原始数据,可以再次进行验伪,保证了验伪的准确性,若原始数据包含扫描数据,说明纸质文件单据不是伪单据,那么根据原始数据获取剩余维度信息添加补充至扫描数据,形成了正式的数据,据此生成目标数据。一方面,对纸质文件单据进行了两次验伪,保证了验伪结果的准确性;另一方面,现将扫描数据匹配目标系统本地的数据库,在本地数据库匹配不到数据信息时,再匹配数据源系统的数据,减少了访问数据源系统的频次,减轻了系统的响应压力。
在上述任一技术方案中,优选地,若原始数据不包含扫描数据,则确认待扫描文件为伪文件。
在该技术方案中,在第二次验伪过程中,若数据源系统中的原始数据不包含扫描数据,则确认待扫描文件为伪文件,实现了对纸质文件单据的验伪功能,避免了伪文件单据对企业造成的损失。
在上述任一技术方案中,优选地,核心数据要素包括但不限于:文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额。
在该技术方案中,根据文件单据类型不同,文件单据的核心数据要素不同,核心数据要素包括文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额,通过上述核心数据要素,确保了文件单据的最主要的数据能够被扫描,能够很好的识别文件单据。
根据本发明的第二个方面,提出了一种数据录入系统,包括:同步单元,用于从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;第一确定单元,用于确定待扫描文件的扫描维度;扫描单元,用于对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;第一比较单元,用于比较扫描数据和原始数据库的数据;生成单元,用于在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据。
本发明提供的数据录入系统,同步单元从数据源系统中同步原始数据至目标系统,在目标系统中形成了具有原始数据的原始数据库,业务员收到纸质文件单据实际上是数据源系统中电子数据的纸质表现形式,因此,数据源系统具有最精确的原始数据,直接从数据源系统同步电子的原始数据,保证了目标系统中的原始数据库中的数据的准确性。然后第一确定单元确定纸质文件单据的扫描维度,扫描单元对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据,只是对扫描文件中与扫描维度相关的内容进行了扫描,而不是对扫描文件全部数据扫描,减小了扫描设备需要识别的信息量,减轻了对扫描设备的文字识别性能及传输网络带宽要求,提高了扫描服务的响应速度。第一比较单元比较扫描数据和原始数据库的数据,生成单元在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据,直接根据原始数据库中电子的原始数据生成目标文件单据,避免了原始数据反复生产,减小了脏数据产生的可能性,保证了数据的统一性、精确性。
根据本发明的上述数据录入系统,还可以具有以下技术特征:
在上述技术方案中,优选地,同步单元具体包括:获取单元,用于定时从数据源系统获取原始数据;转换单元,用于将原始数据转换为目标系统所需的数据形式;存储单元,用于存储转化后的原始数据,生成原始数据库。
在该技术方案中,同步单元从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库过程,具体包括:获取单元定时从数据源系统获取原始数据,根据实际业务需求,设定定时时间,以合适的数据传输量进行传输,在保证数据传输速度的基础上,避免了系统间一直处于数据传输状态,减轻了系统负担。然后,在同步过程中,转换单元将每一条原始数据转换为目标系统所需的数据形式,保证了原始数据符合目标系统中数据形式。存储单元再将转化后的原始数据存储,在目标系统中形成了具有精准原始数据的原始数据库。
在上述任一技术方案中,优选地,第一确定单元具体包括:第一确定子单元,用于根据待扫描文件的类型确定待扫描数据的核心数据要素;第二确定子单元,用于将核心数据要素确定为扫描维度。
在该技术方案中,第一确定单元确定待处理文件的扫描维度的过程,具体包括:第一确定子单元根据待扫描文件的类型确定待扫描数据的核心数据要素,文件单据类型不同,文件的核心数据要素不同,第二确定子单元将核心数据要素确定为扫描维度,对扫描文件单据的核心数据要素进行扫描,一方面,保证了扫描设备扫描了文件单据最主要的数据信息;另一方面,避免了扫描整个文件单据,减少了扫描设备的识别任务量、降低了对传输网络宽带的要求、提高了扫描服务的响应速度以及系统的易用性。
在上述任一技术方案中,优选地,第二比较单元,用于在扫描数据信息未匹配到原始数据库的数据时,比较扫描数据和数据源系统中原始数据;补充单元,用于若原始数据包含扫描数据,根据原始数据添加补充数据至扫描数据,以生成目标数据。
在该技术方案中,在目标系统中对纸质文件单据验伪过程中,也只是用核心数据要素的数据扫描生成的扫描数据和原始数据库的数据信息匹配,减小了目标系统的负担。当扫描数据和原始数据库的数据信息不匹配时,说明此时纸质文件单据有可能是伪文件单据,那么第二比较单元进一步比较扫描数据和数据源系统中原始数据,可以再次进行验伪,保证了验伪的准确性,若原始数据包含扫描数据,说明纸质文件单据不是伪单据,那么根据原始数据获取剩余维度信息添加补充至扫描数据,形成了正式的数据,据此生成目标文件。一方面,对纸质文件单据进行了两次验伪,保证了验伪结果的准确性;另一方面,现将扫描数据匹配目标系统本地的数据库,在本地数据库匹配不到数据信息时,再匹配数据源系统的数据,减少了访问数据源系统的频次,减轻了系统的响应压力。
在上述任一技术方案中,优选地,第二确定单元,用于若原始数据不包含扫描数据,则确认待扫描文件为伪文件。
在该技术方案中,在第二次验伪过程中,若数据源系统中的原始数据不包含扫描数据,则第二确定单元确认待扫描文件为伪文件,实现了对纸质文件单据的验伪功能,避免了伪文件单据对企业造成的损失。
在上述任一技术方案中,优选地,核心数据要素包括但不限于:文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额。
在该技术方案中,根据文件单据类型不同,文件单据的核心数据要素不同,核心数据要素包括文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额,通过上述核心数据要素,确保了文件单据的最主要的数据能够被扫描,能够很好的识别文件单据。
根据本发明的第三个方面,本发明提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;确定待扫描文件的扫描维度;对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;比较扫描数据和原始数据库的数据;在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据。
本发明提供的一种计算机设备,处理器执行计算机程序时实现:从数据源系统中同步原始数据至目标系统,在目标系统中形成了具有原始数据的原始数据库,业务员收到纸质文件单据实际上是数据源系统中电子数据的纸质表现形式,因此,数据源系统具有最精确的原始数据,直接从数据源系统同步电子的原始数据,保证了目标系统中的原始数据库中的数据的准确性。然后确定纸质文件单据的扫描维度,对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据,只是对扫描文件中与扫描维度相关的内容进行了扫描,而不是对扫描文件全部数据扫描,减小了扫描设备需要识别的信息量,减轻了对扫描设备的文字识别性能及传输网络带宽要求,提高了扫描服务的响应速度。比较扫描数据和原始数据库的数据,在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据,直接根据原始数据库中电子的原始数据生成目标文件单据,避免了原始数据反复生产,减小了脏数据产生的可能性,保证了数据的统一性、精确性。
根据本发明的第四个方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;确定待扫描文件的扫描维度;对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;比较扫描数据和原始数据库的数据;在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据。
本发明提供的一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现:从数据源系统中同步原始数据至目标系统,在目标系统中形成了具有原始数据的原始数据库,业务员收到纸质文件单据实际上是数据源系统中电子数据的纸质表现形式,因此,数据源系统具有最精确的原始数据,直接从数据源系统同步电子的原始数据,保证了目标系统中的原始数据库中的数据的准确性。然后确定纸质文件单据的扫描维度,对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据,只是对扫描文件中与扫描维度相关的内容进行了扫描,而不是对扫描文件全部数据扫描,减小了扫描设备需要识别的信息量,减轻了对扫描设备的文字识别性能及传输网络带宽要求,提高了扫描服务的响应速度。比较扫描数据和原始数据库的数据,在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据,直接根据原始数据库中电子的原始数据生成目标文件单据,避免了原始数据反复生产,减小了脏数据产生的可能性,保证了数据的统一性、精确性。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本发明的一个实施例的数据录入方法的流程示意图;
图2示出了本发明的另一个实施例的数据录入方法的流程示意图;
图3示出了本发明的一个实施例的数据录入原理示意图;
图4示出了本发明的一个实施例的数据同步的示意图;
图5示出了本发明的一个具体实施例的生成扫描记录的流程示意图;
图6示出了本发明的一个具体实施例的从国税系统中同步发票电子底账信息至发票管理平台的示意图;
图7示出了本发明的一个具体实施例的生成扫描记录的流程示意图;
图8示出了本发明的一个实施例的数据录入系统的示意框图;
图9示出了本发明的一个实施例的计算机设备的示意框图。
具体实施方式
为了能够更清楚地理解本发明的上述方面、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
本发明第一方面的实施例,提出一种数据录入方法,图1示出了本发明的一个实施例的数据录入方法的流程示意图:
步骤102,从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;
步骤104,确定待扫描文件的扫描维度;
步骤106,对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;
步骤108,比较扫描数据和原始数据库的数据;
步骤110,在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据。
本发明提供的数据录入方法,从数据源系统中同步原始数据至目标系统,在目标系统中形成了具有原始数据的原始数据库,业务员收到纸质文件单据实际上是数据源系统中电子数据的纸质表现形式,因此,数据源系统具有最精确的原始数据,直接从数据源系统同步电子的原始数据,保证了目标系统中的原始数据库中的数据的准确性。然后确定纸质文件单据的扫描维度,对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据,只是对扫描文件中与扫描维度相关的内容进行了扫描,而不是对扫描文件全部数据扫描,减小了扫描设备需要识别的信息量,减轻了对扫描设备的文字识别性能及传输网络带宽要求,提高了扫描服务的响应速度。比较扫描数据和原始数据库的数据,在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据,直接根据原始数据库中电子的原始数据生成目标文件单据,避免了原始数据反复生产,减小了脏数据产生的可能性,保证了数据的统一性、精确性。
图2示出了本发明的另一个实施例的数据录入方法的流程示意图。其中,该方法包括:
步骤202,定时从数据来源系统获取原始数据;
步骤204,将原始数据转换为目标系统所需的数据形式;
步骤206,存储转化后的原始数据,生成原始数据库;
步骤208,根据待扫描文件的类型确定待扫描数据的核心数据要素;
步骤210,将核心数据要素确定为扫描维度;
步骤212,对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;
步骤214,判断扫描数据是否可以匹配到原始数据库中数据,是,则进入步骤216,否,则进入步骤218;
步骤216,根据原始数据库的数据生成目标数据;
步骤218,判断扫描数据是否可以匹配到数据来源系统中原始数据,是,则进入步骤220,否则进入步骤222;
步骤220,根据原始数据添加补充数据至扫描数据,以生成目标数据;
步骤222,确认待扫描文件为伪文件。
其中,核心数据要素包括但不限于:文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额。
在该实施例中,如果目标系统是ERP系统,那么如图3所示的数据录入的原理,通过扫描服务系统、ERP系统、数据来源系统三者的相互协作的方式,解决了纸质文件单据录入效率的问题以及人工维护导致数据一致的问题,简化了文件单据数字化的业务流程,减少了人工操作。
在该实施例中,那么如图4所示,定时从数据来源系统获取原始数据,根据实际业务需求,设定定时时间,以合适的数据传输量进行传输,在保证数据传输速度的基础上,避免了系统间一直处于数据传输状态,减轻了系统负担。然后,在同步过程中,将每一条原始数据转换为ERP系统所需的数据形式,保证了原始数据符合目标系统中数据形式。再将转化后的原始数据存储,在目标系统中形成了具有精准原始数据的原始数据库。
在该实施例中,根据待扫描文件的类型确定待扫描数据的核心数据要素,文件单据类型不同,文件的核心数据要素不同,将核心数据要素确定为扫描维度,对扫描文件单据的核心数据要素进行扫描,一方面,保证了扫描设备扫描了文件单据最主要的数据信息;另一方面,避免了扫描整个文件单据,减少了扫描设备的识别任务量、降低了对传输网络宽带的要求、提高了扫描服务的响应速度以及系统的易用性。
在该实施例中,在目标系统中对纸质文件单据验伪过程中,也只是用核心数据要素的数据扫描生成的扫描数据和原始数据库的数据信息匹配,减小了目标系统的负担。当扫描数据匹配不到原始数据库的数据信息时,说明此时纸质文件单据有可能是伪文件单据,那么进一步匹配扫描数据和数据来源系统中原始数据,可以再次进行验伪,保证了验伪的准确性,若原始数据包含扫描数据,说明纸质文件单据不是伪单据,那么根据原始数据获取剩余维度信息添加补充至扫描数据,形成了正式的数据,据此生成目标文件。一方面,对纸质文件单据进行了两次验伪,保证了验伪结果的准确性;另一方面,现将扫描数据匹配目标系统本地的数据库,在本地数据库匹配不到数据信息时,再匹配数据来源系统的数据,减少了访问数据来源系统的频次,减轻了系统的响应压力。在第二次验伪过程中,若数据来源系统中的原始数据不包含扫描数据,则确认待扫描文件为伪文件,实现了对纸质文件单据的验伪功能,避免了伪文件单据对企业造成的损失。
在该实施例中,根据文件单据类型不同,文件单据的核心数据要素不同,核心数据要素包括文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额,通过上述核心数据要素,确保了文件单据的最主要的数据能够被扫描,能够很好的识别文件单据。
下面结合图5至图7说明本发明的一个具体实施例数据录入过程。
图5示出了该具体实施例中生成扫描记录的步骤流程:
步骤502,业务员拿到纸质企业进项发票;
步骤504,扫描仪扫描识别纸质企业进项发票的7个要素;
步骤506,核对扫描数据与纸质企业进项发票是否一致,如不一致,则进入步骤508,如一致,则进入步骤510;
步骤508,修改扫描数据并保存;
步骤510,生成扫描记录。
在该具体实施例中纸质文件单据是企业进项发票,那么数据来源系统就是国税系统,目标系统是企业的发票管理平台,如图6所示,企业的发票管理平台定时从国税系统中同步发票电子底账信息,形成ERP电子底账库,保证了企业的发票管理平台发票底账信息与国税系统中发票底账信息的一致性。进项发票的核心元素为:发票类型、开票日期、发票号码、发票代码、销货单位名称、无税金额、税额,因此在扫描环节只需扫描这七个元素的形成扫描记录。确保了发票的最主要的数据能够被扫描,能够很好的识别发票。
在生成扫描记录后,如图7所示,由扫描记录生成正式进项发票的步骤过程包括:
步骤702,获取扫描记录;
步骤704,第一次验伪(将扫描记录匹配ERP电子底账);
步骤706,若验伪通过,则拉取底账库信息生成正式发票;
步骤708,若验伪不通过,则进行第二次验伪(将扫描记录匹配国税系统);
步骤710,若验伪通过,则取回剩余信息补全扫描记录数据,生成正式发票;
步骤712,若验伪不通过,则判断该纸质进项发票是伪发票。
在该具体实施例中,对纸质进项发票进行了两次验伪,保证了验伪结果的准确性;另一方面,现将扫描数据匹配ERP系统本地的数据库,在本地数据库匹配不到数据信息时,再匹配国税系统的数据,减少了访问国税系统的频次,减轻了系统的响应压力。在第二次验伪过程中,若扫描记录不匹配国税系统的数据,则确认扫描发票为伪发票,实现了对纸质发票的验伪功能,避免了伪发票对企业造成的损失。
本发明第二方面的实施例,提出一种数据录入系统800,图8示出了本发明的一个实施例的数据录入系统800的示意框图:
同步单元802,用于从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;
第一确定单元804,用于确定待扫描文件的扫描维度;
扫描单元806,用于对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;
第一比较单元808,用于比较扫描数据和原始数据库的数据;
生成单元810,用于在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据;
第二比较单元812,用于在扫描数据信息未匹配到原始数据库的数据时,比较扫描数据和数据源系统中原始数据;
补充单元814,用于若原始数据包含扫描数据,根据原始数据添加补充数据至扫描数据,以生成目标数据;
第二确定单元816,用于若原始数据不包含扫描数据,则确认待扫描文件为伪文件。
同步单元802具体包括:
获取单元8022,用于定时从数据源系统获取原始数据;
转换单元8024,用于将原始数据转换为目标系统所需的数据形式;
存储单元8026,用于存储转化后的原始数据,生成原始数据库。
第一确定单元804具体包括:
第一确定子单元8042,用于根据待扫描文件的类型确定待扫描数据的核心数据要素;
第二确定子单元8044,用于将核心数据要素确定为扫描维度。
本发明提供的数据录入系统800,同步单元802从数据源系统中同步原始数据至目标系统,在目标系统中形成了具有原始数据的原始数据库,业务员收到纸质文件单据实际上是数据源系统中电子数据的纸质表现形式,因此,数据源系统具有最精确的原始数据,直接从数据源系统同步电子的原始数据,保证了目标系统中的原始数据库中的数据的准确性。然后第一确定单元804确定纸质文件单据的扫描维度,扫描单元806对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据,只是对扫描文件中与扫描维度相关的内容进行了扫描,而不是对扫描文件全部数据扫描,减小了扫描设备需要识别的信息量,减轻了对扫描设备的文字识别性能及传输网络带宽要求,提高了扫描服务的响应速度。第一比较单元808比较扫描数据和原始数据库的数据,生成单元810在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据,直接根据原始数据库中电子的原始数据生成目标文件单据,避免了原始数据反复生产,减小了脏数据产生的可能性,保证了数据的统一性、精确性。
在本发明的一个实施例中,优选地,同步单元802具体包括:获取单元8022,用于定时从数据源系统获取原始数据;转换单元8024,用于将原始数据转换为目标系统所需的数据形式;存储单元8026,用于存储转化后的原始数据,生成原始数据库。
在该实施例中,同步单元802从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库过程,具体包括:获取单元8022定时从数据源系统获取原始数据,根据实际业务需求,设定定时时间,以合适的数据传输量进行传输,在保证数据传输速度的基础上,避免了系统间一直处于数据传输状态,减轻了系统负担。然后,在同步过程中,转换单元8024将每一条原始数据转换为目标系统所需的数据形式,保证了原始数据符合目标系统中数据形式。存储单元8026再将转化后的原始数据存储,在目标系统中形成了具有精准原始数据的原始数据库。
在本发明的一个实施例中,优选地,第一确定单元804具体包括:第一确定子单元8042,用于根据待扫描文件的类型确定待扫描数据的核心数据要素;第二确定子单元8044,用于将核心数据要素确定为扫描维度。
在该实施例中,第一确定单元804确定待处理文件的扫描维度的过程,具体包括:第一确定子单元8042根据待扫描文件的类型确定待扫描数据的核心数据要素,文件单据类型不同,文件的核心数据要素不同,第二确定子单元8044将核心数据要素确定为扫描维度,对扫描文件单据的核心数据要素进行扫描,一方面,保证了扫描设备扫描了文件单据最主要的数据信息;另一方面,避免了扫描整个文件单据,减少了扫描设备的识别任务量、降低了对传输网络宽带的要求、提高了扫描服务的响应速度以及系统的易用性。
在本发明的一个实施例中,优选地,第二比较单元812,用于在扫描数据信息未匹配到原始数据库的数据时,比较扫描数据和数据源系统中原始数据;补充单元814,用于若原始数据包含扫描数据,根据原始数据添加补充数据至扫描数据,以生成目标数据。
在该实施例中,在目标系统中对纸质文件单据验伪过程中,也只是用核心数据要素的数据扫描生成的扫描数据和原始数据库的数据信息匹配,减小了目标系统的负担。当扫描数据未匹配到原始数据库的数据信息时,说明此时纸质文件单据有可能是伪文件单据,那么第二比较单元812进一步比较扫描数据和数据源系统中原始数据,可以再次进行验伪,保证了验伪的准确性,若原始数据包含扫描数据,说明纸质文件单据不是伪单据,那么补充单元814根据原始数据获取剩余维度信息添加补充至扫描数据,形成了正式的数据,据此生成目标数据。一方面,对纸质文件单据进行了两次验伪,保证了验伪结果的准确性;另一方面,现将扫描数据匹配目标系统本地的数据库,在本地数据库匹配不到数据信息时,再匹配数据源系统的数据,减少了访问数据源系统的频次,减轻了系统的响应压力。
在本发明的一个实施例中,优选地,第二确定单元816,用于若原始数据不包含扫描数据,则确认待扫描文件为伪文件。
在该实施例中,在第二次验伪过程中,若数据源系统中的原始数据不包含扫描数据,则第二确定单元816确认待扫描文件为伪文件,实现了对纸质文件单据的验伪功能,避免了伪文件单据对企业造成的损失。
在本发明的一个实施例中,优选地,核心数据要素包括但不限于:文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额。
在该实施例中,根据文件单据类型不同,文件单据的核心数据要素不同,核心数据要素包括文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额,通过上述核心数据要素,确保了文件单据的最主要的数据能够被扫描,能够很好的识别文件单据。
本发明第三方面的实施例,提出一种计算机设备,图9示出了本发明的一个实施例的计算机设备900的示意框图。其中,该计算机设备900包括:
存储器902、处理器904及存储在存储器902上并可在处理器904上运行的计算机程序,处理器904执行计算机程序时实现以下步骤:从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;确定待扫描文件的扫描维度;对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;比较扫描数据和原始数据库的数据;在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据。
本发明提供的一种计算机设备900,处理器904执行计算机程序时实现:从数据源系统中同步原始数据至目标系统,在目标系统中形成了具有原始数据的原始数据库,业务员收到纸质文件单据实际上是数据源系统中电子数据的纸质表现形式,因此,数据源系统具有最精确的原始数据,直接从数据源系统同步电子的原始数据,保证了目标系统中的原始数据库中的数据的准确性。然后确定纸质文件单据的扫描维度,对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据,只是对扫描文件中与扫描维度相关的内容进行了扫描,而不是对扫描文件全部数据扫描,减小了扫描设备需要识别的信息量,减轻了对扫描设备的文字识别性能及传输网络带宽要求,提高了扫描服务的响应速度。比较扫描数据和原始数据库的数据,在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据,直接根据原始数据库中电子的原始数据生成目标文件单据,避免了原始数据反复生产,减小了脏数据产生的可能性,保证了数据的统一性、精确性。
本发明第四方面的实施例,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:从数据源系统中同步原始数据至目标系统,以形成目标系统的原始数据库;确定待扫描文件的扫描维度;对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据;比较扫描数据和原始数据库的数据;在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据。
本发明提供的一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现:从数据源系统中同步原始数据至目标系统,在目标系统中形成了具有原始数据的原始数据库,业务员收到纸质文件单据实际上是数据源系统中电子数据的纸质表现形式,因此,数据源系统具有最精确的原始数据,直接从数据源系统同步电子的原始数据,保证了目标系统中的原始数据库中的数据的准确性。然后确定纸质文件单据的扫描维度,对扫描文件中与扫描维度相关的内容进行扫描,生成扫描数据,只是对扫描文件中与扫描维度相关的内容进行了扫描,而不是对扫描文件全部数据扫描,减小了扫描设备需要识别的信息量,减轻了对扫描设备的文字识别性能及传输网络带宽要求,提高了扫描服务的响应速度。比较扫描数据和原始数据库的数据,在扫描数据匹配到原始数据库的数据时,根据原始数据库的数据生成目标数据,直接根据原始数据库中电子的原始数据生成目标文件单据,避免了原始数据反复生产,减小了脏数据产生的可能性,保证了数据的统一性、精确性。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (14)
1.一种数据录入方法,其特征在于,包括:
从数据源系统中同步原始数据至目标系统,以形成所述目标系统的原始数据库;
确定待扫描文件的扫描维度;
对所述扫描文件中与所述扫描维度相关的内容进行扫描,生成扫描数据;
比较所述扫描数据和所述原始数据库的数据;
在所述扫描数据匹配到所述原始数据库的数据时,根据所述原始数据库的数据生成目标数据。
2.根据权利要求1所述的数据录入方法,其特征在于,所述从数据源系统中同步原始数据至目标系统,以形成所述目标系统的原始数据库,具体包括:
定时从所述数据源系统获取所述原始数据;
将所述原始数据转换为所述目标系统所需的数据形式;
存储转化后的所述原始数据,生成所述原始数据库。
3.根据权利要求1所述的数据录入方法,其特征在于,所述确定待处理文件的扫描维度,具体包括:
根据所述待扫描文件的类型确定待扫描数据的核心数据要素;
将所述核心数据要素确定为所述扫描维度。
4.根据权利要求1中所述的数据录入方法,其特征在于,还包括:
在所述扫描数据未匹配到所述原始数据库中的数据时,比较所述扫描数据和所述数据源系统中所述原始数据;
若所述原始数据包含所述扫描数据,根据所述原始数据添加补充数据至所述扫描数据,以生成所述目标数据。
5.根据权利要求4所述的数据录入方法,其特征在于,还包括:
若所述原始数据不包含所述扫描数据,则确认所述待扫描文件为伪文件。
6.根据权利要求1至5中任一项所述的数据录入方法,其特征在于,
所述核心数据要素包括但不限于:文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额。
7.一种数据录入系统,其特征在于,包括:
同步单元,用于从数据源系统中同步原始数据至目标系统,以形成所述目标系统的原始数据库;
第一确定单元,用于确定待扫描文件的扫描维度;
扫描单元,用于对所述扫描文件中与所述扫描维度相关的内容进行扫描,生成扫描数据;
第一比较单元,用于比较所述扫描数据和所述原始数据库的数据;
生成单元,用于在所述扫描数据匹配到所述原始数据库的数据时,根据所述原始数据库的数据生成目标数据。
8.根据权利要求7所述的数据录入系统,其特征在于,所述同步单元具体包括:
获取单元,用于定时从所述数据源系统获取所述原始数据;
转换单元,用于将所述原始数据转换为所述目标系统所需的数据形式;
存储单元,用于存储转化后的所述原始数据,生成所述原始数据库。
9.根据权利要求7所述的数据录入系统,其特征在于,所述第一确定单元具体包括:
第一确定子单元,用于根据所述待扫描文件的类型确定待扫描数据的核心数据要素;
第二确定子单元,用于将所述核心数据要素确定为所述扫描维度。
10.根据权利要求7所述的数据录入系统,其特征在于,还包括:
第二比较单元,用于在所述扫描数据未匹配到所述原始数据库中的数据时,比较所述扫描数据和所述数据源系统中所述原始数据;
补充单元,用于若所述原始数据包含所述扫描数据,根据所述原始数据添加补充数据至所述扫描数据,以生成所述目标数据。
11.根据权利要求10所述的数据录入系统,其特征在于,还包括:
第二确定单元,用于若所述原始数据不包含所述扫描数据,则确认所述待扫描文件为伪文件。
12.根据权利要求7至11中任一项所述的数据录入系统,其特征在于,
所述核心数据要素包括但不限于:文件类型、文件编码、文件生成日期、文件涉及单位名称、文件涉及费用金额。
13.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述数据录入方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述数据录入方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710979562.9A CN107798087B (zh) | 2017-10-19 | 2017-10-19 | 数据录入方法、系统、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710979562.9A CN107798087B (zh) | 2017-10-19 | 2017-10-19 | 数据录入方法、系统、计算机设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107798087A true CN107798087A (zh) | 2018-03-13 |
CN107798087B CN107798087B (zh) | 2020-05-15 |
Family
ID=61533462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710979562.9A Active CN107798087B (zh) | 2017-10-19 | 2017-10-19 | 数据录入方法、系统、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107798087B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563618A (zh) * | 2018-03-15 | 2018-09-21 | 链家网(北京)科技有限公司 | 一种纸质文件线上化方法和系统 |
CN108985299A (zh) * | 2018-06-29 | 2018-12-11 | 海南纽康信息系统有限公司 | 一种基于个人信息安全的互联网数据入力方法及系统 |
CN109460544A (zh) * | 2018-10-26 | 2019-03-12 | 长沙通诺信息科技有限责任公司 | 电子表单生成方法及装置、计算机设备及存储介质 |
CN109754293A (zh) * | 2018-12-29 | 2019-05-14 | 航天信息股份有限公司 | 一种基于定时器和cxf客户端的自动推送发票方法 |
CN109859023A (zh) * | 2018-12-29 | 2019-06-07 | 航天信息股份有限公司 | 一种基于定时器的自动同步和查验发票的方法 |
CN114969377A (zh) * | 2022-06-17 | 2022-08-30 | 南京木米数据科技有限公司 | 一种基于信息图谱的信息匹配系统及其方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005049992A (ja) * | 2003-07-30 | 2005-02-24 | Canon Inc | 情報処理装置およびその方法 |
CN101814168A (zh) * | 2010-04-12 | 2010-08-25 | 福建伊时代信息科技股份有限公司 | 图像数据的动态交互式管理系统及方法 |
CN102289770A (zh) * | 2010-06-19 | 2011-12-21 | 梁军 | 增值税专用发票网上实时防伪和税控的方法 |
CN102654874A (zh) * | 2011-03-02 | 2012-09-05 | 顾菊林 | 单据数据管理方法及系统 |
CN104992495A (zh) * | 2015-07-09 | 2015-10-21 | 胡昭 | 云智能发票查验自助终端及基于其的查验系统和方法 |
-
2017
- 2017-10-19 CN CN201710979562.9A patent/CN107798087B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005049992A (ja) * | 2003-07-30 | 2005-02-24 | Canon Inc | 情報処理装置およびその方法 |
CN101814168A (zh) * | 2010-04-12 | 2010-08-25 | 福建伊时代信息科技股份有限公司 | 图像数据的动态交互式管理系统及方法 |
CN102289770A (zh) * | 2010-06-19 | 2011-12-21 | 梁军 | 增值税专用发票网上实时防伪和税控的方法 |
CN102654874A (zh) * | 2011-03-02 | 2012-09-05 | 顾菊林 | 单据数据管理方法及系统 |
CN104992495A (zh) * | 2015-07-09 | 2015-10-21 | 胡昭 | 云智能发票查验自助终端及基于其的查验系统和方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563618A (zh) * | 2018-03-15 | 2018-09-21 | 链家网(北京)科技有限公司 | 一种纸质文件线上化方法和系统 |
CN108985299A (zh) * | 2018-06-29 | 2018-12-11 | 海南纽康信息系统有限公司 | 一种基于个人信息安全的互联网数据入力方法及系统 |
CN109460544A (zh) * | 2018-10-26 | 2019-03-12 | 长沙通诺信息科技有限责任公司 | 电子表单生成方法及装置、计算机设备及存储介质 |
CN109754293A (zh) * | 2018-12-29 | 2019-05-14 | 航天信息股份有限公司 | 一种基于定时器和cxf客户端的自动推送发票方法 |
CN109859023A (zh) * | 2018-12-29 | 2019-06-07 | 航天信息股份有限公司 | 一种基于定时器的自动同步和查验发票的方法 |
CN114969377A (zh) * | 2022-06-17 | 2022-08-30 | 南京木米数据科技有限公司 | 一种基于信息图谱的信息匹配系统及其方法 |
CN114969377B (zh) * | 2022-06-17 | 2023-05-30 | 南京橙时数据科技有限公司 | 一种基于信息图谱的信息匹配系统及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107798087B (zh) | 2020-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107798087A (zh) | 数据录入方法、系统、计算机设备及可读存储介质 | |
US10402163B2 (en) | Intelligent data extraction | |
CN109858453B (zh) | 一种通用的多引擎票据识别系统及方法 | |
US7779345B2 (en) | Reverse mapping method and apparatus for form filling | |
CN110473078A (zh) | 发票开具中的信息处理方法、装置、网关服务器和介质 | |
CN114862540B (zh) | 一种票据审核系统及其方法 | |
CN106294125B (zh) | 银行核心系统数据处理方法 | |
CN109087155A (zh) | 一种发票管理的方法和设备 | |
CN110188336B (zh) | 一种基于oa申请单生成报销单的方法和装置 | |
CN108255442A (zh) | 一种电子发票查验打印系统及方法 | |
CN109658050A (zh) | 一种工资报告的管理方法及设备 | |
CN110516020A (zh) | 一种基于数字城市地理空间框架的国土资源档案管理系统 | |
CN115017272A (zh) | 基于登记数据的智能核验方法及装置 | |
CN114861623A (zh) | 协议模板的生成方法、装置、电子设备以及存储介质 | |
CN112308727A (zh) | 保险理赔业务处理方法及装置 | |
CN114266539A (zh) | 文件流程处理方法、系统、装置及计算机可读存储介质 | |
CN110598007A (zh) | 账单文件处理方法、装置、介质及电子设备 | |
CN110378886A (zh) | 图像比对方法、图像比对装置、电子设备和介质 | |
CN114219507A (zh) | 中药供应商的资质审核方法、装置、电子设备及存储介质 | |
KR101841929B1 (ko) | 머클트리 구조를 사용하여, 문서를 오프라인으로 발행하며 발행된 오프라인 문서에 대한 인증을 수행하는 방법 및 이를 이용한 서버 | |
CN109727138B (zh) | 基于置信度的凭证匹配方法及系统 | |
US20060123236A1 (en) | Image data registration method and apparatus and image data verification method and apparatus | |
US7873834B2 (en) | Image forming apparatus, storage medium storing program for acquiring time stamp, digital data management system, and method for acquiring time stamp | |
CN109919573A (zh) | 数据处理方法、装置及计算机设备 | |
CN115705678A (zh) | 一种图像数据处理方法、计算机设备以及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |