CN109783450B - 一种数据处理方法和装置、以及计算机设备 - Google Patents

一种数据处理方法和装置、以及计算机设备 Download PDF

Info

Publication number
CN109783450B
CN109783450B CN201811536852.7A CN201811536852A CN109783450B CN 109783450 B CN109783450 B CN 109783450B CN 201811536852 A CN201811536852 A CN 201811536852A CN 109783450 B CN109783450 B CN 109783450B
Authority
CN
China
Prior art keywords
data
source
target
input file
target source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811536852.7A
Other languages
English (en)
Other versions
CN109783450A (zh
Inventor
王小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201811536852.7A priority Critical patent/CN109783450B/zh
Publication of CN109783450A publication Critical patent/CN109783450A/zh
Application granted granted Critical
Publication of CN109783450B publication Critical patent/CN109783450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供了一种数据处理方法和装置、以及计算机设备。一方面,本发明实施例通过获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件;根据预设校验规则分别生成每个录入文件对应的校验数据,得到多个校验数据;比对多个校验数据;在多个校验数据不全部相同的情况下,在多个数据来源中选择目标来源,并向目标来源发送提示信息,其中,提示信息用于指示目标来源基于资料再次提供录入文件。解决了现有技术中相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题,进而达到了提高核对数据方法的效率和准确率的技术效果。

Description

一种数据处理方法和装置、以及计算机设备
【技术领域】
本发明涉及数据处理领域,尤其涉及一种数据处理方法和装置、以及计算机设备。
【背景技术】
目前,大部分企事业单位中都存在大量的纸质文件,例如,凭证、档案等等,为了便于保存和调阅,通常需要将纸质文件中的数据输入到电脑中,以电子文档的形式保存。现如今,大部分企事业单位的数据录入工作通常是人工完成的,这种数据录入方法费时费力,并且容易出错,在人工核对数据时,也容易漏过错误的内容。此外,在一些情况下,还会采用扫描图片并对图片中的文字内容进行识别,但是这种方式需要文字内容清晰,错误率较高,也需要人工去进行核对,对于手写的纸质文件,机器也较难识别。为了减轻企业的人工负担,这类数据录入工作通常会外包给其它专门从事数据录入工作的公司或个人,但是,数据录入的准确率又无法保证,还需要再进行人工核对的工作。
针对相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题,目前尚未提出有效的解决方案。
【发明内容】
有鉴于此,本发明实施例提供了一种数据处理方法和装置、以及计算机设备,用以解决现有技术中相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题。
一方面,本发明实施例提供了一种数据处理方法,包括:获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件;根据预设校验规则分别生成每个录入文件对应的校验数据,得到多个校验数据;比对多个校验数据;在多个校验数据不全部相同的情况下,在多个数据来源中选择目标来源,并向目标来源发送提示信息,其中,提示信息用于指示目标来源基于资料再次提供录入文件。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源包括第一数据来源的情况下,获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件,包括:获取第一数据来源发送的账号登录信息;对账号登录信息进行验证;在验证成功的情况下,接收第一数据来源针对资料提供的录入文件。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源中还包括第二数据来源的情况下,获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件,还包括:在接收第一数据来源基于资料提供的录入文件之后,向第二数据来源发送任务信息,其中,任务信息用于指示第二数据来源基于资料提供录入文件;接收第二数据来源针对资料提供的录入文件。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,接收第一数据来源针对资料提供的录入文件,包括:向第一数据来源提供以图像形式承载的资料;获取第一数据来源提供的录入文件。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在录入文件包括多项数据的情况下,在多个数据来源中选择目标来源,并向目标来源发送提示信息,包括:分别判断每个录入文件中的每一项数据是否满足对应的预设条件;将多项数据中目标项数据不满足预设条件的录入文件对应的数据来源确定为目标来源;向目标来源发送提示信息,其中,提示信息用于提示目标来源针对目标项数据重新提供数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源中选择目标来源,包括:获取每个数据来源的历史错误率;将历史错误率高于目标阈值的数据来源确定为目标来源。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源超过两个的情况下,在多个数据来源中选择目标来源,包括:在多个校验数据中确定与其它校验数据均不相同的校验数据,将其对应的录入文件的数据来源作为目标来源。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源为两个的情况下,向目标来源发送提示信息之后,该方法还包括:获取目标来源再次提供的录入文件;比对目标来源再次提供的录入文件与另一个数据来源提供的录入文件是否相同;在不相同的情况下,向另一个数据来源发送提示信息。
另一方面,本发明实施例提供了一种数据处理装置,包括:获取单元,用于获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件;生成单元,用于根据预设校验规则分别生成每个录入文件对应的校验数据,得到多个校验数据;比对单元,用于比对多个校验数据;执行单元,用于在多个校验数据不全部相同的情况下,在多个数据来源中选择目标来源,并向目标来源发送提示信息,其中,提示信息用于指示目标来源基于资料再次提供录入文件。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源包括第一数据来源的情况下,获取单元包括:第一获取模块,用于获取第一数据来源发送的账号登录信息;验证模块,用于对账号登录信息进行验证;第一接收模块,用于在验证成功的情况下,接收第一数据来源针对资料提供的录入文件。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源中还包括第二数据来源的情况下,获取单元还包括:第一发送模块,用于在接收第一数据来源基于资料提供的录入文件之后,向第二数据来源发送任务信息,其中,任务信息用于指示第二数据来源基于资料提供录入文件;第二接收模块,用于接收第二数据来源针对资料提供的录入文件。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,第一接收模块包括:第二发送模块,用于向第一数据来源提供以图像形式承载的资料;第二获取模块,用于获取第一数据来源提供的录入文件。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在录入文件包括多项数据的情况下,执行单元包括:第一判断模块,用于分别判断每个录入文件中的每一项数据是否满足对应的预设条件;第一确定模块,用于将多项数据中目标项数据不满足预设条件的录入文件对应的数据来源确定为目标来源;第三发送模块,用于向目标来源发送提示信息,其中,提示信息用于提示目标来源针对目标项数据重新提供数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,执行单元包括:第三获取模块,用于获取每个数据来源的历史错误率;第二确定模块,用于将历史错误率高于目标阈值的数据来源确定为目标来源。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源超过两个的情况下,执行单元包括:第三确定模块,用于在多个校验数据中确定与其它校验数据均不相同的校验数据,将其对应的录入文件的数据来源作为目标来源。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在多个数据来源为两个的情况下,该装置还包括:第四获取模块,用于在向目标来源发送提示信息之后,获取目标来源再次提供的录入文件;比对模块,用于比对目标来源再次提供的录入文件与另一个数据来源提供的录入文件是否相同;第四发送模块,用于在不相同的情况下,向另一个数据来源发送提示信息。
另一方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现上述任意一项的数据处理方法。
再一方面,本发明实施例提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本发明的数据处理方法。
上述任一技术方案中具有如下有益效果:
通过对多个数据来源基于相同的资料提供的数据进行比对,利用机器核对代替人工核对,并采用校验规则处理文件,利用校验数据的比对替代录入文件的全文比对,提高了核对效率和核对准确率,并且,如果多个数据来源提供的录入文件相同,则数据准确的概率较大,提高了获取的数据的准确率,从而解决了相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例所提供的一种可选的数据处理方法的流程示意图;
图2是本发明实施例所提供的一种可选的数据处理装置的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
需要说明的是,尽管在本发明的权利要求书、说明书和附图中可能采用术语第一、第二、第三等来用于区别类似的对象XXX,应当理解,术语第一、第二、第三等不必用于描述特定的顺序或先后次序,仅用来将这些类似的对象XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
针对现有技术中所存在的相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题,本发明实施例提供了如下解决思路:获取多个数据来源中每个数据来源基于相同的资料提供的数据,得到多个录入文件;比对多个录入文件;在多个录入文件不全部相同的情况下,基于比对结果在多个数据来源中选择目标来源,并向目标来源发送提示信息,其中,提示信息用于指示目标来源基于资料再次提供数据。
在该思路的引导下,本方案实施例提供了以下可行的实施方案。
本发明实施例提供了一种数据处理方法。
具体的,请参考图1,其为本发明实施例所提供的一种可选的数据处理方法的流程示意图,如图1所示,该方法包括以下步骤:
步骤101,获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件;
步骤102,根据预设校验规则分别生成每个录入文件对应的校验数据,得到多个校验数据;
步骤103,比对多个校验数据;
步骤104,在多个校验数据不全部相同的情况下,在多个数据来源中选择目标来源,并向目标来源发送提示信息,其中,提示信息用于指示目标来源基于资料再次提供录入文件。
每个数据来源可以是对应于一个终端,或者一个用户账号,或者一种录入信息的方式。每个数据来源可以与本发明实施例的执行方通过任意的通讯方式通讯,以对应的通讯方式将文件传输至本发明实施例的执行方,使得本发明实施例的执行方获得对应的数据来源提供的文件。
例如,接收录入员A(多个数据来源之一)和录入员B(多个数据来源之一)基于同一份纸质凭证(相同的资料)录入数据,得到两个待比对的录入文件,将两份录入文件进行比对,如果两份录入文件相同,则说明录入员A和录入员B录入的数据有较高的概率是正确的,进而可以将录入的数据存储起来,如果两份录入文件不相同,则说明录入员A和/或录入员B录入的数据有可能是错误的,通知A和/或B重新录入数据。
具体的,在比对录入文件时,比对全部内容耗时较长,因此,根据预设校验规则对每个录入文件进行处理,得到每个录入文件对应的校验数据。举例而言,预设校验规则可以是一种加密算法,可以是非对称加密算法或对称加密算法,例如,哈希算法、高级加密算法、md5加密算法等等,本发明实施例对此不做具体限定。
需要说明的是,预设校验规则需要使得处理之后的文本或数据得到一个较短的校验数据、且不相同的文本或数据生成的校验数据不同。进而,可以通过比对多个数据来源的校验数据是否相同来确定录入文件是否相同。如果校验数据相同,则说明录入文件是相同的。而如果校验数据不同,则说明录入文件不同,此时可以再更细节的对录入文件中的每一项数据进行逐项比对,逐项判断多个数据来源提供的数据是否相同。
例如,录入文件中包括“公司名称”、“商品名称”、“商品单价”、“商品数量”等多个字段的记录,在进行比对时,先对每个数据来源提供的录入文件采用同一方法进行加密处理,每个录入文件得到一个对应的密文数据,比对多个数据来源的密文数据是否相同。如果不同,再对多个字段逐项比对,以比对“公司名称”为例,判断多个数据来源的录入文件中对“公司名称”这一字段所提供的数据是否全部相同。
这种处理方法节约了系统资源,提高了比对的效率,仅在必要时进行逐项数据的比对。
通过对多个数据来源基于相同的资料提供的数据进行比对,利用机器核对代替人工核对,并采用校验规则处理文件,利用校验数据的比对替代录入文件的全文比对,提高了核对效率和核对准确率,并且,如果多个数据来源提供的录入文件相同,则数据准确的概率较大,提高了获取的数据的准确率,从而解决了相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题。
可选的,为了保证数据的可靠性,还可以通过验证登录账号的方式来验证数据来源的身份,只有在身份验证成功的情况下,才接收对应的数据来源提供的文件,其中,以多个数据来源中的第一数据来源为例,举例说明步骤101获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件的过程,具体可以包括如下步骤:
步骤201,获取第一数据来源发送的账号登录信息;
步骤202,对账号登录信息进行验证;
步骤203,在验证成功的情况下,接收第一数据来源基于资料提供的录入文件。
由于多个数据来源的数据可以是分别获取而非同时获取的,作为一种可选的实施方式,可以在接收到一个数据来源提供的数据之后,向另一个数据来源请求提供针对相同的资料录入的文件,具体的,在该可选实施方式的技术方案中,步骤101获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件还包括:
步骤301,在接收第一数据来源基于资料提供的录入文件之后,向第二数据来源发送任务信息,其中,任务信息用于指示第二数据来源基于资料提供录入文件;
步骤302,接收第二数据来源针对资料提供的数据。
例如,在接收到第一数据来源提供的录入文件之后,为了核对第一数据来源提供数据的准确性,向第二数据来源派发任务,以指示第二数据来源基于相同的资料提供录入文件,在第二数据来源提供录入文件之后,将第一数据来源和第二数据来源提供的录入文件进行比对。
可选的,本发明实施例中所述的资料可以是以电子图像的形式派发给多个数据来源,多个数据来源可以基于图像的内容输入数据,该可选的实施方式中,步骤302接收第一数据来源针对资料提供的录入文件包括如下步骤:
步骤401,向第一数据来源提供以图像形式承载的资料;
步骤402,获取第一数据来源提供的录入文件。
例如,为了获取一份纸质凭证上资料的电子数据,在对第一终端(第一数据来源)发送的账号登录信息验证成功的情况下,向第一终端发送纸质凭证的照片(以图像形式承载的资料),录入员A可以通过第一终端查看纸质凭证的照片,并基于照片输入数据。
在资料包括多项的情况下,每个数据来源提供的录入文件也相应的为多项数据,在多个数据来源中选取需要通知的目标来源时,可以对录入文件逐项判断,分别判断每个录入文件中的每项数据是否满足对应项的预设条件,如果判断出一个录入文件中的某一项(目标项)数据不满足预设条件,则将该录入文件对应的数据来源确定为目标来源,并提示目标来源针对目标项数据重新提供数据。
例如,如果目标项“商品单价”的预设条件为数值小于N,在多个数据来源对“商品单价”提供的录入文件不一致的情况下,分别判断每项数据是否符合对应项的规则,如果判断出一个数据来源对“商品单价”提供的数据的数值大于N,则向该数据来源发送提示信息,提示其重新提供针对“商品单价”这一项录入的数据。
可选的,选择目标来源的方法还可以是基于每个数据来源的错误概率,具体而言,步骤103基于比对结果在多个数据来源中选择目标来源可以包括如下步骤:
步骤501,获取每个数据来源的历史错误率;
步骤502,将历史错误率高于目标阈值的数据来源确定为目标来源。
需要说明的是,上述的实施方式可以是采用对比多个数据来源的历史错误率来实现,例如,第一数据来源的历史错误率为x,第二数据来源的历史错误率为y,且x<y,则目标阈值可以认为是被配置为x,也即,将第二数据来源确定为目标来源。
可选的,在多个数据来源超过两个的情况下,在多个校验数据中确定与其它校验数据均不相同的校验数据,将其对应的录入文件的数据来源作为目标来源,也即,如果多个录入文件中存在相同的录入文件,则确定多个数据来源中提供不相同的录入文件的数据来源为目标来源。
例如,如果第一数据来源和第二数据来源提供的录入文件为A,而第三数据来源提供的录入文件为B,则确定第三数据来源为目标来源。
可选的,在多个数据来源为两个的情况下,由于无法确定两个数据来源中哪一个数据来源提供的数据是错误的,因此,在通过上述任意一种方式或其他方式选择一个数据来源作为目标来源之后,如果获取到目标来源再次提供的数据仍与另一个数据来源提供的录入文件不相同,则认为可能是另一个数据来源提供的数据错误,因此,向另一个数据来源发送提示信息。
需要说明的是,上述各个可选的实施方式可以以任意的方式进行结合,以适应不同的应用场景。下面结合上述提供的实施方式描述一种应用场景如下:
在本应用场景下,需要录入包括多项资料的一份纸质凭证。在获取到第一数据来源基于纸质凭证的照片录入的文件之后,向第二数据来源发送任务信息,以指示第二数据来源基于纸质凭证的照片录入文件。进而,在接收到第二数据来源提供的录入文件之后,将两个数据来源提供的数据逐项比对。如果判断出两个数据来源对某一项数据提供的具体内容不一致,则获取两个数据来源的历史错误率。如果第一数据来源的历史错误率低于第二数据来源的历史错误率,则向第二数据来源发送提示信息,以提示第二数据来源再次输入对应项数据的内容。在第二数据来源再次提供了对应项的数据内容之后,与第一数据来源提供的资料进行比对,如果仍不一致,则确定可能是第一数据来源提供的数据错误,向第一数据来源发送提示信息,并接收第一数据来源再次提供的数据。重复上述步骤直至两个数据来源提供的数据完全一致,至此,确定两个数据来源提供的数据均是正确的,存储任一数据来源提供的数据。
需要说明的是,步骤101~步骤103的执行主体可以为数据处理装置,该装置可以位于本地终端的应用,或者还可以为位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,本发明实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的应用程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本发明实施例对此不进行限定。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer,PC)、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
本发明实施例的数据处理方法至少具有以下有益效果:
通过对多个数据来源基于相同的资料提供的数据进行比对,利用机器核对代替人工核对,并采用校验规则处理文件,利用校验数据的比对替代录入文件的全文比对,提高了核对效率和核对准确率,并且,如果多个数据来源提供的录入文件相同,则数据准确的概率较大,提高了获取的数据的准确率,从而解决了相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题。
基于本发明实施例所提供的数据处理方法,本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
请参考图2,其为本发明实施例所提供的一种可选的数据处理装置的功能方块图。如图2所示,该装置包括获取单元10,生成单元20,比对单元30和执行单元40。
其中,获取单元用于获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件;生成单元用于根据预设校验规则分别生成每个录入文件对应的校验数据,得到多个校验数据;比对单元用于比对多个校验数据;执行单元用于在多个校验数据不全部相同的情况下,在多个数据来源中选择目标来源,并向目标来源发送提示信息,其中,提示信息用于指示目标来源基于资料再次提供录入文件。
可选的,在多个数据来源包括第一数据来源的情况下,获取单元包括:第一获取模块,用于获取第一数据来源发送的账号登录信息;验证模块,用于对账号登录信息进行验证;第一接收模块,用于在验证成功的情况下,接收第一数据来源针对资料提供的录入文件。
可选的,在多个数据来源中还包括第二数据来源的情况下,获取单元还包括:第一发送模块,用于在接收第一数据来源基于资料提供的录入文件之后,向第二数据来源发送任务信息,其中,任务信息用于指示第二数据来源基于资料提供录入文件;第二接收模块,用于接收第二数据来源针对资料提供的录入文件。
可选的,第一接收模块包括:第二发送模块,用于向第一数据来源提供以图像形式承载的资料;第二获取模块,用于获取第一数据来源提供的录入文件。
可选的,在录入文件包括多项数据的情况下,执行单元包括:第一判断模块,用于分别判断每个录入文件中的每一项数据是否满足对应的预设条件;第一确定模块,用于将多项数据中目标项数据不满足预设条件的录入文件对应的数据来源确定为目标来源;第三发送模块,用于向目标来源发送提示信息,其中,提示信息用于提示目标来源针对目标项数据重新提供数据。
可选的,执行单元包括:第三获取模块,用于获取每个数据来源的历史错误率;第二确定模块,用于将历史错误率高于目标阈值的数据来源确定为目标来源。
可选的,在多个数据来源超过两个的情况下,执行单元包括:第三确定模块,用于在多个校验数据中确定与其它校验数据均不相同的校验数据,将其对应的录入文件的数据来源作为目标来源。
可选的,在多个数据来源为两个的情况下,该装置还包括:第四获取模块,用于在向目标来源发送提示信息之后,获取目标来源再次提供的录入文件;比对模块,用于比对目标来源再次提供的录入文件与另一个数据来源提供的录入文件是否相同;第四发送模块,用于在不相同的情况下,向另一个数据来源发送提示信息。
本发明实施例的数据处理装置至少具有以下有益效果:
通过对多个数据来源基于相同的资料提供的数据进行比对,利用机器核对代替人工核对,并采用校验规则处理文件,利用校验数据的比对替代录入文件的全文比对,提高了核对效率和核对准确率,并且,如果多个数据来源提供的录入文件相同,则数据准确的概率较大,提高了获取的数据的准确率,从而解决了相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例还提供了一种计算机设备,本发明实施例提供的计算机设备包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现前述任一项的数据处理方法。
本发明实施例的计算机设备至少具有以下有益效果:
通过对多个数据来源基于相同的资料提供的数据进行比对,利用机器核对代替人工核对,并采用校验规则处理文件,利用校验数据的比对替代录入文件的全文比对,提高了核对效率和核对准确率,并且,如果多个数据来源提供的录入文件相同,则数据准确的概率较大,提高了获取的数据的准确率,从而解决了相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题。
本发明实施例还提供了一种存储介质,本发明实施例的存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本发明实施例的数据处理方法。
本发明实施例的存储介质至少具有以下有益效果:
通过对多个数据来源基于相同的资料提供的数据进行比对,利用机器核对代替人工核对,并采用校验规则处理文件,利用校验数据的比对替代录入文件的全文比对,提高了核对效率和核对准确率,并且,如果多个数据来源提供的录入文件相同,则数据准确的概率较大,提高了获取的数据的准确率,从而解决了相关技术中采用人工核对数据的方法效率较低且准确率较低的技术问题。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (6)

1.一种数据处理方法,其特征在于,所述方法包括:
获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件;
根据预设校验规则分别生成每个所述录入文件对应的校验数据,得到多个校验数据;
比对所述多个校验数据;
在所述多个校验数据不全部相同的情况下,在所述多个数据来源中选择目标来源,并向所述目标来源发送提示信息,其中,所述提示信息用于指示所述目标来源基于所述资料再次提供录入文件;
在所述录入文件包括多项数据的情况下,所述在所述多个数据来源中选择目标来源,并向所述目标来源发送提示信息,包括:
分别判断每个录入文件中的每一项数据是否满足对应的预设条件;
将所述多项数据中目标项数据不满足所述预设条件的录入文件对应的数据来源确定为所述目标来源;
向所述目标来源发送所述提示信息,其中,所述提示信息用于提示所述目标来源针对所述目标项数据重新提供数据;
所述在所述多个数据来源中选择目标来源,包括:
获取每个所述数据来源的历史错误率;
将所述历史错误率高于目标阈值的数据来源确定为所述目标来源;或者,
在所述多个数据来源超过两个的情况下,所述在所述多个数据来源中选择目标来源,包括:
在所述多个校验数据中确定与其它校验数据均不相同的校验数据,将其对应的录入文件的数据来源作为所述目标来源;
在所述多个数据来源为两个的情况下,所述向所述目标来源发送提示信息之后,所述方法还包括:
获取所述目标来源再次提供的录入文件;
比对所述目标来源再次提供的录入文件与另一个数据来源提供的录入文件是否相同;
在不相同的情况下,向所述另一个数据来源发送所述提示信息。
2.根据权利要求1所述的方法,其特征在于,在所述多个数据来源包括第一数据来源的情况下,所述获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件,包括:
获取所述第一数据来源发送的账号登录信息;
对所述账号登录信息进行验证;
在验证成功的情况下,接收所述第一数据来源针对所述资料提供的录入文件。
3.根据权利要求2所述的方法,其特征在于,在所述多个数据来源中还包括第二数据来源的情况下,所述获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件,还包括:
在接收所述第一数据来源基于所述资料提供的录入文件之后,向所述第二数据来源发送任务信息,其中,所述任务信息用于指示所述第二数据来源基于所述资料提供录入文件;
接收所述第二数据来源针对所述资料提供的录入文件。
4.根据权利要求2所述的方法,其特征在于,所述接收所述第一数据来源针对所述资料提供的录入文件,包括:
向所述第一数据来源提供以图像形式承载的所述资料;
获取所述第一数据来源提供的录入文件。
5.一种数据处理装置,其特征在于,所述装置包括:
获取单元,用于获取多个数据来源针对相同的资料所提供的录入文件,得到多个录入文件;
生成单元,用于根据预设校验规则分别生成每个所述录入文件对应的校验数据,得到多个校验数据;
比对单元,用于比对所述多个校验数据;
执行单元,用于在所述多个校验数据不全部相同的情况下,在所述多个数据来源中选择目标来源,并向所述目标来源发送提示信息,其中,所述提示信息用于指示所述目标来源基于所述资料再次提供录入文件;
在录入文件包括多项数据的情况下,所述执行单元包括:
第一判断模块,用于分别判断每个录入文件中的每一项数据是否满足对应的所述预设条件;
第一确定模块,用于将所述多项数据中所述目标项数据不满足所述预设条件的录入文件对应的数据来源确定为所述目标来源;
第三发送模块,用于向所述目标来源发送所述提示信息,其中,所述提示信息用于提示所述目标来源针对所述目标项数据重新提供数据;
所述执行单元包括:
第三获取模块,用于获取每个所述数据来源的历史错误率;
第二确定模块,用于将所述历史错误率高于目标阈值的数据来源确定为所述目标来源;或者,
在多个数据来源超过两个的情况下,所述执行单元包括:
第三确定模块,用于在所述多个校验数据中确定与其它校验数据均不相同的校验数据,将其对应的录入文件的数据来源作为所述目标来源;
在多个数据来源为两个的情况下,所述装置还包括:
第四获取模块,用于在向所述目标来源发送提示信息之后,获取所述目标来源再次提供的录入文件;
比对模块,用于比对所述目标来源再次提供的录入文件与另一个数据来源提供的录入文件是否相同;
第四发送模块,用于在不相同的情况下,向所述另一个数据来源发送所述提示信息。
6.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的方法。
CN201811536852.7A 2018-12-14 2018-12-14 一种数据处理方法和装置、以及计算机设备 Active CN109783450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811536852.7A CN109783450B (zh) 2018-12-14 2018-12-14 一种数据处理方法和装置、以及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811536852.7A CN109783450B (zh) 2018-12-14 2018-12-14 一种数据处理方法和装置、以及计算机设备

Publications (2)

Publication Number Publication Date
CN109783450A CN109783450A (zh) 2019-05-21
CN109783450B true CN109783450B (zh) 2024-05-03

Family

ID=66497010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811536852.7A Active CN109783450B (zh) 2018-12-14 2018-12-14 一种数据处理方法和装置、以及计算机设备

Country Status (1)

Country Link
CN (1) CN109783450B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110400213A (zh) * 2019-07-26 2019-11-01 中国工商银行股份有限公司 数据处理方法和装置、以及电子设备和可读介质
CN112051953B (zh) * 2020-09-29 2021-09-14 中国银行股份有限公司 一种页面栏位的输出控制方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425976A (zh) * 2013-07-17 2013-12-04 中国中医科学院 一种临床病例报告表识别系统及识别方法
CN105550370A (zh) * 2016-01-26 2016-05-04 平安科技(深圳)有限公司 录入方法及录入系统
CN105631412A (zh) * 2015-12-23 2016-06-01 深圳市金立通信设备有限公司 一种数据录入方法及终端
CN107798491A (zh) * 2016-08-29 2018-03-13 杭州海康威视数字技术股份有限公司 一种基于理货平台的数据采集方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140032373A1 (en) * 2012-07-30 2014-01-30 Carl Christopher Tierney Heuristic data entry system and method
EP3321803B1 (en) * 2016-10-31 2022-11-30 Shawn Melvin Systems and methods for generating interactive hypermedia graphical user interfaces on a mobile device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425976A (zh) * 2013-07-17 2013-12-04 中国中医科学院 一种临床病例报告表识别系统及识别方法
CN105631412A (zh) * 2015-12-23 2016-06-01 深圳市金立通信设备有限公司 一种数据录入方法及终端
CN105550370A (zh) * 2016-01-26 2016-05-04 平安科技(深圳)有限公司 录入方法及录入系统
CN107798491A (zh) * 2016-08-29 2018-03-13 杭州海康威视数字技术股份有限公司 一种基于理货平台的数据采集方法及装置

Also Published As

Publication number Publication date
CN109783450A (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
JP6609047B2 (ja) アプリケーション情報リスクマネジメントのための方法及びデバイス
CN104604204B (zh) 在同步通信中安全地操控服务器证书错误
CN110490721B (zh) 财务凭证生成方法及相关产品
CN107852412A (zh) 用于网络钓鱼和品牌保护的系统和方法
CN111343162B (zh) 系统安全登录方法、装置、介质及电子设备
CN111241517A (zh) 一种生物特征验证问答库的构建方法和装置
KR20160119778A (ko) 바코드 생성 및 바코드에 기초한 인증
CN105337928A (zh) 用户身份识别方法、安全保护问题生成方法及装置
CN107733883B (zh) 一种检测批量注册账号的方法及装置
CN105141427A (zh) 一种基于声纹识别的登录认证方法、装置及系统
CN109783450B (zh) 一种数据处理方法和装置、以及计算机设备
CN111124421B (zh) 区块链智能合约的异常合约数据检测方法和装置
CN104951714A (zh) 基于系列的设备绑定
US11899770B2 (en) Verification method and apparatus, and computer readable storage medium
CN110083782B (zh) 电子保单的查看方法、装置、计算机设备和存储介质
CN111651749A (zh) 基于密码找回账号的方法、装置、计算机设备及存储介质
CN106685945B (zh) 业务请求处理方法、业务办理号码的验证方法及其终端
US20180316509A1 (en) Method and System for Authentication of Electronic Documents
CN111062046A (zh) 一种手写签批数据安全管理方法及签批终端
CN112732676B (zh) 基于区块链的数据迁移方法、装置、设备及存储介质
CN112085469B (zh) 基于向量机模型的数据审批方法、装置、设备及存储介质
CN110943982B (zh) 单据数据加密的方法、装置、电子设备和存储介质
CN113986747A (zh) 一种数据生成方法、装置、电子设备及存储介质
CN108734814B (zh) 一种访客信息处理方法及装置
Mohamed et al. Protecting wireless data transmission in mobile application systems using digital watermarking technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant