CN116703248A - 数据审核方法、装置、电子设备及计算机可读存储介质 - Google Patents

数据审核方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN116703248A
CN116703248A CN202310982081.9A CN202310982081A CN116703248A CN 116703248 A CN116703248 A CN 116703248A CN 202310982081 A CN202310982081 A CN 202310982081A CN 116703248 A CN116703248 A CN 116703248A
Authority
CN
China
Prior art keywords
auditing
data
production
defect
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310982081.9A
Other languages
English (en)
Other versions
CN116703248B (zh
Inventor
郑予泽
郭纪伟
左鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202310982081.9A priority Critical patent/CN116703248B/zh
Publication of CN116703248A publication Critical patent/CN116703248A/zh
Application granted granted Critical
Publication of CN116703248B publication Critical patent/CN116703248B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Factory Administration (AREA)

Abstract

本申请公开了一种数据审核方法、装置、电子设备及计算机可读存储介质,可以用于地图、交通等领域的数据审核中,其中,以对象集合中的数据生产对象个体为数据审核单位,获取到各数据生产对象的生产缺陷概率,并根据预生成的生产缺陷概率和一级审核比例的对应关系,匹配出与各数据生产对象相符的目标一级审核比例;然后,指示数据生产平台按照各数据生产对象的目标一级审核比例,对各数据生产对象单独生产的业务数据进行一级审核,得到能够准确反映各数据生产对象所生产的业务数据质量好坏的一级审核缺陷率;最后,再根据各数据生产对象的一级审核缺陷率,汇总得到对象集合的一级审核整体缺陷率。相较于相关技术,本申请能够提高数据审核的准确率。

Description

数据审核方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及数据处理技术领域,具体涉及一种数据审核方法、数据审核装置、电子设备及计算机可读存储介质。
背景技术
目前,如智能手机和平板电脑等电子设备得到了广泛的应用,这些电子设备可以向用户提供各种各样的业务功能,比如音视频功能以及地图功能等。
可以理解的是,业务功能的实现离不开底层的业务数据,比如地图功能的实现需要基于路网数据、水系数据等业务数据。出于生产效率的考虑,会由多个数据生产对象组成的对象集合来共同生产某类业务数据。为了确保业务功能的正常实现,需要对业务数据进行审核。
相关技术在进行数据审核时,会对业务数据进行两级数据审核,分别是在业务数据完成生产时的一级审核,以及在业务数据上线应用时的二级审核。其中,一级审核是将对象集合中所有数据生产对象生产的业务数据汇总后抽审,且审核比例固定,由于不同数据生产对象的个体差异,采用固定的抽审比例抽审所得到缺陷率结果将无法准确反映业务数据整体的好坏,导致数据审核的准确率较低。
发明内容
本申请实施例提供一种数据审核方法、数据审核装置、电子设备及计算机可读存储介质,可以提高数据审核的效率。
第一方面,本申请提供的数据审核方法,包括:
获取对象集合中数据生产对象的生产缺陷概率,对象集合中的不同数据生产对象按照同一生产方式在数据生产平台生产业务数据;
根据生产缺陷概率,以及生产缺陷概率和一级审核比例的对应关系,确定针对数据生产对象的目标一级审核比例;
指示数据生产平台按照目标一级审核比例,对数据生产对象单独生产的业务数据进行一级审核;
接收数据生产平台进行一级审核返回的数据生产对象各自的一级审核缺陷率;
根据数据生产对象各自的一级审核缺陷率,得到对象集合的一级审核整体缺陷率;
其中,生产缺陷概率和一级审核比例的对应关系,根据对象集合的历史一级审核整体缺陷率和历史二级审核整体缺陷率,以及对应对象集合的期望二级审核整体缺陷率所确定。
第二方面,本申请提供的数据审核装置,包括:
缺陷概率获取模块,用于获取对象集合中数据生产对象的生产缺陷概率,对象集合中的不同数据生产对象按照同一生产方式在数据生产平台生产业务数据;
比例确定模块,用于根据生产缺陷概率,以及生产缺陷概率和一级审核比例的对应关系,确定针对数据生产对象的目标一级审核比例;
数据审核模块,用于指示数据生产平台按照目标一级审核比例,对数据生产对象单独生产的业务数据进行一级审核;
结果接收模块,用于接收数据生产平台进行一级审核返回的数据生产对象各自的一级审核缺陷率;
结果汇总模块,用于根据数据生产对象各自的一级审核缺陷率,得到对象集合的一级审核整体缺陷率;
其中,生产缺陷概率和一级审核比例的对应关系,根据对象集合的历史一级审核整体缺陷率和历史二级审核整体缺陷率,以及对应对象集合的期望二级审核整体缺陷率所确定。
可选的,在一实施例中,本申请提供的数据审核装置还包括关系生成模块,用于获取对应对象集合的期望二级审核整体缺陷率;以及假定对象集合的一级免审比例,以及假定对象集合的一级审核整体缺陷率和二级审核整体缺陷率;以及以假定一级免审比例与假定一级审核整体缺陷率之积,和假定二级审核整体缺陷率的和值等于期望二级审核整体缺陷率为约束,确定假定一级审核比例与假定一级审核整体缺陷率、假定二级审核整体缺陷率和期望二级审核整体缺陷率之间的第一函数关系;以及获取对象集合在参考历史时间段内的历史一级审核整体缺陷率和历史二级审核整体缺陷率;以及将历史一级审核整体缺陷率、历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入第一函数关系,得到生产缺陷概率和一级审核比例的对应关系。
可选的,在一实施例中,生产缺陷概率和一级审核比例的对应关系包括生产缺陷概率区间和一级审核比例的对应关系,关系生成模块用于将历史一级审核整体缺陷率、历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入第一函数关系,得到生产缺陷概率和一级审核比例之间一对一的对应关系;以及确定至少两个目标一级审核比例,并根据生产缺陷概率和一级审核比例之间一对一的对应关系,确定至少两个目标一级审核比例所对应的生产缺陷概率;以及根据至少两个目标一级审核比例所对应的生产缺陷概率,划分至少两个生产缺陷概率区间;以及根据至少两个目标一级审核比例以及至少两个生产缺陷概率区间,得到生产缺陷概率区间和一级审核比例的对应关系。
可选的,在一实施例中,关系生成模块用于获取对象集合中不同数据生产对象在参考历史时间段内各自的平均历史一级审核缺陷率;以及确定至少两个数据生产对象分布集中的平均历史一级审核缺陷率;以及将至少两个数据生产对象分布集中的平均历史一级审核缺陷率作为生产缺陷概率,代入生产缺陷概率和一级审核比例之间一对一的对应关系,得到至少两个目标一级审核比例。
可选的,在一实施例中,关系生成模块还用于展示策略配置界面,策略配置界面包括时间段配置接口和期望缺陷率配置接口;以及通过时间段配置接口接收输入的历史起始时间和历史结束时间,并根据历史起始时间和历史结束时间,确定参考历史时间段;以及通过期望缺陷率配置接口,接收输入的期望二级审核整体缺陷率。
可选的,在一实施例中,策略配置界面还包括对应关系展示区域,关系生成模块还用于通过对应关系展示区域,展示生产缺陷概率区间和一级审核比例的对应关系。
可选的,在一实施例中,关系生成模块还用于响应于针对生产缺陷概率区间和一级审核比例的对应关系的调整操作,调整生产缺陷概率区间和一级审核比例的对应关系。
可选的,在一实施例中,策略配置界面还包括时间周期配置接口,关系生成模块还用于通过时间周期配置接口接收输入的参考时间周期;以及将当前时间作为参考时间周期的结束时间,获取数据生产对象在参考时间周期内的历史一级审核缺陷率;以及根据历史一级审核缺陷率,确定数据生产对象的生产缺陷概率。
可选的,在一实施例中,关系生成模块用于按照不同生产缺陷概率的确定策略,根据历史一级审核缺陷率确定多个候选生产缺陷概率;以及根据多个候选生产缺陷概率,确定数据生产对象的生产缺陷概率。
可选的,在一实施例中,确定策略包括:
计算数据生产对象在参考时间周期内的平均历史一级审核缺陷率,作为数据生产对象的生产缺陷概率;
或者,对历史一级审核缺陷率进行加权求和,将计算得到的第一加权和值作为数据生产对象的生产缺陷概率;
或者,对历史一级审核缺陷率按照历史一级审核时间进行函数拟合,得到一级审核时间和一级审核缺陷率的第二函数关系,将当前时间代入第二函数关系,得到数据生产对象的候选生产缺陷概率。
可选的,在一实施例中,关系生成模块用于对多个候选生产缺陷概率进行加权求和,将计算得到的第二加权和值确定为数据生产对象的生产缺陷概率。
可选的,在一实施例中,数据审核模块用于指示数据生产平台合并目标一级审核比例相同的数据生产对象所单独生产的业务数据,并按照目标一级审核比例对合并后的业务数据进行一级审核;
结果接收模块用于接收数据生产平台返回的目标一级审核比例相同的数据生产对象的一级审核缺陷率。
第三方面,本申请提供的电子设备,包括存储器和处理器,存储器存储有计算机程序,处理器用于运行存储器内的计算机程序,实现本申请所提供的数据审核方法中的步骤。
第四方面,本申请提供的计算机可读存储介质,存储有计算机程序,该计算机程序适于处理器运行,实现本申请所提供的数据审核方法中的步骤。
本申请中,对于生产相同类型业务数据的数据生产对象所组成的对象集合,预先根据该对象集合的历史一级审核整体缺陷率所反映的历史一级审核情况和历史二级审核整体缺陷率所反映的历史二级审核情况,以及对应该对象集合的期望二级审核整体缺陷率所反映的质量需求,抽象出生产缺陷概率和一级审核比例的对应关系。在进行数据审核时,以对象集合中的数据生产对象个体为数据审核单位,获取到各数据生产对象的生产缺陷概率,并根据各数据生产对象的生产缺陷概率,以及预生成的生产缺陷概率和一级审核比例的对应关系,匹配出与各数据生产对象的业务生产能力相符的目标一级审核比例;然后,指示数据生产平台按照各数据生产对象的目标一级审核比例,对各数据生产对象单独生产的业务数据进行一级审核,以此排除不同数据生产对象的个体差异导致的误差,得到能够准确反映各数据生产对象所生产的业务数据质量好坏的一级审核缺陷率;最后,再根据各数据生产对象的一级审核缺陷率,汇总得到对象集合的一级审核整体缺陷率,由于排除了不同数据生产对象的个体差异所导致的误差,相应汇总得到的一级审核整体缺陷率能够更准确的反映对象集合生产的业务数据整体的好坏,达到提升数据审核准确率的目的。另外,采用与各数据生产对象相匹配的目标一级审核比例进行一级审核,能够避免采用较高审核比例导致的审核资源浪费,还能够提高数据审核的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的数据审核系统的场景示意图;
图1b是本申请实施例提供的数据审核方法的流程示示意图;
图1c是本申请实施例中针对一对象集合进行一级审核的示例图;
图1d是本申请实施例中合并多个数据生产对象的业务数据进行一级审核的示例图;
图1e是本申请实施例中函数关系的推导示意图;
图1f是本申请实施例中提供的策略配置界面的示例图;
图2是本申请实施例提供的数据审核方法的另一流程示意图;
图3是本申请实施例提供的数据审核系统的运行时序图;
图4是本申请实施例提供的数据审核装置的一结构示意图;
图5是本申请实施例提供的电子设备的结构示意图。
具体实施方式
需要说明的是,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其他具体实施例。
本申请以下描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
本申请以下描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
为了能够提高数据审核的效率,本申请实施例提供一种数据审核方法、数据审核装置、电子设备、计算机可读存储介质以及计算机程序产品。其中,数据审核方法可由数据审核装置执行,或者由集成了该数据审核装置的电子设备执行。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,以下所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请结合参照图1a,本申请还提供一数据审核系统,该数据审核系统包括电子设备100、数据生产平台200和数据仓库300。电子设备100用于执行本申请提供的数据审核方法,数据生产平台200为提供业务数据生产能力的作业平台,数据仓库300用于存储数据审核过程中的相关数据。数据审核系统运行时,对象集合中的数据生产对象登录到数据生成平台200,按照同一生产方式在数据生产平台200生产业务数据。电子设备100响应于数据审核的触发,获取对象集合中每一数据生产对象的生产缺陷概率,以及根据生产缺陷概率和一级审核比例的对应关系,确定针对每一数据生产对象的目标一级审核比例,相应指示数据生产平台200按照每一数据生产对象的目标一级审核比例,对每一数据生产对象单独生产的业务数据进行一级审核,并根据数据生产平台200进行一级审核返回的数据生产对象各自的一级审核缺陷率,得到对象集合的一级审核整体缺陷率。其中,电子设备100还可以将获取到的数据生产对象的一级审核缺陷率,以及对象集合的一级审核整体缺陷率存入数据仓库200中。
需要说明的是,以上描述的数据审核系统仅仅是一个示例,是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着数据审核系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
请参照图1b,图1b是本申请实施例提供的数据审核方法的流程示意图,如图1b所示,本申请提供的数据审核方法的流程如下:
在110中,获取对象集合中数据生产对象的生产缺陷概率,对象集合中的不同数据生产对象按照同一生产方式在数据生产平台生产业务数据。
应当说明的是,本申请实施例以下所记载的一级审核和二级审核并非代指不同的审核方式,而是用于代指不同的审核阶段,其中,一级审核是在业务数据生产完成时进行的数据审核,二级审核是在业务数据上线应用时的数据审核,一级审核和二级审核的审核方式可以完全相同,也可以有所差异。
比如,针对数据生产方一侧,数据生产方在生产出业务数据之后,为了确保生产出的业务数据能够用于业务功能的实现,对生产出的业务数据进行一级审核,审核通过后再交付数据使用方;针对数据使用方一侧,为了确保数据生产方交付的业务数据能够用于业务功能实现,对数据生产方交付的业务数据进行二级审核,审核通过后再用于业务功能的实现。
以上数据生产方和数据使用方可以属于同一商事主体,也可以属于不同的商事主体。以地图业务为例,比如,数据使用方可以为提供地图导航业务的公司,数据生产方可以为提供地图数据制作服务的第三方公司;又比如,数据使用方可以为提供地图导航业务的公司中的地图业务运营管理部门,数据生产方可以为该公司中的地图数据制作部门。
需要说明的是,针对一业务功能,通常需要不同类型的业务数据来共同实现功能,比如地图业务,需要路网数据、水系数据、交通数据等采用不同生产方式所生产的不同类型的业务数据。对于一数据生产方,其可以生产多种类型的业务数据,也可以仅生产单一类型的业务数据。针对一类型的业务数据,数据生产方通常配置有多个数据生产对象组成的对象集合采用相同的生产方式来共同生产该类型的业务数据,以提高数据生产效率。其中,数据生产对象是指业务数据的最小生产单位,如路网数据的制图作业员、水系数据的制图作业员等。本实施例中,数据生产平台提供业务数据的生产能力,生产某一类型业务数据的对象集合中的数据生产对象按照同一生产方式,在数据生产平台生产业务数据。
对于采用某种生产方式所生产的一类型业务数据,在进行一级审核时,本实施例并不将对象集合整体作为审核单位,而是将组成该对象集合的数据生产对象个体作为审核单位。
其中,针对一对象集合,预先根据该对象集合的历史一级审核整体缺陷率、对应历史一级审核整体缺陷率的历史二级审核整体缺陷率,以及对应该对象集合的期望二级审核整体缺陷率,确定有生产缺陷概率和一级审核比例的对应关系,该对应关系描述了在该对象集合中的数据生产对象的生产缺陷概率为一确定值时,相应按照对应值的一级审核比例对该数据生产对象生产的业务数据进行一级审核。
数据生产对象的生产缺陷概率描述该数据生产对象所生产的业务数据可能不通过一级审核的比例,反映了该数据生产对象的业务数据生产能力,生产缺陷概率越小,数据生产对象的业务数据生产能力越高。
对象集合的历史一级审核整体缺陷率描述该对象集合历史生产的业务数据在历史一级审核过程中未通过一级审核的整体比例,可以根据该对象集合包括的数据生产对象各自的历史一级审核缺陷率确定,比如,可以计算对象集合中数据生产对象的平均历史一级审核缺陷率,作为对象集合的历史一级审核整体缺陷率。数据生产对象的历史一级审核缺陷率描述该数据生产对象历史生产的业务数据在历史一级审核过程中未通过一级审核的比例。
对象集合的历史二级审核整体缺陷率描述该对象集合历史生产的业务数据通过一级审核交付数据使用方后,在数据使用方的历史二级审核过程中未通过二级审核的整体比例。
对象集合的期望二级审核整体缺陷率指数据使用方期望该对象集合交付的业务数据在二级审核时无法通过二级审核的最高整体比例。
相应的,在本申请实施例中,响应于数据审核触发,获取对象集合中数据生产对象的生产缺陷概率。比如,本实施例中,对于对象集合中的不同数据生产对象,预先评估有其生产业务数据的生产缺陷概率,并存储在数据仓库中,相应的,在进行数据审核时,可以从数据仓库中获取相应数据生产对象的生产缺陷概率。此外,本实施例对于数据审核的触发方式不作具体限制,比如,可以是在数据生产对象生产的业务数据的数据量达到预设数据量时触发,也可以是在到达预设的数据审核周期时触发。
在120中,根据生产缺陷概率,以及生产缺陷概率和一级审核比例的对应关系,确定针对数据生产对象的目标一级审核比例。
如上,对于对象集合,预先确定有该对象集合匹配的生产缺陷概率和一级审核比例的对应关系。本实施例中,在获取到对象集合中数据生产对象的生产缺陷概率之后,即可将该数据生产对象的生产缺陷概率,代入该其所属对象集合匹配的生产缺陷概率和一级审核比例的对应关系,得到对应该数据生产对象的生产缺陷概率的一级审核比例,记为该数据生产对象的目标一级审核比例。
在130中,指示数据生产平台按照目标一级审核比例,对数据生产对象单独生产的业务数据进行一级审核。
在140中,接收数据生产平台进行一级审核返回的数据生产对象各自的一级审核缺陷率。
如上,在确定针对数据生产对象的目标一级审核比例之后,即指示数据生产平台按照该目标一级审核比例,对数据生产对象单独生产的业务数据进行一级审核,从而得到数据生产对象的一级审核缺陷率。比如,数据生产平台可以按照数据生产对象的目标一级审核比例,直接从该数据生产对象生产的业务数据中采样出业务数据样本,并按照配置的一级审核标准对采样出的业务数据样本进行一级审核,确定出未通过一级审核标准的缺陷业务数据样本,相应计算缺陷业务数据样本的数量与采样出的业务数据样本的总数量的比例,作为该数据生产对象在当次一级审核的一级审核缺陷率。其中,对于业务数据样本的采样方式,此处不做具体限制,可以是随机采样,也可以是间隔采样等采样方式。
比如,请参照图1c,存在一生产某类型业务数据的对象集合,该对象集合包括3名数据生产对象,分别为数据生产对象a、数据生产对象b以及数据生产对象c,请参照下表1,示出了该对象集合关联的部分生产缺陷概率和一级审核比例的(部分)对应关系。
表1,生产缺陷概率和一级审核比例的(部分)对应关系表。
假设数据生产对象a的生产缺陷概率为0.19%,数据生产对象b的生产缺陷概率为0.29%,数据生产对象c的生产缺陷概率为0.53%,则根据上表示出的生产缺陷概率和一级审核比例的对应关系,确定针对数据生产对象a的目标一级审核比例为10%,确定针对数据生产对象b的目标一级审核比例为50%,确定针对数据生产对象c的目标一级审核比例为80%。
对于数据生产对象a,指示数据生产平台按照目标一级审核比例10%对数据生产对象a单独生产的业务数据进行一级审核,相应的,针对数据生产对象a生产的业务数据,数据生产平台从中采样出10%的业务数据作为数据生产对象a的业务数据样本,并对采样出的业务数据样本进行一级审核,得到数据生产对象a在当次一级审核的一级审核缺陷率;对于数据生产对象b,指示数据生产平台按照目标一级审核比例50%对数据生产对象b单独生产的业务数据进行一级审核,相应的,针对数据生产对象b生产的业务数据,数据生产平台从中采样出50%的业务数据作为数据生产对象b的业务数据样本,并对采样出的业务数据样本进行一级审核,得到数据生产对象b在当次一级审核的一级审核缺陷率;对于数据生产对象c,指示数据生产平台按照目标一级审核比例80%对数据生产对象c单独生产的业务数据进行一级审核,相应的,数据生产平台针对数据生产对象c生产的业务数据,从中采样出80%的业务数据作为数据生产对象c的业务数据样本,并对采样出的业务数据样本进行一级审核,得到数据生产对象c在当次一级审核的一级审核缺陷率。此外,相应接收数据生产平台返回的数据生产对象a、数据生产对象b以及数据生产对象c各自的一级审核缺陷率。
可选的,在一实施例中,指示数据生产平台按照目标一级审核比例,对数据生产对象单独生产的业务数据进行一级审核,包括:
指示数据生产平台合并目标一级审核比例相同的数据生产对象所单独生产的业务数据,并按照目标一级审核比例对合并后的业务数据进行一级审核;
接收数据生产平台进行一级审核返回的数据生产对象各自的一级审核缺陷率,包括:
接收数据生产平台返回的目标一级审核比例相同的数据生产对象的一级审核缺陷率。
本实施例中,考虑到生产缺陷概率反映的是数据生产对象的业务生产能力,若生产缺陷概率相同,则说明数据生产对象的业务生产能力相同,可以将业务生产能力相同的数据生产对象作为一个整体进行一级审核,以此来进一步提升数据审核效率。
相应的,在确定对象集合中不同数据生产对象的目标一级审核比例之后,进一步确定出目标一级审核比例相同的数据生产对象,相应指示数据生产平台合并目标一级审核比例相同的数据生产对象所单独生产的业务数据,并按照同一目标一级审核比例对合并后的业务数据进行一级审核。比如,假设确定数据生产对象a、数据生产对象b以及数据生产对象c的目标一级审核比例相同,均为20%,则指示数据生产平台合并数据生产对象a、数据生产对象b以及数据生产对象c的业务数据后按照20%的比例进行一级审核。另一方面,请参照图1d,数据生产平台按照指示,相应合并数据生产对象a、数据生产对象b以及数据生产对象c所生产的业务数据,得到合并业务数据,再按照确定的目标一级审核比例20%,从合并业务数据中抽取20%的业务数据作为业务数据样本;最后,数据生产平台按照配置的审核标准,对抽取出的业务数据样本进行一级审核,得到数据生产对象a/b/c共同的一级审核缺陷率。
在150中,根据数据生产对象各自的一级审核缺陷率,得到对象集合的一级审核整体缺陷率。
如上,在以数据生产对象为审核单位完成一级审核后,即可根据对象集合中数据生产对象各自的一级审核缺陷率进行汇总,相应得到对象集合的一级审核整体缺陷率。
示例性的,本实施例中,数据生产对象的一级审核缺陷率按照缺陷业务数据样本数量/业务数据样本数量的形式表征,相应的,在进行一级审核缺陷率的汇总时,可以计算所有数据生产对象的缺陷业务数据样本数量和值,以及计算所有数据生产对象的业务数据样本数量和值,相应的,缺陷业务数据样本数量和值与业务数据样本数量和值之比即为对象集合的一级审核整体缺陷率。
应当说明的是,在得到对象集合的一级审核整体缺陷率之后,可根据配置的通过条件判定对象集合本批次生产的业务数据是否通过一级审核,是则将本批次生产的业务数据交付数据使用方,经由数据使用方进行二级审核后用于业务功能的实现。其中,通过条件可由数据生产方根据实际需要配置,比如,可以配置为对象集合的一级审核整体缺陷率小于或等于缺陷率阈值。
在一实施例中,提供一可选的生产缺陷概率和一级审核比例的对应关系的建立方案,获取对象集合中数据生产对象的生产缺陷概率之前,本申请提供的数据审核方法还包括:
获取对应对象集合的期望二级审核整体缺陷率;
假定对象集合的一级免审比例,以及假定对象集合的一级审核整体缺陷率和二级审核整体缺陷率;
以假定一级免审比例与假定一级审核整体缺陷率之积,和假定二级审核整体缺陷率的和值等于期望二级审核整体缺陷率为约束,确定假定一级审核比例与假定一级审核整体缺陷率、假定二级审核整体缺陷率和期望二级审核整体缺陷率之间的第一函数关系;
获取对象集合在参考历史时间段内的历史一级审核整体缺陷率和历史二级审核整体缺陷率;
将历史一级审核整体缺陷率和历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入确定的第一函数关系,得到生产缺陷概率和一级审核比例的对应关系。
针对一对象集合,获取对应该对象集合的期望二级审核整体缺陷率C,其中,该期望二级审核整体缺陷率可以根据该对象集合生产的类型业务数据的数据使用方的实际使用需求确定,比如,可以直接将数据使用方的能够接受的该类型业务数据的最大缺陷率确定为期望二级审核整体缺陷率,也可以确定期望二级审核整体缺陷率小于该最大缺陷率。
此外,请参照图1e,将该对象集合作为一个整体,假定该对象集合整体生产的业务数据总量A,假定一级审核比例Z以及一级免审比例1-Z,假定该对象集合的一级审核整体缺陷率X,假定该对象集合的二级审核整体缺陷率Y,以该对象集合整体生产的业务数据能够通过数据使用方的二级审核为目标,则该对象集合整体生产的业务数据中缺陷业务数据总量(无法通过二级审核的业务数据)与业务数据总量A的比值等于期望二级审核整体缺陷率C。
其中,请继续参照图1e,缺陷业务数据总量由两部分构成,其中一部分为经过一级审核流出但在二级审核中被检出(假定二级审核整体缺陷率Y部分)的缺陷业务数据,这一部分的缺陷业务数据量可以表示为(AxZ)xY,另一部分为一级审核免审但在二级审核中被检测出(假定一级免审二级审核整体缺陷率X+Y部分)的缺陷业务数据,这一部分缺陷业务数据量可以表示为(Ax(1-Z))x(X+Y),则存在如下等式:
C=((AxZ)xY+(Ax(1-Z))x(X+Y))/A;(1)
对如上等式(1)进行化简,得到如下等式:
C=Xx(1-Z)+Y;(2)
根据如上等式(2),存在约束:假定一级免审比例(1-Z)与假定一级审核整体缺陷率(X)之积(Xx(1-Z)),和假定二级审核整体缺陷率(Y)的和值(Xx(1-Z)+Y)等于期望二级审核整体缺陷率(C),按照该约束,确定假定一级审核比例(Z)与假定一级审核整体缺陷率(X)和假定二级审核整体缺陷率(Y)之间的函数关系:
Z=1+Y/X-C/X;(3)
将以上函数关系进一步化简为:
Z=1+(Y-C)/X;(4)
将以上化简后的函数关系(4)记为第一函数关系,此外,还获取对象集合在参考历史时间段内不同一级审核批次的历史一级审核整体缺陷率,以及对应该历史一级审核整体缺陷率的历史二级审核整体缺陷率。
应当说明的是,本实施例中,一级审核以对象集合中的数据生产对象个体为审核单位,相应的,一审核批次的历史一级审核整体缺陷率反映对象集合在该审核批次的历史一级审核过程中生产的业务数据的整体缺陷率情况;一审核批次的历史一级审核整体缺陷率所对应的历史二级审核整体缺陷率,反映该对象集合在该批次的历史一级审核过程中生产的业务数据在对应的历史二级审核过程中的整体缺陷率情况。
如上,对于参考历史时间段内的不同一级审核批次,获取到对应的历史一级审核整体缺陷率和历史二级审核整体缺陷率,相应将确定的期望二级审核整体缺陷率,以及获取的不同审核批次的历史一级审核整体缺陷率和历史二级审核整体缺陷率,代入以上第一函数关系(4),以此,对于参考历史时间段内每一个历史一级审核缺陷率,根据第一函数关系(4)均可计算得到一个对应的比例值,相应的,将历史审核过程的历史一级审核整体缺陷率视作生产缺陷概率,将其对应的比例值视作一级审核比例,从而得到生产缺陷概率和一级审核比例的对应关系。
应当说明的是,本实施例中,建立的是生产缺陷概率和一级审核比例之间一对一的对应关系,在一级审核过程中,若数据生产对象的生产缺陷概率并未包括于该对应关系中,则基于该对应关系包括的与数据生产对象的生产缺陷概率值最接近的生产缺陷概率,确定针对该数据生产对象的目标一级审核比例。
根据以上实施例中相关描述可知,按照如上第一函数关系(4),可直接得到生产缺陷概率和一级审核比例之间一对一的对应关系,即一个生产缺陷概率对应一个一级审核比例。可选的,在一实施例中,为进一步提高数据审核效率,建立生产缺陷概率区间和一级审核比例的对应关系,也即建立生产缺陷概率和一级审核比例之间多对一的对应关系,将历史一级审核整体缺陷率和历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入第一函数关系,得到生产缺陷概率和一级审核比例的对应关系,包括:
将历史一级审核整体缺陷率和历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入确定的第一函数关系,得到生产缺陷概率和一级审核比例之间一对一的对应关系;
确定至少两个目标一级审核比例,并根据生产缺陷概率和一级审核比例之间一对一的对应关系,确定至少两个目标一级审核比例所对应的生产缺陷概率;
根据至少两个目标一级审核比例所对应的生产缺陷概率,划分至少两个生产缺陷概率区间;
根据至少两个目标一级审核比例以及至少两个生产缺陷概率区间,得到生产缺陷概率区间和一级审核比例的对应关系。
如上所述,将历史一级审核整体缺陷率和历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入确定的第一函数关系(4),得到生产缺陷概率和一级审核比例之间一对一的对应关系。
之后,从该对应关系所包括的一级审核比例中,确定出至少两个后续实际用于一级审核的目标一级审核比例,并根据以上得到的生产缺陷概率和一级审核比例之间一对一的对应关系,相应确定出与至少两个目标一级审核比例所对应的至少两个生产缺陷概率。
最后,即可根据确定出的至少两个目标一级审核比例所对应的生产缺陷概率,划分出至少两个生产缺陷概率区间,得到生产缺陷概率区间和(目标)一级审核比例的对应关系。
应当说明的,本实施例对于以上目标一级审核比例的确定方式以及生产缺陷概率区间的划分方式,均不作具体限定,可由本领域技术人员根据实际需要进行选择。
示例性的,可将0%至100%等分为10个离散值(10.00%、20.00%、30.00%、40.00%、50.00%、60.00%、70.00%、80.00%、90.00%、100.00%),作为目标一级审核比例,根据生产缺陷概率和一级审核比例之间一对一的对应关系,确定目标一级审核比例10.00%对应生产缺陷概率7.54%、目标一级审核比例20.00%对应生产缺陷概率8.32%、目标一级审核比例30.00%对应生产缺陷概率9.29%、目标一级审核比例40.00%对应生产缺陷概率10.51%、目标一级审核比例50.00%对应生产缺陷概率12.1%、目标一级审核比例60.00%对应生产缺陷概率14.25%、目标一级审核比例70.00%对应生产缺陷概率17.34%、目标一级审核比例80.00%对应生产缺陷概率22.14%、目标一级审核比例90.00%对应生产缺陷概率30.62%、目标一级审核比例100.00%对应生产缺陷概率49.6%。为确保划分的生产缺陷概率区间能够覆盖全部生产缺陷概率,按照左开右闭的方式,根据以上目标一级审核比例所对应的生产缺陷概率,划分10个生产缺陷概率区间,得到生产缺陷概率区间和一级审核比例的对应关系,如下表2所示。
表2,生产缺陷概率区间和一级审核比例的对应关系表
如上,对于一数据生产对象,无论其生产缺陷概率为何,均存在其落入的生产缺陷概率区间,相应存在与之对应的一级审核比例用于对其进行一级审核。
在一实施例中,提供一可选的确定目标一级审核比例的方案,确定至少两个目标一级审核比例,包括:
获取对象集合中不同数据生产对象在参考历史时间段内各自的平均历史一级审核缺陷率;
确定至少两个数据生产对象分布集中的平均历史一级审核缺陷率;
将至少两个目标平均历史一级审核缺陷率作为生产缺陷概率,代入生产缺陷概率和一级审核比例之间一对一的对应关系,得到至少两个目标一级审核比例。
本实施例中,由执行数据审核方法的电子设备利用对象集合在历史一级审核过程中的相关数据,自动分析得到实际用于一级审核的目标一级审核比例。
其中,对于对象集合中的一数据生产对象,获取该数据生产对象在参考历史时间段内不同一级审核批次的历史一级审核缺陷率,相应根据这些不同一级审核批次的历史一级审核缺陷率,计算得到该数据生产对象在参考历史时间段内的平均历史一级审核缺陷率。如此,获取得到对象集合中不同数据生产对象在参考历史时间段内各自的平均历史一级审核缺陷率。
如上,在获取得到对象集合中不同数据生产对象在参考历史时间段内各自的平均历史一级审核缺陷率之后,进一步确定出至少两个数据生产对象分布集中的平均历史一级审核缺陷率。比如,可以采用聚类算法(如K-means算法),对对象集合中不同数据生产对象在参考历史时间段内各自的平均历史一级审核缺陷率进行聚类处理,得到多个聚类集合,对于每一聚类集合,将位于该聚类集合的聚类中心的平均历史一级审核缺陷率确定为一数据生产对象分布集中的平均历史一级审核缺陷率。又比如,可以根据获取得到的对象集合中不同数据生产对象在参考历史时间段内各自的平均历史一级审核缺陷率,获取基于平均历史一级审核缺陷率的数据生产对象的对象数量分布,该对象数量分布描述了不同平均历史一级审核缺陷率对应的数据生产对象的对象数量;将对象数量位于前预设个数(以大于等于2为约束,可由本领域技术人员根据实际需要配置)的平均历史一级审核缺陷率确定为数据生产对象分布集中的平均历史一级审核缺陷率。
最后,将以上确定的至少两个数据生产对象分布集中的平均历史一级审核缺陷率作为生产缺陷概率,分别代入生产缺陷概率和一级审核比例之间一对一的对应关系,得到与之对应的一级审核比例,作为目标一级审核比例。
可选的,在一实施例中,向审核方提供可视化的审核配置能力,以便于审核方按需配置审核策略,获取对应对象集合的期望二级审核整体缺陷率之前,还包括:
展示策略配置界面,策略配置界面包括时间段配置接口和期望缺陷率配置接口;
通过时间段配置接口接收输入的历史起始时间和历史结束时间,并根据历史起始时间和历史结束时间,确定参考历史时间段;
获取对应对象集合的期望二级审核整体缺陷率,包括:
通过期望缺陷率配置接口,接收输入的期望二级审核整体缺陷率。
应当说明的是,本实施例对于策略配置界面的展示形式不作具体限制,可由本领域技术人员根据实际需要设置。
示例性的,请参照图1f,示出了一可选的策略配置界面,该策略配置界面包括审核参数配置区域600,审核参数配置区域600设置有时间段配置接口610和期望缺陷率配置接口640,其中,时间段配置接口610支持日历选择方式和输入框直接输入方式两种方式输入历史起始时间和历史结束时间,期望缺陷率配置接口640支持输入框直接输入方式输入期望二级审核整体缺陷率。
比如,如图1f所示,假设审核方基于时间段配置接口610输入了历史起始时间“2023-05-01”和历史结束时间“2023-05-31”,基于期望缺陷率配置接口640输入了数值“0.08”,相应的,用于执行数据审核方法的电子设备,将“2023-05-01”至“2023-05-31”确定为参考历史时间段,以及确定期望二级审核整体缺陷率为“8.00%”。
审核参数配置区域600还设置有计算控件650,用于执行数据审核方法的电子设备响应于计算控件650被触发,根据通过期望缺陷率配置接口640配置的期望二级审核整体缺陷率、以及通过时间段配置接口610配置的参考历史时间段,计算得到生产缺陷概率和一级审核比例的对应关系,具体可参照以上实施例中的相关描述,此处不再赘述。此外,审核参数配置区域600还设置有一级审核缺陷率展示控件620和二级审核缺陷率展示控件630,相应的,用于执行数据审核方法的电子设备还计算对象集合在参考历史时间段内的平均历史一级审核整体缺陷率和平均历史二级审核整体缺陷率,分别通过一级审核缺陷率展示控件620和二级审核缺陷率展示控件630进行展示。
策略配置界面还包括对应关系预展示区域700,该对应关系预展示区域700被配置为展示确定的目标一级审核比例及其对应的生产缺陷概率。假设按照等分的方式从0%至100%之间确定了10个目标一级审核比例,且相应确定了与之对应的生产缺陷概率,则在关系预展示区域700进行展示,如图1f所示。
该对应关系预展示区域700还设置有关系生成控件710,用于执行数据审核方法的电子设备响应于该关系生成控件710被触发,根据确定的至少两个目标一级审核比例所对应的生产缺陷概率,划分至少两个生产缺陷概率区间;以及根据确定的至少两个目标一级审核比例以及至少两个生产缺陷概率区间,得到生产缺陷概率区间和一级审核比例的对应关系。
可选的,在一实施例中,策略配置界面还包括对应关系展示区域800,根据至少两个目标一级审核比例以及至少两个生产缺陷概率区间,得到生产缺陷概率区间和一级审核比例的对应关系之后,还包括:
通过对应关系展示区域,展示生产缺陷概率区间和一级审核比例的对应关系。
本实施例中,请继续参照图1f,策略配置界面还包括对应关系展示区域800,该对应关系展示区域800被配置为展示确定的生产缺陷概率区间和一级审核比例的对应关系(审核策略)。
比如,对于以上等分方式确定的10个目标一级审核比例中的每一目标一级审核比例,划分有一对应的生产缺陷概率区间,共10个生产缺陷概率区间,并在对应关系展示区域展示了这10生产缺陷概率区间和目标一级审核比例之间的对应关系,如图1f所示。
可选的,在一实施例中,为满足审核方的实际审核需求,通过对应关系展示区域,展示生产缺陷概率区间和一级审核比例的对应关系之后,还包括:
响应于针对生产缺陷概率区间和一级审核比例的对应关系的调整操作,调整生产缺陷概率区间和一级审核比例的对应关系。
本实施例中,通过策略配置界面提供修改生产缺陷概率区间和一级审核比例的对应关系的能力。
其中,调整操作包括但不限于调整生产缺陷概率区间大小和/或一级审核比例大小,新增或删除生产缺陷概率区间和一级审核比例的对应关系。
示例性的,请继续参照图1f,对于一组对应的生产缺陷概率区间和一级审核比例,在对应关系展示区域通过三个输入框形式的展示控件进行展示,其中一展示控件展示该生产缺陷概率区间的下限,一展示控件展示该生产缺陷概率区间的上限,一展示控件展示该生产缺陷概率区间对应的一级审核比例。可以直接对展示控件展示的生产缺陷概率区间的上限/下限及其对应的一级审核比例进行调整,从而实现对一组或多组生产缺陷概率区间和一级审核比例的对应关系的调整。
此外,对应关系展示区域还包括新增控件810和删除控件820,新增控件810被配置为触发时新增一组空白的生产缺陷概率区间和一级审核比例的对应关系,供审核方进行配置,删除控件820被配置为触发时删除对应的一组生产缺陷概率区间和一级审核比例的对应关系。
可选的,在一实施例中,策略配置界面还包括时间周期配置接口,获取数据生产对象的生产缺陷概率之前,还包括:
通过时间周期配置接口接收输入的参考时间周期;
获取数据生产对象的生产缺陷概率,包括:
将当前时间作为参考时间周期的结束时间,获取数据生产对象在参考时间周期内的历史一级审核缺陷率;
根据历史一级审核缺陷率,确定数据生产对象的生产缺陷概率。
本实施例中,数据生产对象的生产缺陷概率根据其历史一级审核缺陷率所确定。其中,由审核方指定选取历史一级审核缺陷率的参考时间周期。
示例性的,时间周期配置接口为预置了多个不同时间周期(比如,3天、7天、14天以及30天等)的选择控件,比如,请继续参照图1f,假设通过时间周期配置接口910接收到输入的参考时间周期为“7天”,相应在获取数据生产对象的生产缺陷概率时,用于执行数据审核方法的电子设备以当前时间为结束时间,获取数据生产对象在之前7天内的一级审核过程中的历史一级审核缺陷率,并根据获取到的历史一级审核缺陷率,确定数据生产对象的生产缺陷概率,也即根据历史实际发生的一级审核过程中的历史一级审核缺陷率,来预测数据生产对象在当前时间的所生产的生产缺陷概率。
可选的,在一实施例中,根据历史一级审核缺陷率,确定数据生产对象的生产缺陷概率,包括:
按照不同生产缺陷概率的确定策略,根据历史一级审核缺陷率确定多个候选生产缺陷概率;
根据多个候选生产缺陷概率,确定数据生产对象的生产缺陷概率。
示例性的,本实施例中生产缺陷概率的确定策略包括:
根据获取到的历史一级审核缺陷率,计算数据生产对象在参考时间周期内的平均历史一级审核缺陷率;并将数据生产对象在参考时间周期内的平均历史一级审核缺陷率,确定为数据生产对象的候选生产缺陷概率;
或者,对获取到历史一级审核缺陷率进行加权求和,将计算得到的第一加权和值确定为数据生产对象的候选生产缺陷概率;其中,历史一级审核缺陷率的权重,与其对应的历史一级审核时间距离当前时间的时间间隔负相关。也即,对于数据生产对象的一历史一级审核缺陷率,若其对应的历史一级审核时间距离当前时间的越久,则该历史一级审核缺陷率对数据生产对象的生产缺陷概率贡献越大;
或者,根据获取到的历史一级审核缺陷率及其对应的历史一级审核时间进行函数拟合,得到一级审核时间和一级审核缺陷率的第二函数关系,相应将当前时间代入该第二函数关系,将得到的缺陷率作为数据生产对象的候选生产缺陷概率。
在其他实施例中,还可以由本领域技术人员按照实际需要对生产缺陷概率的确定策略进行配置,比如,还可以配置为:将距离当前时间最近的历史一级审核缺陷率作为数据生产对象的候选生产缺陷概率。
如上,针对一数据生产对象,在按照不同生产缺陷概率的确定策略,确定了多个候选生产缺陷概率之后,进一步根据确定出的多个候选生产概率,进一步确定得到数据生产对象的生产缺陷概率。比如,可以计算多个候选生产缺陷概率的平均值,将多个候选生产缺陷概率的平均值作为数据生产对象的生产缺陷概率;也可以对多个候选生产缺陷概率进行加权求和,将多个候选生产缺陷概率的第二加权和值作为数据生产对象的生产缺陷概率,其中,取平均值方式确定的候选生产缺陷概率的权重大于函数拟合方式确定的候选生产缺陷概率的权重,但是小于加权方式确定的候选生产缺陷概率的权重。
请继续参照图1f,策略配置界面还包括基本信息配置区域500,基本信息配置区域500设置有策略名称配置接口510,产线选择接口520以及策略生效时间配置接口530,其中,策略名称配置接口510用接收输入的策略名称,产线选择接口520用于选择需要生成匹配的生产缺陷概率和一级审核比例的对应关系的对象集合,策略生效时间配置接口530用于指定生产的生产缺陷概率和一级审核比例的对应关系的应用起始时间。
此外,策略配置界面还包括策略类型选择接口920、取消控件930以及确认控件940,该策略类型选择接口920提供三个可选的审核类型,分别为全审、免审以及抽审,用于执行数据审核方法的电子设备在抽审类型被选中时,按照如上方式在策略配置界面展示参数配置区域、对应关系预展示区域以及对应关系展示区域等,相应完成生产缺陷概率和一级审核比例的对应关系的生成,具体请参照以上实施例中的相关描述,此处不再赘述。用于执行数据审核方法的电子设备响在确认控件940被触发时,将对应关系展示区域展示的生产缺陷概率和一级审核比例的对应关系存储至预设存储区域(可由本领域技术人员根据实际需要进行配置)中,以便后续针对其匹配的对象集合中的数据生产对象进行一级审核时使用。此外,用于执行数据审核方法的电子设备在取消控件930被触发时,停止展示策略配置界面。
由上可知,本申请提供的数据审核方法,对于生产相同类型业务数据的数据生产对象所组成的对象集合,预先根据该对象集合的历史一级审核整体缺陷率所反映的历史一级审核情况和历史二级审核整体缺陷率所反映的历史二级审核情况,以及对应该对象集合的期望二级审核整体缺陷率所反映的质量需求,抽象出生产缺陷概率和一级审核比例的对应关系。在进行数据审核时,以对象集合中的数据生产对象个体为数据审核单位,获取到各数据生产对象的生产缺陷概率,并根据各数据生产对象的生产缺陷概率,以及预生成的生产缺陷概率和一级审核比例的对应关系,匹配出与各数据生产对象的业务生产能力相符的目标一级审核比例;然后,由数据生产平台按照各数据生产对象的目标一级审核比例,对各数据生产对象单独生产的业务数据进行一级审核,以此排除不同数据生产对象的个体差异导致的误差,得到能够准确反映各数据生产对象所生产的业务数据质量好坏的一级审核缺陷率;最后,再根据各数据生产对象的一级审核缺陷率,汇总得到对象集合的一级审核整体缺陷率,由于排除了不同数据生产对象的个体差异所导致的误差,相应汇总得到的一级审核整体缺陷率能够更准确的反映对象集合生产的业务数据整体的好坏,达到提升数据审核准确率的目的。另外,采用与各数据生产对象相匹配的目标一级审核比例进行一级审核,能够避免采用较高审核比例导致的审核资源浪费,还能够提高数据审核的效率。
请参照图2,图2是本申请提供的数据审核方法的另一流程示意图,本申请提供的数据审核方法的流程还可以如下:
在210中,确定需要进行一级审核的目标对象集合,以及确定对应目标对象集合的期望二级审核整体缺陷率。
需要说明的是,针对一业务功能,通常需要不同类型的业务数据来共同实现功能,比如地图业务,需要路网数据、水系数据、交通数据等采用不同生产方式所生产的不同类型的业务数据。对于一数据生产方,其可以生产多种类型的业务数据,也可以仅生产单一类型的业务数据。针对一类型的业务数据,数据生产方通常配置有多个数据生产对象组成的对象集合采用相同的生产方式来共同生产该类型的业务数据,以提高数据生产效率。其中,数据生产对象是指业务数据的最小生产单位,如路网数据的制图作业员、水系数据的制图作业员等。
本实施例中,首先确定需要进行一级审核的对象集合,将其记为目标对象集合。比如,针对地图业务,可以将生产路网数据的对象集合确定为目标对象集合,也可以将生成水系数据的对象集合确定为目标对象集合。
在确定目标对象集合之后,进一步确定期望该对象集合生产的业务数据在二级审核过程中的缺陷率,即期望二级审核整体缺陷率,该期望二级审核整体缺陷率可以根据该对象集合生产的类型业务数据的数据使用方的实际使用需求确定,比如,可以直接将数据使用方的能够接受的该类型业务数据的最大缺陷率确定为期望二级审核整体缺陷率,也可以确定期望二级审核整体缺陷率小于该最大缺陷率。
在220中,假定目标对象集合的一级免审比例,以及假定目标对象集合的一级审核整体缺陷率和二级审核整体缺陷率。
在230中,以假定一级免审比例与假定一级审核整体缺陷率之积,和假定二级审核整体缺陷率的和值等于期望二级审核整体缺陷率为约束,确定假定一级审核比例与假定一级审核整体缺陷率、假定二级审核整体缺陷率和期望二级审核整体缺陷率之间的第一函数关系。
将该目标对象集合作为一个整体,假定该目标对象集合整体生产的业务数据总量A,假定一级审核比例Z以及一级免审比例1-Z,假定该目标对象集合的一级审核整体缺陷率X,假定该目标对象集合的二级审核整体缺陷率Y,以该目标对象集合整体生产的业务数据能够通过数据使用方的二级审核为目标,则该目标对象集合整体生产的业务数据中缺陷业务数据总量(无法通过二级审核的业务数据)与业务数据总量A的比值等于期望二级审核整体缺陷率C。
其中,缺陷业务数据总量由两部分构成,一部分为经过一级审核流出但在二级审核中被检出(假定二级审核整体缺陷率Y部分)的缺陷业务数据,这一部分的缺陷业务数据量可以表示为(AxZ)xY,另一部分为一级审核免审但在二级审核中被检测出(假定一级免审二级审核整体缺陷率X+Y部分)的缺陷业务数据,这一部分缺陷业务数据量可以表示为(Ax(1-Z))x(X+Y),则存在如下等式:
C=((AxZ)xY+(Ax(1-Z))x(X+Y))/A;(1)
对如上等式(1)进行化简,得到如下等式:
C=Xx(1-Z)+Y;(2)
根据如上等式(2),存在约束:假定一级免审比例(1-Z)与假定一级审核整体缺陷率(X)之积(Xx(1-Z)),和假定二级审核整体缺陷率(Y)的和值(Xx(1-Z)+Y)等于期望二级审核整体缺陷率(C),按照该约束,确定假定一级审核比例(Z)与假定一级审核整体缺陷率(X)和假定二级审核整体缺陷率(Y)之间的函数关系:
Z=1+Y/X-C/X;(3)
将以上函数关系进一步化简为:
Z=1+(Y-C)/X;(4)
将以上化简后的函数关系(4)记为第一函数关系。
在240中,获取目标对象集合在参考历史时间段内的历史一级审核整体缺陷率和历史二级审核整体缺陷率。
在250中,将历史一级审核整体缺陷率和历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入确定的第一函数关系,得到匹配目标对象集合的生产缺陷概率和一级审核比例的对应关系。
本实施例中,还获取对象集合在参考历史时间段内不同审核批次的历史一级审核整体缺陷率,以及对应该历史一级审核整体缺陷率的历史二级审核整体缺陷率。
应当说明的是,本实施例中,一级审核以对象集合中的数据生产对象个体为审核单位,相应的,一审核批次的历史一级审核整体缺陷率反映对象集合在该审核批次的历史一级审核过程中生产的业务数据的整体缺陷率情况;一审核批次的历史一级审核整体缺陷率所对应的历史二级审核整体缺陷率,反映该对象集合在该批次的历史一级审核过程中生产的业务数据在对应的历史二级审核过程中的整体缺陷率情况。
如上,对于参考历史时间段内的不同一级审核批次,获取到对应的历史一级审核整体缺陷率和历史二级审核整体缺陷率,相应将确定的期望二级审核整体缺陷率,以及获取的不同审核批次的历史一级审核整体缺陷率和历史二级审核整体缺陷率,代入以上第一函数关系(4),以此,对于参考历史时间段内每一个历史一级审核缺陷率,根据第一函数关系(4)均可计算得到一个对应的比例值,相应的,将历史审核过程的历史一级审核缺陷率视作生产缺陷概率,将其对应的比例值视作一级审核比例,从而得到生产缺陷概率和一级审核比例的对应关系。
在260中,获取目标对象集合中各数据生产对象的生产缺陷概率。
其中,数据生产对象的生产缺陷概率描述该数据生产对象所生产的业务数据可能不通过一级审核的比例,反映了该数据生产对象的业务数据生产能力,生产缺陷概率越小,数据生产对象的业务数据生产能力越高。
数据生产对象的生产缺陷概率可以根据该数据生产对象的历史一级审核缺陷率确定,比如,可以直接将该数据生产对象最近一次一级审核的历史一级审核缺陷率作为其生产缺陷概率。
在270中,根据各数据生产对象的生产缺陷概率,以及匹配目标对象集合的生产缺陷概率和一级审核比例的对应关系,确定针对各数据生产对象的目标一级审核比例。
如上,针对目标对象集合,确定有该目标对象集合匹配的生产缺陷概率和一级审核比例的对应关系。对于该目标对象集合中的每一数据生产对象,将其生产缺陷概率代入生产缺陷概率和一级审核比例的对应关系,得到该目标对象集合中各数据生产对象的目标一级审核比例。
在280中,按照各数据生产对象的目标一级审核比例,分别对各数据生产对象生产的业务数据进行一级审核,得到各数据生产对象的一级审核缺陷率。
在确定目标对象集合中各数据生产对象的目标一级审核比例之后,即按照各数据生产对象的目标一级审核比例,分别对各数据生产对象生产的业务数据进行一级审核,从而得到各数据生产对象的一级审核缺陷率。比如,对于目标对象集合中的一数据生产对象,可以按照该数据生产对象的目标一级审核比例,直接从该数据生产对象生产的业务数据中采样出业务数据样本,并按照配置的一级审核标准对采样出的业务数据样本进行一级审核,确定出未通过一级审核标准的业务数据样本,相应计算未通过一级审核标准的业务数据样本数量与采样出的业务数据样本的总数量的比例,作为该数据生产对象在当次一级审核的一级审核缺陷率。其中,对于业务数据样本的采样方式,此处不做具体限制,可以是随机采样,也可以是间隔采样等采样方式。
在290中,根据各数据生产对象的一级审核缺陷率,得到目标对象集合的一级审核整体缺陷率。
如上,在以数据生产对象为审核单位完成一级审核后,即可根据对象集合中数据生产对象各自的一级审核缺陷率进行汇总,相应得到对象集合的一级审核整体缺陷率。
示例性的,本实施例中,数据生产对象的一级审核缺陷率按照缺陷业务数据样本数量/业务数据样本数量的形式表征,相应的,在进行一级审核缺陷率的汇总时,可以计算所有数据生产对象的缺陷业务数据样本数量和值,以及计算所有数据生产对象的业务数据样本数量和值,相应的,缺陷业务数据样本数量和值与业务数据样本数量和值之比即为对象集合的一级审核整体缺陷率。
应当说明的是,在得到目标对象集合的一级审核整体缺陷率之后,进一步根据配置的通过条件判定目标对象集合本批次生产的业务数据是否通过一级审核,是则将本批次生产的业务数据交付数据使用方,经由数据使用方进行二级审核后用于业务功能的实现。其中,通过条件可由数据生产方根据实际需要配置,比如,可以配置目标对象集合的一级审核整体缺陷率小于或等于缺陷率阈值。
请参照图3,图3是根据本申请提供的数据审核系统的运行时序图,其中,
1、数据生产平台响应于对象集合中数据生产对象的数据生产操作,生产业务数据;
2、用于执行数据审核方法的电子设备响应于业务管理员登录,展示策略配置界面,并接收业务管理员基于策略配置界面配置的参考历史时间段;
3、电子设备生成历史整体缺陷率查询请求发送至数据仓库,该历史整体缺陷率查询请求用于指示数据仓库返回对象集合在历史时间段内的历史一级审核整体缺陷率和历史二级审核整体缺陷率;
4、数据仓库响应于来自电子设备的历史整体缺陷率查询请求,返回参考历史时间段内的历史一级审核整体缺陷率和历史二级审核整体缺陷率至电子设备。另一方面,电子设备计算平均历史一级审核整体缺陷率和平均历史二级审核整体缺陷率,通过策略配置界面展示给业务管理员;
5、电子设备接收业务管理员基于策略配置界面配置的期望二级审核整体缺陷率;
6、电子设备根据对象集合的历史一级审核整体缺陷率和历史二级审核整体缺陷率,以及对象集合的期望二级审核整体缺陷率,确定生产缺陷概率和一级审核比例的对应关系,并通过策略配置界面向业务管理员展示确定的对应关系;
7、电子设备接收业务管理员基于策略配置界面配置的参考时间周期;
8、电子设备生成历史缺陷率查询请求发送至数据仓库,该历史缺陷率查询请求用于指示数据仓库返回数据生产对象在参考时间周期内的历史一级审核缺陷率;
9、数据仓库响应于来自电子设备的历史缺陷率查询请求,返回数据生产对象在参考历史时间周期内的历史一级审核缺陷率;
10、电子设备根据数据生产对象在参考历史时间周期内的历史一级审核缺陷率,确定数据生产对象的生产缺陷概率;
11、电子设备根据数据生产对象的生产缺陷概率,以及生产缺陷概率和一级审核比例的对应关系,确定数据生产对象的目标一级审核比例;
12、电子设备生成数据审核请求发送至数据生产平台,该数据审核请求用于指示数据生产平台按照每一数据生产对象的目标一级审核比例,分别对每一数据生产对象单独生产的业务数据进行一级审核,得到每一数据生产对象的一级审核缺陷率;
13、数据生产平台响应于来自电子设备的数据审核请求,按照每一数据生产对象的目标一级审核比例,分别对每一数据生产对象单独生产的业务数据进行一级审核,得到每一数据生产对象的一级审核缺陷率;
14、数据生产平台将数据生产对象各自的一级审核缺陷率保存至数据仓库;
15、数据生产平台将数据生产对象各自的一级审核缺陷率返回至电子设备;
16、电子设备根据数据生产平台返回的数据生产对象各自的一级审核缺陷率,计算对象集合的一级审核整体缺陷率;
17、电子设备通过向业务管理员展示对象集合的一级审核整体缺陷率,以及将对象集合的一级审核整体缺陷率保存至数据仓库。
以上各个步骤的具体实施可参照以上实施例中的相关记载,此处不再赘述。
为便于更好的实施本申请提供的数据审核方法,本申请实施例还提供一种对应的数据审核装置。其中名词的含义与上述数据审核方法中相同,具体实现细节请参考以上方法实施例中的说明。
请参照图4,图4为本申请实施例提供的数据审核装置的结构示意图,该数据审核装置可以包括缺陷概率获取模块310、比例确定模块320、数据审核模块330、结果接收模块340和结果汇总模块350,其中,
缺陷概率获取模块310,用于获取对象集合中数据生产对象的生产缺陷概率,对象集合中的不同数据生产对象按照同一生产方式在数据生产平台生产业务数据;
比例确定模块320,用于根据生产缺陷概率,以及生产缺陷概率和一级审核比例的对应关系,确定针对数据生产对象的目标一级审核比例;
数据审核模块330,用于指示数据生产平台按照目标一级审核比例,对数据生产对象单独生产的业务数据进行一级审核;
结果接收模块340,用于接收数据生产平台进行一级审核返回的数据生产对象各自的一级审核缺陷率;
结果汇总模块350,用于根据数据生产对象各自的一级审核缺陷率,得到对象集合的一级审核整体缺陷率;
其中,生产缺陷概率和一级审核比例的对应关系,根据对象集合的历史一级审核整体缺陷率和历史二级审核整体缺陷率,以及对应对象集合的期望二级审核整体缺陷率所确定。
可选的,在一实施例中,本申请提供的数据审核装置还包括关系生成模块,用于获取对应对象集合的期望二级审核整体缺陷率;以及假定对象集合的一级免审比例,以及假定对象集合的一级审核整体缺陷率和二级审核整体缺陷率;以及以假定一级免审比例与假定一级审核整体缺陷率之积,和假定二级审核整体缺陷率的和值等于期望二级审核整体缺陷率为约束,确定假定一级审核比例与假定一级审核整体缺陷率、假定二级审核整体缺陷率和期望二级审核整体缺陷率之间的第一函数关系;以及获取对象集合在参考历史时间段内的历史一级审核整体缺陷率和历史二级审核整体缺陷率;以及将历史一级审核整体缺陷率、历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入第一函数关系,得到生产缺陷概率和一级审核比例的对应关系。
可选的,在一实施例中,生产缺陷概率和一级审核比例的对应关系包括生产缺陷概率区间和一级审核比例的对应关系,关系生成模块用于将历史一级审核整体缺陷率、历史二级审核整体缺陷率以及期望二级审核整体缺陷率,代入第一函数关系,得到生产缺陷概率和一级审核比例之间一对一的对应关系;以及确定至少两个目标一级审核比例,并根据生产缺陷概率和一级审核比例之间一对一的对应关系,确定至少两个目标一级审核比例所对应的生产缺陷概率;以及根据至少两个目标一级审核比例所对应的生产缺陷概率,划分至少两个生产缺陷概率区间;以及根据至少两个目标一级审核比例以及至少两个生产缺陷概率区间,得到生产缺陷概率区间和一级审核比例的对应关系。
可选的,在一实施例中,关系生成模块用于获取对象集合中不同数据生产对象在参考历史时间段内各自的平均历史一级审核缺陷率;以及确定至少两个数据生产对象分布集中的平均历史一级审核缺陷率;以及将至少两个数据生产对象分布集中的平均历史一级审核缺陷率作为生产缺陷概率,代入生产缺陷概率和一级审核比例之间一对一的对应关系,得到至少两个目标一级审核比例。
可选的,在一实施例中,关系生成模块还用于展示策略配置界面,策略配置界面包括时间段配置接口和期望缺陷率配置接口;以及通过时间段配置接口接收输入的历史起始时间和历史结束时间,并根据历史起始时间和历史结束时间,确定参考历史时间段;以及通过期望缺陷率配置接口,接收输入的期望二级审核整体缺陷率。
可选的,在一实施例中,策略配置界面还包括对应关系展示区域,关系生成模块还用于通过对应关系展示区域,展示生产缺陷概率区间和一级审核比例的对应关系。
可选的,在一实施例中,关系生成模块还用于响应于针对生产缺陷概率区间和一级审核比例的对应关系的调整操作,调整生产缺陷概率区间和一级审核比例的对应关系。
可选的,在一实施例中,策略配置界面还包括时间周期配置接口,关系生成模块还用于通过时间周期配置接口接收输入的参考时间周期;以及将当前时间作为参考时间周期的结束时间,获取数据生产对象在参考时间周期内的历史一级审核缺陷率;以及根据历史一级审核缺陷率,确定数据生产对象的生产缺陷概率。
可选的,在一实施例中,关系生成模块用于按照不同生产缺陷概率的确定策略,根据历史一级审核缺陷率确定多个候选生产缺陷概率;以及根据多个候选生产缺陷概率,确定数据生产对象的生产缺陷概率。
可选的,在一实施例中,确定策略包括:
计算数据生产对象在参考时间周期内的平均历史一级审核缺陷率,作为数据生产对象的生产缺陷概率;
或者,对历史一级审核缺陷率进行加权求和,将计算得到的第一加权和值作为数据生产对象的生产缺陷概率;
或者,对历史一级审核缺陷率按照历史一级审核时间进行函数拟合,得到一级审核时间和一级审核缺陷率的第二函数关系,将当前时间代入第二函数关系,得到数据生产对象的候选生产缺陷概率。
可选的,在一实施例中,关系生成模块用于对多个候选生产缺陷概率进行加权求和,将计算得到的第二加权和值确定为数据生产对象的生产缺陷概率。
可选的,在一实施例中,数据审核模块330用于指示数据生产平台合并目标一级审核比例相同的数据生产对象所单独生产的业务数据,并按照目标一级审核比例对合并后的业务数据进行一级审核;
结果接收模块340用于接收数据生产平台返回的目标一级审核比例相同的数据生产对象的一级审核缺陷率。
以上各个模块的具体实施可参见前面的实施例,在此不再赘述。
本实施例中,对于生产相同类型业务数据的数据生产对象所组成的对象集合,预先根据该对象集合的历史一级审核整体缺陷率所反映的一级审核情况和历史二级审核整体缺陷率所反映的二级审核情况,以及对应该对象集合的期望二级审核整体缺陷率所反映的数据使用方的真实需求,抽象出生产缺陷概率和一级审核比例的对应关系。在进行数据审核时,以对象集合中的数据生产对象个体为数据审核单位,由缺陷概率获取模块310获取到各数据生产对象的生产缺陷概率,并由比例确定模块320,根据各数据生产对象的生产缺陷概率,以及预生成的生产缺陷概率和一级审核比例的对应关系,匹配出与各数据生产对象的业务生产能力相符的目标一级审核比例;然后,由数据审核模块330指示数据生产平台按照各数据生产对象的目标一级审核比例,对各数据生产对象单独生产的业务数据进行一级审核,以此排除不同数据生产对象的个体差异导致的误差,由结果接收模块340接收数据生产平台返回的能够准确反映各数据生产对象所生产的业务数据质量好坏的一级审核缺陷率;最后,再由结果汇总模块350根据各数据生产对象的一级审核缺陷率,汇总得到对象集合的一级审核整体缺陷率,由于排除了不同数据生产对象的个体差异所导致的误差,相应汇总得到的一级审核整体缺陷率能够更准确的反映对象集合生产的业务数据整体的好坏,达到提升数据审核准确率的目的。另外,采用与各数据生产对象相匹配的目标一级审核比例进行一级审核,能够避免采用较高审核比例导致的审核资源浪费,还能够提高数据审核的效率。
本申请实施例还提供一种电子设备,包括存储器和处理器,其中处理器通过调用存储器中存储的计算机程序,用于执行本实施例提供的数据审核方法中的步骤。
请参照图5,图5为本申请实施例提供的电子设备的结构示意图。
该电子设备可以包括一个或者一个以上处理核心的处理器101、一个或一个以上计算机可读存储介质的存储器102、电源103和输入单元104等部件。本领域技术人员可以理解,图5中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器101是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器102内的软件程序和/或模块,以及调用存储在存储器102内的数据,执行电子设备的各种功能和处理数据。可选的,处理器101可包括一个或多个处理核心;可选的,处理器101可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器101中。
存储器102可用于存储软件程序以及模块,处理器101通过运行存储在存储器102的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器102可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器102可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器102还可以包括存储器控制器,以提供处理器101对存储器102的访问。
电子设备还包括给各个部件供电的电源103,可选的,电源103可以通过电源管理系统与处理器101逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源103还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元104,该输入单元104可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,该电子设备还可以包括显示单元、图像采集组件等,在此不再赘述。具体在本实施例中,处理器101会将一个或一个以上的计算机程序对应的可执行代码加载到存储器102中,并由处理器101来执行本申请提供的数据审核方法中的步骤,比如:
获取对象集合中数据生产对象的生产缺陷概率,对象集合中的不同数据生产对象按照同一生产方式在数据生产平台生产业务数据;
根据生产缺陷概率,以及生产缺陷概率和一级审核比例的对应关系,确定针对数据生产对象的目标一级审核比例;
指示数据生产平台按照目标一级审核比例,对数据生产对象单独生产的业务数据进行一级审核;
接收数据生产平台进行一级审核返回的数据生产对象各自的一级审核缺陷率;
根据数据生产对象各自的一级审核缺陷率,得到对象集合的一级审核整体缺陷率;
其中,生产缺陷概率和一级审核比例的对应关系,根据对象集合的历史一级审核整体缺陷率和历史二级审核整体缺陷率,以及对应对象集合的期望二级审核整体缺陷率所确定。
应当说明的是,本申请实施例提供的电子设备与上文实施例中的数据审核方法属于同一构思,其具体实现过程详见以上相关实施例,此处不再赘述。
本申请还提供一种计算机可读的存储介质,其上存储有计算机程序,当其存储的计算机程序在本申请实施例提供的电子设备的处理器上执行时,使得电子设备的处理器实现本申请提供的数据审核方法中的步骤。其中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM)或者随机存取器(Random Access Memory,RAM)等。
本申请还提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序在本申请实施例提供的电子设备的处理器上执行时,使得电子设备的处理器实现本申请提供的数据审核方法中的步骤。
以上对本申请所提供的数据审核方法、数据审核装置、电子设备、计算机可读存储介质及计算机程序产品进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
应当说明的是,当本申请以上实施例运用到具体产品或技术中时,涉及到对象的相关数据,需要获得对象许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

Claims (15)

1.一种数据审核方法,其特征在于,包括:
获取对象集合中数据生产对象的生产缺陷概率,所述对象集合中的不同数据生产对象按照同一生产方式在数据生产平台生产业务数据;
根据所述生产缺陷概率,以及生产缺陷概率和一级审核比例的对应关系,确定针对所述数据生产对象的目标一级审核比例;
指示所述数据生产平台按照所述目标一级审核比例,对所述数据生产对象单独生产的业务数据进行一级审核;
接收所述数据生产平台进行一级审核返回的所述数据生产对象各自的一级审核缺陷率;
根据所述数据生产对象各自的一级审核缺陷率,得到所述对象集合的一级审核整体缺陷率;
其中,所述生产缺陷概率和一级审核比例的对应关系,根据所述对象集合的历史一级审核整体缺陷率和历史二级审核整体缺陷率,以及对应所述对象集合的期望二级审核整体缺陷率所确定。
2.根据权利要求1所述的数据审核方法,其特征在于,所述获取对象集合中数据生产对象的生产缺陷概率之前,还包括:
获取对应所述对象集合的期望二级审核整体缺陷率;
假定所述对象集合的一级免审比例,以及假定所述对象集合的一级审核整体缺陷率和二级审核整体缺陷率;
以假定一级免审比例与假定一级审核整体缺陷率之积,和假定二级审核整体缺陷率的和值等于所述期望二级审核整体缺陷率为约束,确定假定一级审核比例与所述假定一级审核整体缺陷率、所述假定二级审核整体缺陷率和所述期望二级审核整体缺陷率之间的第一函数关系;
获取所述对象集合在参考历史时间段内的历史一级审核整体缺陷率和历史二级审核整体缺陷率;
将所述历史一级审核整体缺陷率、所述历史二级审核整体缺陷率以及所述期望二级审核整体缺陷率,代入所述第一函数关系,得到生产缺陷概率和一级审核比例的对应关系。
3.根据权利要求2所述的数据审核方法,其特征在于,所述生产缺陷概率和一级审核比例的对应关系包括生产缺陷概率区间和一级审核比例的对应关系,所述将所述历史一级审核整体缺陷率、所述历史二级审核整体缺陷率以及所述期望二级审核整体缺陷率,代入所述第一函数关系,得到生产缺陷概率和一级审核比例的对应关系,包括:
将所述历史一级审核整体缺陷率、所述历史二级审核整体缺陷率以及所述期望二级审核整体缺陷率,代入所述第一函数关系,得到生产缺陷概率和一级审核比例之间一对一的对应关系;
确定至少两个目标一级审核比例,并根据所述生产缺陷概率和一级审核比例之间一对一的对应关系,确定所述至少两个目标一级审核比例所对应的生产缺陷概率;
根据所述至少两个目标一级审核比例所对应的生产缺陷概率,划分至少两个生产缺陷概率区间;
根据所述至少两个目标一级审核比例以及所述至少两个生产缺陷概率区间,得到生产缺陷概率区间和一级审核比例的对应关系。
4.根据权利要求3所述的数据审核方法,其特征在于,所述确定至少两个目标一级审核比例,包括:
获取所述数据生产对象在所述参考历史时间段内各自的平均历史一级审核缺陷率;
确定至少两个数据生产对象分布集中的平均历史一级审核缺陷率;
将所述至少两个数据生产对象分布集中的平均历史一级审核缺陷率作为生产缺陷概率,代入所述生产缺陷概率和一级审核比例之间一对一的对应关系,得到至少两个目标一级审核比例。
5.根据权利要求3所述的数据审核方法,其特征在于,所述获取对应所述对象集合的期望二级审核整体缺陷率之前,还包括:
展示策略配置界面,所述策略配置界面包括时间段配置接口和期望缺陷率配置接口;
通过所述时间段配置接口接收输入的历史起始时间和历史结束时间,并根据所述历史起始时间和所述历史结束时间,确定参考历史时间段;
所述获取对应所述对象集合的期望二级审核整体缺陷率,包括:
通过所述期望缺陷率配置接口,接收输入的期望二级审核整体缺陷率。
6.根据权利要求5所述的数据审核方法,其特征在于,所述策略配置界面还包括对应关系展示区域,所述根据所述至少两个目标一级审核比例以及所述至少两个生产缺陷概率区间,得到生产缺陷概率区间和一级审核比例的对应关系之后,还包括:
通过所述对应关系展示区域,展示所述生产缺陷概率区间和一级审核比例的对应关系。
7.根据权利要求6所述的数据审核方法,其特征在于,所述通过所述对应关系展示区域,展示所述生产缺陷概率区间和一级审核比例的对应关系之后,还包括:
响应于针对所述生产缺陷概率区间和一级审核比例的对应关系的调整操作,调整所述生产缺陷概率区间和一级审核比例的对应关系。
8.根据权利要求5所述的数据审核方法,其特征在于,所述策略配置界面还包括时间周期配置接口,所述获取对象集合中数据生产对象的生产缺陷概率之前,还包括:
通过所述时间周期配置接口接收输入的参考时间周期;
所述获取对象集合中数据生产对象的生产缺陷概率,包括:
将当前时间作为所述参考时间周期的结束时间,获取对象集合中数据生产对象在所述参考时间周期内的历史一级审核缺陷率;
根据所述历史一级审核缺陷率,确定所述数据生产对象的生产缺陷概率。
9.根据权利要求8所述的数据审核方法,其特征在于,所述根据所述历史一级审核缺陷率,确定所述数据生产对象的生产缺陷概率,包括:
按照不同生产缺陷概率的确定策略,根据所述历史一级审核缺陷率确定多个候选生产缺陷概率;
根据多个所述候选生产缺陷概率,确定所述数据生产对象的生产缺陷概率。
10.根据权利要求9所述的数据审核方法,其特征在于,所述确定策略包括:
计算所述数据生产对象在所述参考时间周期内的平均历史一级审核缺陷率,作为所述数据生产对象的生产缺陷概率;
或者,对所述历史一级审核缺陷率进行加权求和,将计算得到的第一加权和值作为所述数据生产对象的生产缺陷概率;
或者,对所述历史一级审核缺陷率按照历史一级审核时间进行函数拟合,得到一级审核时间和一级审核缺陷率的第二函数关系,将所述当前时间代入所述第二函数关系,得到所述数据生产对象的候选生产缺陷概率。
11.根据权利要求9所述的数据审核方法,其特征在于,所述根据多个所述候选生产缺陷概率,确定所述数据生产对象的生产缺陷概率,包括:
对多个所述候选生产缺陷概率进行加权求和,将计算得到的第二加权和值确定为所述数据生产对象的生产缺陷概率。
12.根据权利要求2-11任一项所述的数据审核方法,其特征在于,所述指示所述数据生产平台按照所述目标一级审核比例,对所述数据生产对象单独生产的业务数据进行一级审核,包括:
指示所述数据生产平台合并目标一级审核比例相同的数据生产对象所单独生产的业务数据,并按照所述目标一级审核比例对合并后的业务数据进行一级审核;
所述接收所述数据生产平台进行一级审核返回的所述数据生产对象各自的一级审核缺陷率,包括:
接收所述数据生产平台返回的目标一级审核比例相同的数据生产对象的一级审核缺陷率。
13.一种数据审核装置,其特征在于,包括:
缺陷概率获取模块,用于获取对象集合中数据生产对象的生产缺陷概率,所述对象集合中的不同数据生产对象按照同一生产方式在数据生产平台生产业务数据;
比例确定模块,用于根据所述生产缺陷概率,以及生产缺陷概率和一级审核比例的对应关系,确定针对所述数据生产对象的目标一级审核比例;
数据审核模块,用于指示所述数据生产平台按照所述目标一级审核比例,对所述数据生产对象单独生产的业务数据进行一级审核;
结果接收模块,用于接收所述数据生产平台进行一级审核返回的所述数据生产对象各自的一级审核缺陷率;
结果汇总模块,用于根据所述数据生产对象各自的一级审核缺陷率,得到所述对象集合的一级审核整体缺陷率;
其中,所述生产缺陷概率和一级审核比例的对应关系,根据所述对象集合的历史一级审核整体缺陷率和历史二级审核整体缺陷率,以及对应所述对象集合的期望二级审核整体缺陷率所确定。
14.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器用于执行所述存储器内的计算机程序,以实现权利要求1至12任一项所述的数据审核方法中的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器执行,以实现权利要求1至12任一项所述的数据审核方法中的步骤。
CN202310982081.9A 2023-08-07 2023-08-07 数据审核方法、装置、电子设备及计算机可读存储介质 Active CN116703248B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310982081.9A CN116703248B (zh) 2023-08-07 2023-08-07 数据审核方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310982081.9A CN116703248B (zh) 2023-08-07 2023-08-07 数据审核方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN116703248A true CN116703248A (zh) 2023-09-05
CN116703248B CN116703248B (zh) 2024-01-30

Family

ID=87839663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310982081.9A Active CN116703248B (zh) 2023-08-07 2023-08-07 数据审核方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN116703248B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104867840A (zh) * 2014-02-20 2015-08-26 中芯国际集成电路制造(上海)有限公司 Ye在线检测管控方法
CN110555596A (zh) * 2019-08-09 2019-12-10 国网陕西省电力公司电力科学研究院 一种基于配电物资质量评价的抽检策略制定方法及系统
CN110826855A (zh) * 2019-10-09 2020-02-21 广州供电局有限公司 智能配电房状态监测传感器入网性能的检验方法及系统
CN110851792A (zh) * 2019-11-13 2020-02-28 国网上海市电力公司 一种运行智能电能表的分阶段与分层抽样方法
CN110866691A (zh) * 2019-11-13 2020-03-06 国网上海市电力公司 一种孤立批智能电能表的分阶段与分层抽样方法
KR102100499B1 (ko) * 2019-10-11 2020-04-13 강현광 빅데이터를 이용한 품질관리 시스템
CN111984704A (zh) * 2020-08-20 2020-11-24 支付宝(杭州)信息技术有限公司 数据筛选方法及装置
CN114121281A (zh) * 2021-11-12 2022-03-01 杭州太美星程医药科技有限公司 抽样比例的确定方法及装置、可读存储介质及电子设备
CN114840565A (zh) * 2022-03-11 2022-08-02 神策网络科技(北京)有限公司 抽样查询方法、装置、电子设备及计算机可读存储介质
CN115936628A (zh) * 2023-01-03 2023-04-07 中国工商银行股份有限公司 数据审核方法、装置、设备、存储介质和计算机程序产品

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104867840A (zh) * 2014-02-20 2015-08-26 中芯国际集成电路制造(上海)有限公司 Ye在线检测管控方法
CN110555596A (zh) * 2019-08-09 2019-12-10 国网陕西省电力公司电力科学研究院 一种基于配电物资质量评价的抽检策略制定方法及系统
CN110826855A (zh) * 2019-10-09 2020-02-21 广州供电局有限公司 智能配电房状态监测传感器入网性能的检验方法及系统
KR102100499B1 (ko) * 2019-10-11 2020-04-13 강현광 빅데이터를 이용한 품질관리 시스템
CN110851792A (zh) * 2019-11-13 2020-02-28 国网上海市电力公司 一种运行智能电能表的分阶段与分层抽样方法
CN110866691A (zh) * 2019-11-13 2020-03-06 国网上海市电力公司 一种孤立批智能电能表的分阶段与分层抽样方法
CN111984704A (zh) * 2020-08-20 2020-11-24 支付宝(杭州)信息技术有限公司 数据筛选方法及装置
CN114121281A (zh) * 2021-11-12 2022-03-01 杭州太美星程医药科技有限公司 抽样比例的确定方法及装置、可读存储介质及电子设备
CN114840565A (zh) * 2022-03-11 2022-08-02 神策网络科技(北京)有限公司 抽样查询方法、装置、电子设备及计算机可读存储介质
CN115936628A (zh) * 2023-01-03 2023-04-07 中国工商银行股份有限公司 数据审核方法、装置、设备、存储介质和计算机程序产品

Also Published As

Publication number Publication date
CN116703248B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
CN113869801B (zh) 一种企业数字中台的成熟状态评估方法和装置
US11972295B2 (en) Green cloud computing recommendation system
CN112860769B (zh) 一种能源规划数据管理系统
US7941296B2 (en) Benchmarking and gap analysis system and method
CN116567547A (zh) 人口数据质量检验方法、系统和可读存储介质
CN103488525A (zh) 确定与情景相关的用户偏好
CN115668265A (zh) 为操纵和调整承保标的的风险驱动组合提供前瞻和后顾度量的风险转移配置器和模拟引擎及其方法
CN112102099B (zh) 保单数据处理方法、装置、电子设备及存储介质
CN116703248B (zh) 数据审核方法、装置、电子设备及计算机可读存储介质
CN110690987B (zh) 账号信息管理方法、装置及设备
CN114844791B (zh) 基于大数据的云服务自动管理分配方法、系统及存储介质
CN115080412A (zh) 软件更新质量评估方法、装置、设备及计算机存储介质
KR101462858B1 (ko) 기업의 해외 진출 역량 평가 방법
CN109558152A (zh) 系统灰度发布时流量切换方法、装置、介质及电子设备
CN111598390B (zh) 服务器高可用性评估方法、装置、设备和可读存储介质
CN110278250B (zh) 终端选择方法、装置和存储介质
CN113760550A (zh) 资源分配方法和资源分配装置
CN110807599A (zh) 电化学储能方案的决策方法、装置、服务器和存储介质
CN113448842B (zh) 大数据系统测试方法、装置、服务器及存储介质
CN112148779B (zh) 确定业务指标的方法、装置及存储介质
CN114997575A (zh) 定价策略的评估方法、电子设备以及存储介质
CN114819216A (zh) 空调的保养服务推荐方法及服务器
CN117609198A (zh) 数据处理方法、装置、存储介质及电子设备
CN116646923A (zh) 电力负荷中长期预测方法、装置、终端及存储介质
CN113268648A (zh) 数据质量的确定方法、系统、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant