CN114066405A - 数据处理方法及装置 - Google Patents
数据处理方法及装置 Download PDFInfo
- Publication number
- CN114066405A CN114066405A CN202111331869.0A CN202111331869A CN114066405A CN 114066405 A CN114066405 A CN 114066405A CN 202111331869 A CN202111331869 A CN 202111331869A CN 114066405 A CN114066405 A CN 114066405A
- Authority
- CN
- China
- Prior art keywords
- index
- data
- target
- project
- time interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例提供数据处理方法及装置,其中所述数据处理方法包括:按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据,根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测,根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种数据处理方法。本说明书一个或者多个实施例同时涉及一种数据处理装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着互联网技术的发展,各式各样的服务都相继开展了线上服务,虽然线上模式更加方便的服务于用户,但是更多的商家或者店铺为了能够得到大的销售市场,个别商家或者店铺会单独选择开展线上服务,或者单独开展线下服务,还或者同时开展线上服务和线下服务,从而吸引更多的用户。
然而随着这种现象的增多,销售场景变得更加复杂化,部分商家或者店铺在向用户提供服务的时候,需进行合规自查,以确定其经营范围或经营模式是否符合规定合规条件,随着新技术的不断出现,传统监管合规手段难以应对各行业的快速发展。目前主要是依靠监管合规专业人力的经验来分析与判断项目的合规性,不仅效率较低,对人员的监管合规行业经验的要求也较高,而且信息获取滞后、信息真实性不易核验等效率低下,这对监管的及时性、有效性造成了很大障碍,因此亟需一种有效的方法以解决此类问题。
发明内容
有鉴于此,本说明书实施例提供了一种数据处理方法。本说明书一个或者多个实施例同时涉及一种数据处理装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种数据处理方法,包括:
按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据;
根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测;
根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
可选地,所述根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测,包括:
将所述第一时间序列数据及目标时间区间内所述目标项目的项目事件输入数据预测模型,其中,所述数据预测模型根据所述第一时间序列数据及所述项目事件对目标时间区间内所述待审核项目指标的指标数据进行预测。
可选地,所述数据预测模型通过以下方式进行训练:
获取目标项目中待审核项目指标在历史时间区间内的历史指标数据;
根据所述待审核项目指标确定目标采样时间间隔,并按照所述目标采样时间间隔对所述历史指标数据进行采样,生成所述待审核项目指标对应的第二时间序列数据;
从所述历史指标数据中提取目标历史时间区间内所述待审核项目指标对应的目标历史指标数据,并获取所述目标历史时间区间内所述目标项目的项目事件;
将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,获得所述数据预测模型。
可选地,所述将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,包括:
将所述第二时间序列数据、所述项目事件及所述目标历史指标数据输入数据预测模型;
其中,所述数据预测模型根据所述第二时间序列数据及所述项目事件对目标历史时间区间内所述待审核项目指标的指标数据进行预测,并计算预测值与所述目标历史指标数据间的损失值,根据所述损失值对所述数据预测模型的模型参数进行调整,以对数据预测模型进行训练。
可选地,所述将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,包括:
将所述目标历史指标数据,以及所述数据预测模型输出的预测结果作为模型参数,并基于所述模型参数以及目标预测算法构建损失函数,其中,所述预测结果由所述数据预测模型根据所述第二时间序列数据及所述项目事件,对所述目标历史时间区间内所述待审核项目指标的指标数据进行预测生成;
基于所述损失函数对所述数据预测模型进行迭代训练,直至达到训练停止条件,停止进行迭代训练。
可选地,所述基于所述模型参数以及目标预测算法构建损失函数,包括:
基于所述第二时间序列数据中包含的历史指标数据的个数确定损失函数的系数,并将所述目标历史指标数据以及所述数据预测模型输出的预测结果作为变量,构建损失函数。
可选地,所述按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据,包括:
按照所述目标采样时间间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据。
可选地,所述根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息,包括:
确定所述待审核项目指标的历史审核信息,并确定所述历史审核信息中所述待审核项目指标对应的指标区间;
根据所述预测结果确定所述指标区间对应的调节范围以及调节方向,并基于所述调节范围以及调节方向,对所述指标区间进行调节,生成所述目标时间区间内所述待审核项目指标对应的审核信息。
可选地,所述数据处理方法,还包括:
获取所述目标项目下所述待审核项目指标在所述目标时间区间的待公示指标值;
利用所述审核信息对所述待公示指标值进行审核,生成对应的审核结果;
在根据所述审核结果确定审核通过的情况下,对所述待公示指标值进行公示处理。
根据本说明书实施例的第二方面,提供了一种数据处理装置,包括:
采样模块,被配置为按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据;
预测模块,被配置为根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测;
确定模块,被配置为根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据;
根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测;
根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述数据处理方法的步骤。
本说明书一个实施例通过按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据,根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测,根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
本说明书实施例利用目标项目中待审核项目指标的指标数据,预先对待审核项目指标在未来某个时间区间(目标时间区间)内的指标数据进行预测,以根据预测结果确定目标时间区间内待审核项目指标对应的合规检测规则(审核信息),从而有利于保证待审核项目指标的合规检测规则的合理性。
附图说明
图1是本说明书一个实施例提供的一种数据处理方法的处理流程图;
图2是本说明书一个实施例提供的一种数据处理方法的处理过程流程图;
图3是本说明书一个实施例提供的一种数据处理装置的示意图;
图4是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本说明书中,提供了一种数据处理方法,本说明书同时涉及一种数据处理装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一个实施例提供的一种数据处理方法的处理流程图,包括步骤102至步骤106。
步骤102,按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据。
具体的,所述目标项目,包括但不限于交易项目、信息查询项目、保险项目、借贷项目、投资项目、法律项目等,本说明书实施例以所述目标项目为交易项目为例进行说明,信息查询项目、保险项目、借贷项目、投资项目、法律项目的具体实现与交易项目的具体实现类似,参照交易项目的具体实现即可,在此不再赘述。
另外,所述待审核项目指标,即目标项目下需要对其指标数据进行审核的项目指标;若所述目标项目为交易项目,则所述待审核项目指标则包括但不限于日交易量、月交易量、年交易量、单笔交易额度等;所述指标数据,即为待审核项目指标对应的具体的数值,例如若待审核项目指标为日交易量,则其指标数据可以是一天之内交易对象的交易量之和,具体的数值形式即可以是200或300等。
实际应用中,本说明书实施例需对目标项目中待审核项目指标的指标数据进行披露,即进行公示或公布,而在进行数据披露之前,则需对这部分指标数据进行合规检测,只有在检测通过,即确定这部分指标数据合规的情况下,才能对其进行披露,但是目前对指标数据进行合规检测所使用的检测规则需通过人工配置,然后通过检测规则对指标数据进行遍历检测,判断是否存在不符合规则的指标数据。由于人工配置检测规则的过程中,所能了解到的信息有限,导致配置的检测规则,其合理性有待提高。
因此,本说明书实施例利用目标项目中待审核项目指标的指标数据,提前对待审核项目指标在未来某个时间区间内的指标数据进行预测,以根据预测结果生成未来某个时间区间内待审核项目指标对应的检测规则(审核信息),并将该检测规则作为人工配置的检测规则的补充,从而提高检测规则的合理性。
实际应用中,时间序列是指把某一变量在不同时间上的数值按先后顺序排列起来形成的序列,它的时间单位可以是分、时、日、周、月、季、年等。
在进行指标数据的预测之前,可先获取目标项目在预设时间段内待审核项目指标的指标数据,并按照预设采样间隔对前述指标数据进行采样,生成待审核项目指标对应的第一时间序列数据。
其中,预设时间段可以是当前时间之前的一个月或一个季度或一年等;并且预设时间段内待审核项目指标的指标数据的粒度以及预设采样间隔可根据待预测的指标数据的粒度确定,例如,若需预测交易对象在未来某一天的交易量,则预设时间段内待审核项目指标的指标数据的粒度可以为天,即获取当前时间之前的一个月或一个季度或一年内交易对象每天的交易量;然后以天为采样间隔,对获取的指标数据进行采样,生成第一时间序列数据。
若需预测交易对象在未来某个月的交易量,则预设时间段内待审核项目指标的指标数据的粒度可以是月,即获取当前时间之前的几个月或几个季度或几年内交易对象每月的交易量;然后以月为采样间隔,对获取的指标数据进行采样,生成第一时间序列数据。
步骤104,根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测。
具体的,如前所述,本说明书实施例需利用目标项目中待审核项目指标的指标数据,提前对待审核项目指标在未来某个时间区间内的指标数据进行预测,因此,所述目标时间区间即表示前述的未来某个时间区间,并且,实际应用中,所述目标时间区间或所述未来某个时间区间即可以是当前时间之后的某个具体的时间点或某一时间段。
所述项目事件,即目标时间区间内与目标项目相关的事件,例如,在所述目标项目为交易项目的情况下,所述项目事件,即可以是打折促销活动或满减活动等。
在所述目标项目为交易项目的情况下,若不存在项目事件,则交易对象每天的交易量差异可能不会很大,这种情况下,利用人工构建的标准检测规则对交易对象每天的交易量对应的指标数据进行合规检测,其检测结果的准确性仍较高;但在某一时间区间内存在项目事件的情况下,该时间区间内交易对象的交易量可能会出现大幅增长,这种情况下,利用人工构建的标准检测规则对该时间区间内交易对象的交易量对应的指标数据进行合规检测,其检测结果即有可能为不合规,即存在检测结果不准确的问题。
因此,本说明书实施例在生成第一时间序列数据后,还可结合目标时间区间内目标项目的项目事件以及所述第一时间序列数据对目标时间区间内待审核项目指标对应的指标数据进行预测,以根据预测结果对人工构建的标准检测规则进行调整,生成适用于目标时间区间内待审核项目指标的审核信息。
具体实施时,根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测,具体可将所述第一时间序列数据及目标时间区间内所述目标项目的项目事件输入数据预测模型,其中,所述数据预测模型根据所述第一时间序列数据及所述项目事件对目标时间区间内所述待审核项目指标的指标数据进行预测。
具体的,在生成第一时间序列数据后,可将第一时间序列数据和目标时间区间内目标项目的项目事件输入数据预测模型,由该数据预测模型根据第一时间序列数据和项目事件,对目标时间区间,即当前时间之后的某一时间点或某一时间段内待审核项目指标的指标数据进行预测,以根据预测结果对人工构建的标准检测规则进行调整,生成适用于目标时间区间内待审核项目指标的审核信息。
其中,所述数据预测模型通过以下方式进行训练:
获取目标项目中待审核项目指标在历史时间区间内的历史指标数据;
根据所述待审核项目指标确定目标采样时间间隔,并按照所述目标采样时间间隔对所述历史指标数据进行采样,生成所述待审核项目指标对应的第二时间序列数据;
从所述历史指标数据中提取目标历史时间区间内所述待审核项目指标对应的目标历史指标数据,并获取所述目标历史时间区间内所述目标项目的项目事件;
将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,获得所述数据预测模型。
进一步的,将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,包括:
将所述第二时间序列数据、所述项目事件及所述目标历史指标数据输入数据预测模型;
其中,所述数据预测模型根据所述第二时间序列数据及所述项目事件对目标历史时间区间内所述待审核项目指标的指标数据进行预测,并计算预测值与所述目标历史指标数据间的损失值,根据所述损失值对所述数据预测模型的模型参数进行调整,以对数据预测模型进行训练。
具体的,本说明书实施例所述的数据预测模型为时间序列预测模型,具体可利用时间序列数据中历史时间节点的指标数据预测目标时间区间的指标数据。
因此,在对数据预测模型进行训练时,可先获取目标项目中待审核项目指标在历史时间区间内的历史指标数据,然后根据待审核项目指标确定目标采样时间间隔,例如,若待审核项目指标为日交易量,则目标采样时间间隔则可以是天,即每一天采集一次;若待审核项目指标为月交易量,则目标采样时间间隔则可以是月,即每个月采集一次。确定目标采样时间间隔后,可按照该目标采样时间间隔对历史指标数据进行采样,生成待审核项目指标对应的第二时间序列数据。
其中,第二时间序列数据的生成过程与前述第一时间序列数据的生成过程类似,在此不再赘述。
生成第二时间序列数据后,可获取目标历史时间区间内所述目标项目的项目事件,并将第二时间序列数据、所述项目事件以及目标历史时间区间内所述待审核项目指标对应的目标历史指标数据输入数据预测模型,以对数据预测模型进行训练。
其中,目标历史时间区间即可以是当前时间点之前,目标项目的项目事件的开始至结束时间对应的时间区间。而目标时间区间则可以是当前时间点之后,目标项目的项目事件的开始至结束时间对应的时间区间;例如,每年的11月11日,各电商平台都会进行商品打折促销活动,那么11月11日0点至24点即可以作为历史年份的目标时间区间,或作为未来年份的目标时间区间。
由于每年的11月11日,交易对象即商品的交易量会大幅上升,这种情况下,为保证利用合规检测规则对11月11日这天的日交易量对应的指标数据进行合规检测所获得的检测结果的准确性,则可以将11月11日这天的商品打折促销活动作为项目事件,并结合该项目事件和第一时间序列数据,对未来的某个年份中11月11日的日交易量的指标数据进行预测,以根据预测结果确定审核信息。
因此,为保证数据预测模型能够实现对目标时间区间内待审核项目指标的指标数据进行预测,则可将该项目事件和第二时间序列数据作为训练样本,将目标历史时间区间内所述待审核项目指标对应的目标历史指标数据作为标签,对数据预测模型进行训练。
实际应用中,可将项目事件和第二时间序列数据作为训练样本,将目标历史时间区间内所述待审核项目指标对应的目标历史指标数据作为标签,输入数据预测模型,由数据预测模型根据所述第二时间序列数据及所述项目事件对目标历史时间区间内所述待审核项目指标的指标数据进行预测,并计算预测值与所述目标历史指标数据间的损失值,根据所述损失值对所述数据预测模型的模型参数进行调整,以对数据预测模型进行训练,从而保证训练获得的数据预测模型输出结果的准确性。
或者,将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,还可通过以下方式实现:
将所述目标历史指标数据,以及所述数据预测模型输出的预测结果作为模型参数,并基于所述模型参数以及目标预测算法构建损失函数,其中,所述预测结果由所述数据预测模型根据所述第二时间序列数据及所述项目事件,对所述目标历史时间区间内所述待审核项目指标的指标数据进行预测生成;
基于所述损失函数对所述数据预测模型进行迭代训练,直至达到训练停止条件,停止进行迭代训练。
进一步的,根据模型参数以及目标预测算法构建损失函数,具体即基于所述第二时间序列数据中包含的历史指标数据的个数确定损失函数的系数,并将所述目标历史指标数据以及所述数据预测模型输出的预测结果作为变量,构建损失函数。
具体的,本说明书实施例可基于指数平滑预测算法构建损失函数,而指数平滑算法是以α(1-α)i为权数(0<α<1),(i=1,2,……,n)对时间序列数据{y1,y2……,yt}进行加权平均的一种预测方法。yt的权数为α,yt-1的权数为α(1-α),yt-2的权数为α(1-α)2,……,以此类推。其计算公式如式(1)所示。
基于模型参数以及指数平滑算法构建的损失函数如式(2)所示。
其中,n为第二时间序列数据中包含的历史指标数据的个数,而yt+1表示t+1期的真实指标数据,即目标历史时间区间内所述待审核项目指标对应的目标历史指标数据,由于不同目标历史时间区间内待审核项目指标对应的目标历史指标数据不同,且不同目标历史时间区间内待审核项目指标对应的指标数据的预测结果不同,因此,本说明书实施例即可将所述目标历史指标数据以及数据预测模型输出的预测结果作为变量,并将第二时间序列数据中包含的历史指标数据的个数减1后的值作为损失函数的系数,以构建式(2)所示的损失函数。
另外,本说明书实施例还可基于移动平均预测算法构建损失函数。
损失函数构建完成后,可基于该损失函数对待训练的数据预测模型进行迭代训练,直至达到训练停止条件,停止进行迭代训练,生成所述数据预测模型。
实际应用中,训练获得数据预测模型后,还可在模型应用过程中,利用模型的输出结果对模型进行优化,具体可将数据预测模型输出的目标时间区间内待审核项目指标对应的预测结果,与目标时间区间内待审核项目指标对应的实际的指标数据进行损失值计算,并根据计算结果对该数据预测模型进行优化,以提高该数据预测模型的预测结果的准确性。
具体实施时,按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据,包括:
按照所述目标采样时间间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据。
具体的,由于在数据预测模型的训练过程中,根据待审核项目指标确定目标采样时间间隔,并按照该目标采样时间间隔对历史指标数据进行采样,以基于采样结果进行模型训练,获得所述数据预测模型,因此,在数据预测模型的应用过程中,仍可按照该目标采样时间间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据,以根据该第一时间序列数据和项目事件,对待审核项目指标在目标时间区间内的指标数据进行预测。
按照目标采样时间间隔对目标项目中待审核项目指标的指标数据进行采样,生成第一时间序列数据,然后基于第一时间序列数据进行预测,有利于保证预测结果的准确性。
步骤106,根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
具体实施时,根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息,具体可通过以下方式实现:
确定所述待审核项目指标的历史审核信息,并确定所述历史审核信息中所述待审核项目指标对应的指标区间;
根据所述预测结果确定所述指标区间对应的调节范围以及调节方向,并基于所述调节范围以及调节方向,对所述指标区间进行调节,生成所述目标时间区间内所述待审核项目指标对应的审核信息。
具体的,所述审核信息中包含待审核项目指标在目标时间区间内的指标数据的合规条件。
如前所述,本说明书实施例利用目标项目中待审核项目指标的指标数据,提前对待审核项目指标在未来某个时间区间内的指标数据进行预测,以根据预测结果生成未来某个时间区间内待审核项目指标对应的检测规则(审核信息),并将该检测规则作为人工配置的检测规则的补充,从而提高检测规则的合理性。
因此,所述历史审核信息即可以是人工配置的标准检测规则,历史审核信息中同样包含待审核项目指标在目标时间区间内的指标数据的合规条件,即指标数据的合规波动范围(指标区间);所述指标区间的调节方向即将指标区间(合规波动范围)的右边界值向上调节/将指标区间的左边界值向下调节(将合规波动范围调大),或将指标区间的右边界值向下调节/将指标区间的左边界值向上调节(将合规波动范围调小);而调节范围即表示指标区间的左边界值或右边界值的调节幅度。
在数据预测模型输出目标时间区间内待审核项目指标的指标数据的预测结果后,即可认为目标时间区间内待审核项目指标的指标数据的合规范围应该与预测结果相同或相近,因此,可根据预测结果确定历史审核信息中待审核项目指标的指标区间应该调大还是调小(调节方向),并确定调节幅度,以基于调节幅度以及调节方向对该指标区间进行调整,生成目标时间区间内所述待审核项目指标对应的审核信息。
本说明书实施例根据预测结果对人工构建的标准检测规则(历史审核信息)进行调整,生成适用于目标时间区间内待审核项目指标的审核信息,并将该审核信息作为人工配置的历史审核信息的补充,有利于提高审核信息的合理性。
进一步的,在生成新的审核信息作为补充后,即可利用该审核信息对目标时间区间内待审核项目指标的指标值(待公示指标值)进行审核,具体可通过以下方式实现:
获取所述目标项目下所述待审核项目指标在所述目标时间区间的待公示指标值;
利用所述审核信息对所述待公示指标值进行审核,生成对应的审核结果;
在根据所述审核结果确定审核通过的情况下,对所述待公示指标值进行公示处理。
具体的,所述待公示指标值即需要进行公布的待审核项目指标的具体数值或具体信息,而在对这些数值或信息进行公布之前,需利用前述方式生成的审核信息对这些数值或信息进行审核,以判断该部分数值或信息是否合规,并且,在根据审核结果确定审核通过,即合规的情况下,即可对所述待公示指标值进行公示处理。
本说明书实施例利用调整后的审核信息进行合规性自查,既保证了所获取审核信息的准确性,同时也保证了审核结果的可信度,有利于提升服务体验。
本说明书一个实施例通过按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据,根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测,根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
本说明书实施例利用目标项目中待审核项目指标的指标数据,预先对待审核项目指标在未来某个时间区间(目标时间区间)内的指标数据进行预测,以根据预测结果确定目标时间区间内待审核项目指标对应的合规检测规则(审核信息),从而有利于保证待审核项目指标的合规检测规则的合理性。
下述结合附图2,以本说明书提供的数据处理方法在交易项目的应用为例,对所述数据处理方法进行进一步说明。其中,图2示出了本说明书一个实施例提供的一种数据处理方法的处理过程流程图,具体步骤包括步骤202至步骤224。
步骤202,获取交易项目中待审核项目指标在历史时间区间内的历史指标数据。
步骤204,根据所述待审核项目指标确定目标采样时间间隔,并按照所述目标采样时间间隔对所述历史指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据。
步骤206,从所述历史指标数据中提取目标历史时间区间内所述待审核项目指标对应的目标历史指标数据,并获取所述目标历史时间区间内所述交易项目的项目事件。
步骤208,基于所述第一时间序列数据中包含的历史指标数据的个数确定损失函数的系数,并将所述目标历史指标数据以及所述数据预测模型输出的预测结果作为变量,构建损失函数。
其中,所述预测结果由所述数据预测模型根据所述第一时间序列数据及所述项目事件,对所述目标历史时间区间内所述待审核项目指标的指标数据进行预测生成。
步骤210,基于所述损失函数对所述数据预测模型进行迭代训练,直至达到训练停止条件,停止进行迭代训练,生成所述数据预测模型。
步骤212,按照所述目标采样时间间隔对交易项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第二时间序列数据。
步骤214,根据所述第二时间序列数据及目标时间区间内所述交易项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测。
步骤216,将所述第二时间序列数据及目标时间区间内所述交易项目的项目事件输入所述数据预测模型进行预测。
其中,所述数据预测模型根据所述第二时间序列数据及所述项目事件对目标时间区间内所述待审核项目指标的指标数据进行预测。
步骤218,根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
步骤220,获取所述交易项目下所述待审核项目指标在所述目标时间区间的待公示指标值。
步骤222,利用所述审核信息对所述待公示指标值进行审核,生成对应的审核结果。
步骤224,在根据所述审核结果确定审核通过的情况下,对所述待公示指标值进行公示处理。
本说明书实施例利用交易项目中待审核项目指标的指标数据,预先对待审核项目指标在未来某个时间区间(目标时间区间)内的指标数据进行预测,以根据预测结果确定目标时间区间内待审核项目指标对应的合规检测规则(审核信息),从而有利于保证待审核项目指标的合规检测规则的合理性。
与上述方法实施例相对应,本说明书还提供了数据处理装置实施例,图3示出了本说明书一个实施例提供的一种数据处理装置的示意图。如图3所示,该装置包括:
采样模块302,被配置为按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据;
预测模块304,被配置为根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测;
确定模块306,被配置为根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
可选地,所述预测模块304,进一步被配置为:
将所述第一时间序列数据及目标时间区间内所述目标项目的项目事件输入数据预测模型,其中,所述数据预测模型根据所述第一时间序列数据及所述项目事件对目标时间区间内所述待审核项目指标的指标数据进行预测。
可选地,所述数据处理装置,还包括:
获取模块,被配置为获取目标项目中待审核项目指标在历史时间区间内的历史指标数据;
生成模块,被配置为根据所述待审核项目指标确定目标采样时间间隔,并按照所述目标采样时间间隔对所述历史指标数据进行采样,生成所述待审核项目指标对应的第二时间序列数据;
提取模块,被配置为从所述历史指标数据中提取目标历史时间区间内所述待审核项目指标对应的目标历史指标数据,并获取所述目标历史时间区间内所述目标项目的项目事件;
训练模块,被配置为将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,获得所述数据预测模型。
可选地,所述训练模块,进一步被配置为:
将所述第二时间序列数据、所述项目事件及所述目标历史指标数据输入数据预测模型;
其中,所述数据预测模型根据所述第二时间序列数据及所述项目事件对目标历史时间区间内所述待审核项目指标的指标数据进行预测,并计算预测值与所述目标历史指标数据间的损失值,根据所述损失值对所述数据预测模型的模型参数进行调整,以对数据预测模型进行训练。
可选地,所述训练模块,进一步被配置为:
构建子模块,被配置为将所述目标历史指标数据,以及所述数据预测模型输出的预测结果作为模型参数,并基于所述模型参数以及目标预测算法构建损失函数,其中,所述预测结果由所述数据预测模型根据所述第二时间序列数据及所述项目事件,对所述目标历史时间区间内所述待审核项目指标的指标数据进行预测生成;
训练子模块,被配置为基于所述损失函数对所述数据预测模型进行迭代训练,直至达到训练停止条件,停止进行迭代训练。
可选地,所述构建子模块,进一步被配置为:
基于所述第二时间序列数据中包含的历史指标数据的个数确定损失函数的系数,并将所述目标历史指标数据以及所述数据预测模型输出的预测结果作为变量,构建损失函数。
可选地,所述采样模块302,进一步被配置为:
按照所述目标采样时间间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据。
可选地,所述确定模块306,进一步被配置为:
确定所述待审核项目指标的历史审核信息,并确定所述历史审核信息中所述待审核项目指标对应的指标区间;
根据所述预测结果确定所述指标区间对应的调节范围以及调节方向,并基于所述调节范围以及调节方向,对所述指标区间进行调节,生成所述目标时间区间内所述待审核项目指标对应的审核信息。
可选地,所述数据处理装置,还包括公示处理模块,被配置为:
获取所述目标项目下所述待审核项目指标在所述目标时间区间的待公示指标值;
利用所述审核信息对所述待公示指标值进行审核,生成对应的审核结果;
在根据所述审核结果确定审核通过的情况下,对所述待公示指标值进行公示处理。
上述为本实施例的一种数据处理装置的示意性方案。需要说明的是,该数据处理装置的技术方案与上述的数据处理方法的技术方案属于同一构思,数据处理装置的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
图4示出了根据本说明书一个实施例提供的一种计算设备400的结构框图。该计算设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接,数据库450用于保存数据。
计算设备400还包括接入设备440,接入设备440使得计算设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备400的上述部件以及图4中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图4所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备400可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备400还可以是移动式或静止式的服务器。
其中,所述存储器410用于存储计算机可执行指令,处理器420用于执行如下计算机可执行指令:
按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据;
根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测;
根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的数据处理方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于实现所述数据处理方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的数据处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.一种数据处理方法,包括:
按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据;
根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测;
根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
2.根据权利要求1所述的数据处理方法,所述根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测,包括:
将所述第一时间序列数据及目标时间区间内所述目标项目的项目事件输入数据预测模型,其中,所述数据预测模型根据所述第一时间序列数据及所述项目事件对目标时间区间内所述待审核项目指标的指标数据进行预测。
3.根据权利要求2所述的数据处理方法,所述数据预测模型通过以下方式进行训练:
获取目标项目中待审核项目指标在历史时间区间内的历史指标数据;
根据所述待审核项目指标确定目标采样时间间隔,并按照所述目标采样时间间隔对所述历史指标数据进行采样,生成所述待审核项目指标对应的第二时间序列数据;
从所述历史指标数据中提取目标历史时间区间内所述待审核项目指标对应的目标历史指标数据,并获取所述目标历史时间区间内所述目标项目的项目事件;
将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,获得所述数据预测模型。
4.根据权利要求3所述的数据处理方法,所述将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,包括:
将所述第二时间序列数据、所述项目事件及所述目标历史指标数据输入数据预测模型;
其中,所述数据预测模型根据所述第二时间序列数据及所述项目事件对目标历史时间区间内所述待审核项目指标的指标数据进行预测,并计算预测值与所述目标历史指标数据间的损失值,根据所述损失值对所述数据预测模型的模型参数进行调整,以对数据预测模型进行训练。
5.根据权利要求3所述的数据处理方法,所述将所述第二时间序列数据及所述项目事件作为训练样本,将所述目标历史指标数据作为样本标签,对数据预测模型进行训练,包括:
将所述目标历史指标数据,以及所述数据预测模型输出的预测结果作为模型参数,并基于所述模型参数以及目标预测算法构建损失函数,其中,所述预测结果由所述数据预测模型根据所述第二时间序列数据及所述项目事件,对所述目标历史时间区间内所述待审核项目指标的指标数据进行预测生成;
基于所述损失函数对所述数据预测模型进行迭代训练,直至达到训练停止条件,停止进行迭代训练。
6.根据权利要求5所述的数据处理方法,所述基于所述模型参数以及目标预测算法构建损失函数,包括:
基于所述第二时间序列数据中包含的历史指标数据的个数确定损失函数的系数,并将所述目标历史指标数据以及所述数据预测模型输出的预测结果作为变量,构建损失函数。
7.根据权利要求1所述的数据处理方法,所述根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息,包括:
确定所述待审核项目指标的历史审核信息,并确定所述历史审核信息中所述待审核项目指标对应的指标区间;
根据所述预测结果确定所述指标区间对应的调节范围以及调节方向,并基于所述调节范围以及调节方向,对所述指标区间进行调节,生成所述目标时间区间内所述待审核项目指标对应的审核信息。
8.根据权利要求1所述的数据处理方法,还包括:
获取所述目标项目下所述待审核项目指标在所述目标时间区间的待公示指标值;
利用所述审核信息对所述待公示指标值进行审核,生成对应的审核结果;
在根据所述审核结果确定审核通过的情况下,对所述待公示指标值进行公示处理。
9.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
按照预设采样间隔对目标项目中待审核项目指标的指标数据进行采样,生成所述待审核项目指标对应的第一时间序列数据;
根据所述第一时间序列数据及目标时间区间内所述目标项目的项目事件,对所述目标时间区间内所述待审核项目指标对应的指标数据进行预测;
根据预测结果,确定所述目标时间区间内所述待审核项目指标对应的审核信息。
10.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1至9任意一项所述数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111331869.0A CN114066405A (zh) | 2021-11-11 | 2021-11-11 | 数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111331869.0A CN114066405A (zh) | 2021-11-11 | 2021-11-11 | 数据处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114066405A true CN114066405A (zh) | 2022-02-18 |
Family
ID=80274877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111331869.0A Pending CN114066405A (zh) | 2021-11-11 | 2021-11-11 | 数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114066405A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115238175A (zh) * | 2022-07-18 | 2022-10-25 | 中移互联网有限公司 | 消息审核方法、装置和电子设备 |
CN115964620A (zh) * | 2023-03-15 | 2023-04-14 | 阿里巴巴(中国)有限公司 | 数据处理方法、存储介质和电子设备 |
-
2021
- 2021-11-11 CN CN202111331869.0A patent/CN114066405A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115238175A (zh) * | 2022-07-18 | 2022-10-25 | 中移互联网有限公司 | 消息审核方法、装置和电子设备 |
CN115238175B (zh) * | 2022-07-18 | 2023-08-15 | 中移互联网有限公司 | 消息审核方法、装置和电子设备 |
CN115964620A (zh) * | 2023-03-15 | 2023-04-14 | 阿里巴巴(中国)有限公司 | 数据处理方法、存储介质和电子设备 |
CN115964620B (zh) * | 2023-03-15 | 2023-12-12 | 阿里巴巴(中国)有限公司 | 数据处理方法、存储介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022211812A1 (en) | Method and system of dynamic model selection for time series forecasting | |
CN108399564B (zh) | 信用评分方法及装置 | |
CN114066405A (zh) | 数据处理方法及装置 | |
US20180349790A1 (en) | Time-Based Features and Moving Windows Sampling For Machine Learning | |
CN112669096B (zh) | 对象推荐模型训练方法以及装置 | |
CN111078880A (zh) | 子应用的风险识别方法以及装置 | |
CN114298232A (zh) | 用户的类型信息的确定方法、设备及存储介质 | |
CN110555749A (zh) | 基于神经网络的信用行为预测方法以及装置 | |
CN111242284A (zh) | 预测方法及装置 | |
CN111310995A (zh) | 基于卷积神经网络的业务预测方法以及装置 | |
CN114581119A (zh) | 流量预测方法以及装置 | |
CN111222631A (zh) | 业务预测方法以及装置 | |
CN109241249B (zh) | 一种确定突发问题的方法及装置 | |
CN110633971A (zh) | 资损估计方法以及装置 | |
CN114091903A (zh) | 资损评估模型的训练方法及装置、资损评估方法及装置 | |
CN113947439A (zh) | 需求预测模型训练方法和装置、需求预测方法和装置 | |
CN114282657A (zh) | 一种市场数据长期预测模型训练方法、装置、设备及存储介质 | |
CN111340281B (zh) | 预测模型训练方法及装置 | |
CN110852854B (zh) | 一种量化收益模型的生成方法和风险控制策略的评价方法 | |
CN113469399A (zh) | 业务预测方法及装置 | |
CN111340632A (zh) | 资源管控方法以及装置 | |
CN111882339A (zh) | 预测模型训练及响应率预测方法、装置、设备及存储介质 | |
CN111784313B (zh) | 业务处理方法以及装置 | |
CN111401845B (zh) | 业务处理方法及装置 | |
CN114091902A (zh) | 风险预测模型的训练方法及装置、风险预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |