CN117575407A - 一种数据处理方法、装置、存储介质及电子设备 - Google Patents
一种数据处理方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN117575407A CN117575407A CN202311564960.6A CN202311564960A CN117575407A CN 117575407 A CN117575407 A CN 117575407A CN 202311564960 A CN202311564960 A CN 202311564960A CN 117575407 A CN117575407 A CN 117575407A
- Authority
- CN
- China
- Prior art keywords
- data
- credit
- target
- trust
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 21
- 238000011156 evaluation Methods 0.000 claims abstract description 96
- 238000004088 simulation Methods 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 60
- 238000011161 development Methods 0.000 claims abstract description 34
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 122
- 238000013475 authorization Methods 0.000 claims description 25
- 238000002360 preparation method Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 19
- 238000007726 management method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000013508 migration Methods 0.000 claims description 5
- 230000005012 migration Effects 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 8
- 238000012854 evaluation process Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 238000013210 evaluation model Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000002000 scavenging effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本说明书公开了一种数据处理方法、装置、存储介质及电子设备,其中,方法包括:获取开发服务端所选择的目标授信源,对目标授信源进行数据清除仿真得到数据源仿真配置,基于数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集,基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据,基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种数据处理方法、装置、存储介质及电子设备。
背景技术
授信是指授信平台为待授信的用户提供一定的资源。授信平台在收到待授信的用户的授信申请后,可以获取一个或多个授信(数据)源针对该待授信用户的用户原始数据,授信平台基于用户原始数据进行评测,以确定该用户是否为可授信用户,以及在确定该用户为可授信用户的情形下,确定该用户的授信额度等授信数据。
发明内容
本说明书提供了一种数据处理方法、装置、存储介质及电子设备,所述技术方案如下:
第一方面,本说明书提供了一种数据处理方法,所述方法包括:
获取开发服务端所选择的目标授信源,对所述目标授信源进行数据清除仿真得到数据源仿真配置;
基于所述数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集;
基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于所述参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据;
基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度。
第二方面,本说明书提供了一种数据处理装置,所述装置包括:
数据获取模块,用于获取开发服务端所选择的目标授信源,对所述目标授信源进行数据清除仿真得到数据源仿真配置;
指标确定模块,用于基于所述数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集;
授信确定模块,用于基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于所述参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据;
数据处理模块,用于基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度。
第三方面,本说明书提供一种计算机存储介质,所述计算机存储介质存储有至少一条指令,所述指令适于由处理器加载并执行本说明书一个或多个实施例的方法步骤。
第四方面,本说明书提供一种计算机程序产品,所述计算机程序产品存储有至少一条指令,所述指令适于由处理器加载并执行本说明书一个或多个实施例的方法步骤。
第五方面,本说明书提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行本说明书一个或多个实施例的方法步骤。
本说明书一些实施例提供的技术方案带来的有益效果至少包括:
在本说明书一个或多个实施例中,服务平台可以获取开发服务端所选择的目标授信源,对目标授信源进行数据清除仿真得到数据源仿真配置,基于数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集,并采用目标授信策略模型确定目标用户授信数据和参考用户授信数据,然后再基于目标用户授信数据和参考用户授信数据,就可以确定针对目标授信源的数据贡献程度,可准确在授信评测过程中对不同授信源机构进行度量,可以准确、高效的评估出待测授信源对授信评测过程的数据贡献程度,为挖掘出高价值、高性价比的授信源提供辅助,以辅助平台决策对相应授信源机构的资源投入,节省数据处理成本。
附图说明
为了更清楚地说明本说明书或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书提供的一种数据处理系统的场景示意图;
图2是本说明书提供的一种数据处理方法的流程示意图;
图3是本说明书提供的另一种数据处理方法的流程示意图;
图4是本说明书提供的一种数据处理装置的结构示意图;
图5是本说明书提供的一种数据获取模块的结构示意图;
图6是本说明书提供的一种指标确定模块的结构示意图;
图7是本说明书提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本说明书中的附图,对本说明书中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
在本说明书的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本说明书的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本说明书中的具体含义。此外,在本说明书的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
在相关技术中,授信平台需要为待授信用户从不同的授信源机构(如银行、金融机构、金融平台)采集得到用户原始数据,依赖不同授信源的用户原始数据进行授信评测,以确定该用户是否为可授信用户,以及在确定该用户为可授信用户的情形下,确定该用户的授信额度等授信数据,而授信源机构众多,从不同的授信源机构获取用户原始数据存在一定的资源开销,因此需要在授信评测过程中对不同授信源机构进行度量。
下面结合具体的实施例对本说明书进行详细说明。
请参见图1,为本说明书提供的一种数据处理系统的场景示意图。如图1所示,所述数据处理系统至少可以包括客户端集群和服务平台100。
所述客户端集群可以包括至少一个客户端,如图1所示,具体包括用户1对应的客户端1、用户2对应的客户端2、…、用户n对应的客户端n,n为大于0的整数。
客户端集群中的各客户端可以是具备通信功能的电子设备,该电子设备包括但不限于:可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中电子设备可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的电子设备等。
所述服务平台100可以是单独的服务器设备,例如:机架式、刀片、塔式、或者机柜式的服务器设备,或采用工作站、大型计算机等具备较强计算能力硬件设备;也可以是采用多个服务器组成的服务器集群,所述服务集群中的各服务器可以是以对称方式组成的,其中每台服务器在事务链路中功能等价、地位等价,各服务器均可单独对外提供服务,所述单独提供服务可以理解为无需另外的服务器的辅助。
在本说明书的一个或多个实施例中,服务平台100与客户端集群中的至少一个客户端可建立通信连接,基于该通信连接完成数据处理过程中数据的交互,诸如线上事务数据交互,如服务平台100可基于本说明书的数据处理方法得到的目标神经网络模型可实现向客户端进行内容推荐;又如,服务平台100可从客户端上获取训练数据,如第一训练数据。
需要说明的是,服务平台100与客户端集群中的至少一个客户端通过网络建立通信连接进行交互通信,其中,网络可以是无线网络,也可以是有线网络,无线网络包括但不限于蜂窝网络、无线局域网、红外网络或蓝牙网络,有线网络包括但不限于以太网、通用串行总线(universal serial bus,USB)或控制器局域网络。在说明书一个或多个实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据(如目标压缩包)。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
本说明书所提供的数据处理系统实施例与一个或多个实施例中的所述数据处理方法属于同一构思,在说明书一个或多个实施例涉及的所述数据处理方法对应的执行主体可以是上述服务平台100;在说明书一个或多个实施例涉及的所述数据处理方法对应的执行主体也可以是客户端所对应的电子设备,具体基于实际应用环境确定。数据处理系统实施例其体现实现过程可详见下述的方法实施例,这里不再赘述。
基于图1所示的场景示意图,下面对本说明书一个或多个实施例提供的数据处理方法进行详细介绍。
请参见图2,为本说明书一个或多个实施例提供了一种数据处理方法的流程示意图,该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的数据处理装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。所述数据处理装置可以为服务平台。
具体的,该数据处理方法包括:
S102:获取开发服务端所选择的目标授信源,对所述目标授信源进行数据清除仿真得到数据源仿真配置;
开发服务端可以是服务平台用于维护、管理授信服务的后台管理设备,服务平台对用户提供授信服务。
示例性的,金融授信场景下,用户授信是否准入以及确定授信后授信数据,通常依赖用户的一系列用户原始数据,用户原始数据来源于若干授信源(机构),诸如银行、金融服务机构、学校等等,而从相应授信源来获取这些用户原始数据对于服务平台而言,需要支出一定的资源开销才能够成功获取到用户原始数据。
进一步的,目标授信源可以是一个或多个,具体基于实际应用场景来确定。
目标授信源是开发服务端从服务平台所关联的所有授信源(机构)中所确定的当前待评测的授信源。
在本说明书中,可以采用离线仿真的手段选择历史平台数据进行针对目标数据源的数据清除仿真,历史平台数据可以理解为针对大量用户从各个授信机构获取的历史用户原始数据集合。
数据清除仿真可以理解为从历史平台数据中将来自目标数据源的相关数据进行清除,而在数据清除仿真过程中需要先生成数据源仿真配置,后续基于数据源仿真配置进行自动清除以及自动计算相关评测指标特征。
在一种可行的实施方式中,可以获取开发服务端针对目标授信源所输入的目标授信数据源信息,基于目标授信数据源信息生成数据源仿真配置。
可以理解的,开发服务端可以向服务平台确定待评测的目标授信源,然后针对目标授信源输入目标授信源信息,然后基于目标授信源信息来生成数据源仿真配置。
目标授信源信息可以包括仿真数据源对应的样本事件范围、授信指标加工逻辑(也可称之为指标加工处理逻辑)、用户群体筛选条件、样本时间范围(也可称之为)等类型中的一种或多种的拟合。
S104:基于所述数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集;
目标授信评测指标特征集可以理解为应用数据源仿真配置后通过获取测试用户的目标用户数据,然后对目标用户数据执行授信指标加工逻辑所得到的一个或多个目标授信评测指标,一个或多个目标授信评测指标的集合也即目标授信评测指标特征集;
参考授信评测指标特征集可以理解为不应用数据源仿真也即不进行任何针对目标授信源的处理,通过获取测试用户的参考用户数据,然后对参考用户数据执行授信指标加工逻辑所得到的一个或多个参考授信评测指标,这些参考授信评测指标的集合也即参考授信评测指标特征集;
例如,假设服务平台关联有n个参考授信源,目标授信评测指标特征集是服务平台执行数据源仿真配置从历史平台数据中将来自目标数据源的相关数据进行清除以对n-1个参考授信源(除去目标授信源)的目标历史平台数据执行授信指标加工逻辑自动计算相关目标评测指标特征,得到目标授信评测指标特征集。同步或异步:服务平台对n个参考授信源对应的历史平台数据按照数据源仿真配置中的执行授信指标加工逻辑自动计算相关参考评测指标特征,得到参考授信评测指标特征集;
示意性的,金融授信场景下,用户授信是否准入,通常依赖用户的用户数据计算授信评测指标,比如年均成交总额,过去x个月平均流水金额,过去x个月最大流水金额等授信评测指标,授信评测指标是由对用户的用户数据经过指标加工计算所得到,指标加工计算是基于授信指标加工逻辑实现的。
示意性的,授信指标加工逻辑:原用户数据经过一定的指标规则运算,产出一新的授信评测指标,这个指标规则运算过程称为授信指标加工逻辑;
S106:基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于所述参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据;
目标授信策略模型是服务平台所提供针对用户的授信数据(如授信额度、授信时间等)评估服务下的一种表征形式,目标授信策略模型基于实际应用环境下平台授信评估规则所配置,具体目标授信策略模型的确定生成过程此处不做限定,例如目标授信策略模型可以是基于机器学习模型使用样本训练数据训练后得到。
目标授信策略模型的输入是待评测用户的授信评测指标特征集,使用目标授信策略模型基于授信评测指标特征集进行授信计算得到用户授信数据(如授信额度、授信时间等),目标授信策略模型的输出是用户授信数据;
具体的,在目标授信评测指标特征集采用目标授信策略模型进行授信计算得到目标用户授信数据,在参考授信评测指标特征集采用目标授信策略模型确定进行授信计算得到参考用户授信数据;
S108:基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度。
在本说明书中,用户的各种数据需要服务平台从不同的授信源(机构)采集得到,从授信源机构采集数据的每次调用会产生一定的资源开销(如费用),随着授信源(机构)越来越多,平台数据采集相关的资源开销也逐渐上涨。在这个过程中有些授信源(机构)的数据对结果的影响较大,有些授信源(机构)的数据对结果的影响较小,本说明书提出了一种衡量数据贡献程度的方法,旨可以更加有效、准确的评估出不同授信源的原始数据对授信处理的影响;
在一种可行的实施方式中,可以训练有数据贡献评估模型,将目标用户授信数据和参考用户授信数据输入至数据贡献评估模型,由数据贡献评估模型基于目标用户授信数据和参考用户授信数据进行数据源影响评估,可以得到针对目标授信源的数据贡献程度,并输出数据贡献程度;
模型创建:基于机器学习模型创建针对金融授信场景的初始数据贡献评估模型,
样本数据获取:获取大量样本数据,样本数据是:基于服务平台的从各个授信机构获取的历史用户原始数据集合,进而在确定待评估的样本授信源后对历史用户原始数据集合进行处理然后计算所得到的样本目标用户授信数据和样本参考用户授信数据,样本目标用户授信数据和样本参考用户授信数据作为样本数据。
样本数据标注:基于需求引入专家端服务由人工对样本数据标注对应的样本标签,样本标签包括针对每个样本数据的样本数据贡献程度。
模型训练过程:将样本数据输入初始数据贡献评估模型进行至少一轮模型训练,得到预测数据贡献程度,基于预测数据贡献程度和样本数据贡献程度采用模型损失函数确定模型损失值,基于该模型损失值对初始数据贡献评估模型进行模型参数调整,直至满足模型训练结束条件得到数据贡献评估模型。
可选的,模型的模型结束训练条件可以包括诸如损失函数的取值小于或等于预设的损失函数阈值,迭代次数达到预设的次数阈值等。具体模型结束训练条件可基于实际情况确定,此处不作具体限定。
需要说明的是,本说明书一个或多个实施例所涉及的机器学习模型包括但不限于卷积神经网络(Convolutional Neural Network,CNN)模型,深度神经网络(Deep NeuralNetwork,DNN)模型、循环神经网络(Recurrent Neural Networks,RNN)、模型、嵌入(embedding)模型、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型、逻辑回归(Logistic Regression,LR)模型等机器学习模型中的一种或多种的拟合;
在一种可行的实施方式中,可以采用如下方式:
A2:基于所述目标用户授信数据和所述参考用户授信数据确定数据源授信增益数据;
数据源授信增益数据是基于目标用户授信数据和参考用户授信数据所计算出的增量数据;
例如,假设目标用户授信数据至少包括目标授信额度,参考用户授信数据至少包括参考授信额度,则数据源授信增益数据中的授信额度增益数据为参考授信额度与目标授信额度所对应的增量;
例如,假设目标用户授信数据至少包括目标授信周期,参考用户授信数据至少包括参考授信周期,则数据源授信增益数据中的授信周期增益数据为参考授信周期与目标授信周期所对应的增量;
A4:确定所述目标授信源的资源开销数据,基于所述资源开销数据和数据源授信增益数据确定针对所述目标授信源的数据贡献程度。
资源开销数据可以理解为服务平台从目标授信源进行用户原始数据所支出的资源开销,通常基于服务平台日常运营事务可直接确定。
具体的,可以计算资源开销数据和数据源增益数据的比值数据,将该比值数据作为针对目标授信源的数据贡献程度。
可选的,考虑到实际数据贡献评估的方便,可以直接生成数据贡献分析数据,从而节省人工分析成本,在本说明书中可引入用于解释数据贡献的数据贡献描述模型,然后采用数据贡献描述模型直接产出数据贡献描述信息,具体而言可以采用如下方式:
示例性的,可以预先基于机器模型训练数据贡献描述模型,数据贡献描述模型的输入是本次授信评测过程所涉及到目标用户授信数据、参考用户授信数据、资源开销数据和数据源授信增益数据和数据贡献程度,数据贡献描述模型的输出是针对待评测数据源的数据贡献描述信息
具体的,将所述目标用户授信数据、所述参考用户授信数据、所述资源开销数据、数据源授信增益数据和所述数据贡献程度输入数据贡献描述模型中,输出针对所述目标数据源的数据贡献描述信息,所述数据贡献描述模型为在数据授信场景下对基础大语言模型迁移训练得到。
进一步的,将所述目标用户授信数据、所述参考用户授信数据、所述资源开销数据、数据源授信增益数据和所述数据贡献程度输入数据贡献描述模型中,并可输入数据贡献描述提示词,数据贡献描述提示词以指示数据贡献描述模型基于输入的一系列数据进行针对待测授信源的数据贡献程度生成描述分析;
可选的,在本说明书中预先训练了数据贡献描述模型,且数据贡献描述模型是对基础大语言模型针对授信数据源评测场景进行场景适配后得到,可快速实现将基础大语言模型迁移训练至授信数据源评测场景下,也即应用在一个新的授信数据源评测场景领域中,不需要重新训练新的模型,仅需对基础大语言模型进行微调训练即可;
进一步的,基础大语言模型诸如可以是ChatGPT模型、文心一言模型、LLM模型等等。本说明书中不对基础大语言模型的类型进行限定。
模型创建:可以是先获取到基础大语言模型,然后构建初始数据贡献描述模型,初始数据贡献描述模型可由场景适配网络和基于基础大语言模型的基础大语言模块组成;
样本数据获取:获取大量样本数据,每个样本数据是针对样本授信源的样本目标用户授信数据、样本参考用户授信数据、样本资源开销数据、样本数据源授信增益数据和样本数据贡献程度,“样本目标用户授信数据、样本参考用户授信数据、样本资源开销数据、样本数据源授信增益数据和样本数据贡献程度”与“目标用户授信数据、参考用户授信数据、资源开销数据、数据源授信增益数据和数据贡献程度”的数据生成过程一致,区别在于处理对象不同,前者为基础大语言模型数据迁移阶段的样本授信源,后者为实际应用阶段的目标授信源;样本数据可以携带数据贡献描述提示词(也即指示模型进行数据贡献描述处理的提示描述词);
例如,数据贡献描述提示词可以是文字形式的提示词,也即指示数据贡献描述模型进行数据贡献描述处理的提示描述词,例如期望大语言生成式模型可以基于一系列样本数据来得到一个分析待测数据源的数据贡献程度的描述分析(也即输出数据贡献描述信息),则数据贡献描述提示词可以为“假设你是一个数据分析专家,请结合针对待评估授信源的一系列数据帮我生成一份分析待测数据源的数据贡献程度的描述分析”;其中,一系列数据也即样本数据,实际应用阶段对应“目标用户授信数据、参考用户授信数据、资源开销数据、数据源授信增益数据和数据贡献程度”。
样本数据标注:基于授信数据源评测场景的需求引入专家端服务由人工对样本数据标注对应的数据贡献描述信息标签。
模型训练过程:将样本数据输入初始数据贡献描述模型进行至少一轮模型训练,得到预测数据贡献描述信息(相当于实际应用阶段的数据贡献描述信息),基于预测数据贡献描述信息和数据贡献描述信息标签采用模型损失函数确定模型损失值,基于该模型损失值对场景适配网络进行模型参数调整控制基础大语言模型的模型参数不变,直至满足模型训练结束条件得到特征匹配模型。
可选的,模型的模型结束训练条件可以包括诸如损失函数的取值小于或等于预设的损失函数阈值,迭代次数达到预设的次数阈值等。具体模型结束训练条件可基于实际情况确定,此处不作具体限定。
需要说明的是,本说明书一个或多个实施例所涉及的场景适配网络基于机器学习模型创建,机器学习模型包括但不限于卷积神经网络(Convolutional Neural Network,CNN)模型,深度神经网络(Deep Neural Network,DNN)模型、循环神经网络(RecurrentNeural Networks,RNN)、模型、嵌入(embedding)模型、梯度提升决策树(GradientBoosting Decision Tree,GBDT)模型、逻辑回归(Logistic Regression,LR)模型等机器学习模型中的一种或多种的拟合。
在本说明书一个或多个实施例中,服务平台可以获取开发服务端所选择的目标授信源,对目标授信源进行数据清除仿真得到数据源仿真配置,基于数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集,并采用目标授信策略模型确定目标用户授信数据和参考用户授信数据,然后再基于目标用户授信数据和参考用户授信数据,就可以确定针对目标授信源的数据贡献程度,可准确在授信评测过程中对不同授信源机构进行度量,可以准确、高效的评估出待测授信源对授信评测过程的数据贡献程度,为挖掘出高价值、高性价比的授信源提供辅助,以辅助平台决策对相应授信源机构的资源投入,节省数据处理成本。
请参见图3,图3是本说明书一个或多个实施例提出的一种数据处理方法的另一种实施例的流程示意图。具体的:
S202:获取开发服务端针对目标授信源所输入的目标授信数据源信息,从目标授信数据源信息中确定目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑;
可以理解的,开发服务人员可以操作开发服务端向服务平台确定本次待评测的目标授信源,然后针对目标授信源输入目标授信源信息,目标授信源信息可以至少包括目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑;
目标授信源信息指示具体的本次待评测授信源,例如是目标授信源的标识等等;
样本用户数据回溯周期指示将那一时间周期内的该目标授信源的用户原始数据进行清除;
指标加工处理逻辑指示如何基于用户原始数据计算相应授信评测指标;
S204:基于所述目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑生成数据源仿真配置;
本说明书中数据清除仿真可以理解为从历史平台数据中将来自目标数据源的相关数据进行清除,而在数据清除仿真过程中需要先生成数据源仿真配置,具体而言基于目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑生成数据源仿真配置,后续基于数据源仿真配置对目标授信源的相关用户原始数据进行自动清除以及自动基于数据计算相关评测指标特征。
S206:基于所述数据源仿真配置确定授信指标加工处理任务实例和授信数据准备任务实例;
进一步的,开发服务人员在操作开发服务端输入完目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑,则此时可以操作开发服务端提交数据源仿真,服务平台会至少基于目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑生成数据源仿真配置;
进一步的,服务平台基于数据源仿真配置,创建授信指标加工处理任务实例和授信数据准备任务实例。
授信数据准备任务实例用于自动执行:从历史平台数据中将来自目标数据源的相关数据进行清除得到包含对n-1个参考授信源(除去目标授信源)的目标历史平台数据;
授信指标加工处理任务实例用于基于授信数据准备任务实例所产出的目标历史平台数据和原历史平台数据进行一系列的授信评测指标的计算,从而计算出一个或多个授信评测指标,这些授信评测指标的集合也即授信评测指标特征集;
进一步的,金融授信场景下,用户授信是否准入,通常依赖用户的用户数据计算授信评测指标,比如年均成交总额,过去x个月平均流水金额,过去x个月最大流水金额等授信评测指标,授信评测指标是基于由对用户的用户数据经过指标加工计算所得到,指标加工计算是基于授信指标加工逻辑实现的。
示意性的,授信指标加工处理任务实例对应的授信指标加工逻辑:数据经过一定的指标规则运算,产出一新的授信评测指标,这个指标规则运算过程称为授信指标加工逻辑;
可选的,服务平台可以与开发服务端进行交互,服务平台将授信指标加工处理任务实例的第一实例状态同步至开发服务端,开发服务端可以将第一实例状态进行显示;和/或,服务平台将授信指标加工处理任务实例的第二实例状态同步至开发服务端,开发服务端可以将第二实例状态进行显示;
示例性的,服务平台可以监测所述授信数据准备任务实例对应的第一执行任务状态,向所述开发服务端同步所述第一执行任务状态;
示例性的,服务平台可以监测所述授信指标加工处理任务实例对应的第二执行任务状态,向所述开发服务端同步所述第二执行任务状态。
S208:执行所述授信数据准备任务实例,以获取目标授信数据集和参考授信数据集,所述目标授信数据集为所述参考授信数据集经目标数据源数据清除后得到;
自动执行授信数据准备任务实例,从历史平台数据中将来自目标数据源的相关数据进行清除得到包含对n-1个参考授信源(除去目标授信源)的目标历史平台数据(也即目标授信数据集);同时将本次纳入参考的原历史平台数据作为参考授信数据集。
可选的,服务平台组执行所述执行所述授信数据准备任务实例,以获取目标授信数据集和参考授信数据集,可以采用如下方式:
通过数据管理中心服务向离线资源管理服务提交授信数据准备任务,并执行授信数据准备任务实例,基于所述授信数据准备任务实例获取参考授信数据集,对所述参考授信数据集中的目标数据源数据进行清除处理,得到目标授信数据集;
例如,服务平台可以至少维护有数据管理中心服务和离线资源管理服务,数据管理中心服务可简称为bkdmc服务,离线资源管理服务也可称之为数据中台,服务平台与数据管理中心服务和离线资源管理服务进行协调,以提高平台数据服务处理效率。
示例性的,通过数据管理中心服务(如bkdmc服务)向离线资源管理服务提交授信数据准备任务,离线资源管理服务会从历史平台数据中将来自目标数据源的相关数据进行清除得到包含对n-1个参考授信源(除去目标授信源)的目标历史平台数据(也即目标授信数据集);同时将本次纳入参考的原历史平台数据作为参考授信数据集,完成数据清洗;
S210:执行所述授信指标加工处理任务实例,通过所述授信指标加工处理任务实例对所述目标授信数据集进行指标加工处理得到目标授信评测指标特征集,和对所述参考授信数据集进行指标加工处理得到参考授信评测指标特征集。
目标授信评测指标特征集是对目标授信数据集执行授信指标加工逻辑所得到的一个或多个目标授信评测指标,一个或多个目标授信评测指标的集合也即目标授信评测指标特征集;
参考授信评测指标特征集是对参考授信数据集执行授信指标加工逻辑所得到的一个或多个参考授信评测指标,这些参考授信评测指标的集合也即参考授信评测指标特征集;
在一种可行的实施方式中,服务平台可以通过数据管理中心服务向离线资源管理服务提交授信指标加工处理任务,并执行授信指标加工处理任务实例;基于所述授信指标加工处理任务实例对所述目标授信数据集进行指标加工处理得到目标授信评测指标特征集,和对所述参考授信数据集进行指标加工处理得到参考授信评测指标特征集;
S212:基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于所述参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据;
具体可参考本说明书其他实施例的方法步骤,此处不再赘述。
S214:基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度。
具体可参考本说明书其他实施例的方法步骤,此处不再赘述。
在本说明书一个或多个实施例中,服务平台可以获取开发服务端所选择的目标授信源,对目标授信源进行数据清除仿真得到数据源仿真配置,基于数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集,并采用目标授信策略模型确定目标用户授信数据和参考用户授信数据,然后再基于目标用户授信数据和参考用户授信数据,就可以确定针对目标授信源的数据贡献程度,可准确在授信评测过程中对不同授信源机构进行度量,可以准确、高效的评估出待测授信源对授信评测过程的数据贡献程度,为挖掘出高价值、高性价比的授信源提供辅助,以辅助平台决策对相应授信源机构的资源投入,节省数据处理成本;以及,使用平台离线的历史平台数据构建针对待评测目标授信源的样本,基于相关平台服务在仿真时将目标授信源的数据剔除,离线执行指标特征加工逻辑,产出新的授信评测指标特征集,在这些新的授信评测指标特征集上运行目标授信策略模型,通过比对目标用户授信数据和所述参考用户授信数据,来衡量该目标授信源数据的重要程度。通过控制变量的方式精准衡量目标授信源数据在指标加工过程中的参与度,衡量目标授信源数据在用户授信过程中的数据贡献程度。
下面将结合图4,对本说明书提供的数据处理装置进行详细介绍。需要说明的是,图4所示的数据处理装置,用于执行本说明书图1~图3所示实施例的方法,为了便于说明,仅示出了与本说明书相关的部分,具体技术细节未揭示的,请参照本说明书图1~图3所示的实施例。
请参见图4,其示出本说明书的数据处理装置的结构示意图。该数据处理装置1可以通过软件、硬件或者两者的结合实现成为设备的全部或一部分。根据一些实施例,该数据处理装置1包括数据获取模块11、指标确定模块12、授信确定模块13和数据处理模块14,具体用于:
数据获取模块11,用于获取开发服务端所选择的目标授信源,对所述目标授信源进行数据清除仿真得到数据源仿真配置;
指标确定模块12,用于基于所述数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集;
授信确定模块13,用于基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于所述参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据;
数据处理模块14,用于基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度。
可选的,所述数据获取模块11,用于:
获取开发服务端针对目标授信源所输入的目标授信数据源信息,基于目标授信数据源信息进行数据清除仿真得到数据源仿真配置。
可选的,如图5所示,所述数据获取模块11,包括:
数据确定单元111,用于从目标授信数据源信息中确定目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑;
配置生成单元112,用于基于所述目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑生成数据源仿真配置。
可选的,如图6所示,所述指标确定模块12,包括:
实例确定单元121,用于基于所述数据源仿真配置确定授信指标加工处理任务实例和授信数据准备任务实例;
实例执行单元122,用于执行所述授信数据准备任务实例,以获取目标授信数据集和参考授信数据集,所述目标授信数据集为所述参考授信数据集经目标数据源数据清除后得到;
所述执行单元122,还用于执行所述授信指标加工处理任务实例,通过所述授信指标加工处理任务实例对所述目标授信数据集进行指标加工处理得到目标授信评测指标特征集,和对所述参考授信数据集进行指标加工处理得到参考授信评测指标特征集。
可选的,所述执行单元122,用于:
通过数据管理中心服务向离线资源管理服务提交授信数据准备任务,并执行授信数据准备任务实例;
基于所述授信数据准备任务实例获取参考授信数据集,对所述参考授信数据集中的目标数据源数据进行清除处理,得到目标授信数据集;
所述执行所述授信指标加工处理任务实例,通过所述授信指标加工处理任务实例对所述目标授信数据集进行指标加工处理得到目标授信评测指标特征集,和对所述参考授信数据集进行指标加工处理得到参考授信评测指标特征集,包括:
通过数据管理中心服务向离线资源管理服务提交授信指标加工处理任务,并执行授信指标加工处理任务实例;
基于所述授信指标加工处理任务实例对所述目标授信数据集进行指标加工处理得到目标授信评测指标特征集,和对所述参考授信数据集进行指标加工处理得到参考授信评测指标特征集。
可选的,所述执行单元122,用于:
监测所述授信数据准备任务实例对应的第一执行任务状态,向所述开发服务端同步所述第一执行任务状态;和/或,
监测所述授信指标加工处理任务实例对应的第二执行任务状态,向所述开发服务端同步所述第二执行任务状态。
可选的,所述执行单元122,用于:
将所述目标授信评测指标特征集和所述参考授信评测指标特征集输入至目标授信策略模型中进行授信处理得到目标用户授信数据和参考用户授信数据。
可选的,所述数据处理模块14,用于:
基于所述目标用户授信数据和所述参考用户授信数据确定数据源授信增益数据;
确定所述目标授信源的资源开销数据,基于所述资源开销数据和数据源授信增益数据确定针对所述目标授信源的数据贡献程度。
可选的,所述数据处理模块14,用于:计算所述资源开销数据和数据源授信增益数据的商值数据,将所述商值数据确定为针对所述目标授信源的数据贡献程度。
可选的,所述装置1还用于:
将所述目标用户授信数据、所述参考用户授信数据、所述资源开销数据、数据源授信增益数据和所述数据贡献程度输入数据贡献描述模型中,输出针对所述目标数据源的数据贡献描述信息,所述数据贡献描述模型为在数据授信场景下对基础大语言模型迁移训练得到。
需要说明的是,上述实施例提供的数据处理装置在执行数据处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的数据处理装置与数据处理方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本说明书序号仅仅为了描述,不代表实施例的优劣。
本说明书还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1~图3所示实施例的所述数据处理方法,具体执行过程可以参见图1~图3所示实施例的具体说明,在此不进行赘述。
本说明书还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如上述图1~图3所示实施例的所述数据处理方法,具体执行过程可以参见图1~图3所示实施例的具体说明,在此不进行赘述。
请参考图7,为本说明书实施例提供的一种电子设备的结构方框图。本说明书中的电子设备可以包括一个或多个如下部件:处理器110、存储器120、输入装置130、输出装置140和总线150。处理器110、存储器120、输入装置130和输出装置140之间可以通过总线150连接。
处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个终端内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行终端100的各种功能和处理数据。可选地,处理器110可以采用数字信号处理(digital signal processing,DSP)、现场可编程门阵列(field-programmable gate array,FPGA)、可编程逻辑阵列(programmable logicArray,PLA)中的至少一种硬件形式来实现。处理器110可集成中心处理器(centralprocessing unit,CPU)、图像处理器(graphics processing unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块通信芯片进行实现。
存储器120可以包括随机存储器(random Access Memory,RAM),也可以包括只读存储器(read-only memory,ROM)。可选地,该存储器120包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器120可用于存储指令、程序、代码、代码集或指令集。
其中,输入装置130用于接收输入的指令或数据,输入装置130包括但不限于键盘、鼠标、摄像头、麦克风或触控设备。输出装置140用于输出指令或数据,输出装置140包括但不限于显示设备和扬声器等。在本说明书实施例中,输入装置130可以为温度传感器,用于获取终端的运行温度。输出装置140可以为扬声器,用于输出音频信号。
除此之外,本领域技术人员可以理解,上述附图所示出的终端的结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端中还包括射频电路、输入单元、传感器、音频电路、无线保真(wirelessfidelity,WIFI)模块、电源、蓝牙模块等部件,在此不再赘述。
在本说明书实施例中,各步骤的执行主体可以是上文介绍的终端。可选地,各步骤的执行主体为终端的操作系统。操作系统可以是安卓系统,也可以是IOS系统,或者其它操作系统,本说明书实施例对此不作限定。
在图7的电子设备中,处理器110可以用于调用存储器120中存储的程序,并执行以实现如本说明书各个方法实施例所述的数据处理方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
需要说明的是,本说明书实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本说明书中涉及的用户信息、授信数据等都是在充分授权的情况下获取的。
以上所揭露的仅为本说明书较佳实施例而已,当然不能以此来限定本说明书之权利范围,因此依本说明书权利要求所作的等同变化,仍属本说明书所涵盖的范围。
Claims (14)
1.一种数据处理方法,所述方法包括:
获取开发服务端所选择的目标授信源,对所述目标授信源进行数据清除仿真得到数据源仿真配置;
基于所述数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集;
基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于所述参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据;
基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度。
2.根据权利要求1所述的方法,所述获取开发服务端所选择的目标授信源,对所述目标授信源进行数据清除仿真得到数据源仿真配置,包括:
获取开发服务端针对目标授信源所输入的目标授信数据源信息,基于目标授信数据源信息进行数据清除仿真得到数据源仿真配置。
3.根据权利要求2所述的方法,所述基于目标授信数据源信息进行数据清除仿真得到数据源仿真配置,包括:
从目标授信数据源信息中确定目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑;
基于所述目标清除数据源信息、样本用户数据回溯周期和指标加工处理逻辑生成数据源仿真配置。
4.根据权利要求1所述的方法,所述基于所述数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集,包括:
基于所述数据源仿真配置确定授信指标加工处理任务实例和授信数据准备任务实例;
执行所述授信数据准备任务实例,以获取目标授信数据集和参考授信数据集,所述目标授信数据集为所述参考授信数据集经目标数据源数据清除后得到;
执行所述授信指标加工处理任务实例,通过所述授信指标加工处理任务实例对所述目标授信数据集进行指标加工处理得到目标授信评测指标特征集,和对所述参考授信数据集进行指标加工处理得到参考授信评测指标特征集。
5.根据权利要求2所述的方法,所述执行所述授信数据准备任务实例,以获取目标授信数据集和参考授信数据集,包括:
通过数据管理中心服务向离线资源管理服务提交授信数据准备任务,并执行授信数据准备任务实例;
基于所述授信数据准备任务实例获取参考授信数据集,对所述参考授信数据集中的目标数据源数据进行清除处理,得到目标授信数据集;
所述执行所述授信指标加工处理任务实例,通过所述授信指标加工处理任务实例对所述目标授信数据集进行指标加工处理得到目标授信评测指标特征集,和对所述参考授信数据集进行指标加工处理得到参考授信评测指标特征集,包括:
通过数据管理中心服务向离线资源管理服务提交授信指标加工处理任务,并执行授信指标加工处理任务实例;
基于所述授信指标加工处理任务实例对所述目标授信数据集进行指标加工处理得到目标授信评测指标特征集,和对所述参考授信数据集进行指标加工处理得到参考授信评测指标特征集。
6.根据权利要求5所述的方法,所述方法还包括:
监测所述授信数据准备任务实例对应的第一执行任务状态,向所述开发服务端同步所述第一执行任务状态;和/或,
监测所述授信指标加工处理任务实例对应的第二执行任务状态,向所述开发服务端同步所述第二执行任务状态。
7.根据权利要求1所述的方法,所述基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于所述参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据,包括:
将所述目标授信评测指标特征集和所述参考授信评测指标特征集输入至目标授信策略模型中进行授信处理得到目标用户授信数据和参考用户授信数据。
8.根据权利要求1所述的方法,所述基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度,包括:
基于所述目标用户授信数据和所述参考用户授信数据确定数据源授信增益数据;
确定所述目标授信源的资源开销数据,基于所述资源开销数据和数据源授信增益数据确定针对所述目标授信源的数据贡献程度。
9.根据权利要求2所述的方法,所述基于所述资源开销数据和数据源授信增益数据确定针对所述目标授信源的数据贡献程度,包括:
计算所述资源开销数据和数据源授信增益数据的商值数据,将所述商值数据确定为针对所述目标授信源的数据贡献程度。
10.根据权利要求9所述的方法,所述方法还包括:
将所述目标用户授信数据、所述参考用户授信数据、所述资源开销数据、数据源授信增益数据和所述数据贡献程度输入数据贡献描述模型中,输出针对所述目标数据源的数据贡献描述信息,所述数据贡献描述模型为在数据授信场景下对基础大语言模型迁移训练得到。
11.一种数据处理装置,所述装置包括:
数据获取模块,用于获取开发服务端所选择的目标授信源,对所述目标授信源进行数据清除仿真得到数据源仿真配置;
指标确定模块,用于基于所述数据源仿真配置确定针对测试用户的目标授信评测指标特征集和参考授信评测指标特征集;
授信确定模块,用于基于目标授信评测指标特征集采用目标授信策略模型确定目标用户授信数据,基于所述参考授信评测指标特征集采用所述目标授信策略模型确定参考用户授信数据;
数据处理模块,用于基于所述目标用户授信数据和所述参考用户授信数据,确定针对所述目标授信源的数据贡献程度。
12.一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~10任意一项的方法步骤。
13.一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由处理器加载并执行如权利要求1~10任意一项的方法步骤。
14.一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~10任意一项的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311564960.6A CN117575407A (zh) | 2023-11-22 | 2023-11-22 | 一种数据处理方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311564960.6A CN117575407A (zh) | 2023-11-22 | 2023-11-22 | 一种数据处理方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117575407A true CN117575407A (zh) | 2024-02-20 |
Family
ID=89887768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311564960.6A Pending CN117575407A (zh) | 2023-11-22 | 2023-11-22 | 一种数据处理方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117575407A (zh) |
-
2023
- 2023-11-22 CN CN202311564960.6A patent/CN117575407A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108197652B (zh) | 用于生成信息的方法和装置 | |
CN112884092B (zh) | Ai模型生成方法、电子设备及存储介质 | |
CN109858828B (zh) | 一种配电网定值自动整定方法、装置及配网系统 | |
CN111651989B (zh) | 命名实体识别方法和装置、存储介质及电子装置 | |
CN112351076A (zh) | 推荐系统api的生成方法、装置、电子设备及存储介质 | |
CN117150130A (zh) | 一种内容生成方法、装置、存储介质及电子设备 | |
CN111523798B (zh) | 一种自动建模的方法、装置、系统、及其电子设备 | |
CN117131179A (zh) | 一种对话处理方法、装置、存储介质及电子设备 | |
CN117575407A (zh) | 一种数据处理方法、装置、存储介质及电子设备 | |
CN106779404A (zh) | 一种流程预告警方法和装置 | |
CN116306777A (zh) | 模型精度损失定位方法、装置和电子设备 | |
CN114004206A (zh) | 一种表单生成方法、装置、计算机设备和存储介质 | |
CN113052509A (zh) | 模型评估方法、模型评估装置、电子设备和存储介质 | |
CN112307757A (zh) | 基于辅助任务的情感分析方法、装置、设备及存储介质 | |
CN111159988A (zh) | 一种模型处理方法、装置、计算机设备及存储介质 | |
CN113457128B (zh) | 游戏角色对战胜率预测方法、装置 | |
CN117785721A (zh) | 一种应用测试方法、装置、存储介质及电子设备 | |
CN117978363B (zh) | 区域相关数据信息流转方法、装置、电子设备和介质 | |
CN116614431B (zh) | 数据处理方法、装置、电子设备和计算机可读存储介质 | |
CN111526054B (zh) | 用于获取网络的方法及装置 | |
CN110362619B (zh) | 一种基于认证服务器的用户注册方法、装置和电子设备 | |
CN112766350B (zh) | 二分类模型构建方法、装置、设备及计算机可读存储介质 | |
CN111813694B (zh) | 测试方法、测试装置、电子设备及可读存储介质 | |
CN114722061B (zh) | 数据处理方法及装置、设备、计算机可读存储介质 | |
CN116954860A (zh) | 一种文件处理方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |