CN115934809B - 一种数据处理方法、装置和电子设备 - Google Patents

一种数据处理方法、装置和电子设备 Download PDF

Info

Publication number
CN115934809B
CN115934809B CN202310239311.2A CN202310239311A CN115934809B CN 115934809 B CN115934809 B CN 115934809B CN 202310239311 A CN202310239311 A CN 202310239311A CN 115934809 B CN115934809 B CN 115934809B
Authority
CN
China
Prior art keywords
intervention
variable
parameter
conversion
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310239311.2A
Other languages
English (en)
Other versions
CN115934809A (zh
Inventor
曹绍升
周霖
黄海斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202310239311.2A priority Critical patent/CN115934809B/zh
Publication of CN115934809A publication Critical patent/CN115934809A/zh
Application granted granted Critical
Publication of CN115934809B publication Critical patent/CN115934809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例公开了一种数据处理方法、装置和电子设备,通过对干预变量进行转换处理,获取对应的多维变量,将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数,响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。由此,本发明实施例通过将干预变量转换为多维变量以增加其影响程度,从而可以提高转化预测模型对是否执行干预变量对应操作的判断准确度。

Description

一种数据处理方法、装置和电子设备
技术领域
本发明涉及计算机技术领域,更具体地,涉及一种数据处理方法、装置和电子设备。
背景技术
在提高业务增长或新的服务推出时,如何挖掘出潜在用户并进行用户转化是一种重要问题。在转化过程中,往往会采用一定的策略,例如推送广告等,以便于用户能够清楚了解相关业务。而若对所有用户实施相关策略,操作成本较大,且可能会给予一些用户带来不必要的信息负担。因此,如何准确识别可转化对象是目前亟待解决的难题。
发明内容
有鉴于此,本发明实施例提供一种数据处理方法、装置和电子设备,以通过将干预变量转换为多维变量以增加其影响程度,提高转化预测模型对是否执行干预变量对应操作的判断准确度。
第一方面,本发明实施例提供一种数据处理方法,所述方法包括:
对干预变量进行转换处理,获取对应的多维变量;
将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数;
响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。
可选的,所述干预变量包括干预状态和/或不干预状态;
所述目标转化参数包括干预状态下对应的第一转化参数、和/或不干预状态下对应的第二转化参数。
可选的,所述响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签包括:
根据所述第一转化参数和/或第二转化参数确定所述目标对象的操作执行价值参数;
响应于所述操作执行价值参数达到预定值,对所述目标对象标注第一标签。
可选的,所述根据所述第一转化参数和/或第二转化参数确定所述目标对象的操作执行价值参数包括:
计算所述第一转化参数和所述第二转化参数的差值;
根据所述差值确定所述操作执行价值参数。
可选的,所述对干预变量进行转换处理,获取对应的多维变量包括:
将所述干预变量输入至预定的特征处理层,获取所述多维变量。
可选的,所述特征处理层基于矩阵构建、或者基于傅立叶变换函数构建;
所述矩阵的参数与所述转化预测模型进行同步训练。
可选的,所述转化预测模型通过以下步骤训练:
获取训练数据集,所述训练数据集包括多个样本,所述样本包括样本的基础特征参数、干预变量和样本标签;
对各所述样本的干预变量进行转换处理,获取各所述样本分别对应的多维变量;
将各所述样本的多维变量和基础特征参数输入至转化预测模型中进行处理,获取各所述样本的转化参数;
基于各所述样本的样本标签和所述转化参数的差异性,调节所述转化预测模型的参数。
可选的,所述方法还包括:
响应于所述第二转化参数达到第一转化阈值,对所述目标对象标注第二标签,所述第二标签用于表征所述目标对象自然转化的概率大于概率阈值。
可选的,所述目标转化参数满足预定条件具体为:所述第一转化参数达到第二转化阈值。
第二方面,本发明实施例提供一种数据处理装置,所述装置包括:
转换处理单元,被配置为对干预变量进行转换处理,获取对应的多维变量;
参数获取单元,被配置为将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数;
标注单元,被配置为响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。
第三方面,本发明实施例提供一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如上所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。
第五方面,本发明实施例提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如上所述的方法。
本发明实施例通过对干预变量进行转换处理,获取对应的多维变量,将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数,响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。由此,本发明实施例通过将干预变量转换为多维变量以增加其影响程度,从而可以提高转化预测模型对是否执行干预变量对应操作的判断准确度。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是本发明实施例的数据处理方法的流程图;
图2是本发明实施例的转化预测模型的训练方法的流程图;
图3是本发明实施例的转化预测模型的训练过程示意图;
图4是本发明实施例的数据处理过程的示意图;
图5是本发明实施例的数据处理装置的示意图;
图6是本发明实施例的电子设备的示意图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本说明书及实施例中所述方案,如涉及个人信息处理,则均会在具备合法性基础(例如征得个人信息主体同意,或者为履行合同所必需等)的前提下进行处理,且仅会在规定或者约定的范围内进行处理。用户拒绝处理基本功能所需必要信息以外的个人信息,不会影响用户使用基本功能。
在本发明实施例中,所提到的自然转化用户表征未采取相关策略,自然成为用户的对象。干预转化用户表征在采取相关拉新操作后才成为用户的对象。其中,成为用户可以表征成为某一平台相关APP或小程序的用户,或者使用某一平台功能的用户、或者购买某一物品的用户等。本实施例主要以平台拉新场景为例进行描述,应理解,本实施例还可应用于其他应用场景,例如对某一产品的推广(也即执行相关推广操作,预测用户是否使用或购买该产品)场景,本实施例并不对此进行限制。
对于平台或平台推出的新服务来说,大多拉新策略往往需要消耗一定的成本(例如发信息的通信成本等),因此,准确识别能够通过拉新干预策略转化为新用户的用户是至关重要的。
因果推断是一种通过算法模型来分析因果关系的方法,也可成为因果模型。自然转化和干预转化可以认为是对是否施加拉新干预策略的因果关系分析。因此,在相关技术领域,通过采用因果推断方法来解决上述问题。常见的因果推断方法包括S-Learner(S模型),T-Learner(T模型),X-Learner(X模型)等。
S模型可通过现有的模型(例如LR、GBDT、NN模型等)对干预和不干预的数据进行训练,在预测时,分别获取执行干预和不执行干预时的转化概率进行预测计算,并将预测结果进行相减,获取价值参数,以用于评估是否对相关用户执行拉新干预操作。由此可见,S模型可以使用现有的模型,并且只依赖于一个模型,避免了多模型的累积误差。
T模型利用干预后的数据集和未干预的数据集分别训练两个模型,在预测时,计算两个模型的输出差值,获取价值参数,以用于评估是否对相关用户执行拉新干预操作。由此可见,T模型也可使用现有的模型,且不需要太多的特征工程工作。
X-Learner(X模型)通过交叉训练的方式,并采用干预组模型预测不干预的数据,用不干预的模型预测干预的数据。也即,预测被拉新操作干预的用户,在不被干预的情况下转化的概率,以及未被干预的用户,如果实施干预转化的概率,然后计算差值并拟合,这解决了对照组和实验组之间数据不平衡的问题。
然而,一般地,在模型预测过程中,用户相关特征往往有上百个特征变量,如果仅有一个特征变量发生变换(比如从0变成1),其他特征变量的值都不变,模型的输出值经常不会发生改变。因此,现有的预测模型经常会出现预测不准的情况。因此,本实施例提供一种数据处理方法、装置和电子设备,以通过将干预变量转换为多维变量以增加其影响程度,提高转化预测模型对是否执行干预变量对应操作的判断准确度。
图1是本发明实施例的数据处理方法的流程图。如图1所示,本发明实施例的数据处理方法包括以下步骤:
步骤S110,对干预变量进行转换处理,获取对应的多维变量。在一种可选的实现方式中,本实施例的干预变量可以包括干预状态和/或不干预状态。例如,对于干预变量T,T=1(也即干预状态)或T=0(也即不干预状态)。可选的,干预变量对应的操作可以为推送优惠券、发送推广消息、推送定向宣传等,本实施例并不对干预变量的操作进行限制。
在一种可选的实现方式中,本实施例将干预变量输入至预定的特征处理层中,获取其对应的多维变量。也就是说,本实施例通过特征处理层增加干预变量的维度,也即相当于通过一个干预变量生成不同维度的多个干预因子,由此,若干预变量发生变化,输入至转化模型参数的多个干预因子发生变化,其能够提高对转化预测模型输出的影响程度,进而可以提高转化预测模型在干预变量单独变化时的预测准确性。
进一步可选的,在本实施例中,特征处理层基于矩阵构建、或者基于傅立叶变换函数构建。
若特征处理层采用参数可学习矩阵进行构建,则特征处理层中的矩阵参数可以与转化预测模型的参数进行同步训练,以提高干预变量对应的多维变量的有效性,进一步提高转化预测模型在干预变量单独变化时的预测准确性。
若特征处理层基于傅立叶变换函数构建,则可通过特征处理层将时域的一维变量(干预变量)转换到频域,获得多维变量。
进一步地,本实施例的特征处理层将一维的干预变量转换为K维的多维变量。其中,特征处理层中的K是一个超参数,K的值可以大于1,且小于用户的基础特征参数的数量。由此,可以避免干预变量对结果的影响力过大,导致预测不准确的情况。
步骤S120,将多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取目标对象的目标转化参数。
可选的,在本实施例中,目标对象的基础特征参数可以包括用户的基本信息。例如,在当前平台推出新的服务、或者当前平台的关联平台需要拉新时,在用户授权情况下获取当前平台已注册用户的基本信息。例如,用户使用平台的时间、使用频次、所使用的功能等。本实施例并不对用户基本信息进行限制,其能够经用户授权在合法合规的情况下获取即可。在其他可选的实现方式中,也可以采用填写问卷等方式获取用户的基本信息,本实施例并不对此进行限制。
进一步地,本实施例的转化预测模型以采用S模型为例,其在训练过程中仅依赖于一个模型,避免了多模型的累计误差。应理解,在其他可选的实现方式中,本实施例的转化预测模型还可以采用T模型或X模型,本实施例并不对此进行限制。
步骤S210,获取训练数据集。其中,训练数据集包括多个样本,所述样本包括样本的基础特征参数、干预变量和样本标签。其中,样本标签表征对应的样本是否转化成功。
在一种可选的实现方式中,一部分样本中的干预变量T=1,样本标签Y=1。也即,这类样本中的用户在接收到干预变量T对应的操作后(例如接收到优惠券信息等),转化为平台新用户。
一部分样本中的干预变量T=1,样本标签Y=0。也即,这类样本中的用户在接收到干预变量T对应的操作后(例如接收到优惠券信息等),未转化为平台新用户。
一部分样本中的干预变量T=0,样本标签Y=1。也即,这类样本中的用户在未接收到干预变量T对应的操作后(例如接收到优惠券信息等),转化为平台新用户。
一部分样本中的干预变量T=0,样本标签Y=0。也即,这类样本中的用户在未接收到干预变量T对应的操作后(例如接收到优惠券信息等),未转化为平台新用户。
由于前期干预变量T=1的样本较少,因此,本实施例还通过获取干预变量T=0的样本作为训练数据集,以进一步提高转化预测模型的准确性。
步骤S220,对各样本的干预变量进行转换处理,获取各样本分别对应的多维变量。
可选的,本实施例可以将各样本的干预变量输入至预定的特征处理层进行转换处理,获取各样本分别对应的多维变量。进一步可选的,特征处理层可以为具有参数可学习矩阵的处理层,也可以为基于傅立叶变换确定的处理层,本实施例并不对此进行限制,其能够实现将一维数据转换为相关的多维数据即可。
步骤S230,将各样本的多维变量和基础特征参数输入至转化预测模型中进行处理,获取各样本的转化参数。其中,转化参数用于表征该样本能够被转化为新用户的概率。
步骤S240,基于各样本的样本标签和转化参数的差异性,调节转化预测模型的参数。
进一步地,本实施例根据各样本的实际的样本标签和转化参数的差异性,调节转化预测模型的参数,直至各样本的样本标签和转化参数的差异性满足条件,获取训练完成的转化预测模型。
进一步可选的,在本实施例中,若特征处理层采用参数可学习的矩阵,则在基于各样本的实际的样本标签和转化参数的差异性,调节转化预测模型的参数的同时,调节特征处理层中的矩阵参数,以调节特征处理层输出的多维变量对模型输出结果的影响程度。
进一步地,各样本的样本标签为0或1,转化参数表征该样本能够被转化为新用户的概率,也即位于0-1之间,其差异性可以基于具体数值进行确定。在其他可选的实现方式中,也可设置一个参数阈值,当转化参数达到参数阈值时,将转化参数调整为1,当转化参数未达到参数阈值时,将转化参数调整为0,并基于调整后的转化参数和样本标签进行比对。
在本实施例中,转化预测模型采用S模型,也即采用一个例如LR、GBDT、NN模型之类的模型,将样本的多维变量和基础特征参数输入转化预测模型中进行处理,获得该样本的转化参数。
在其他可选的实现方式中,转化预测模型也可以采用T模型或X模型,此时,转化预测模型可以包括两个子模型,因此,可以通过将样本的多维变量和基础特征参数分别输出至两个子模型中,以对各个子模型进行训练,以获取T类型或X类型的转化预测模型,本实施例并不对此进行限制。
图3是本发明实施例的转化预测模型的训练过程示意图。如图3所示,在本实施例中,将样本的干预变量输入至预定的特征处理层31中进行转换处理,获取对应的多维变量,将该样本对应的多维变量、基础特征信息和样本标签输入至多层神经网络32(也即训练过程中的转化预测模型),以基于多层神经网络32的输出以及样本标签调节多层神经网络32的参数,在训练完成后获取转化预测模型33。
本实施例通过采用在干预变量的不同状态下的多种样本标签的样本作为模型的训练数据集,进一步提高了训练完成后的转化预测模型的准确性。
步骤S130,响应于目标转化参数满足预定条件,对该目标对象标注第一标签。其中,第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。
进一步可选的,本实施例可以在该目标对象对应的目标转化参数满足预定条件时,对该目标对象执行干预变量,也可以先对满足预定条件的目标对象标注第一标签,在达到预定时间周期后或者满足预定条件的目标对象的数量达到一个预定值后,同时对多个标注有第一标签的目标对象执行干预变量对应的操作,本实施例并不对执行操作的时机进行限制。
在一种可选的实现方式中,若步骤S110中的干预变量为干预状态,则目标转化参数为干预状态下的第一转化参数,若步骤S110中的干预变量为不干预状态,则目标转化参数为不干预状态下的第二转化参数,若步骤S110中的干预变量包括干预状态和不干预状态,则目标转化参数包括干预状态下的第一转化参数和不干预状态下的第二转化参数。
在一种可选的实现方式中,本实施例根据第一转化参数和/或第二转化参数确定目标对象的操作执行价值参数,响应于操作执行价值参数达到预定值,对所述目标对象标注第一标签。应理解,该预定值可以根据具体应用场景设置,本实施例并不对具体值进行限制。
进一步可选的,若干预变量包括干预状态和不干预状态。也即,对于同一目标对象,将干预变量(T=1)输入至特征处理层进行转换处理,获得对应的多维变量,将该多维变量和目标对象的基础特征参数输入至转化预测模型进行处理,获得第一转化参数;并将干预变量(T=0)输入至特征处理层进行转换处理,获得对应的多维变量,将该多维变量和目标对象的基础特征参数输入至转化预测模型进行处理,获得第二转化参数。进一步地,计算第一转化参数和第二转化参数的差值,根据该差值确定对应的操作执行价值参数。
应理解,第一转化参数和第二转化参数的差值,表征操作执行价值越高。也就是说,在未对目标对象执行干预变量对应的操作时,该目标对象转化成功的概率较低,而在对目标对象执行干预变量对应的操作后,该目标对象转化成功的概率大幅提升,这表征是否执行干预变量对应的操作对该目标用户的影响程度较大,其操作执行价值较高。
在其他可选的实现方式中,本实施例的数据处理方法还包括:响应于第一转化参数达到第二转化阈值,对目标对象标注第一标签。也就是说,若干预变量处于干预状态时获取的第一转化参数较大,则可表征目标对象在接收到干预操作的情况下极大可能转化成功。因此,在第一转化参数足够大(例如达到0.9)的情况下,本实施例也可仅基于干预状态的干预变量执行相关判断,以进一步提高判断效率。
在一种可选的实现方式中,本实施例响应于第二转化参数达到第一转化阈值,对目标对象标注第二标签。其中,第二标签用于表征所述目标对象自然转化的概率达到概率阈值。也就是说,若干预变量处于不干预状态时获取的第二转化参数较大,则可表征目标对象在不进行干预操作的情况下极大可能自然转化。因此,在第二转化参数足够大的情况下,本实施例也可仅基于不干预状态的干预变量执行相关判断,以进一步提高判断效率。
进一步地,在本实施例首先执行上述步骤S110-S120获取干预变量T=0时对应的第二转化参数,响应于第二转化参数达到第一转化阈值,对目标对象标注第二标签,响应于第二转化参数未达到第一转化阈值,执行上述步骤S110-S120获取干预变量T=1时对应的第一转化参数,并计算第一转化参数和第二转化参数的差值,以获取操作执行价值参数,响应于操作执行价值参数达到预定值,对目标对象标注第一标签。由此,本实施例即可以判断目标对象是否能够实现自然转化,也能够判断对目标对象执行干预变量对应的操作是否具有较高的价值。
本发明实施例通过对干预变量进行转换处理,获取对应的多维变量,将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数,响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。由此,本发明实施例通过将干预变量转换为多维变量以增加其影响程度,从而可以提高转化预测模型对是否执行干预变量对应操作的判断准确度。
图4是本发明实施例的数据处理过程的示意图。如图4所示,确定目标对象A的目标对象特征X和目标对象特征X'。其中,目标对象特征X包括基础特征信息x和干预变量T=1。目标对象特征X'包括基础特征信息x和干预变量T=0。也就是说,目标对象特征X和目标对象特征X'只有干预变量不同。
进一步地,将目标对象特征X的干预变量T=1输入至特征处理层41进行转换处理,获得干预变量T=1的多维变量t1,并将多维变量t1和基础特征信息x输入至转化预测模型42中进行处理,得到第一转化参数。同理,将目标对象特征X'的干预变量T=0输入至特征处理层41进行转换处理,获得干预变量T=0的多维变量t0,并将多维变量t0和基础特征信息x输入至转化预测模型42中进行处理,得到第二转化参数。
进一步地,在本实施例中,计算第一转化参数和第二转化参数的差值,以获取操作执行价值参数,并根据操作执行价值参数确定是否对该目标对象执行干预变量对应的操作。其中,在该目标对象对应的操作执行价值参数达到预定值时,对该目标对象执行干预变量对应的操作。
本发明实施例通过对干预变量进行转换处理,获取对应的多维变量,将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数,响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。由此,本发明实施例通过将干预变量转换为多维变量以增加其影响程度,从而可以提高转化预测模型对是否执行干预变量对应操作的判断准确度。
图5是本发明实施例的数据处理装置的示意图。如图5所示,本实施例的数据处理装置5包括转换处理单元51、参数获取单元52和标注单元53。
转换处理单元51被配置为对干预变量进行转换处理,获取对应的多维变量。参数获取单元52被配置为将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数。标注单元53被配置为响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。
在一种可选的实现方式中,所述干预变量包括干预状态和/或不干预状态;
所述目标转化参数包括干预状态下对应的第一转化参数、和/或不干预状态下对应的第二转化参数。
在一种可选的实现方式中,标注单元53包括参数计算子单元和标注子单元。参数计算子单元被配置为根据所述第一转化参数和/或第二转化参数确定所述目标对象的操作执行价值参数。标注子单元被配置为响应于所述操作执行价值参数达到预定值,对所述目标对象标注第一标签。
在一种可选的实现方式中,参数计算子单元包括差值计算模块和参数确定模块。差值计算模块被配置为计算所述第一转化参数和所述第二转化参数的差值。参数确定模块被配置为根据所述差值确定所述操作执行价值参数。
在其他可选的实现方式中,所述目标转化参数满足预定条件具体为:所述第一转化参数达到第二转化阈值。
在一种可选的实现方式中,转换处理单元51进一步被配置为将所述干预变量输入至预定的特征处理层,获取所述多维变量。
在一种可选的实现方式中,所述特征处理层基于矩阵构建、或者基于傅立叶变换函数构建。所述矩阵的参数与所述转化预测模型进行同步训练。
在一种可选的实现方式中,数据处理装置5包括训练单元。训练单元包括样本获取子单元、样本转换子单元、样本参数获取子单元和参数调节子单元。
样本获取子单元被配置为获取训练数据集,所述训练数据集包括多个样本,所述样本包括样本的基础特征参数、干预变量和样本标签。样本转换子单元被配置为对各所述样本的干预变量进行转换处理,获取各所述样本分别对应的多维变量。样本参数获取子单元被配置为将各所述样本的多维变量和基础特征参数输入至转化预测模型中进行处理,获取各所述样本的转化参数。参数调节子单元被配置为基于各所述样本的样本标签和所述转化参数的差异性,调节所述转化预测模型的参数。
在一种可选的实现方式中,标注单元53进一步被配置为响应于所述第二转化参数达到第一转化阈值,对所述目标对象标注第二标签,所述第二标签用于表征所述目标对象自然转化的概率大于概率阈值。
本发明实施例通过对干预变量进行转换处理,获取对应的多维变量,将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数,响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。由此,本发明实施例通过将干预变量转换为多维变量以增加其影响程度,从而可以提高转化预测模型对是否执行干预变量对应操作的判断准确度。
图6是本发明实施例的电子设备的示意图。如图6所示,电子设备6为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器61和存储器62。处理器61和存储器62通过总线63连接。存储器62适于存储处理器61可执行的指令或程序。处理器61可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器61通过执行存储器62所存储的指令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线63将上述多个组件连接在一起,同时将上述组件连接到显示控制器64和显示装置以及输入/输出(I/O)装置65。输入/输出(I/O)装置65可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出装置65通过输入/输出(I/O)控制器66与系统相连。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图来描述的。应理解可由计算机程序指令实现流程图中的每一流程。
这些计算机程序指令可以存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现流程图一个流程或多个流程中指定的功能。
也可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程中指定的功能的装置。
本发明的另一实施例涉及一种非易失性存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行上述部分或全部的方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指定相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种数据处理方法,其特征在于,所述方法包括:
对干预变量进行转换处理,获取对应的多维变量,所述多维变量包括所述干预变量对应的不同维度的多个干预因子;
将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数;
响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。
2.根据权利要求1所述的方法,其特征在于,所述干预变量包括干预状态和/或不干预状态;
所述目标转化参数包括干预状态下对应的第一转化参数、和/或不干预状态下对应的第二转化参数。
3.根据权利要求2所述的方法,其特征在于,所述响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签包括:
根据所述第一转化参数和/或第二转化参数确定所述目标对象的操作执行价值参数;
响应于所述操作执行价值参数达到预定值,对所述目标对象标注第一标签。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一转化参数和/或第二转化参数确定所述目标对象的操作执行价值参数包括:
计算所述第一转化参数和所述第二转化参数的差值;
根据所述差值确定所述操作执行价值参数。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述对干预变量进行转换处理,获取对应的多维变量包括:
将所述干预变量输入至预定的特征处理层,获取所述多维变量。
6.根据权利要求5所述的方法,其特征在于,所述特征处理层基于矩阵构建、或者基于傅立叶变换函数构建;
所述矩阵的参数与所述转化预测模型进行同步训练。
7.根据权利要求1所述的方法,其特征在于,所述转化预测模型通过以下步骤训练:
获取训练数据集,所述训练数据集包括多个样本,所述样本包括样本的基础特征参数、干预变量和样本标签;
对各所述样本的干预变量进行转换处理,获取各所述样本分别对应的多维变量;
将各所述样本的多维变量和基础特征参数输入至转化预测模型中进行处理,获取各所述样本的转化参数;
基于各所述样本的样本标签和所述转化参数的差异性,调节所述转化预测模型的参数。
8.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应于所述第二转化参数达到第一转化阈值,对所述目标对象标注第二标签,所述第二标签用于表征所述目标对象自然转化的概率大于概率阈值。
9.根据权利要求2所述的方法,其特征在于,所述目标转化参数满足预定条件具体为:所述第一转化参数达到第二转化阈值。
10.一种数据处理装置,其特征在于,所述装置包括:
转换处理单元,被配置为对干预变量进行转换处理,获取对应的多维变量,所述多维变量包括所述干预变量对应的不同维度的多个干预因子;
参数获取单元,被配置为将所述多维变量和目标对象的基础特征参数输入至预先训练的转化预测模型中进行处理,获取所述目标对象的目标转化参数;
标注单元,被配置为响应于所述目标转化参数满足预定条件,对所述目标对象标注第一标签,所述第一标签用于表征需要对所述目标对象执行所述干预变量对应的操作。
11.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储DA2306115YS
介质内存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-9任一项所述的方法。
CN202310239311.2A 2023-03-08 2023-03-08 一种数据处理方法、装置和电子设备 Active CN115934809B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310239311.2A CN115934809B (zh) 2023-03-08 2023-03-08 一种数据处理方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310239311.2A CN115934809B (zh) 2023-03-08 2023-03-08 一种数据处理方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN115934809A CN115934809A (zh) 2023-04-07
CN115934809B true CN115934809B (zh) 2023-07-18

Family

ID=86554589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310239311.2A Active CN115934809B (zh) 2023-03-08 2023-03-08 一种数据处理方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN115934809B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919436A (zh) * 2019-01-29 2019-06-21 华融融通(北京)科技有限公司 一种基于稀疏特征嵌入的违约用户概率预测方法
CN113469755A (zh) * 2021-09-03 2021-10-01 广东联讯科技发展股份有限公司 一种基于广告推送的智能精准营销管理系统
CN114638696A (zh) * 2022-04-08 2022-06-17 深圳微言科技有限责任公司 信贷风险预测模型的训练方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090888B (zh) * 2013-12-10 2016-05-11 深圳市腾讯计算机系统有限公司 一种用户行为数据的分析方法和装置
CN106682063B (zh) * 2016-10-20 2018-04-03 北京跃盟科技有限公司 一种广告信息推送方法、装置以及系统
CN109840531B (zh) * 2017-11-24 2023-08-25 华为技术有限公司 训练多标签分类模型的方法和装置
CN111652315B (zh) * 2020-06-04 2023-06-02 广州虎牙科技有限公司 模型训练、对象分类方法和装置、电子设备及存储介质
CN112990480A (zh) * 2021-03-10 2021-06-18 北京嘀嘀无限科技发展有限公司 构建模型的方法、装置、电子设备和存储介质
CN115082095A (zh) * 2021-03-10 2022-09-20 顺丰科技有限公司 转化率预测模型训练方法、装置、电子设备及存储介质
CN113191821A (zh) * 2021-05-20 2021-07-30 北京大米科技有限公司 一种数据处理方法及装置
CN115601088A (zh) * 2022-10-25 2023-01-13 杭州网易云音乐科技有限公司(Cn) 对象投放方法、装置、存储介质及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919436A (zh) * 2019-01-29 2019-06-21 华融融通(北京)科技有限公司 一种基于稀疏特征嵌入的违约用户概率预测方法
CN113469755A (zh) * 2021-09-03 2021-10-01 广东联讯科技发展股份有限公司 一种基于广告推送的智能精准营销管理系统
CN114638696A (zh) * 2022-04-08 2022-06-17 深圳微言科技有限责任公司 信贷风险预测模型的训练方法及系统

Also Published As

Publication number Publication date
CN115934809A (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN106650780B (zh) 数据处理方法及装置、分类器训练方法及系统
JP5819629B2 (ja) パッセージシーケンスの再使用を介して文書の展開を推測することによる文書類似性の測定
CN109598566B (zh) 下单预测方法、装置、计算机设备和计算机可读存储介质
CN106529145A (zh) 一种基于arima‑bp神经网络的桥梁监测数据预测方法
CN104317894A (zh) 样本标注的确定方法和装置
CN113268403B (zh) 时间序列的分析预测方法、装置、设备及存储介质
US20210365813A1 (en) Management computer, management program, and management method
CN108234441B (zh) 确定伪造访问请求的方法、装置、电子设备和存储介质
JP6658507B2 (ja) 負荷推定システム、情報処理装置、負荷推定方法、及び、コンピュータ・プログラム
Ens et al. Quantifying musical style: Ranking symbolic music based on similarity to a style
CN112116025A (zh) 用户分类模型的训练方法、装置、电子设备及存储介质
CN111092769A (zh) 一种基于机器学习的web指纹识别方法
CN115934809B (zh) 一种数据处理方法、装置和电子设备
KR102223687B1 (ko) 기계 학습 데이터 선택 방법 및 장치
TWI816078B (zh) 樣本分群探勘方法
CN109743200B (zh) 基于资源特征的云计算平台计算任务成本预测方法及系统
CN114693011A (zh) 一种政策匹配方法、装置、设备和介质
US11031125B2 (en) Identification of structural parts in error handling of medical devices
CN112116024B (zh) 用户分类模型的方法、装置、电子设备和存储介质
KR102413588B1 (ko) 학습 데이터에 따른 객체 인식 모델 추천 방법, 시스템 및 컴퓨터 프로그램
CN115512696A (zh) 模拟训练方法及车辆
CN107222328B (zh) 预测饱和拐点的方法及装置
CN110414845B (zh) 针对目标交易的风险评估方法及装置
CN112463378B (zh) 一种服务器资产扫描方法、系统、电子设备及存储介质
CN113191821A (zh) 一种数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant