CN109727070A - 一种潜在活跃用户的确定方法及装置 - Google Patents
一种潜在活跃用户的确定方法及装置 Download PDFInfo
- Publication number
- CN109727070A CN109727070A CN201811626634.2A CN201811626634A CN109727070A CN 109727070 A CN109727070 A CN 109727070A CN 201811626634 A CN201811626634 A CN 201811626634A CN 109727070 A CN109727070 A CN 109727070A
- Authority
- CN
- China
- Prior art keywords
- value
- user
- potential
- active ues
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种潜在活跃用户的确定方法及装置,涉及手机银行领域,解决了推广手机银行时,效率低、没有针对性、资源利用率低的问题。具体方案为:获取N个用户中每个用户的标志信息和至少两个特征的值,删除至少两个特征的值中的异常值,在删除异常值的空缺处填充值,对填充值后的每个特征的值计算得到相应的向量值,从N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户得到候选用户,从至少两个特征中确定目标特征,对候选用户的目标特征的向量值进行矩阵降维得到目标矩阵,根据目标矩阵确定活跃度预测模型,采用活跃度预测模型计算用户的活跃度,活跃度大于预设值时确定为潜在活跃用户。本发明实施例用于推广手机银行的过程中。
Description
技术领域
本发明实施例涉及手机银行领域,尤其涉及一种潜在活跃用户的确定方法及装置。
背景技术
目前,手机银行作为重要的战略渠道,已成为各大银行竞争的主要阵地。当前手机银行的注册用户和活跃用户远远低于银行的自有客户,因此,手机银行推广便成为各大银行发展的主要目标。现有技术中主要通过业务人员向客户“广撒网”的方式进行手机银行的推广,即业务人员依据经验对客户进行初步筛选,再进行推广。
现有技术中至少存在以下技术问题:通过业务人员向客户推广手机银行,存在效率低、没有针对性的问题,且如果忽略了对手机银行有使用需求的用户,将大量的人力物力投入到低价值低活跃度的客户上,则会造成资源利用率低。
发明内容
本发明提供一种潜在活跃用户的确定方法及装置,解决了推广手机银行时,效率低、没有针对性、资源利用率低的问题。
为达到上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种潜在活跃用户的确定方法,该方法可以包括:获取N个用户中每个用户的标志信息和至少两个特征的值;标志信息包括第一值或第二值,第一值用于指示用户是潜在活跃用户,第二值用于指示用户是非潜在活跃用户,N为大于1的整数;删除N个用户中每个用户的至少两个特征的值中的异常值;采用空缺值填充规则,在删除了异常值的空缺处填充值;根据证据权重(Weight Of Evidence,WOE)算法,对填充值后的N个用户中每个用户的至少两个特征的值中,每个特征的值进行计算,得到每个特征的向量值;根据N个用户中每个用户的标志信息,从N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户,得到候选用户;根据信息增益算法,计算与至少两个特征一一对应的增益;将至少两个特征中,特征对应的增益大于预设增益的特征确定为目标特征;根据主成分分析法,对候选用户中每个用户的目标特征的向量值进行矩阵降维,得到目标矩阵;根据目标矩阵,确定活跃度预测模型;采用活跃度预测模型,计算用户的活跃度;如果用户的活跃度大于预设值,则将用户确定为潜在活跃用户。
结合第一方面,在一种可能的实现方式中,删除N个用户中每个用户的至少两个特征的值中的异常值,具体的可以包括:如果候选特征的值为连续型的值,则将未在预设范围内的候选特征的值删除;候选特征为至少两个特征中的任意一个特征;如果候选特征的值为离散型的值,则在确定候选特征的值不符合业务逻辑时,删除候选特征的值。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,采用空缺值填充规则,在删除了异常值的空缺处填充值,具体的可以包括:如果删除的候选特征的值为连续型的值,则填充删除值后的候选特征的值的均值或中位数;如果删除的候选特征的值为离散型的值,则填充删除值后的候选特征的值中占比最大的值。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,根据N个用户中每个用户的标志信息,从N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户,得到候选用户,具体的可以包括:根据N个用户中每个用户的标志信息,在确定潜在活跃用户的第一数量大于非潜在活跃用户的第二数量时,将第二数量的非潜在活跃用户确定为所述候选用户,并从第一数量的潜在活跃用户中选择第二数量的用户作为候选用户。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,活跃度预测模型为根据广义相加模型或支持向量机算法得到的;或者,活跃度预测模型为根据广义相加模型、支持向量机算法,以及遗传算法得到的。
第二方面,本发明提供一种潜在活跃用户的确定装置,该潜在活跃用户的确定装置可以包括:获取单元、删除单元、填充单元、计算单元、选择单元和确定单元。获取单元,用于获取N个用户中每个用户的标志信息和至少两个特征的值;标志信息包括第一值或第二值,第一值用于指示用户是潜在活跃用户,第二值用于指示用户是非潜在活跃用户,N为大于1的整数。删除单元,用于删除N个用户中每个用户的至少两个特征的值中的异常值。填充单元,用于采用空缺值填充规则,在删除了异常值的空缺处填充值。计算单元,用于根据WOE算法,对填充值后的N个用户中每个用户的至少两个特征的值中,每个特征的值进行计算,得到每个特征的向量值。选择单元,用于根据N个用户中每个用户的标志信息,从N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户,得到候选用户。计算单元,还用于根据信息增益算法,计算与至少两个特征一一对应的增益。确定单元,用于将至少两个特征中,特征对应的增益大于预设增益的特征确定为目标特征。计算单元,还用于根据主成分分析法,对候选用户中每个用户的目标特征的向量值进行矩阵降维,得到目标矩阵。确定单元,还用于根据目标矩阵,确定活跃度预测模型。计算单元,还用于采用活跃度预测模型,计算用户的活跃度。确定单元,还用于如果用户的活跃度大于预设值,则将用户确定为潜在活跃用户。
结合第二方面,在一种可能的实现方式中,删除单元,具体用于如果候选特征的值为连续型的值,则将未在预设范围内的候选特征的值删除;候选特征为至少两个特征中的任意一个特征;如果候选特征的值为离散型的值,则在确定候选特征的值不符合业务逻辑时,删除候选特征的值。
结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,填充单元,具体用于:如果删除的候选特征的值为连续型的值,则填充删除值后的候选特征的值的均值或中位数;如果删除的候选特征的值为离散型的值,则填充删除值后的候选特征的值中占比最大的值。
结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,选择单元,具体用于根据N个用户中每个用户的标志信息,在确定潜在活跃用户的第一数量大于非潜在活跃用户的第二数量时,将第二数量的非潜在活跃用户确定为候选用户,并从第一数量的潜在活跃用户中选择第二数量的用户作为候选用户。
结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,活跃度预测模型为根据广义相加模型或支持向量机算法得到的;或者,活跃度预测模型为根据广义相加模型、支持向量机算法,以及遗传算法得到的。
具体的实现方式可以参考第一方面或第一方面的可能的实现方式提供的潜在活跃用户的确定方法中潜在活跃用户的确定装置的行为功能。
第三方面,提供一种潜在活跃用户的确定装置,该潜在活跃用户的确定装置包括:至少一个处理器、存储器、通信接口和通信总线。处理器与存储器、通信接口通过通信总线连接,存储器用于存储计算机执行指令,当潜在活跃用户的确定装置运行时,处理器执行存储器存储的计算机执行指令,以使潜在活跃用户的确定装置执行如第一方面或第一方面的可能的实现方式中任意一项的潜在活跃用户的确定方法。
第四方面,提供一种计算机存储介质,其上存储有计算机执行指令,当计算机执行指令在潜在活跃用户的确定装置上运行时,使得潜在活跃用户的确定装置执行如第一方面或第一方面的可能的实现方式中任意一项的潜在活跃用户的确定方法。
本发明提供的潜在活跃用户的确定方法,通过根据N个用户中每个用户的标志信息和至少两个特征的值,来确定活跃度预测模型。当需要确定某个用户是否为潜在活跃用户时,仅需输入该用户的至少两个特征的值,便可以得到该用户的活跃度,并与预设值进行比较,从而获知该用户是否为潜在活跃用户,这样,不仅提高了确定潜在活跃用户的效率,且由于活跃度预测模型是基于准确的数据预先计算得到的,使得采用该模型得到的结果较准确,从而使得手机银行的推广有针对性,提高了资源利用率。
附图说明
图1为本发明实施例提供的一种潜在活跃用户的确定装置的组成示意图;
图2为本发明实施例提供的一种潜在活跃用户的确定方法的流程图;
图3为本发明实施例提供的一种潜在活跃用户的确定装置的组成示意图;
图4为本发明实施例提供的一种潜在活跃用户的确定装置的组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种潜在活跃用户的确定装置的组成示意图,如图1所示,该潜在活跃用户的确定装置可以包括:至少一个处理器11、存储器12、通信接口13和通信总线14。
下面结合图1对潜在活跃用户的确定装置的各个构成部件进行具体介绍:
其中,处理器11是潜在活跃用户的确定装置的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器11是一个中央处理器(Central Processing Unit,CPU),也可以是特定集成电路(Application Specific Integrated Circuit,ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路,例如:一个或多个数字信号处理器(Digital Signal Processor,DSP),或,一个或者多个现场可编程门阵列(FieldProgrammable Gate Array,FPGA)。
在具体的实现中,作为一种实施例,处理器11可以包括一个或多个CPU,例如图1中所示的CPU0和CPU1。且,作为一种实施例,潜在活跃用户的确定装置可以包括多个处理器,例如图1中所示的处理器11和处理器15。这些处理器中的每一个可以是一个单核处理器(Single-CPU),也可以是一个多核处理器(Multi-CPU)。
存储器12可以是只读存储器(Read-Only Memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(Random Access Memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器12可以是独立存在,通过通信总线14与处理器11相连接。存储器12也可以和处理器11集成在一起。
在具体的实现中,存储器12,用于存储本发明中的数据和执行本发明的软件程序。处理器11可以通过运行或执行存储在存储器12内的软件程序,以及调用存储在存储器12内的数据,执行潜在活跃用户的确定装置的各种功能。
通信接口13,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如无线接入网(Radio Access NetWork,RAN),无线局域网(Wireless LoCal Area Networks,WLAN)等。通信接口13可以包括接收单元实现接收功能,以及发送单元实现发送功能。
通信总线14,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图1中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
为了便于本领域技术人员的理解,本发明实施例在此对涉及的基本术语进行说明。
1、活跃度:指用户使用某个网站或者应用(Application,APP)的频繁程度,使用越频繁,活跃度就越高。
2、潜在活跃用户:指没有注册手机银行和已注册手机银行的低活度用户,实际却有较强的手机银行的业务需求。例如:注册过程中因操作过于繁杂,放弃注册手机银行的用户,或者已经注册但是由于使用体验较差而放弃继续使用响用户。
由于现有技术中在推广手机银行时,存在效率低、没有针对性、资源利用率低的问题,为了解决该问题,本发明实施例提供了一种潜在活跃用户的确定方法,如图2所示,该方法可以包括:
201、获取N个用户中每个用户的标志信息和至少两个特征的值。
其中,N为大于1的整数。当需要确定活跃度预测模型时,管理人员可以从银行数据服务器中获取N个用户的信息,该信息可以为:用户的姓名、性别、年龄、职业、资产、消费、交易、存款等特征中至少两个特征的值,并根据每个用户的信息分析该用户是否是潜在活跃用户,设置标志信息来表示,该标志信息可以包括第一值或第二值,第一值用于指示用户是潜在活跃用户,第二值用于指示用户是非潜在活跃用户。且将N个用户的信息,以及每个用户的标志信息输入潜在活跃用户的确定装置中,这样,潜在活跃用户的确定装置便可以获取N个用户中,每个用户的标志信息和至少两个特征的值,并将每个用户的相关数据与该用户的用户标识相关联,以用户标识为主键(Key),以该用户的标志信息和至少两个特征的值为值(Value)进行存储。
需要说明的是,在本发明实施例中,值的取值可以是:0或1,在一种可能的实现方式中,第一值的取值为1,第二值的取值为0,在另一种可能的实现方式中,第一值的取值为0,第二值的取值为1。值的具体取值可以根据实际应用场景的需求进行设置,本发明实施例在此不做具体限制。在本发明实施例中以第一值的取值为1,第二值的取值为0为例进行说明。
示例性的,假设用户标识为数字,N为5,如表1所示,为五个用户中每个用户的标志信息,以及每个用户的六个特征,分别为:姓名、性别、年龄、理财、存款、资产的值。
表1
用户标识 | 姓名 | 性别 | 年龄 | 理财 | 存款 | 资产 | 标志信息 |
1 | 小红 | 女 | 18 | 零 | 五百 | 五百 | 0 |
2 | 小明 | 男 | 40 | 十万 | 五十万 | 六十万 | 1 |
3 | 小绿 | 好 | 30 | 五万 | 十万 | 十五万 | 1 |
4 | 小黄 | 女 | 60 | 零 | 三万 | 三万 | 0 |
5 | 小兰 | 女 | 25 | 一万 | 四万 | 五万 | 1 |
202、删除N个用户中每个用户的至少两个特征的值中的异常值。
其中,潜在活跃用户的确定装置在获取到N个用户的特征的值之后,可以删除这些特征的值中的异常值。具体的,对于至少两个特征中的任意一个特征,如候选特征,如果候选特征的值为连续型的值,则潜在活跃用户的确定装置可以将未在预设范围内的候选特征的值确定为异常值,并将其删除,置为空;如果候选特征的值为离散型的值,则可以判断该候选特征的值是否符合业务逻辑,并将不符合业务逻辑的候选特征的值确定为异常值,将其删除,置为空。
例如,结合表1,当候选特征为性别时,性别的值为离散型的值,那么可以确定小绿的性别的值:好,不符合业务逻辑男和女,从而将其删除。当候选特征为年龄时,年龄的值为连续型的值,假设年龄的预设范围为:18岁-50岁,那么可以确定小黄的年龄的值:60未在预设范围内,从而将其删除。
203、采用空缺值填充规则,在删除了异常值的空缺处填充值。
其中,潜在活跃用户的确定装置在删除了异常值之后,可以采用空缺值填充规则,在删除了异常值的空缺处填充值。具体的,对于至少两个特征中的任意一个特征,如候选特征,如果删除的候选特征的值为连续型的值,则潜在活跃用户的确定装置可以填充删除值后的候选特征的值的均值或中位数,中位数指的是将删除值后的候选特征的值按照从小到大的顺序排序后正中间的值,如果排序后的值有偶数个,中位数为最中间两个值的均值。如果删除的候选特征的值为离散型的值,则可以填充删除值后的候选特征的值中占比最大的值。
例如,按照步骤202中的例子,当候选特征为性别时,删除的小绿的性别的值为离散型的值,那么可以确定其余四个用户的性别的值中占比最大的值为女,并将该值填充在小绿的性别的值处。当候选特征为年龄时,删除的小黄的年龄的值为连续型的值,假设填充值为均值,那么可以确定其余四个用户的年龄的值的均值为:(18+40+30+25)/4=28,并将其填充在小黄的年龄的值处;假设填充值为中位数,那么可以确定其余四个用户的年龄的值的中位数为:(25+30)/2=27,并将其填充在小黄的年龄的值处。
204、根据WOE算法,对填充值后的N个用户中每个用户的至少两个特征的值中,每个特征的值进行计算,得到每个特征的向量值。
其中,潜在活跃用户的确定装置在填充值之后,可以根据WOE算法,对经过步骤203处理后的每个特征的值进行计算,得到相应的向量值,从而得到N个用户的统一标准的值,便于后续计算。
205、根据N个用户中每个用户的标志信息,从N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户,得到候选用户。
其中,潜在活跃用户的确定装置在步骤201中获取到N个用户中每个用户的标志信息之后,可以从N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户,以使得两种类型的样本数量均衡。在具体的实现中,潜在活跃用户的确定装置可以根据每个用户的标志信息,确定潜在活跃用户的第一数量和非潜在活跃用户的第二数量,如果第一数量大于第二数量,则可以将数量少的,即第二数量的非潜在活跃用户确定为候选用户,并从数量多的,即第一数量的潜在活跃用户中选择第二数量的用户作为候选用户。
例如,结合表1,可以得出潜在活跃用户的第一数量为3,非潜在活跃用户的第二数量为2,那么可以将用户标识为1和4的用户确定为候选用户,并从用户标识为2、3和5的用户中选择两个用户作为候选用户,如选择用户标识为2和5的用户。
206、根据信息增益算法,计算与至少两个特征一一对应的增益。
其中,由于不同的特征对于判断是否是潜在活跃用户的作用不同,有的作用较大,如年龄,有的作用较小,如姓名,因此为了减少无效计算,提高效率,潜在活跃用户的确定装置在获知至少两个特征之后,可以根据信息增益算法,计算与至少两个特征一一对应的增益,增益能够体现对应的特征对于判断是否是潜在活跃用户有多大的作用,作用越大,增益越大。
207、将至少两个特征中,特征对应的增益大于预设增益的特征确定为目标特征。
其中,潜在活跃用户的确定装置在计算出每个特征对应的增益之后,可以将该增益与预设增益进行比较,如果大于预设增益,则将该增益对应的特征确定为目标特征,从而从至少两个特征中选择出多个目标特征,这些目标特征即为判断是否为潜在活跃用户的有效特征。
208、根据主成分分析法,对候选用户中每个用户的目标特征的向量值进行矩阵降维,得到目标矩阵。
其中,潜在活跃用户的确定装置在步骤204得到每个特征的向量值、步骤205得到候选用户、步骤207得到目标特征之后,可以根据主成分分析法,对候选用户的目标特征的向量值进行矩阵降维,得到目标矩阵,以将一组可能存在相关性的特征的值转换为一组线性不相关的值。例如,如表1所示,特征资产和存款是线性相关的,资产和姓名是线性不相关的。
209、根据目标矩阵,确定活跃度预测模型。
其中,潜在活跃用户的确定装置在得到目标矩阵之后,可以将该目标矩阵作为广义相加模型或支持向量机的输入量进行训练,从而得到活跃度预测模型,活跃度预测模型可以表征用户的活跃度与用户的信息之间的关系。
优选的,潜在活跃用户的确定装置可以将该目标矩阵,分别作为广义相加模型和支持向量机的输入量进行训练,得到两个活跃度预测模型,并根据遗传算法,计算与两个活跃度预测模型对应的权重,从而得到最终的活跃度预测模型,该活跃度预测模型,由于考虑了更多的因素,因此比仅根据广义相加模型或支持向量机得到的模型要准确得多。例如,假设两个活跃度预测模型分别为:Y1(x)和Y2(x),对应的权重分别为:α、(1-α),则最终的活跃度预测模型为:α*Y1(x)+(1-α)*Y2(x)。
210、采用活跃度预测模型,计算用户的活跃度。
其中,在确定出活跃度预测模型之后,若需要判断某个用户是否为潜在活跃用户,则可以在潜在活跃用户的确定装置中输入该用户的多个特征的值,此时,潜在活跃用户的确定装置可以从多个特征中筛选出目标特征,并删除目标特征的值中的异常值,在删除了异常值的空缺处填充值,对填充值后的每个目标特征的值进行计算,得到相应的向量值,且根据主成分分析法,对该用户的目标特征的向量值进行矩阵降维,得到相应的矩阵,将该矩阵代入活跃度预测模型,计算该用户的活跃度。
211、如果用户的活跃度大于预设值,则将用户确定为潜在活跃用户。
其中,如果该用户的活跃度小于或等于预设值,则可以确定该用户为非潜在活跃用户,如果该用户的活跃度大于预设值,则可以确定该用户为潜在活跃用户,这样潜在活跃用户的确定装置可以输入提示信息,以便管理人员获知判断结果,从而决定是否对该用户进行产品推广。
需要说明的是,在本发明实施例中,由于用户的需求会随着时间推移发生改变,因此对于确定出的非潜在活跃用户,潜在活跃用户的确定装置还可以持续跟踪该用户,即周期性的根据该用户的信息确定该用户的活跃度,一旦确定出该用户的活跃度大于预设值,则向该用户进行相关产品的推广。
本发明提供的潜在活跃用户的确定方法,通过根据N个用户中每个用户的标志信息和至少两个特征的值,来确定活跃度预测模型。当需要确定某个用户是否为潜在活跃用户时,仅需输入该用户的至少两个特征的值,便可以得到该用户的活跃度,并与预设值进行比较,从而获知该用户是否为潜在活跃用户,这样,不仅提高了确定潜在活跃用户的效率,且由于活跃度预测模型是基于准确的数据预先计算得到的,使得采用该模型得到的结果较准确,从而使得手机银行的推广有针对性,提高了资源利用率。
上述主要从潜在活跃用户的确定装置的角度对本发明实施例提供的方案进行了介绍。可以理解的是,潜在活跃用户的确定装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明实施例可以根据上述方法示例对潜在活跃用户的确定装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,图3示出了上述实施例中涉及的潜在活跃用户的确定装置的另一种可能的组成示意图,如图3所示,该潜在活跃用户的确定装置可以包括:获取单元31、删除单元32、填充单元33、计算单元34、选择单元35和确定单元36。
其中,获取单元31,用于支持潜在活跃用户的确定装置执行图2所示的潜在活跃用户的确定方法中的步骤201。
删除单元32,用于支持潜在活跃用户的确定装置执行图2所示的潜在活跃用户的确定方法中的步骤202。
填充单元33,用于支持潜在活跃用户的确定装置执行图2所示的潜在活跃用户的确定方法中的步骤203。
计算单元34,用于支持潜在活跃用户的确定装置执行图2所示的潜在活跃用户的确定方法中的步骤204、步骤206、步骤208、步骤210。
选择单元35,用于支持潜在活跃用户的确定装置执行图2所示的潜在活跃用户的确定方法中的步骤205。
确定单元36,用于支持潜在活跃用户的确定装置执行图2所示的潜在活跃用户的确定方法中的步骤207、步骤209、步骤211。
需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
本发明实施例提供的潜在活跃用户的确定装置,用于执行上述潜在活跃用户的确定方法,因此可以达到与上述潜在活跃用户的确定方法相同的效果。
在采用集成的单元的情况下,图4示出了上述实施例中所涉及的潜在活跃用户的确定装置的另一种可能的组成示意图。如图4所示,该潜在活跃用户的确定装置包括:处理模块41、通信模块42和存储模块43。
处理模块41用于对潜在活跃用户的确定装置的动作进行控制管理,例如,处理模块41用于支持潜在活跃用户的确定装置执行图2中的步骤201、步骤202、步骤203、步骤204、步骤205、步骤206、步骤207、步骤208、步骤209、步骤210、步骤211,和/或用于本文所描述的技术的其它过程。通信模块42用于支持潜在活跃用户的确定装置与其他网络实体的通信。存储模块43,用于存储潜在活跃用户的确定装置的程序代码和数据。
其中,处理模块41可以是图1中的处理器。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块42可以是图1中的通信接口。存储模块43可以是图1中的存储器。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何在本发明揭露的技术范围内的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种潜在活跃用户的确定方法,其特征在于,所述方法包括:
获取N个用户中每个用户的标志信息和至少两个特征的值;所述标志信息包括第一值或第二值,所述第一值用于指示用户是潜在活跃用户,所述第二值用于指示所述用户是非潜在活跃用户,N为大于1的整数;
删除所述N个用户中每个用户的至少两个特征的值中的异常值;
采用空缺值填充规则,在删除了所述异常值的空缺处填充值;
根据证据权重WOE算法,对填充值后的N个用户中每个用户的至少两个特征的值中,每个特征的值进行计算,得到每个特征的向量值;
根据所述N个用户中每个用户的标志信息,从所述N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户,得到候选用户;
根据信息增益算法,计算与所述至少两个特征一一对应的增益,并将所述至少两个特征中,特征对应的增益大于预设增益的特征确定为目标特征;
根据主成分分析法,对所述候选用户中每个用户的目标特征的向量值进行矩阵降维,得到目标矩阵;
根据所述目标矩阵,确定活跃度预测模型;
采用所述活跃度预测模型,计算用户的活跃度;
如果所述用户的活跃度大于预设值,则将所述用户确定为潜在活跃用户。
2.根据权利要求1所述的潜在活跃用户的确定方法,其特征在于,所述删除所述N个用户中每个用户的至少两个特征的值中的异常值,包括:
如果候选特征的值为连续型的值,则将未在预设范围内的所述候选特征的值删除;所述候选特征为所述至少两个特征中的任意一个特征;
如果所述候选特征的值为离散型的值,则在确定所述候选特征的值不符合业务逻辑时,删除所述候选特征的值。
3.根据权利要求2所述的潜在活跃用户的确定方法,其特征在于,所述采用空缺值填充规则,在删除了所述异常值的空缺处填充值,包括:
如果删除的所述候选特征的值为所述连续型的值,则填充删除值后的所述候选特征的值的均值或中位数;
如果删除的所述候选特征的值为所述离散型的值,则填充删除值后的所述候选特征的值中占比最大的值。
4.根据权利要求1所述的潜在活跃用户的确定方法,其特征在于,所述根据所述N个用户中每个用户的标志信息,从所述N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户,得到候选用户,包括:
根据所述N个用户中每个用户的标志信息,在确定潜在活跃用户的第一数量大于非潜在活跃用户的第二数量时,将所述第二数量的非潜在活跃用户确定为所述候选用户,并从所述第一数量的潜在活跃用户中选择所述第二数量的用户作为所述候选用户。
5.根据权利要求1所述的潜在活跃用户的确定方法,其特征在于,所述活跃度预测模型为根据广义相加模型或支持向量机算法得到的;或者,所述活跃度预测模型为根据广义相加模型、支持向量机算法,以及遗传算法得到的。
6.一种潜在活跃用户的确定装置,其特征在于,所述潜在活跃用户的确定装置包括:获取单元、删除单元、填充单元、计算单元、选择单元和确定单元;
所述获取单元,用于获取N个用户中每个用户的标志信息和至少两个特征的值;所述标志信息包括第一值或第二值,所述第一值用于指示用户是潜在活跃用户,所述第二值用于指示所述用户是非潜在活跃用户,N为大于1的整数;
所述删除单元,用于删除所述N个用户中每个用户的至少两个特征的值中的异常值;
所述填充单元,用于采用空缺值填充规则,在删除了所述异常值的空缺处填充值;
所述计算单元,用于根据证据权重WOE算法,对填充值后的N个用户中每个用户的至少两个特征的值中,每个特征的值进行计算,得到每个特征的向量值;
所述选择单元,用于根据所述N个用户中每个用户的标志信息,从所述N个用户中选择数量相同的潜在活跃用户和非潜在活跃用户,得到候选用户;
所述计算单元,还用于根据信息增益算法,计算与所述至少两个特征一一对应的增益;
所述确定单元,用于将所述至少两个特征中,特征对应的增益大于预设增益的特征确定为目标特征;
所述计算单元,还用于根据主成分分析法,对所述候选用户中每个用户的目标特征的向量值进行矩阵降维,得到目标矩阵;
所述确定单元,还用于根据所述目标矩阵,确定活跃度预测模型;
所述计算单元,还用于采用所述活跃度预测模型,计算用户的活跃度;
所述确定单元,还用于如果所述用户的活跃度大于预设值,则将所述用户确定为潜在活跃用户。
7.根据权利要求6所述的潜在活跃用户的确定装置,其特征在于,所述删除单元,具体用于:
如果候选特征的值为连续型的值,则将未在预设范围内的所述候选特征的值删除;所述候选特征为所述至少两个特征中的任意一个特征;
如果所述候选特征的值为离散型的值,则在确定所述候选特征的值不符合业务逻辑时,删除所述候选特征的值。
8.根据权利要求7所述的潜在活跃用户的确定装置,其特征在于,所述填充单元,具体用于:
如果删除的所述候选特征的值为所述连续型的值,则填充删除值后的所述候选特征的值的均值或中位数;
如果删除的所述候选特征的值为所述离散型的值,则填充删除值后的所述候选特征的值中占比最大的值。
9.根据权利要求6所述的潜在活跃用户的确定装置,其特征在于,所述选择单元,具体用于:
根据所述N个用户中每个用户的标志信息,在确定潜在活跃用户的第一数量大于非潜在活跃用户的第二数量时,将所述第二数量的非潜在活跃用户确定为所述候选用户,并从所述第一数量的潜在活跃用户中选择所述第二数量的用户作为所述候选用户。
10.根据权利要求6所述的潜在活跃用户的确定装置,其特征在于,所述活跃度预测模型为根据广义相加模型或支持向量机算法得到的;或者,所述活跃度预测模型为根据广义相加模型、支持向量机算法,以及遗传算法得到的。
11.一种潜在活跃用户的确定装置,其特征在于,所述潜在活跃用户的确定装置包括:处理器、存储器、通信接口和通信总线;
所述处理器与所述存储器、所述通信接口通过所述通信总线连接,所述存储器用于存储计算机执行指令,当所述潜在活跃用户的确定装置运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述潜在活跃用户的确定装置执行如权利要求1-5中任一项所述的潜在活跃用户的确定方法。
12.一种计算机存储介质,其特征在于,所述计算机存储介质包括计算机执行指令,当所述计算机执行指令在潜在活跃用户的确定装置上运行时,使得所述潜在活跃用户的确定装置执行如权利要求1-5中任一项所述的潜在活跃用户的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811626634.2A CN109727070B (zh) | 2018-12-28 | 2018-12-28 | 一种潜在活跃用户的确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811626634.2A CN109727070B (zh) | 2018-12-28 | 2018-12-28 | 一种潜在活跃用户的确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109727070A true CN109727070A (zh) | 2019-05-07 |
CN109727070B CN109727070B (zh) | 2021-11-19 |
Family
ID=66297844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811626634.2A Active CN109727070B (zh) | 2018-12-28 | 2018-12-28 | 一种潜在活跃用户的确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109727070B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111882113A (zh) * | 2020-07-01 | 2020-11-03 | 中国银行股份有限公司 | 一种企业手机银行用户的预测方法和装置 |
CN111967971A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 银行客户数据处理方法及装置 |
CN111967671A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 基于支持向量数据域描述的跨境活跃用户识别方法及装置 |
CN112017031A (zh) * | 2020-09-01 | 2020-12-01 | 中国银行股份有限公司 | 一种信息推送方法及装置 |
CN112215386A (zh) * | 2020-05-11 | 2021-01-12 | 北京明略软件系统有限公司 | 一种人员活跃度预测方法、装置和计算机可读存储介质 |
CN113627653A (zh) * | 2021-07-14 | 2021-11-09 | 深圳索信达数据技术有限公司 | 手机银行用户的活跃度预测策略的确定方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104516918A (zh) * | 2013-09-30 | 2015-04-15 | 深圳市腾讯计算机系统有限公司 | 用户身份信息的维护方法、装置、服务器及系统 |
CN105631538A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 一种用户活跃度的预测方法、装置及其应用方法和系统 |
CN105913175A (zh) * | 2016-04-07 | 2016-08-31 | 哈尔滨理工大学 | 基于改进神经网络算法的智能电网短期负荷预测方法 |
CN106649579A (zh) * | 2016-11-17 | 2017-05-10 | 苏州航天系统工程有限公司 | 一种用于管网建模的时序数据清洗方法 |
CN107203772A (zh) * | 2016-03-16 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 一种用户类型识别方法及装置 |
CN107370614A (zh) * | 2016-05-13 | 2017-11-21 | 北京京东尚科信息技术有限公司 | 网络用户活跃度评估方法和预测方法 |
CN108710609A (zh) * | 2018-05-07 | 2018-10-26 | 南京邮电大学 | 一种基于多特征融合的社交平台用户信息的分析方法 |
CN109086964A (zh) * | 2018-07-03 | 2018-12-25 | 南京邮电大学 | 基于随机森林的mr覆盖率影响因素判定方法 |
-
2018
- 2018-12-28 CN CN201811626634.2A patent/CN109727070B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104516918A (zh) * | 2013-09-30 | 2015-04-15 | 深圳市腾讯计算机系统有限公司 | 用户身份信息的维护方法、装置、服务器及系统 |
CN105631538A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 一种用户活跃度的预测方法、装置及其应用方法和系统 |
CN107203772A (zh) * | 2016-03-16 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 一种用户类型识别方法及装置 |
CN105913175A (zh) * | 2016-04-07 | 2016-08-31 | 哈尔滨理工大学 | 基于改进神经网络算法的智能电网短期负荷预测方法 |
CN107370614A (zh) * | 2016-05-13 | 2017-11-21 | 北京京东尚科信息技术有限公司 | 网络用户活跃度评估方法和预测方法 |
CN106649579A (zh) * | 2016-11-17 | 2017-05-10 | 苏州航天系统工程有限公司 | 一种用于管网建模的时序数据清洗方法 |
CN108710609A (zh) * | 2018-05-07 | 2018-10-26 | 南京邮电大学 | 一种基于多特征融合的社交平台用户信息的分析方法 |
CN109086964A (zh) * | 2018-07-03 | 2018-12-25 | 南京邮电大学 | 基于随机森林的mr覆盖率影响因素判定方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215386A (zh) * | 2020-05-11 | 2021-01-12 | 北京明略软件系统有限公司 | 一种人员活跃度预测方法、装置和计算机可读存储介质 |
CN111882113A (zh) * | 2020-07-01 | 2020-11-03 | 中国银行股份有限公司 | 一种企业手机银行用户的预测方法和装置 |
CN111882113B (zh) * | 2020-07-01 | 2024-02-27 | 中国银行股份有限公司 | 一种企业手机银行用户的预测方法和装置 |
CN111967971A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 银行客户数据处理方法及装置 |
CN111967671A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 基于支持向量数据域描述的跨境活跃用户识别方法及装置 |
CN111967671B (zh) * | 2020-08-18 | 2023-08-22 | 中国银行股份有限公司 | 基于支持向量数据域描述的跨境活跃用户识别方法及装置 |
CN111967971B (zh) * | 2020-08-18 | 2023-09-19 | 中国银行股份有限公司 | 银行客户数据处理方法及装置 |
CN112017031A (zh) * | 2020-09-01 | 2020-12-01 | 中国银行股份有限公司 | 一种信息推送方法及装置 |
CN112017031B (zh) * | 2020-09-01 | 2023-11-10 | 中国银行股份有限公司 | 一种信息推送方法及装置 |
CN113627653A (zh) * | 2021-07-14 | 2021-11-09 | 深圳索信达数据技术有限公司 | 手机银行用户的活跃度预测策略的确定方法及装置 |
CN113627653B (zh) * | 2021-07-14 | 2023-10-20 | 深圳索信达数据技术有限公司 | 手机银行用户的活跃度预测策略的确定方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109727070B (zh) | 2021-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109727070A (zh) | 一种潜在活跃用户的确定方法及装置 | |
CN110851529B (zh) | 算力调度方法及相关设备 | |
CN104468803B (zh) | 一种虚拟数据中心资源映射方法和设备 | |
CN109451002A (zh) | 一种cdn节点的选择方法及设备 | |
CN106326002B (zh) | 资源调度方法、装置及设备 | |
CN109547286A (zh) | 一种cdn节点的选择方法及设备 | |
CN110463140A (zh) | 计算机数据中心的网络服务水平协议 | |
CN110019292A (zh) | 一种数据的查询方法及装置 | |
CN108306874B (zh) | 服务接口访问限流方法及装置 | |
CN104408640B (zh) | 应用软件推荐方法及装置 | |
CN107708217A (zh) | 一种资源调度方法及基站 | |
CN109600344A (zh) | 识别风险群体的方法、装置及电子设备 | |
CN115134371A (zh) | 包含边缘网络算力资源的调度方法、系统、设备及介质 | |
CN109684426A (zh) | 一种地图切片方法及装置 | |
CN114302422A (zh) | 利用学习模型进行业务处理的方法以及装置 | |
CN108132827A (zh) | 一种网络切片资源映射方法、相关设备及系统 | |
Karsten et al. | Analysis of resource pooling games via a new extension of the Erlang loss function | |
CN109086289A (zh) | 一种媒体数据处理方法、客户端、介质和设备 | |
CN111986318A (zh) | 对待加工钢材进行选料的方法及装置 | |
CN114020455B (zh) | 一种服务功能的编排方法、装置及计算机可读存储介质 | |
CN106681803A (zh) | 一种任务调度方法及服务器 | |
CN108053197A (zh) | 工作流处理方法及系统 | |
CN112286623B (zh) | 一种信息处理方法及装置、存储介质 | |
CN116795553A (zh) | 算力资源的调度方法及装置、存储介质及电子装置 | |
CN116521369A (zh) | 边缘计算任务分配方法、装置及非易失性存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |